• Mô hình quản lý tập dữ liệu văn bản lớn cho phép tìm kiếm toàn văn và phân tích thống kê trực quanMô hình quản lý tập dữ liệu văn bản lớn cho phép tìm kiếm toàn văn và phân tích thống kê trực quan

  TÓM TẮT— Mục tiêu của bài viết là đề xuất mô hình mới cho phép quản lý tập dữ liệu lớn phi cấu trúc, tồn tại dưới dạng các tập tin văn bản, bảng tính. Mô hình đề xuất dựa trên một tập các công nghệ nguồn mở của Big Data theo hướng tích hợp dịch vụ và chuẩn hóa dữ liệu nối kết, bao gồm : (1) HDFS (Hadoop Distributed File System) của Hadoop dùng tr...

  pdf9 trang | Chia sẻ: thanhle95 | Ngày: 28/06/2021 | Lượt xem: 4 | Lượt tải: 0

 • Mô hình hóa mặt cong tham số bậc thấp từ lưới tam giác dựa trên phương pháp dịch chuyển hình học cục bộMô hình hóa mặt cong tham số bậc thấp từ lưới tam giác dựa trên phương pháp dịch chuyển hình học cục bộ

  TÓM TẮT— Tái tạo mặt cong tham số từ lưới tam giác, đặc biệt là mặt cong tham số bậc thấp, có ý nghĩa quan trọng và mang lại nhiều ứng dụng thực tiễn trong lĩnh vực tái tạo ngược, thực tại ảo và hỗ trợ thiết kế. Bài báo này đề xuất một phương pháp mới nhằm tái tạo các mặt cong trên miền tham số tam giác có bậc thấp (cụ thể là các mặt Bézier, B-pa...

  pdf8 trang | Chia sẻ: thanhle95 | Ngày: 28/06/2021 | Lượt xem: 3 | Lượt tải: 0

 • Khai thác tập phổ biến có trọng số dựa trên cấu trúc L-listKhai thác tập phổ biến có trọng số dựa trên cấu trúc L-list

  TÓM TẮT— Khai thác tập phổ biến là bài toán quan trọng trong khai thác dữ liệu. Đã có nhiều phương pháp khác nhau được đề xuất để giải quyết bài toán này. Trong đó, cấu trúc N-list được đề xuất bởi Deng với việc sử dụng hướng tiếp cận lai giữa cây FP và cây liệt kê đã đạt được hiệu quả đáng khích lệ. Tuy nhiên phương pháp này mới chỉ khai thác tr...

  pdf8 trang | Chia sẻ: thanhle95 | Ngày: 28/06/2021 | Lượt xem: 2 | Lượt tải: 0

 • Khai thác luật phân lớp kết hợp trên cơ sở dữ liệu mất cân bằng về lớpKhai thác luật phân lớp kết hợp trên cơ sở dữ liệu mất cân bằng về lớp

  TÓM TẮT: Phân lớp dựa vào luật phân lớp kết hợp đã được chứng minh là tốt hơn các phương pháp phân lớp dựa vào luật hiện có như cây quyết định, ILA, v.v. Tuy nhiên, do dựa vào khai thác luật kết hợp nên chỉ những luật phổ biến (có độ hỗ trợ cao) được khai thác. Trong các cơ sở dữ liệu (CSDL) mất cân bằng về lớp, mặc dù các lớp thiểu số cũng đóng ...

  pdf7 trang | Chia sẻ: thanhle95 | Ngày: 28/06/2021 | Lượt xem: 2 | Lượt tải: 0

 • Hệ ANFIS cho bài toán dự báo dữ liệu chuỗi thời gian và ứng dụngHệ ANFIS cho bài toán dự báo dữ liệu chuỗi thời gian và ứng dụng

  TÓM TẮT— Khai thác dữ liệu quá khứ để dự báo dữ liệu tương lai với độ chính xác cao là vấn đề thử thách. Hệ suy luận ANFIS (Adaptive Neuro-fuzzy Inference System) là một trong các kỹ thuật dùng để dự báo dữ liệu chuỗi thời gian. Vì vậy, bài báo đề xuất mô hình dự báo đa trị dựa trên hệ suy luận ANFIS. Từ đó, chúng tôi xây dựng thuật toán huấn luy...

  pdf8 trang | Chia sẻ: thanhle95 | Ngày: 28/06/2021 | Lượt xem: 2 | Lượt tải: 0

 • Giải thuật tSVM cho phân lớp phi tuyến tập dữ liệu lớnGiải thuật tSVM cho phân lớp phi tuyến tập dữ liệu lớn

  TÓM TẮT— Trong bài viết này, chúng tôi trình bày giải thuật tSVM cho phân lớp phi tuyến tập dữ liệu lớn. Giải thuật tSVM sử dụng máy học cây quyết định để phân hoạch nhanh tập dữ liệu lớn thành k phân vùng được gọi là nút lá. Chỉ những nút lá có nhãn (lớp) của các phần tử thuần nhất (giống nhau) được giải thuật tSVM gán nhãn tương ứng như giải th...

  pdf9 trang | Chia sẻ: thanhle95 | Ngày: 28/06/2021 | Lượt xem: 2 | Lượt tải: 0

 • Giải pháp tích hợp xử lý ngữ nghĩa vào hệ thống gợi ýGiải pháp tích hợp xử lý ngữ nghĩa vào hệ thống gợi ý

  TÓM TẮT — Hệ thống gợi ý thường tạo ra một danh sách các mục tin để gợi ý cho người dùng theo một trong hai cách: lọc dựa trên nội dung (content-based filtering) và lọc cộng tác (collaborative filtering). Lọc dựa trên nội dung là hướng tiếp cận căn cứ vào việc phân tích đặc trưng trên nội dung của các mục tin mà người dùng đã chọn trong quá khứ v...

  pdf11 trang | Chia sẻ: thanhle95 | Ngày: 28/06/2021 | Lượt xem: 2 | Lượt tải: 0

 • On Rectifying the Mapping between Articles and Institutions in Bibliometric DatabasesOn Rectifying the Mapping between Articles and Institutions in Bibliometric Databases

  Abstract: Today, bibliometric databases are indispensable sources for researchers and research institutions. The main role of these databases is to find research articles and estimate the performance of researchers and institutions. Regarding the evaluation of the research performance of an organization, the accuracy in determining institutions ...

  pdf10 trang | Chia sẻ: thanhle95 | Ngày: 28/06/2021 | Lượt xem: 2 | Lượt tải: 0

 • Đánh giá hiệu năng các thuật toán theo vết đối tượng chuyển độngĐánh giá hiệu năng các thuật toán theo vết đối tượng chuyển động

  Tóm tắt: Theo vết đối tượng đóng một vai trò quan trọng trong các hệ thống giám sát, các kết quả theo dõi và dự đoán chính xác sẽ giúp hệ thống hoạt động hiệu quả hơn. Bài báo này trình bày một số kết quả nghiên cứu các thuật toán theo vết đối tượng di chuyển trong video. Trước tiên, các đối tượng chuyển động được phát hiện theo thuật toán tr...

  pdf8 trang | Chia sẻ: thanhle95 | Ngày: 28/06/2021 | Lượt xem: 2 | Lượt tải: 0

 • An information-Theoretic metric based method for selecting clustering attributeAn information-Theoretic metric based method for selecting clustering attribute

  ABSTRACT—Clustering problem appears in many different fields like Data Mining, Pattern Recognition, Bioinfor-matics, etc. The basic objective of clustering is to group objects into clusters so that objects in the same cluster are more similar to one another than they are to objects in other clusters. Recently, many researchers have contributed to...

  pdf10 trang | Chia sẻ: thanhle95 | Ngày: 28/06/2021 | Lượt xem: 2 | Lượt tải: 0