Tổng hợp tất cả tài liệu, ebook, giáo trình Cơ Sở Dữ Liệu chọn lọc và hay nhất.
TÓM TẮT— Khai phá các mẫu thường xuyên là bài toán quan trọng có nhiều khả năng ứng dụng vào thực tiễn. Các ứng dụng trong thực tiễn rất đa dạng và phong phú nên phương pháp khai phá tập mục thường xuyên bị giới hạn bởi cấu trúc dữ liệu dạng tập hợp không phản ánh được hết bản chất của dữ liệu chẳng hạn như cấu trúc thành phần hóa học của các viê...
9 trang | Chia sẻ: thanhle95 | Ngày: 28/06/2021 | Lượt xem: 579 | Lượt tải: 1
TÓM TẮT— Ảnh số đã trở nên thân thuộc với cuộc sống hàng ngày, nên bài toán truy vấn ảnh phù hợp với nhu cầu xã hội hiện nay. Bài báo tiếp cận xây dựng hệ truy vấn ảnh theo nội dung CBIR (Content-Based Image Retrieval) dựa trên chữ ký nhị phân (binary signature) và cây S-Tree. Để tạo chữ ký nhị phân, chúng tôi ứng dụng phương pháp gom cụm K-mean ...
12 trang | Chia sẻ: thanhle95 | Ngày: 28/06/2021 | Lượt xem: 773 | Lượt tải: 1
TÓM TẮT— Thủy vân số được xem là một công cụ hữu hiệu để bảo vệ cơ sở dữ liệu trên các môi trường trao đổi không an toàn. Các lược đồ thủy vân truyền thống chỉ cho phép trích thủy vân mà không có khả năng khôi phục cơ sở dữ liệu. Do đó, người nhận không có được dữ liệu gốc mà chỉ là một bản gần đúng. Để khắc phục nhược điểm trên, gần đây đã xuất ...
8 trang | Chia sẻ: thanhle95 | Ngày: 28/06/2021 | Lượt xem: 551 | Lượt tải: 1
TÓM TẮT— Hiện nay, cùng với sự mở rộng của World Wide Web là sự tăng trưởng nhanh chóng của dữ liệu. Nguồn dữ liệu khổng lồ hiện nay vẫn được lưu trữ trong các mô hình cơ sở dữ liệu khác nhau, phổ biến là các mô hình: cơ sở dữ liệu quan hệ (relational database), cơ sở dữ liệu ngữ nghĩa, Sự phong phú của các loại cơ sở dữ liệu gây khó khăn cho ngư...
12 trang | Chia sẻ: thanhle95 | Ngày: 28/06/2021 | Lượt xem: 675 | Lượt tải: 2
TÓM TẮT— Mục tiêu của bài viết là đề xuất mô hình mới cho phép quản lý tập dữ liệu lớn phi cấu trúc, tồn tại dưới dạng các tập tin văn bản, bảng tính. Mô hình đề xuất dựa trên một tập các công nghệ nguồn mở của Big Data theo hướng tích hợp dịch vụ và chuẩn hóa dữ liệu nối kết, bao gồm : (1) HDFS (Hadoop Distributed File System) của Hadoop dùng tr...
9 trang | Chia sẻ: thanhle95 | Ngày: 28/06/2021 | Lượt xem: 561 | Lượt tải: 1
TÓM TẮT— Tái tạo mặt cong tham số từ lưới tam giác, đặc biệt là mặt cong tham số bậc thấp, có ý nghĩa quan trọng và mang lại nhiều ứng dụng thực tiễn trong lĩnh vực tái tạo ngược, thực tại ảo và hỗ trợ thiết kế. Bài báo này đề xuất một phương pháp mới nhằm tái tạo các mặt cong trên miền tham số tam giác có bậc thấp (cụ thể là các mặt Bézier, B-pa...
8 trang | Chia sẻ: thanhle95 | Ngày: 28/06/2021 | Lượt xem: 790 | Lượt tải: 1
TÓM TẮT— Khai thác tập phổ biến là bài toán quan trọng trong khai thác dữ liệu. Đã có nhiều phương pháp khác nhau được đề xuất để giải quyết bài toán này. Trong đó, cấu trúc N-list được đề xuất bởi Deng với việc sử dụng hướng tiếp cận lai giữa cây FP và cây liệt kê đã đạt được hiệu quả đáng khích lệ. Tuy nhiên phương pháp này mới chỉ khai thác tr...
8 trang | Chia sẻ: thanhle95 | Ngày: 28/06/2021 | Lượt xem: 614 | Lượt tải: 1
TÓM TẮT: Phân lớp dựa vào luật phân lớp kết hợp đã được chứng minh là tốt hơn các phương pháp phân lớp dựa vào luật hiện có như cây quyết định, ILA, v.v. Tuy nhiên, do dựa vào khai thác luật kết hợp nên chỉ những luật phổ biến (có độ hỗ trợ cao) được khai thác. Trong các cơ sở dữ liệu (CSDL) mất cân bằng về lớp, mặc dù các lớp thiểu số cũng đóng ...
7 trang | Chia sẻ: thanhle95 | Ngày: 28/06/2021 | Lượt xem: 514 | Lượt tải: 1
TÓM TẮT— Khai thác dữ liệu quá khứ để dự báo dữ liệu tương lai với độ chính xác cao là vấn đề thử thách. Hệ suy luận ANFIS (Adaptive Neuro-fuzzy Inference System) là một trong các kỹ thuật dùng để dự báo dữ liệu chuỗi thời gian. Vì vậy, bài báo đề xuất mô hình dự báo đa trị dựa trên hệ suy luận ANFIS. Từ đó, chúng tôi xây dựng thuật toán huấn luy...
8 trang | Chia sẻ: thanhle95 | Ngày: 28/06/2021 | Lượt xem: 865 | Lượt tải: 1
TÓM TẮT— Trong bài viết này, chúng tôi trình bày giải thuật tSVM cho phân lớp phi tuyến tập dữ liệu lớn. Giải thuật tSVM sử dụng máy học cây quyết định để phân hoạch nhanh tập dữ liệu lớn thành k phân vùng được gọi là nút lá. Chỉ những nút lá có nhãn (lớp) của các phần tử thuần nhất (giống nhau) được giải thuật tSVM gán nhãn tương ứng như giải th...
9 trang | Chia sẻ: thanhle95 | Ngày: 28/06/2021 | Lượt xem: 556 | Lượt tải: 1