• Phân lớp hiệu quả tập dữ liệu lớn với giải thuật giảm Gradient ngẫu nhiênPhân lớp hiệu quả tập dữ liệu lớn với giải thuật giảm Gradient ngẫu nhiên

    TÓM TẮT— Trong bài viết này, chúng tôi trình bày giải thuật giảm gradient ngẫu nhiên sử dụng trong máy học véctơ hỗ trợ cho phân lớp nhanh tập dữ liệu lớn. Máy học véctơ hỗ trợ sử dụng hàm hinge loss trong phân lớp nhằm đạt được tính chất thưa trong lời giải. Tuy nhiên, do hàm hinge loss không khả vi là nguyên nhân làm chậm hội tụ đến lời giải kh...

    pdf7 trang | Chia sẻ: thanhle95 | Ngày: 28/06/2021 | Lượt xem: 566 | Lượt tải: 1

  • Một số vấn đề về khai phá đồ thị con thường xuyên đóngMột số vấn đề về khai phá đồ thị con thường xuyên đóng

    TÓM TẮT— Khai phá các mẫu thường xuyên là bài toán quan trọng có nhiều khả năng ứng dụng vào thực tiễn. Các ứng dụng trong thực tiễn rất đa dạng và phong phú nên phương pháp khai phá tập mục thường xuyên bị giới hạn bởi cấu trúc dữ liệu dạng tập hợp không phản ánh được hết bản chất của dữ liệu chẳng hạn như cấu trúc thành phần hóa học của các viê...

    pdf9 trang | Chia sẻ: thanhle95 | Ngày: 28/06/2021 | Lượt xem: 565 | Lượt tải: 1

  • Một số cải tiến cho hệ truy vấn ảnh dựa trên cây S-TreeMột số cải tiến cho hệ truy vấn ảnh dựa trên cây S-Tree

    TÓM TẮT— Ảnh số đã trở nên thân thuộc với cuộc sống hàng ngày, nên bài toán truy vấn ảnh phù hợp với nhu cầu xã hội hiện nay. Bài báo tiếp cận xây dựng hệ truy vấn ảnh theo nội dung CBIR (Content-Based Image Retrieval) dựa trên chữ ký nhị phân (binary signature) và cây S-Tree. Để tạo chữ ký nhị phân, chúng tôi ứng dụng phương pháp gom cụm K-mean ...

    pdf12 trang | Chia sẻ: thanhle95 | Ngày: 28/06/2021 | Lượt xem: 763 | Lượt tải: 1

  • Một lược đồ thủy vân thuận nghịch khóa công khai cho cơ sở dữ liệu dựa trên kỹ thuật mở rộng các thuộc tính kiểu thựcMột lược đồ thủy vân thuận nghịch khóa công khai cho cơ sở dữ liệu dựa trên kỹ thuật mở rộng các thuộc tính kiểu thực

    TÓM TẮT— Thủy vân số được xem là một công cụ hữu hiệu để bảo vệ cơ sở dữ liệu trên các môi trường trao đổi không an toàn. Các lược đồ thủy vân truyền thống chỉ cho phép trích thủy vân mà không có khả năng khôi phục cơ sở dữ liệu. Do đó, người nhận không có được dữ liệu gốc mà chỉ là một bản gần đúng. Để khắc phục nhược điểm trên, gần đây đã xuất ...

    pdf8 trang | Chia sẻ: thanhle95 | Ngày: 28/06/2021 | Lượt xem: 542 | Lượt tải: 1

  • Mô hình truy vấn dữ liệu tùy chọn dựa trên ngữ nghĩa của câu truy vấnMô hình truy vấn dữ liệu tùy chọn dựa trên ngữ nghĩa của câu truy vấn

    TÓM TẮT— Hiện nay, cùng với sự mở rộng của World Wide Web là sự tăng trưởng nhanh chóng của dữ liệu. Nguồn dữ liệu khổng lồ hiện nay vẫn được lưu trữ trong các mô hình cơ sở dữ liệu khác nhau, phổ biến là các mô hình: cơ sở dữ liệu quan hệ (relational database), cơ sở dữ liệu ngữ nghĩa, Sự phong phú của các loại cơ sở dữ liệu gây khó khăn cho ngư...

    pdf12 trang | Chia sẻ: thanhle95 | Ngày: 28/06/2021 | Lượt xem: 663 | Lượt tải: 2

  • Mô hình quản lý tập dữ liệu văn bản lớn cho phép tìm kiếm toàn văn và phân tích thống kê trực quanMô hình quản lý tập dữ liệu văn bản lớn cho phép tìm kiếm toàn văn và phân tích thống kê trực quan

    TÓM TẮT— Mục tiêu của bài viết là đề xuất mô hình mới cho phép quản lý tập dữ liệu lớn phi cấu trúc, tồn tại dưới dạng các tập tin văn bản, bảng tính. Mô hình đề xuất dựa trên một tập các công nghệ nguồn mở của Big Data theo hướng tích hợp dịch vụ và chuẩn hóa dữ liệu nối kết, bao gồm : (1) HDFS (Hadoop Distributed File System) của Hadoop dùng tr...

    pdf9 trang | Chia sẻ: thanhle95 | Ngày: 28/06/2021 | Lượt xem: 551 | Lượt tải: 1

  • Mô hình hóa mặt cong tham số bậc thấp từ lưới tam giác dựa trên phương pháp dịch chuyển hình học cục bộMô hình hóa mặt cong tham số bậc thấp từ lưới tam giác dựa trên phương pháp dịch chuyển hình học cục bộ

    TÓM TẮT— Tái tạo mặt cong tham số từ lưới tam giác, đặc biệt là mặt cong tham số bậc thấp, có ý nghĩa quan trọng và mang lại nhiều ứng dụng thực tiễn trong lĩnh vực tái tạo ngược, thực tại ảo và hỗ trợ thiết kế. Bài báo này đề xuất một phương pháp mới nhằm tái tạo các mặt cong trên miền tham số tam giác có bậc thấp (cụ thể là các mặt Bézier, B-pa...

    pdf8 trang | Chia sẻ: thanhle95 | Ngày: 28/06/2021 | Lượt xem: 781 | Lượt tải: 1

  • Khai thác tập phổ biến có trọng số dựa trên cấu trúc L-listKhai thác tập phổ biến có trọng số dựa trên cấu trúc L-list

    TÓM TẮT— Khai thác tập phổ biến là bài toán quan trọng trong khai thác dữ liệu. Đã có nhiều phương pháp khác nhau được đề xuất để giải quyết bài toán này. Trong đó, cấu trúc N-list được đề xuất bởi Deng với việc sử dụng hướng tiếp cận lai giữa cây FP và cây liệt kê đã đạt được hiệu quả đáng khích lệ. Tuy nhiên phương pháp này mới chỉ khai thác tr...

    pdf8 trang | Chia sẻ: thanhle95 | Ngày: 28/06/2021 | Lượt xem: 603 | Lượt tải: 1

  • Khai thác luật phân lớp kết hợp trên cơ sở dữ liệu mất cân bằng về lớpKhai thác luật phân lớp kết hợp trên cơ sở dữ liệu mất cân bằng về lớp

    TÓM TẮT: Phân lớp dựa vào luật phân lớp kết hợp đã được chứng minh là tốt hơn các phương pháp phân lớp dựa vào luật hiện có như cây quyết định, ILA, v.v. Tuy nhiên, do dựa vào khai thác luật kết hợp nên chỉ những luật phổ biến (có độ hỗ trợ cao) được khai thác. Trong các cơ sở dữ liệu (CSDL) mất cân bằng về lớp, mặc dù các lớp thiểu số cũng đóng ...

    pdf7 trang | Chia sẻ: thanhle95 | Ngày: 28/06/2021 | Lượt xem: 504 | Lượt tải: 1

  • Hệ ANFIS cho bài toán dự báo dữ liệu chuỗi thời gian và ứng dụngHệ ANFIS cho bài toán dự báo dữ liệu chuỗi thời gian và ứng dụng

    TÓM TẮT— Khai thác dữ liệu quá khứ để dự báo dữ liệu tương lai với độ chính xác cao là vấn đề thử thách. Hệ suy luận ANFIS (Adaptive Neuro-fuzzy Inference System) là một trong các kỹ thuật dùng để dự báo dữ liệu chuỗi thời gian. Vì vậy, bài báo đề xuất mô hình dự báo đa trị dựa trên hệ suy luận ANFIS. Từ đó, chúng tôi xây dựng thuật toán huấn luy...

    pdf8 trang | Chia sẻ: thanhle95 | Ngày: 28/06/2021 | Lượt xem: 850 | Lượt tải: 1