• Bài giảng Học máy - Bài 7: Học máy không giám sát - Nguyễn Thanh TùngBài giảng Học máy - Bài 7: Học máy không giám sát - Nguyễn Thanh Tùng

    Học không giám sát • Tại sao học không giám sát luôn thách thức lớn? – Phân tích khám phá dữ liệu (Exploratory data analysis) – mục tiêu không được định nghĩa rõ ràng – Khó đánh giá hiệu năng – không biết được đáp án đúng (“right answer” unknown) – Xử lý dữ liệu với số chiều lớnHọc không giám sát • Hai cách tiếp cận: – Phân tích cụm (Cluste...

    pdf87 trang | Chia sẻ: thanhle95 | Ngày: 03/07/2021 | Lượt xem: 641 | Lượt tải: 1

  • Bài giảng Học máy - Bài 6: Các phương pháp học máy kết hợp - Nguyễn Thanh TùngBài giảng Học máy - Bài 6: Các phương pháp học máy kết hợp - Nguyễn Thanh Tùng

    Bootstrap là gì? • Giả sử ta có 5 quả bóng gắn nhãn A,B,C,D, E và bỏ tất cả chúng vào trong 1 cái giỏ. • Lấy ra ngẫu nhiên 1 quả từ giỏ và ghi lại nhãn, sau đó bỏ lại quả bóng vừa bốc được vào giỏ. • Tiếp tục lấy ra ngẫu nhiên một quả bóng và lặp lại quá trình trên cho đến khi việc lấy mẫu kết thúc. Việc lấy mẫu này gọi là lấy mẫu có hoàn lại...

    pdf53 trang | Chia sẻ: thanhle95 | Ngày: 03/07/2021 | Lượt xem: 642 | Lượt tải: 1

  • Bài giảng Học máy - Bài 5: Cây phân loại và hồi quy - Nguyễn Thanh TùngBài giảng Học máy - Bài 5: Cây phân loại và hồi quy - Nguyễn Thanh Tùng

    • Học cây quyết định (Decision tree –DT– learning) • Để học (xấp xỉ) một hàm mục tiêu có giá trị rời rạc (discrete- valued target function) – hàm phân lớp • Hàm phân lớp được biểu diễn bởi một cây quyết định • Một cây quyết định có thể được biểu diễn (diễn giải) bằng một tập các luật IF-THEN (dễ đọc và dễ hiểu) • Học cây quyết định có thể thự...

    pdf68 trang | Chia sẻ: thanhle95 | Ngày: 03/07/2021 | Lượt xem: 1020 | Lượt tải: 1

  • Bài giảng Học máy - Bài 4: Hồi quy Logistic, Máy véctơ hỗ trợ (SVM) - Nguyễn Thanh TùngBài giảng Học máy - Bài 4: Hồi quy Logistic, Máy véctơ hỗ trợ (SVM) - Nguyễn Thanh Tùng

    Phân lớp • Hồi quy – dự đoán biến định lượng (liên tục) Y – Trong nhiều ứng dụng, biến đầu ra là định tính hoặc kiểu định danh/hạng mục • Phân lớp: Dự đoán biến đầu ra định tính – Gán mỗi quan sát cho một lớp/mục – vd: Bộ phân lớp K-láng giềng gần nhất trong bài học trướcVí dụ về phân lớp • Các giao dịch thẻ tín dụng – Có phải dịch gian lậ...

    pdf86 trang | Chia sẻ: thanhle95 | Ngày: 03/07/2021 | Lượt xem: 640 | Lượt tải: 1

  • Bài giảng Học máy - Bài 3: Kỹ thuật kiểm tra chéo, hiệu chỉnh mô hình, mô hình thưa - Nguyễn Thanh TùngBài giảng Học máy - Bài 3: Kỹ thuật kiểm tra chéo, hiệu chỉnh mô hình, mô hình thưa - Nguyễn Thanh Tùng

    Dùng để ước lượng lỗi dự đoán • Dùng để chọn các giá trị tham số phù hợp cho mô hình (vd: tham số k trong k--lánggiềnggần nhất) CSE 445: Học máy | Học kỳ 1, 2016-2017 Kỹ thuật kiểm tra chéoAuto Data: LOOCV vs. K-fold CV Hình trái: Sai số LOOCV Hình phải: 10-fold CV được chạy nhiều lần, đồ thị biểu diễn sai khác nhỏ về lỗi CV LOOCV là trườn...

    pdf48 trang | Chia sẻ: thanhle95 | Ngày: 03/07/2021 | Lượt xem: 757 | Lượt tải: 1

  • Bài giảng Học máy - Bài 2: Học có giám sát - Nguyễn Thanh TùngBài giảng Học máy - Bài 2: Học có giám sát - Nguyễn Thanh Tùng

    Giải thuật Học máy “Tốt nhất” • Tin tồi: Không có giải thuật nào tốt nhất – Không có giải thuật học máy nào thực hiện tốt cho mọi bài toán • Tin tốt: Tất cả các giải thuật học máy đều tốt – Mỗi giải thuật học máy thực hiện tốt cho một số bài toán • Định lý “No free lunch” – Wolpert (1996): các giải thuật thực hiện như nhau khi ta lấy trung b...

    pdf96 trang | Chia sẻ: thanhle95 | Ngày: 03/07/2021 | Lượt xem: 581 | Lượt tải: 1

  • Bài giảng Học máy - Bài 1: Giới thiệu về Học máy - Nguyễn Thanh TùngBài giảng Học máy - Bài 1: Giới thiệu về Học máy - Nguyễn Thanh Tùng

    Các giải thuật Học máy • Để lọc thư rác hoặc nhận dạng chữ viết tay, chúng ta gắn nhãn các mẫu (quan sát) để học mô hình từ chúng – Học máy có giám sát: Huấn luyện cho giải thuật học máy xây dựng mô hình từ các mối quan hệ trong dữ liệu, dựa trên tập các cặp đầu vào-ra của các quan sát. • Để phát hiện các nhóm bệnh nhân trong Bệnh án điện tử (...

    pdf78 trang | Chia sẻ: thanhle95 | Ngày: 03/07/2021 | Lượt xem: 684 | Lượt tải: 1

  • Bài giảng Kỹ thuật lập trình - Chương 9: Tập tin - Trần QuangBài giảng Kỹ thuật lập trình - Chương 9: Tập tin - Trần Quang

    Các loại tập tin  Tập tin văn bản (text)  Các byte trong mô hình tập tin chứa các ký tự đọc được (có nghĩa) bởi con người  Tập tin có thể mở ra để đọc và thay đổi bởi chương trình soạn thảo văn bản như NOTEPAD.  Tập tin nhị phân (binary)  Được tạo bởi chương trình nào đó, không dành cho con người đọc và hiểu trực tiếp bằng NOTEPAD  C...

    pdf33 trang | Chia sẻ: thanhle95 | Ngày: 03/07/2021 | Lượt xem: 624 | Lượt tải: 1

  • Bài giảng Kỹ thuật lập trình - Chương 8: Hàm - Trần QuangBài giảng Kỹ thuật lập trình - Chương 8: Hàm - Trần Quang

    Lợi ích của hàm  Tránh lặp lại mã nguồn  Tiết kiệm thời gian phát triển  Thay đổi đoạn mã nguồn trong hàm nhanh và dễ dàng, chỉ tại một nơi  Sử dụng lại một đơn vị tính toán mà không phải viết lại  Tiết kiệm thời gian phát triển  Có thể chia sẻ đơn vị tính toán không chỉ cho một dự án mà cho nhiều dự án

    pdf34 trang | Chia sẻ: thanhle95 | Ngày: 03/07/2021 | Lượt xem: 619 | Lượt tải: 1

  • Bài giảng Kỹ thuật lập trình - Chương 7: Con trỏ - Trần QuangBài giảng Kỹ thuật lập trình - Chương 7: Con trỏ - Trần Quang

    Ứng dụng của con trỏ  Mảng trong C  Phải biết trước số lượng phần tử tại thời điểm viết chương trình  Do đó, cần phải khai báo một số lượng lớn các ô nhớ để sẵn. Tuy nhiên, tại một thời điểm nào đó, chương trình có thể sẽ sử dụng ít hơn rất nhiều  lãng phí  Yêu cầu: có thể nào dùng mảng với số lượng phần tử chỉ cần biết lúc chương trì...

    pdf28 trang | Chia sẻ: thanhle95 | Ngày: 03/07/2021 | Lượt xem: 614 | Lượt tải: 1