Tổng hợp tất cả tài liệu, ebook, giáo trình Công Nghệ Thông Tin chọn lọc và hay nhất.
Học không giám sát • Tại sao học không giám sát luôn thách thức lớn? – Phân tích khám phá dữ liệu (Exploratory data analysis) – mục tiêu không được định nghĩa rõ ràng – Khó đánh giá hiệu năng – không biết được đáp án đúng (“right answer” unknown) – Xử lý dữ liệu với số chiều lớnHọc không giám sát • Hai cách tiếp cận: – Phân tích cụm (Cluste...
87 trang | Chia sẻ: thanhle95 | Ngày: 03/07/2021 | Lượt xem: 641 | Lượt tải: 1
Bootstrap là gì? • Giả sử ta có 5 quả bóng gắn nhãn A,B,C,D, E và bỏ tất cả chúng vào trong 1 cái giỏ. • Lấy ra ngẫu nhiên 1 quả từ giỏ và ghi lại nhãn, sau đó bỏ lại quả bóng vừa bốc được vào giỏ. • Tiếp tục lấy ra ngẫu nhiên một quả bóng và lặp lại quá trình trên cho đến khi việc lấy mẫu kết thúc. Việc lấy mẫu này gọi là lấy mẫu có hoàn lại...
53 trang | Chia sẻ: thanhle95 | Ngày: 03/07/2021 | Lượt xem: 642 | Lượt tải: 1
• Học cây quyết định (Decision tree –DT– learning) • Để học (xấp xỉ) một hàm mục tiêu có giá trị rời rạc (discrete- valued target function) – hàm phân lớp • Hàm phân lớp được biểu diễn bởi một cây quyết định • Một cây quyết định có thể được biểu diễn (diễn giải) bằng một tập các luật IF-THEN (dễ đọc và dễ hiểu) • Học cây quyết định có thể thự...
68 trang | Chia sẻ: thanhle95 | Ngày: 03/07/2021 | Lượt xem: 1020 | Lượt tải: 1
Phân lớp • Hồi quy – dự đoán biến định lượng (liên tục) Y – Trong nhiều ứng dụng, biến đầu ra là định tính hoặc kiểu định danh/hạng mục • Phân lớp: Dự đoán biến đầu ra định tính – Gán mỗi quan sát cho một lớp/mục – vd: Bộ phân lớp K-láng giềng gần nhất trong bài học trướcVí dụ về phân lớp • Các giao dịch thẻ tín dụng – Có phải dịch gian lậ...
86 trang | Chia sẻ: thanhle95 | Ngày: 03/07/2021 | Lượt xem: 640 | Lượt tải: 1
Dùng để ước lượng lỗi dự đoán • Dùng để chọn các giá trị tham số phù hợp cho mô hình (vd: tham số k trong k--lánggiềnggần nhất) CSE 445: Học máy | Học kỳ 1, 2016-2017 Kỹ thuật kiểm tra chéoAuto Data: LOOCV vs. K-fold CV Hình trái: Sai số LOOCV Hình phải: 10-fold CV được chạy nhiều lần, đồ thị biểu diễn sai khác nhỏ về lỗi CV LOOCV là trườn...
48 trang | Chia sẻ: thanhle95 | Ngày: 03/07/2021 | Lượt xem: 757 | Lượt tải: 1
Giải thuật Học máy “Tốt nhất” • Tin tồi: Không có giải thuật nào tốt nhất – Không có giải thuật học máy nào thực hiện tốt cho mọi bài toán • Tin tốt: Tất cả các giải thuật học máy đều tốt – Mỗi giải thuật học máy thực hiện tốt cho một số bài toán • Định lý “No free lunch” – Wolpert (1996): các giải thuật thực hiện như nhau khi ta lấy trung b...
96 trang | Chia sẻ: thanhle95 | Ngày: 03/07/2021 | Lượt xem: 581 | Lượt tải: 1
Các giải thuật Học máy • Để lọc thư rác hoặc nhận dạng chữ viết tay, chúng ta gắn nhãn các mẫu (quan sát) để học mô hình từ chúng – Học máy có giám sát: Huấn luyện cho giải thuật học máy xây dựng mô hình từ các mối quan hệ trong dữ liệu, dựa trên tập các cặp đầu vào-ra của các quan sát. • Để phát hiện các nhóm bệnh nhân trong Bệnh án điện tử (...
78 trang | Chia sẻ: thanhle95 | Ngày: 03/07/2021 | Lượt xem: 684 | Lượt tải: 1
Các loại tập tin Tập tin văn bản (text) Các byte trong mô hình tập tin chứa các ký tự đọc được (có nghĩa) bởi con người Tập tin có thể mở ra để đọc và thay đổi bởi chương trình soạn thảo văn bản như NOTEPAD. Tập tin nhị phân (binary) Được tạo bởi chương trình nào đó, không dành cho con người đọc và hiểu trực tiếp bằng NOTEPAD C...
33 trang | Chia sẻ: thanhle95 | Ngày: 03/07/2021 | Lượt xem: 624 | Lượt tải: 1
Lợi ích của hàm Tránh lặp lại mã nguồn Tiết kiệm thời gian phát triển Thay đổi đoạn mã nguồn trong hàm nhanh và dễ dàng, chỉ tại một nơi Sử dụng lại một đơn vị tính toán mà không phải viết lại Tiết kiệm thời gian phát triển Có thể chia sẻ đơn vị tính toán không chỉ cho một dự án mà cho nhiều dự án
34 trang | Chia sẻ: thanhle95 | Ngày: 03/07/2021 | Lượt xem: 619 | Lượt tải: 1
Ứng dụng của con trỏ Mảng trong C Phải biết trước số lượng phần tử tại thời điểm viết chương trình Do đó, cần phải khai báo một số lượng lớn các ô nhớ để sẵn. Tuy nhiên, tại một thời điểm nào đó, chương trình có thể sẽ sử dụng ít hơn rất nhiều lãng phí Yêu cầu: có thể nào dùng mảng với số lượng phần tử chỉ cần biết lúc chương trì...
28 trang | Chia sẻ: thanhle95 | Ngày: 03/07/2021 | Lượt xem: 614 | Lượt tải: 1