Bài giảng Lý thuyết xác suất và thống kê toán (Mới)

Tổng thể và Mẫu ▪ Tổng thể (Population): tất cả các phần tử cần quan tâm • Kích thước tổng thể: N, có thể vô hạn • Giá trị tính từ tổng thể: Tham số (parameter) ▪ Mẫu (Sample): tập con rút ra từ tổng thể • Kích thước mẫu: n, hữu hạn • Giá trị tính được: Thống kê (statistic) Phân loại biến ▪ Định tính (Qualitative) và Định lượng (Quantitative) ▪ Biến định tính: Định danh và Thứ bậc • Định danh (Nominal): VD: Tên, địa chỉ, ngành học • Thứ bậc (Ordinal): VD: Thứ hạng, cỡ giày, • Riêng: Nhị phân (binary): Đúng / Sai, Nam / Nữ ▪ Biến Định lượng (Quantitative): có đơn vị đo lường • Rời rạc (Discrete): VD: tuổi, số buổi học, • Liên tục (Continuous): VD: thời gian, cân nặng • Biến định lượng có thể sử dụng để xác định biến định tính

pdf89 trang | Chia sẻ: thanhle95 | Lượt xem: 326 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Bài giảng Lý thuyết xác suất và thống kê toán (Mới), để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
BTEC - SFM www.mfe.edu.vn/buiduonghai 1 Bài giảng LÝ THUYẾT XÁC SUẤT & THỐNG KÊ TOÁN ĐẠI HỌC KINH TẾ QUỐC DÂN KHOA TOÁN KINH TẾ Bộ môn Toán kinh tế 1 www.mfe.neu.edu.vn 2019 Thông tin học phần ▪ Tiếng Anh: Probability and Mathematical Statistics ▪ Số tín chỉ: 3 Thời lượng: 45 tiết ▪ Đánh giá: • Điểm do giảng viên đánh giá: 10% • Điểm kiểm tra giữa kỳ: 20% • Điểm kiểm tra cuối kỳ (90 phút): 70% ▪ Không tham gia quá 20% số tiết không được thi LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 2 ▪ Thông tin chi tiết về Giảng dạy và học tập học phần: ▪ www.mfe.edu.vn  Văn bản quan trọng “Hướng dẫn giảng dạy học tập học phần Lý thuyết xác suất và Thống kê toán” • Đề cương chi tiết • Hướng dẫn thực hành Excel • Bảng số và công thức cơ bản • Một số đề thi và bài tập • Nội dung giảng dạy học tập cụ thể LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 3 Thông tin học phần 1 2 3 BTEC - SFM www.mfe.edu.vn/buiduonghai 2 Thông tin giảng viên ▪ Giảng viên: Nguyễn Thị Thùy Trang ▪ Giảng viên Bộ môn Toán kinh tế - Khoa Toán kinh tế - ĐH Kinh tế quốc dân ▪ Email: thuytrang@neu.edu.vn ▪ Phone: 0985984389 ▪ Group: ▪ Trang web: www.mfe.neu.edu.vn/nguyenthithuytrang LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 4 Tài liệu ▪ [1] Nguyễn Cao Văn, Trần Thái Ninh, Ngô Văn Thứ (2015), Giáo trình Lý thuyết xác suất và Thống kê toán, NXB ĐHKTQD. ▪ [2] Bùi Dương Hải (2016), Tài liệu hướng dẫn thực hành Excel, Lưu hành hội bộ. ▪ [3] Paul Newbold, William L. Carlson, Betty Thorne (2010), Statistics for Business and Economics, 7th edition, Pearson. ▪ Website: www.mfe.neu.edu.vn LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 5 Thông tin lớp học LMS + Tài liệu ▪ Thông tin lớp học LMS ▪ Toàn bộ tài liệu+các thông tin liên quan sẽ được đăng tải và update liên tục trên: www.mfe.edu.vn/nguyen thithuytrang LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 6 4 5 6 BTEC - SFM www.mfe.edu.vn/buiduonghai 3 Nhà khoa học ▪ Thế kỉ 16: Galilei O Galile (Italia) ▪ Thế kỉ 17: Blaise Pascal, Piere de Fermat (Pháp), Christian Huygens (Hà Lan), Jakob Bernoulli (Thụy Sĩ) ▪ Thế kỉ 18: Nicolaus Bernoulli (Thụy Sĩ), Thomas Bayes (Anh), Pierre Simon Laplace (Pháp) ▪ Thế kỉ 19: Carl Friedrich Gauss (Đức), Simeon Denis Poisson (Pháp), Pafuni Chebyshev (Nga), Francis Galton, Karl Pearson (Anh) ▪ Thế kỉ 20: Charles Spearman, Royal Aylmer Fisher (Anh), Andrei Kolmogorov (Nga) LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 7 NỘI DUNG ▪ BÀI 1: MỞ ĐẦU ▪ BÀI 2: BIẾN CỐ VÀ XÁC SUẤT ▪ BÀI 3: BIẾN NGẪU NHIÊN RỜI RẠC VÀ QUY LUẬT PHÂN PHỐI XÁC SUẤT ▪ BÀI 4: BIẾN NGẪU NHIÊN LIÊN TỤC VÀ QUY LUẬT PHÂN PHỐI XÁC SUẤT ▪ BÀI 5: BIẾN NGẪU NHIÊN HAI CHIỀU ▪ BÀI 6: LUẬT SỐ LỚN ▪ BÀI 7: MẪU NGẪU NHIÊN ▪ BÀI 8: ƯỚC LƯỢNG THAM SỐ ▪ BÀI 9: KIỂM ĐỊNH GIẢ THUYẾT LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 8 BÀI 1 – MỞ ĐẦU ▪ 1.1. Các khái niệm cơ bản ▪ 1.2. Bảng biểu – Đồ thị ▪ 1.3. Thống kê mô tả LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 9 7 8 9 BTEC - SFM www.mfe.edu.vn/buiduonghai 4 1.1. CÁC KHÁI NIỆM CƠ BẢN ▪ Khái niệm về Thống kê ▪ Hai nhánh của thống kê ▪ Tổng thể và Mẫu ▪ Cấu trúc dữ liệu cơ bản ▪ Các loại biến, Thang đo ▪ Nguồn gốc dữ liệu ▪ [1] Chương 6, trang 295, 306, 308 – 312. ▪ [2] Chapter 1, pp. 1 – 7. ▪ [3] Chapter 1, pp. 1 – 22. LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 10 Thống kê (Statistics) ▪ Thu thập dữ liệu ▪ Xử lý dữ liệu ▪ Trình bày, biểu diễn dữ liệu ▪ Phân tích dữ liệu để có được thông tin ở mức cao hơn ▪ Suy diễn về thông tin LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 11 Thống kê Thông tin ban đầu (Dữ liệu) Thông tin cao cấp hơn (Kết quả) Hai nhánh của Thống kê ▪ Có hai nhánh chính ▪ Thống kê mô tả (Descriptive Statistics): sắp xếp, tổng hợp, trình bày dữ liệu theo những cách hợp lý, thuận tiện nhất. ▪ Thống kê suy diễn (Inferential Statistics): dự đoán, kiểm chứng, phân tích dữ liệu để có các kết luận tổng quát. ▪ Thống kê mô tả là thông tin cơ bản cho thống kê suy diễn LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 12 10 11 12 BTEC - SFM www.mfe.edu.vn/buiduonghai 5 Tổng thể và Mẫu ▪ Tổng thể (Population): tất cả các phần tử cần quan tâm • Kích thước tổng thể: N, có thể vô hạn • Giá trị tính từ tổng thể: Tham số (parameter) ▪ Mẫu (Sample): tập con rút ra từ tổng thể • Kích thước mẫu: n, hữu hạn • Giá trị tính được: Thống kê (statistic) LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 13 Cấu trúc dữ liệu truyền thống ▪ Gồm: Quan sát / bản ghi – Biến / trường – Giá trị ▪ (Observation / record – Variable / field – Value) LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 14 Biến TT Họ tên Giới Tuổi Điểm T.Anh Điểm Toán Q u a n s á t 1 Nguyễn A M 19 A 8 2 Trần T. F 20 C 9 3 Lê . M 20 B 7 . . Phân loại biến ▪ Định tính (Qualitative) và Định lượng (Quantitative) ▪ Biến định tính: Định danh và Thứ bậc • Định danh (Nominal): VD: Tên, địa chỉ, ngành học • Thứ bậc (Ordinal): VD: Thứ hạng, cỡ giày, • Riêng: Nhị phân (binary): Đúng / Sai, Nam / Nữ ▪ Biến Định lượng (Quantitative): có đơn vị đo lường • Rời rạc (Discrete): VD: tuổi, số buổi học, • Liên tục (Continuous): VD: thời gian, cân nặng • Biến định lượng có thể sử dụng để xác định biến định tính LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 15 13 14 15 BTEC - SFM www.mfe.edu.vn/buiduonghai 6 Phân loại biến LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 16 Định tính Định lượng Định danh Thứ bậc Rời rạc Liên tục Liệt kê Nhóm, gộp Liệt kê, nhóm Sắp xếp thứ tự, so sánh Liệt kê, nhóm, gộp Sắp xếp thứ tự, so sánh Tính toán, +, -, × , ÷ , Mã hóa bởi con số Sử dụng để xếp hạng Thang đo Likert ▪ Sử dụng trong các bảng hỏi đánh giá, nhận xét ▪ Thang Likert 5 bậc, 7 bậc LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 17 Rất không đồng ý Không đồng ý Không ý kiến Đồng ý Rất đồng ý 1 2 3 4 5 Hoàn toàn không đồng ý Rất không đồng ý Không đồng ý Không ý kiến Đồng ý Rất đồng ý Hoàn toàn đồng ý 1 2 3 4 5 6 7 1.2. BẢNG BIỂU & ĐỒ THỊ ▪ Bảng tần số, tần suất, tần suất tích lũy ▪ Đồ thị tròn (pie chart), cột (column chart, bar chart) ▪ Đồ thị phân phối giá trị (histogram) ▪ Đồ thị rải điểm (scatter plot) ▪ [1] Chương 6, trang 312 – 323. ▪ [2] Chapter 1, pp. 8 – 38. ▪ [3] Chapter 2, pp. 33 – 98. LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 18 16 17 18 BTEC - SFM www.mfe.edu.vn/buiduonghai 7 Ví dụ: Dữ liệu VHLSS 2012 No. Khu vực Số người Thu nhập (triệu VND) So với toàn quốc 1 Thành thị 3 130,8 Cao 2 Thành thị 5 133,1 TB cao 3 Nông thôn 4 104,3 TB thấp 420 Nông thôn 7 25,7 Thấp LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 19 ▪ Dữ liệu hộ gia đình ở Hà Nội, n = 420 quan sát Tần số & Tần suất (tỷ lệ) LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 20 Khu vực Thành thị Nông thôn Tần số 183 237 Khu vực Thành thị Nông thôn Tần suất Tỷ lệ, phần trăm 0,436 43,6 % 0,564 56,4 % ▪ Bảng tần số (frequency table) của biến Khu vực ▪ Bảng tần suất (relative frequency) hay tỷ lệ (proportion) Tần suất = Tần số Tổng số phần tử Đồ thị tròn (pie chart) 183 44% 237 56% Khu vực Thành thị Nông thôn LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 21 Khu vực Thành thị Nông thôn Tần số 183 237 Tỷ lệ 43,6% 56,4% So với toàn quốc Cao TB cao TB thấp Thấp Tần số 205 104 78 33 % 49% 25% 19% 8% 205 49% 104 25% 78 18% 33 8% So sánh với toàn quốc Cao TB cao TB thấp Thấp 19 20 21 BTEC - SFM www.mfe.edu.vn/buiduonghai 8 Đồ thị cột (column chart) LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 22 So với toàn quốc Tần số % Cao 205 49% TB cao 104 25% TB thấp 78 19% Thấp 33 8% Tổng 420 100% 205 104 78 33 0 50 100 150 200 250 Cao TB cao TB thấp Thấp So với toàn quốc Đồ thị cột: phân phối giá trị (histogram) LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 23 SN 1 2 3 4 5 6 7 8 9 Tổng Tần số 22 54 78 139 74 33 12 4 4 420 % 5% 13% 19% 33% 18% 8% 3% 1% 1% 100% 5% 13% 19% 33% 18% 8% 3% 1% 1% 1 2 3 4 5 6 7 8 9 Quy mô hộ gia đình Hình dạng của phân phối giá trị ▪ Phân phối đối xứng và bất đối xứng LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 24 Đối xứng, dạng chuông (Symmertrical) Lệch phải (lệch dương) Positively skewed Right skewed Lệch trái (lệch âm) Negatively skewed Left skewed Bất đối xứng / phân phối lệch 22 23 24 BTEC - SFM www.mfe.edu.vn/buiduonghai 9 Đồ thị rải điểm (scatter plot) 0 50 100 150 200 250 300 10 12 14 16 18 20 O u tp u t Labor Output – Labor relationship LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 25 Labor Output Labor Output 11 80 15 250 11 130 16 220 12 150 17 210 13 110 18 240 13 150 18 200 13 200 17 260 15 170 19 240 14 180 19 280 ▪ Sử dụng với số liệu hai chiều Tương quan giữa hai biến định lượng ▪ Dạng cơ bản của đồ thị điểm hai biến định lượng LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 26 Tương quan Dương Yếu Mạnh Tương quan Âm Không Tương quan r = 0,5 r = – 0,5 r = 0,8 r = 0 1.3. THỐNG KÊ MÔ TẢ ▪ Xu thế trung tâm: Trung bình, trung vị, mốt ▪ Các vị trí: tứ phân vị, các phân vị ▪ Đo độ phân tán: Phương sai, độ lệch chuẩn, hệ số biến thiên, khoảng biến thiên, khoảng tứ phân vị ▪ Hình dáng phân phối: Hệ số bất đối xứng, hệ số nhọn ▪ Đo độ liên hệ: Hiệp phương sai, hệ số tương quan ▪ [1] Chương 6 LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 27 25 26 27 BTEC - SFM www.mfe.edu.vn/buiduonghai 10 Ví dụ ▪ So sánh về điểm Tiếng Anh của 10 sinh viên vào năm thứ nhất và thứ hai LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 28 0 20 40 60 80 100 A B C D E F G H I J Điểm Tiếng Anh năm 1 ĐH 0 20 40 60 80 100 A B C D E F G H I J Điểm Tiếng Anh năm 2 ĐH Nhóm xu thế trung tâm ▪ Dùng một giá trị đại diện cho bộ số liệu ▪ Ba thống kê xu thế trung tâm thường sử dụng: • Trung bình (mean) • Trung vị (median) • Mốt (mode) LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 29 Trung bình (mean) LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 30 Tổng thể Mẫu Dữ liệu: {𝑥1, 𝑥2, , 𝑥𝑁} Dữ liệu: {𝑥1, 𝑥2, , 𝑥𝑛 } 𝝁 = 𝒙𝟏 + 𝒙𝟐 + ⋯ + 𝒙𝑵 𝑵 ഥ𝒙 = 𝒙𝟏 + 𝒙𝟐 + ⋯ + 𝒙𝒏 𝒏 ▪ Trung bình = ▪ Áp dụng cho biến định lượng ▪ Có cùng đơn vị với biến ngẫu nhiên được mô tả trong bộ dữ liệu 28 29 30 BTEC - SFM www.mfe.edu.vn/buiduonghai 11 Trung bình có trọng số ▪ Nếu số liệu dạng có trọng số (weighted data) ▪ Giá trị 𝑥𝑖 có trọng số là 𝑤𝑖 ▪ Trung bình có trọng số (weighted mean): ▪ ഥ𝒙 = 𝒘𝟏𝒙𝟏+𝒘𝟐𝒙𝟐+⋯+𝒘𝒌𝒙𝒌 𝒘𝟏+𝒘𝟐+⋯+𝒘𝒌 = ∑𝒘𝒊𝒙𝒊 ∑𝒘𝒊 ▪ Ví dụ: LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 31 Giá bán (triệu / kg) 10 12 14 16 Số lượng (kg) 3 10 5 2 Trung vị (median) ▪ Là giá trị trung tâm của bộ dữ liệu khi dữ liệu được sắp xếp từ nhỏ nhất đến lớn nhất ▪ Sử dụng số liệu về số lần mua hàng: 5, 2, 7, 4, 2 • Sắp xếp theo thứ tự tăng dần: 2,2,4,5,7 → 𝑚𝑑 = 4 ▪ Khi n lẻ, 𝑚𝑑 nhận giá trị tại quan sát thứ 𝑛+1 2 ▪ Khi n chẵn, 𝑚𝑑 nhận giá trị là trung bình cộng của 2 giá trị đứng giữa. ▪ Ví dụ với dữ liệu: 3, 8, 12, 14 LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 32 Mốt (mode) ▪ Là giá trị xuất hiện ít nhất 2 lần và xuất hiện thường xuyên nhất trong bộ dữ liệu ▪ Sử dụng số liệu về số lần mua hàng: • Dữ liệu : 2, 5, 7, 4, 2 → 𝑚0 = 𝟐 ▪ Ví dụ với dữ liệu: 4, 8, 7, 6, 9, 8, 10, 5, 8 LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 33 31 32 33 BTEC - SFM www.mfe.edu.vn/buiduonghai 12 Nhóm thống kê xu thế trung tâm ▪ Khả năng áp dụng các giá trị xu thế trung tâm LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 34 Các thống kê Xu thế Trung tâm Các loại biến Định danh (Nomial) Thứ bậc (Ordinal) Định tính (Interval) Trung bình x Trung vị x x Mốt x x x Nhóm thống kê đo độ phân tán Đo độ phân tán hoặc mức độ “đồng đều” (homogeneity) của bộ dữ liệu ▪ Khoảng biến thiên (Range) ▪ Phương sai (Variance) ▪ Độ lệch chuẩn (Standard Deviation) ▪ Hệ số biến thiên (Coefficient of Variation) ▪ Khoảng tứ phân vị (Interquartile Range) LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 35 Khoảng biến thiên ▪ Thống kê đơn giản nhất đo độ biến động của bộ dữ liệu là khoảng biến thiên: ▪ Range = Giá trị lớn nhất – Giá trị nhỏ nhất ▪ Ví dụ: Khoảng biến thiên thu nhập 5 lao động: 12, 10, 8, 20, 21 LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 36 34 35 36 BTEC - SFM www.mfe.edu.vn/buiduonghai 13 Phương sai và độ lệch chuẩn LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 37 Tổng thể Mẫu Số liệu {𝑥1, 𝑥2, , 𝑥𝑁} {𝑥1, 𝑥2, , 𝑥𝑛} Trung bình 𝝁 = ∑𝒙𝒊 𝑵 ഥ𝒙 = ∑𝒙𝒊 𝒏 Tổng bình phương 𝑆𝑆 = ∑ 𝑥𝑖 − 𝜇 2 𝑆𝑆 = ∑ 𝑥𝑖 − ҧ𝑥 2 Phương sai 𝝈𝟐 = 𝑆𝑆 𝑵 𝒔𝟐 = 𝑆𝑆 𝒏 − 𝟏 Độ lệch chuẩn 𝜎 = 𝜎2 𝑠 = 𝑠2 Phương sai và độ lệch chuẩn ▪ Ví dụ: Tính các thống kê phương sai, độ lệch chuẩn LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 38 Tổng thể Mẫu Số liệu 10, 12, 15, 10, 12, 13, 18, 19, 14, 15 10, 12, 14, 15, 19 Trung bình 𝝁 = ഥ𝒙 = Tổng bình phương 𝑆𝑆 = 𝑆𝑆 = Phương sai 𝝈𝟐 = 𝒔𝟐 = Độ lệch chuẩn 𝜎 = 𝑠 = Phương sai và độ lệch chuẩn ▪ Phương sai và độ lệch chuẩn đo mức độ phân tán, biến động, dao động, đồng đều, ổn định của số liệu ▪ Phương sai lớn hơn → phân tán hơn, biến động hơn Phương sai nhỏ hơn → đồng đều hơn, ổn định hơn ▪ Phương sai có đơn vị là bình phương đơn vị của biến ▪ Độ lệch chuẩn có đơn vị giống đơn vị của biến LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 39 37 38 39 BTEC - SFM www.mfe.edu.vn/buiduonghai 14 Hệ số biến thiên ▪ Phương sai, độ lệch chuẩn đo độ biến động tuyệt đối ▪ Hệ số biến thiên đo độ biến động tương đối 𝐶𝑉𝑡ổ𝑛𝑔 𝑡ℎể = 𝜎 𝜇 × 100% 𝐶𝑉𝑚ẫ𝑢 = 𝑠 ҧ𝑥 × 100% ▪ Ví dụ: Tính hệ số biến thiên của hai số liệu trong ví dụ trước LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 40 Tứ phân vị (Quartile) ▪ 𝑄1, 𝑄2, 𝑄3 chia bộ dữ liệu thành 4 phần với số lượng phần tử bằng nhau ▪ Tứ phân vị thứ hai chính là trung vị ▪ Khoảng tứ phân vị: 𝐼𝑄𝑅 = 𝑄3 − 𝑄1 ▪ IQR cũng dùng để đánh giá độ phân tán của bộ dữ liệu ▪ Sử dụng khoảng (𝑄1 − 1,5 ⋅ 𝐼𝑄𝑅 ; 𝑄3 + 1,5 ⋅ 𝐼𝑄𝑅) là 1 tiêu chuẩn để xác định giá trị ngoại lai (outlier) LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 41 Giá trị chuẩn hóa ▪ Giá trị chuẩn hóa còn gọi là Z-score, dùng để xác định vị trí tương đối của 1 giá trị cụ thể so với trung bình của tập dữ liệu 𝑧𝑖 (tổng thể) = 𝑥𝑖 − 𝜇 𝜎 𝑧𝑖 (mẫu) = 𝑥𝑖 − ҧ𝑥 𝑠 ▪ Z-score có trung bình bằng 0, phương sai bằng 1 ▪ Ví dụ: Tính Z-score của các giá trị của mẫu sau LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 42 𝒙𝒊 5 8 9 10 15 𝑧𝑖 40 41 42 BTEC - SFM www.mfe.edu.vn/buiduonghai 15 Thống kê mô tả hình dạng phân phối ▪ Tính cho mẫu ▪ Hệ số bất đối xứng (Skewness) 𝑎3: 𝑎3 = ∑ 𝑥𝑖 − ҧ𝑥 3/𝑛 𝑠3 ▪ Hệ số nhọn 𝑎4: 𝑎4 = ∑ 𝑥𝑖 − ҧ𝑥 4/𝑛 𝑠4 ▪ Lưu ý: trong một số phần mềm như Excel, hệ số bất đối xứng Kurtosis = 𝑎4 − 3 LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 43 Thống kê mô tả mức độ liên hệ ▪ Hai biến 𝑋 và 𝑌 là số liệu theo cặp (𝑥𝑖, 𝑦𝑖) LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 44 Tổng thể Mẫu Hiệp phương sai Covariance 𝐶𝑜𝑣 𝑋, 𝑌 = ∑ 𝑥𝑖 − 𝜇𝑋 𝑦𝑖 − 𝜇𝑌 𝑁 𝑐𝑜𝑣 𝑋, 𝑌 = ∑ 𝑥𝑖 − ҧ𝑥 𝑦𝑖 − ത𝑦 𝑛 − 1 Hệ số tương quan Correlation 𝜌𝑋,𝑌 = 𝐶𝑜𝑣 𝑋, 𝑌 𝜎𝑋𝜎𝑌 𝑟𝑋,𝑌 = 𝐶𝑜𝑣 𝑋, 𝑌 𝑠𝑋𝑠𝑌 Hiệp phương sai - hệ số tương quan ▪ Hệ số tương quan nằm trong đoạn [−1,1] ▪ Hệ số tương quan càng gần 0: càng yếu, lỏng ▪ Hệ số tương quan càng gần ±1: càng mạnh, chặt ▪ Ví dụ: Tính hiệp phương sai và hệ số tương quan của mẫu sau LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 45 𝒙𝒊 𝒚𝒊 2 4 5 5 8 7 7 8 9 10 43 44 45 BTEC - SFM www.mfe.edu.vn/buiduonghai 16 2.1. Phép thử và biến cố 2.2. Xác suất của biến cố 2.3. Các công thức xác suất [1] Chương 1, trang 5-77 [2] Chapter 3, pp. 73-125 [3] Chapter 4, pp.170-214 LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 46 BÀI 2 – BIẾN CỐ VÀ XÁC SUẤT Ví dụ mở đầu Một đề thi xác suất gồm 12 câu hỏi trắc nghiệm. Mỗi câu hỏi có 4 phương án trả lời, với một đáp án đúng. Một sinh viên sẽ thi qua môn nếu có ít nhất 7 câu đúng. Huy có 6 câu trả lời chắc chắn đúng còn 6 câu trả lời được chọn ngẫu nhiên. Tính khả năng xảy ra các trường hợp sau: a) Huy có đúng 7 câu trả lời đúng? b) Huy thi qua môn xác suất? c) Huy trả lời đúng tất cả các câu hỏi? LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 47 Tóm tắt nội dung ▪ Các khái niệm cơ bản: Phép thử, Biến cố (định nghĩa và phân loại), Xác suất (khái niệm, các định nghĩa, nguyên lý xác suất lớn và nhỏ) ▪ Mối quan hệ các biến cố: Kéo theo, tương đương, biến cố tổng, biến cố tích, xung khắc-không xung khắc, độc lập-phụ thuộc, đối lập ▪ Công thức xác suất: định lý cộng, định lý nhân, lược đồ (công thức Bernoulli), công thức xác suất đầy đủ và Bayes. LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 48 46 47 48 BTEC - SFM www.mfe.edu.vn/buiduonghai 17 2.1. CÁC KHÁI NIỆM CƠ BẢN ▪ Định nghĩa 2.1. Thực hiện một nhóm các điều kiện cơ bản để quan sát một hiện tượng nào đó có thể xảy ra hay không gọi là một phép thử (experiment) ▪ Ví dụ: - Gieo 1 con xúc xắc - Tung đồng xu - T(6X,4D)→ 1 quả - Quá trình sản xuất sản phẩm - Ném 1 cái cốc thủy tinh từ tầng 5 xuống đất LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 49 2.1. CÁC KHÁI NIỆM CƠ BẢN ▪ Định nghĩa 2.2. Hiện tượng có thể xảy ra hoặc không xảy ra trong một phép thử được gọi là biến cố (event) ▪ Phân loại: • Biến cố chắc chắn (certain): kí hiệu U hay  • Biến cố không thể có (impossible): kí hiệu V hay  • Biến cố ngẫu nhiên (random): kí hiệu A, B, hay A1, A2, LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 50 ▪ Phân biệt các loại biến cố ngẫu nhiên: - Biến cố cơ sở (kết cục duy nhất) - Biến cố thuận lợi (kết cục thuận lợi) ▪ Ví dụ: Xác định số kết cục duy nhất của phép thử và số kết cục thuận lợi cho biến cố LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 51 49 50 51 BTEC - SFM www.mfe.edu.vn/buiduonghai 18 Phép thử Kết cục Biến cố Tung đồng xu Sấp, ngửa ‘sấp’, ‘ngửa’ Tung xúc xắc 1,2,3,4,5,6 chấm ‘lớn hơn 3’ Tham gia 1 kỳ thi Điểm = 0, 1, 2,, 10 ‘đỗ’; ‘đạt điểm giỏi’ Đầu tư 1 dự án Lợi nhuận: (+), (-), 0 ‘không âm’ ‘có lãi’ Ứng tuyển 1 vị trí Đạt; Bị loại Làm 1 công việc Lương = 52LÝ THUYẾT