Bài giảng Lý thuyết xác suất và thống kê toán - Bài 1: Mở đầu

Thống kê và Xác suất ▪ Thống kê có hai nhánh chính ▪ Thống kê mô tả (Descriptive Statistics): sắp xếp, tổng hợp, trình bày dữ liệu theo những cách hợp lý, thuận tiện nhất. ▪ Thống kê suy diễn (Inferential Statistics): dự đoán, kiểm chứng, phân tích dữ liệu để có các kết luận tổng quát. ▪ Kết nối là Lý thuyết xác suất ▪ Thống kê mô tả là thông tin cơ bản cho thống kê suy diễn ▪ Tổng thể (Population): tất cả các phần tử cần quan tâm • Kích thước tổng thể: N, có thể vô hạn • Giá trị tính từ tổng thể: Tham số (parameter) ▪ Mẫu (Sample): tập con rút ra từ tổng thể • Kích thước mẫu: n, hữu hạn • Giá trị tính từ mẫu: Thống

pdf40 trang | Chia sẻ: thanhle95 | Lượt xem: 311 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Bài giảng Lý thuyết xác suất và thống kê toán - Bài 1: Mở đầu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Bài giảng LÝ THUYẾT XÁC SUẤT & THỐNG KÊ TOÁN ĐẠI HỌC KINH TẾ QUỐC DÂN KHOA TOÁN KINH TẾ Bộ môn Toán kinh tế 1 www.mfe.neu.edu.vn 2019 Thông tin học phần ▪ Tiếng Anh: Probability and Mathematical Statistics ▪ Số tín chỉ: 3 Thời lượng: 45 tiết ▪ Đánh giá: • Điểm do giảng viên đánh giá: 10% • Điểm kiểm tra giữa kỳ: 20% • Điểm kiểm tra cuối kỳ (90 phút): 70% ▪ Không tham gia quá 20% số tiết không được thi LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 2 ▪ Thông tin chi tiết về Giảng dạy và học tập học phần: ▪ www.mfe.edu.vn  Thông tin  Hướng dẫn học tập  “Hướng dẫn giảng dạy học tập học phần Lý thuyết xác suất và Thống kê toán” • Đề cương chi tiết • Hướng dẫn thực hành Excel • Bảng số và công thức cơ bản • Một số bài tập bổ sung • Nội dung giảng dạy học tập cụ thể LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 3 Thông tin học phần Thông tin giảng viên ▪ Giảng viên: ▪ Giảng viên Bộ môn Toán kinh tế - Khoa Toán kinh tế - ĐH Kinh tế quốc dân ▪ Email: @neu.edu.vn ▪ Phone: ▪ Group: ▪ Trang web: www.mfe.neu.edu.vn/ LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 4 Tài liệu ▪ [1] Nguyễn Cao Văn, Trần Thái Ninh, Ngô Văn Thứ (2015), Giáo trình Lý thuyết xác suất và Thống kê toán, NXB ĐHKTQD. ▪ [2] Paul Newbold, William L. Carlson, Betty Thorne (2013), Statistics for Business and Economics, 8th edition, Pearson. ▪ [3] Anderson, Sweeney, Willams, Camm, Cochran (2017), Statistics for Business and Economics, 12th edition, South-Western. ▪ Website: www.mfe.neu.edu.vn LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 5 Nhà khoa học ▪ Thế kỉ 16: Galilei O Galile (Italia) ▪ Thế kỉ 17: Blaise Pascal, Piere de Fermat (Pháp), Christian Huygens (Hà Lan), Jakob Bernoulli (Thụy Sĩ) ▪ Thế kỉ 18: Nicolaus Bernoulli (Thụy Sĩ), Thomas Bayes (Anh), Pierre Simon Laplace (Pháp) ▪ Thế kỉ 19: Carl Friedrich Gauss (Đức), Simeon Denis Poisson (Pháp), Pafuni Chebyshev (Nga), Francis Galton, Karl Pearson (Anh) ▪ Thế kỉ 20: Charles Spearman, Royal Aylmer Fisher (Anh), Andrei Kolmogorov (Nga) LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 6 NỘI DUNG BÀI 1: MỞ ĐẦU BÀI 2: BIẾN CỐ VÀ XÁC SUẤT BÀI 3: BIẾN NGẪU NHIÊN RỜI RẠC VÀ QUY LUẬT PHÂN PHỐI XÁC SUẤT BÀI 4: BIẾN NGẪU NHIÊN LIÊN TỤC VÀ QUY LUẬT PHÂN PHỐI XÁC SUẤT BÀI 5: BIẾN NGẪU NHIÊN HAI CHIỀU BÀI 6: LUẬT SỐ LỚN BÀI 7: MẪU NGẪU NHIÊN BÀI 8: ƯỚC LƯỢNG THAM SỐ BÀI 9: KIỂM ĐỊNH GIẢ THUYẾT LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 7 BÀI 1 – MỞ ĐẦU ▪ 1.1. Các khái niệm cơ bản • Thống kê – Xác suất • Tổng thể, mẫu, quan sát, biến ▪ 1.2. Bảng biểu – Đồ thị • Bảng tần số, tần suất • Đồ thị tròn, cột, phân phối giá trị ▪ 1.3. Thống kê mô tả • Nhóm xu thế trung tâm • Nhóm đo độ phân tán • Nhóm hình dáng phân phối, mối quan hệ LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 8 1.1. CÁC KHÁI NIỆM CƠ BẢN THỐNG KÊ (STATISTICS) ▪ Thu thập dữ liệu ▪ Xử lý dữ liệu ▪ Trình bày, biểu diễn dữ liệu ▪ Phân tích dữ liệu để có được thông tin ở mức cao hơn ▪ Suy diễn về thông tin LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 9 Thống kê Thông tin ban đầu (Dữ liệu) Thông tin cao cấp hơn (Kết quả) Thống kê và Xác suất ▪ Thống kê có hai nhánh chính ▪ Thống kê mô tả (Descriptive Statistics): sắp xếp, tổng hợp, trình bày dữ liệu theo những cách hợp lý, thuận tiện nhất. ▪ Thống kê suy diễn (Inferential Statistics): dự đoán, kiểm chứng, phân tích dữ liệu để có các kết luận tổng quát. ▪ Kết nối là Lý thuyết xác suất ▪ Thống kê mô tả là thông tin cơ bản cho thống kê suy diễn LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 10 Tổng thể và Mẫu ▪ Tổng thể (Population): tất cả các phần tử cần quan tâm • Kích thước tổng thể: N, có thể vô hạn • Giá trị tính từ tổng thể: Tham số (parameter) ▪ Mẫu (Sample): tập con rút ra từ tổng thể • Kích thước mẫu: n, hữu hạn • Giá trị tính từ mẫu: Thống kê (statistic) LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 11 Cấu trúc dữ liệu truyền thống ▪ Gồm: Quan sát / bản ghi – Biến / trường – Giá trị ▪ (Observation / record – Variable / field – Value) LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 12 Biến TT Họ tên Giới Tuổi Điểm T.Anh Điểm Toán Q u a n s á t 1 Nguyễn A M 19 A 8 2 Trần T. F 20 C 9 3 Lê . M 20 B 7 . . Phân loại biến ▪ Định tính (Qualitative) và Định lượng (Quantitative) ▪ Biến định tính: Định danh và Thứ bậc • Định danh (Nominal): VD: Tên, địa chỉ, ngành học • Thứ bậc (Ordinal): VD: Thứ hạng, cỡ giày, • Riêng: Nhị phân (binary): Đúng / Sai, Nam / Nữ ▪ Biến Định lượng (Quantitative): có đơn vị đo lường • Rời rạc (Discrete): VD: tuổi, số buổi học, • Liên tục (Continuous): VD: thời gian, cân nặng • Biến định lượng có thể sử dụng để xác định biến định tính LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 13 Phân loại biến LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 14 Định tính Định lượng Định danh Thứ bậc Rời rạc Liên tục Liệt kê Nhóm, gộp Liệt kê, nhóm Sắp xếp thứ tự, so sánh Liệt kê, nhóm, gộp Sắp xếp thứ tự, so sánh Tính toán, +, -, × , ÷ , Mã hóa bởi con số Sử dụng để xếp hạng Thang đo Likert ▪ Sử dụng trong các bảng hỏi đánh giá, nhận xét ▪ Thang Likert 5 bậc, 7 bậc LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 15 Rất không đồng ý Không đồng ý Không ý kiến Đồng ý Rất đồng ý 1 2 3 4 5 Hoàn toàn không đồng ý Rất không đồng ý Không đồng ý Không ý kiến Đồng ý Rất đồng ý Hoàn toàn đồng ý 1 2 3 4 5 6 7 1.2. BẢNG BIỂU & ĐỒ THỊ ▪ Bảng tần số, tần suất, tần suất tích lũy ▪ Đồ thị tròn (pie chart), cột (column chart, bar chart) ▪ Đồ thị phân phối giá trị (histogram) ▪ Đồ thị rải điểm (scatter plot) ▪ [1] Chương 6, trang 312 – 323. ▪ [2] Chapter 1, pp. 8 – 38. ▪ [3] Chapter 2, pp. 33 – 98. LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 16 Ví dụ: Dữ liệu VHLSS 2012 No. Khu vực Số người Thu nhập (triệu VND) So với toàn quốc 1 Thành thị 3 130,8 Cao 2 Thành thị 5 133,1 TB cao 3 Nông thôn 4 104,3 TB thấp 420 Nông thôn 7 25,7 Thấp LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 17 ▪ Dữ liệu hộ gia đình ở Hà Nội, n = 420 quan sát Tần số & Tần suất (tỷ lệ) LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 18 Khu vực Thành thị Nông thôn Tần số 183 237 Khu vực Thành thị Nông thôn Tần suất Tỷ lệ, phần trăm 0,436 43,6 % 0,564 56,4 % ▪ Bảng tần số (frequency table) của biến Khu vực ▪ Bảng tần suất (relative frequency) hay tỷ lệ (proportion) Tần suất = Tần số Tổng số phần tử Đồ thị tròn (pie chart) 183 44% 237 56% Khu vực Thành thị Nông thôn LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 19 Khu vực Thành thị Nông thôn Tần số 183 237 Tỷ lệ 43,6% 56,4% So với toàn quốc Cao TB cao TB thấp Thấp Tần số 205 104 78 33 % 49% 25% 19% 8% 205 49% 104 25% 78 18% 33 8% So sánh với toàn quốc Cao TB cao TB thấp Thấp Đồ thị cột (column chart) LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 20 So với toàn quốc Tần số % Cao 205 49% TB cao 104 25% TB thấp 78 19% Thấp 33 8% Tổng 420 100% 205 104 78 33 0 50 100 150 200 250 Cao TB cao TB thấp Thấp So với toàn quốc Đồ thị cột: phân phối giá trị (histogram) LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 21 SN 1 2 3 4 5 6 7 8 9 Tổng Tần số 22 54 78 139 74 33 12 4 4 420 % 5% 13% 19% 33% 18% 8% 3% 1% 1% 100% 5% 13% 19% 33% 18% 8% 3% 1% 1% 1 2 3 4 5 6 7 8 9 Quy mô hộ gia đình Hình dạng của phân phối giá trị ▪ Phân phối đối xứng và bất đối xứng LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 22 Đối xứng, dạng chuông (Symmertrical) Lệch phải (lệch dương) Positively skewed Right skewed Lệch trái (lệch âm) Negatively skewed Left skewed Bất đối xứng / phân phối lệch Đồ thị rải điểm (scatter plot) 0 50 100 150 200 250 300 10 12 14 16 18 20 O u tp u t Labor Output – Labor relationship LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 23 Labor Output Labor Output 11 80 15 250 11 130 16 220 12 150 17 210 13 110 18 240 13 150 18 200 13 200 17 260 15 170 19 240 14 180 19 280 ▪ Sử dụng với số liệu hai chiều Tương quan giữa hai biến định lượng ▪ Dạng cơ bản của đồ thị điểm hai biến định lượng LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 24 Tương quan Dương Yếu Mạnh Tương quan Âm Không Tương quan r = 0,5 r = – 0,5 r = 0,8 r = 0 1.3. THỐNG KÊ MÔ TẢ ▪ Xu thế trung tâm: Trung bình, trung vị, mốt ▪ Các vị trí: tứ phân vị, các phân vị ▪ Đo độ phân tán: Phương sai, độ lệch chuẩn, hệ số biến thiên, khoảng biến thiên, khoảng tứ phân vị ▪ Hình dáng phân phối: Hệ số bất đối xứng, hệ số nhọn ▪ Đo độ liên hệ: Hiệp phương sai, hệ số tương quan ▪ [1] Chương 6 LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 25 Nhóm xu thế trung tâm ▪ Dùng một giá trị đại diện cho bộ số liệu ▪ Ba thống kê xu thế trung tâm thường sử dụng: • Trung bình (mean) • Trung vị (median) • Mốt (mode) LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 26 Trung bình (mean) LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 27 Tổng thể Mẫu Dữ liệu: {𝑥1, 𝑥2, , 𝑥𝑁} Dữ liệu: {𝑥1, 𝑥2, , 𝑥𝑛} 𝝁 = 𝒙𝟏 + 𝒙𝟐 + ⋯ + 𝒙𝑵 𝑵 ഥ𝒙 = 𝒙𝟏 + 𝒙𝟐 + ⋯ + 𝒙𝒏 𝒏 ▪ Trung bình = ▪ Dùng cho biến định lượng ▪ Có cùng đơn vị với biến Trung bình có trọng số ▪ Nếu số liệu dạng có trọng số (weighted data) ▪ Giá trị 𝑥𝑖 có trọng số là 𝑤𝑖 ▪ Trung bình có trọng số (weighted mean): ഥ𝒙 = 𝒘𝟏𝒙𝟏 + 𝒘𝟐𝒙𝟐 + ⋯ + 𝒘𝒌𝒙𝒌 𝒘𝟏 + 𝒘𝟐 + ⋯ + 𝒘𝒌 = σ𝒘𝒊𝒙𝒊 σ𝒘𝒊 ▪ Ví dụ: LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 28 Giá bán (triệu / kg) 10 12 14 16 Số lượng (kg) 3 10 5 2 Trung vị (median) ▪ Là giá trị trung tâm của bộ dữ liệu khi dữ liệu được sắp xếp từ nhỏ nhất đến lớn nhất ▪ Sử dụng số liệu về số lần mua hàng: 5, 2, 7, 4, 2 • Sắp xếp theo thứ tự tăng dần: 2,2,4,5,7 → 𝑚𝑑 = 4 ▪ Khi n lẻ, 𝑚𝑑 nhận giá trị tại quan sát thứ 𝑛+1 2 ▪ Khi n chẵn, 𝑚𝑑 nhận giá trị là trung bình cộng của 2 giá trị đứng giữa. ▪ Ví dụ với dữ liệu: 3, 8, 12, 14 LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 29 Mốt (mode) ▪ Là giá trị xuất hiện ít nhất 2 lần và xuất hiện thường xuyên nhất trong bộ dữ liệu ▪ Sử dụng số liệu về số lần mua hàng: • Dữ liệu : 2, 5, 7, 4, 2 → 𝑚0 = 𝟐 LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 30 Các thống kê Xu thế Trung tâm Các loại biến Định danh (Nomial) Thứ bậc (Ordinal) Định tính (Interval) Trung bình  Trung vị   Mốt    Nhóm thống kê đo độ phân tán Đo độ phân tán hoặc mức độ “đồng đều” (homogeneity) của biến định lượng ▪ Khoảng biến thiên (Range) ▪ Phương sai (Variance) ▪ Độ lệch chuẩn (Standard Deviation) ▪ Hệ số biến thiên (Coefficient of Variation) ▪ Khoảng tứ phân vị (Interquartile Range) LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 31 Khoảng biến thiên ▪ Thống kê đơn giản nhất đo độ biến động của bộ dữ liệu là khoảng biến thiên: ▪ Range = Giá trị lớn nhất – Giá trị nhỏ nhất ▪ Ví dụ: Khoảng biến thiên thu nhập 5 lao động: 12, 10, 8, 20, 21 LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 32 Phương sai và độ lệch chuẩn LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 33 Tổng thể Mẫu Số liệu {𝑥1, 𝑥2, , 𝑥𝑁} {𝑥1, 𝑥2, , 𝑥𝑛} Trung bình 𝝁 = σ𝒙𝒊 𝑵 ഥ𝒙 = σ𝒙𝒊 𝒏 Tổng bình phương 𝑆𝑆 = σ 𝑥𝑖 − 𝜇 2 𝑆𝑆 = σ 𝑥𝑖 − ҧ𝑥 2 Phương sai 𝝈𝟐 = 𝑆𝑆 𝑵 𝒔𝟐 = 𝑆𝑆 𝒏 − 𝟏 Độ lệch chuẩn 𝜎 = 𝜎2 𝑠 = 𝑠2 Phương sai và độ lệch chuẩn ▪ Ví dụ: Tính các thống kê phương sai, độ lệch chuẩn LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 34 Tổng thể Mẫu Số liệu 10, 12, 15, 10, 12, 13, 18, 19, 14, 15 10, 12, 14, 15, 19 Trung bình 𝝁 = ഥ𝒙 = Tổng bình phương 𝑆𝑆 = 𝑆𝑆 = Phương sai 𝝈𝟐 = 𝒔𝟐 = Độ lệch chuẩn 𝜎 = 𝑠 = Hệ số biến thiên ▪ Phương sai, độ lệch chuẩn đo độ biến động tuyệt đối ▪ Hệ số biến thiên đo độ biến động tương đối 𝐶𝑉𝑡ổ𝑛𝑔 𝑡ℎể = 𝜎 𝜇 × 100% 𝐶𝑉𝑚ẫ𝑢 = 𝑠 ҧ𝑥 × 100% ▪ Ví dụ: Tính hệ số biến thiên của hai số liệu trong ví dụ trước LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 35 Tứ phân vị (Quartile) ▪ 𝑄1, 𝑄2, 𝑄3 chia bộ dữ liệu thành 4 phần với số lượng phần tử bằng nhau ▪ Tứ phân vị thứ hai chính là trung vị ▪ Khoảng tứ phân vị: 𝐼𝑄𝑅 = 𝑄3 − 𝑄1 ▪ IQR cũng dùng để đánh giá độ phân tán của bộ dữ liệu ▪ Sử dụng khoảng (𝑄1 − 1,5 ⋅ 𝐼𝑄𝑅 ; 𝑄3 + 1,5 ⋅ 𝐼𝑄𝑅) là 1 tiêu chuẩn để xác định giá trị ngoại lai (outlier) LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 36 Giá trị chuẩn hóa ▪ Giá trị chuẩn hóa còn gọi là Z-score, dùng để xác định vị trí tương đối của 1 giá trị cụ thể so với trung bình của tập dữ liệu 𝑧𝑖 (tổng thể) = 𝑥𝑖 − 𝜇 𝜎 𝑧𝑖 (mẫu) = 𝑥𝑖 − ҧ𝑥 𝑠 ▪ Z-score có trung bình bằng 0, phương sai bằng 1 ▪ Ví dụ: Tính Z-score của các giá trị của mẫu sau LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 37 𝒙𝒊 5 8 9 10 15 𝑧𝑖 Thống kê mô tả hình dạng phân phối ▪ Tính cho mẫu ▪ Hệ số bất đối xứng (Skewness) 𝑎3: 𝑎3 = σ 𝑥𝑖 − ҧ𝑥 3/𝑛 𝑠3 ▪ Hệ số nhọn 𝑎4: 𝑎4 = σ 𝑥𝑖 − ҧ𝑥 4/𝑛 𝑠4 ▪ Lưu ý: trong một số phần mềm như Excel, hệ số bất đối xứng Kurtosis = 𝑎4 − 3 LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 38 Thống kê mô tả mức độ liên hệ ▪ Hai biến 𝑋 và 𝑌 là số liệu theo cặp (𝑥𝑖 , 𝑦𝑖) LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 39 Tổng thể Mẫu Hiệp phương sai Covariance 𝐶𝑜𝑣 𝑋, 𝑌 = σ 𝑥𝑖 − 𝜇𝑋 𝑦𝑖 − 𝜇𝑌 𝑁 𝑐𝑜𝑣 𝑋, 𝑌 = σ 𝑥𝑖 − ҧ𝑥 𝑦𝑖 − ത𝑦 𝑛 − 1 Hệ số tương quan Correlation 𝜌𝑋,𝑌 = 𝐶𝑜𝑣 𝑋, 𝑌 𝜎𝑋𝜎𝑌 𝑟𝑋,𝑌 = 𝐶𝑜𝑣 𝑋, 𝑌 𝑠𝑋𝑠𝑌 Hiệp phương sai - hệ số tương quan ▪ Hệ số tương quan nằm trong đoạn [−1,1] ▪ Hệ số tương quan càng gần 0: càng yếu, lỏng ▪ Hệ số tương quan càng gần ±1: càng mạnh, chặt ▪ Ví dụ: Tính hiệp phương sai và hệ số tương quan của mẫu sau LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 40 𝒙𝒊 𝒚𝒊 2 4 5 5 8 7 7 8 9 10