Thống kê và Xác suất
▪ Thống kê có hai nhánh chính
▪ Thống kê mô tả (Descriptive Statistics): sắp xếp, tổng
hợp, trình bày dữ liệu theo những cách hợp lý, thuận
tiện nhất.
▪ Thống kê suy diễn (Inferential Statistics): dự đoán,
kiểm chứng, phân tích dữ liệu để có các kết luận tổng
quát.
▪ Kết nối là Lý thuyết xác suất
▪ Thống kê mô tả là thông tin cơ bản cho thống kê suy
diễn
▪ Tổng thể (Population): tất cả các phần tử cần quan
tâm
• Kích thước tổng thể: N, có thể vô hạn
• Giá trị tính từ tổng thể: Tham số (parameter)
▪ Mẫu (Sample): tập con rút ra từ tổng thể
• Kích thước mẫu: n, hữu hạn
• Giá trị tính từ mẫu: Thống
40 trang |
Chia sẻ: thanhle95 | Lượt xem: 311 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Bài giảng Lý thuyết xác suất và thống kê toán - Bài 1: Mở đầu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Bài giảng
LÝ THUYẾT XÁC SUẤT
&
THỐNG KÊ TOÁN
ĐẠI HỌC KINH TẾ QUỐC DÂN
KHOA TOÁN KINH TẾ
Bộ môn Toán kinh tế
1
www.mfe.neu.edu.vn
2019
Thông tin học phần
▪ Tiếng Anh: Probability and Mathematical Statistics
▪ Số tín chỉ: 3 Thời lượng: 45 tiết
▪ Đánh giá:
• Điểm do giảng viên đánh giá: 10%
• Điểm kiểm tra giữa kỳ: 20%
• Điểm kiểm tra cuối kỳ (90 phút): 70%
▪ Không tham gia quá 20% số tiết không được thi
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 2
▪ Thông tin chi tiết về Giảng dạy và học tập học phần:
▪ www.mfe.edu.vn Thông tin Hướng dẫn học tập
“Hướng dẫn giảng dạy học tập học phần Lý thuyết
xác suất và Thống kê toán”
• Đề cương chi tiết
• Hướng dẫn thực hành Excel
• Bảng số và công thức cơ bản
• Một số bài tập bổ sung
• Nội dung giảng dạy học tập cụ thể
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 3
Thông tin học phần
Thông tin giảng viên
▪ Giảng viên:
▪ Giảng viên Bộ môn Toán kinh tế - Khoa Toán kinh tế -
ĐH Kinh tế quốc dân
▪ Email: @neu.edu.vn
▪ Phone:
▪ Group:
▪ Trang web: www.mfe.neu.edu.vn/
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 4
Tài liệu
▪ [1] Nguyễn Cao Văn, Trần Thái
Ninh, Ngô Văn Thứ (2015), Giáo
trình Lý thuyết xác suất và Thống
kê toán, NXB ĐHKTQD.
▪ [2] Paul Newbold, William L.
Carlson, Betty Thorne (2013),
Statistics for Business and
Economics, 8th edition, Pearson.
▪ [3] Anderson, Sweeney, Willams,
Camm, Cochran (2017), Statistics
for Business and Economics, 12th
edition, South-Western.
▪ Website: www.mfe.neu.edu.vn
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 5
Nhà khoa học
▪ Thế kỉ 16: Galilei O Galile (Italia)
▪ Thế kỉ 17: Blaise Pascal, Piere de Fermat (Pháp),
Christian Huygens (Hà Lan), Jakob Bernoulli (Thụy Sĩ)
▪ Thế kỉ 18: Nicolaus Bernoulli (Thụy Sĩ), Thomas Bayes
(Anh), Pierre Simon Laplace (Pháp)
▪ Thế kỉ 19: Carl Friedrich Gauss (Đức), Simeon Denis
Poisson (Pháp), Pafuni Chebyshev (Nga), Francis
Galton, Karl Pearson (Anh)
▪ Thế kỉ 20: Charles Spearman, Royal Aylmer Fisher
(Anh), Andrei Kolmogorov (Nga)
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 6
NỘI DUNG
BÀI 1: MỞ ĐẦU
BÀI 2: BIẾN CỐ VÀ XÁC SUẤT
BÀI 3: BIẾN NGẪU NHIÊN RỜI RẠC VÀ QUY LUẬT PHÂN PHỐI
XÁC SUẤT
BÀI 4: BIẾN NGẪU NHIÊN LIÊN TỤC VÀ QUY LUẬT PHÂN PHỐI
XÁC SUẤT
BÀI 5: BIẾN NGẪU NHIÊN HAI CHIỀU
BÀI 6: LUẬT SỐ LỚN
BÀI 7: MẪU NGẪU NHIÊN
BÀI 8: ƯỚC LƯỢNG THAM SỐ
BÀI 9: KIỂM ĐỊNH GIẢ THUYẾT
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 7
BÀI 1 – MỞ ĐẦU
▪ 1.1. Các khái niệm cơ bản
• Thống kê – Xác suất
• Tổng thể, mẫu, quan sát, biến
▪ 1.2. Bảng biểu – Đồ thị
• Bảng tần số, tần suất
• Đồ thị tròn, cột, phân phối giá trị
▪ 1.3. Thống kê mô tả
• Nhóm xu thế trung tâm
• Nhóm đo độ phân tán
• Nhóm hình dáng phân phối, mối quan hệ
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 8
1.1. CÁC KHÁI NIỆM CƠ BẢN
THỐNG KÊ (STATISTICS)
▪ Thu thập dữ liệu
▪ Xử lý dữ liệu
▪ Trình bày, biểu diễn dữ liệu
▪ Phân tích dữ liệu để có được thông tin ở mức cao hơn
▪ Suy diễn về thông tin
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 9
Thống kê
Thông tin
ban đầu
(Dữ liệu)
Thông tin
cao cấp hơn
(Kết quả)
Thống kê và Xác suất
▪ Thống kê có hai nhánh chính
▪ Thống kê mô tả (Descriptive Statistics): sắp xếp, tổng
hợp, trình bày dữ liệu theo những cách hợp lý, thuận
tiện nhất.
▪ Thống kê suy diễn (Inferential Statistics): dự đoán,
kiểm chứng, phân tích dữ liệu để có các kết luận tổng
quát.
▪ Kết nối là Lý thuyết xác suất
▪ Thống kê mô tả là thông tin cơ bản cho thống kê suy
diễn
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 10
Tổng thể và Mẫu
▪ Tổng thể (Population): tất cả các phần tử cần quan
tâm
• Kích thước tổng thể: N, có thể vô hạn
• Giá trị tính từ tổng thể: Tham số (parameter)
▪ Mẫu (Sample): tập con rút ra từ tổng thể
• Kích thước mẫu: n, hữu hạn
• Giá trị tính từ mẫu: Thống kê (statistic)
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 11
Cấu trúc dữ liệu truyền thống
▪ Gồm: Quan sát / bản ghi – Biến / trường – Giá trị
▪ (Observation / record – Variable / field – Value)
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 12
Biến
TT Họ tên Giới Tuổi
Điểm
T.Anh
Điểm
Toán
Q
u
a
n
s
á
t
1 Nguyễn A M 19 A 8
2 Trần T. F 20 C 9
3 Lê . M 20 B 7
. .
Phân loại biến
▪ Định tính (Qualitative) và Định lượng (Quantitative)
▪ Biến định tính: Định danh và Thứ bậc
• Định danh (Nominal): VD: Tên, địa chỉ, ngành học
• Thứ bậc (Ordinal): VD: Thứ hạng, cỡ giày,
• Riêng: Nhị phân (binary): Đúng / Sai, Nam / Nữ
▪ Biến Định lượng (Quantitative): có đơn vị đo lường
• Rời rạc (Discrete): VD: tuổi, số buổi học,
• Liên tục (Continuous): VD: thời gian, cân nặng
• Biến định lượng có thể sử dụng để xác định biến
định tính
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 13
Phân loại biến
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 14
Định tính Định lượng
Định danh Thứ bậc Rời rạc Liên tục
Liệt kê
Nhóm, gộp
Liệt kê, nhóm
Sắp xếp thứ
tự, so sánh
Liệt kê, nhóm, gộp
Sắp xếp thứ tự, so sánh
Tính toán, +, -, × , ÷ ,
Mã hóa bởi con số Sử dụng để xếp hạng
Thang đo Likert
▪ Sử dụng trong các bảng hỏi đánh giá, nhận xét
▪ Thang Likert 5 bậc, 7 bậc
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 15
Rất không
đồng ý
Không
đồng ý
Không
ý kiến
Đồng ý Rất đồng ý
1 2 3 4 5
Hoàn
toàn
không
đồng ý
Rất
không
đồng ý
Không
đồng ý
Không
ý kiến
Đồng ý Rất
đồng ý
Hoàn
toàn
đồng ý
1 2 3 4 5 6 7
1.2. BẢNG BIỂU & ĐỒ THỊ
▪ Bảng tần số, tần suất, tần suất tích lũy
▪ Đồ thị tròn (pie chart), cột (column chart, bar chart)
▪ Đồ thị phân phối giá trị (histogram)
▪ Đồ thị rải điểm (scatter plot)
▪ [1] Chương 6, trang 312 – 323.
▪ [2] Chapter 1, pp. 8 – 38.
▪ [3] Chapter 2, pp. 33 – 98.
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 16
Ví dụ: Dữ liệu VHLSS 2012
No. Khu vực Số
người
Thu nhập
(triệu VND)
So với toàn
quốc
1 Thành thị 3 130,8 Cao
2 Thành thị 5 133,1 TB cao
3 Nông thôn 4 104,3 TB thấp
420 Nông thôn 7 25,7 Thấp
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 17
▪ Dữ liệu hộ gia đình ở Hà Nội, n = 420 quan sát
Tần số & Tần suất (tỷ lệ)
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 18
Khu vực Thành thị Nông thôn
Tần số 183 237
Khu vực Thành thị Nông thôn
Tần suất
Tỷ lệ, phần trăm
0,436
43,6 %
0,564
56,4 %
▪ Bảng tần số (frequency table) của biến Khu vực
▪ Bảng tần suất (relative frequency) hay tỷ lệ
(proportion)
Tần suất =
Tần số
Tổng số phần tử
Đồ thị tròn (pie chart)
183
44%
237
56%
Khu vực
Thành
thị
Nông
thôn
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 19
Khu
vực
Thành
thị
Nông
thôn
Tần số 183 237
Tỷ lệ 43,6% 56,4%
So với
toàn
quốc
Cao
TB
cao
TB
thấp
Thấp
Tần số 205 104 78 33
% 49% 25% 19% 8%
205
49%
104
25%
78
18%
33
8%
So sánh với toàn quốc
Cao
TB cao
TB thấp
Thấp
Đồ thị cột (column chart)
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 20
So với
toàn quốc
Tần số %
Cao 205 49%
TB cao 104 25%
TB thấp 78 19%
Thấp 33 8%
Tổng 420 100%
205
104
78
33
0
50
100
150
200
250
Cao TB cao TB thấp Thấp
So với toàn quốc
Đồ thị cột: phân phối giá trị (histogram)
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 21
SN 1 2 3 4 5 6 7 8 9 Tổng
Tần số 22 54 78 139 74 33 12 4 4 420
% 5% 13% 19% 33% 18% 8% 3% 1% 1% 100%
5%
13%
19%
33%
18%
8%
3% 1% 1%
1 2 3 4 5 6 7 8 9
Quy mô hộ gia đình
Hình dạng của phân phối giá trị
▪ Phân phối đối xứng và bất đối xứng
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 22
Đối xứng,
dạng chuông
(Symmertrical)
Lệch phải (lệch dương)
Positively skewed
Right skewed
Lệch trái (lệch âm)
Negatively skewed
Left skewed
Bất đối xứng / phân phối lệch
Đồ thị rải điểm (scatter plot)
0
50
100
150
200
250
300
10 12 14 16 18 20
O
u
tp
u
t
Labor
Output – Labor relationship
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 23
Labor Output Labor Output
11 80 15 250
11 130 16 220
12 150 17 210
13 110 18 240
13 150 18 200
13 200 17 260
15 170 19 240
14 180 19 280
▪ Sử dụng với số liệu hai chiều
Tương quan giữa hai biến định lượng
▪ Dạng cơ bản của đồ thị điểm hai biến định lượng
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 24
Tương quan
Dương
Yếu
Mạnh
Tương quan
Âm
Không
Tương quan
r = 0,5
r = – 0,5
r = 0,8
r = 0
1.3. THỐNG KÊ MÔ TẢ
▪ Xu thế trung tâm: Trung bình, trung vị, mốt
▪ Các vị trí: tứ phân vị, các phân vị
▪ Đo độ phân tán: Phương sai, độ lệch chuẩn, hệ số biến
thiên, khoảng biến thiên, khoảng tứ phân vị
▪ Hình dáng phân phối: Hệ số bất đối xứng, hệ số nhọn
▪ Đo độ liên hệ: Hiệp phương sai, hệ số tương quan
▪ [1] Chương 6
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 25
Nhóm xu thế trung tâm
▪ Dùng một giá trị đại diện cho bộ số liệu
▪ Ba thống kê xu thế trung tâm thường sử dụng:
• Trung bình (mean)
• Trung vị (median)
• Mốt (mode)
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 26
Trung bình (mean)
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 27
Tổng thể Mẫu
Dữ liệu: {𝑥1, 𝑥2, , 𝑥𝑁} Dữ liệu: {𝑥1, 𝑥2, , 𝑥𝑛}
𝝁 =
𝒙𝟏 + 𝒙𝟐 + ⋯ + 𝒙𝑵
𝑵
ഥ𝒙 =
𝒙𝟏 + 𝒙𝟐 + ⋯ + 𝒙𝒏
𝒏
▪ Trung bình =
▪ Dùng cho biến định lượng
▪ Có cùng đơn vị với biến
Trung bình có trọng số
▪ Nếu số liệu dạng có trọng số (weighted data)
▪ Giá trị 𝑥𝑖 có trọng số là 𝑤𝑖
▪ Trung bình có trọng số (weighted mean):
ഥ𝒙 =
𝒘𝟏𝒙𝟏 + 𝒘𝟐𝒙𝟐 + ⋯ + 𝒘𝒌𝒙𝒌
𝒘𝟏 + 𝒘𝟐 + ⋯ + 𝒘𝒌
=
σ𝒘𝒊𝒙𝒊
σ𝒘𝒊
▪ Ví dụ:
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 28
Giá bán (triệu / kg) 10 12 14 16
Số lượng (kg) 3 10 5 2
Trung vị (median)
▪ Là giá trị trung tâm của bộ dữ liệu khi dữ liệu được
sắp xếp từ nhỏ nhất đến lớn nhất
▪ Sử dụng số liệu về số lần mua hàng: 5, 2, 7, 4, 2
• Sắp xếp theo thứ tự tăng dần: 2,2,4,5,7 → 𝑚𝑑 = 4
▪ Khi n lẻ, 𝑚𝑑 nhận giá trị tại quan sát thứ
𝑛+1
2
▪ Khi n chẵn, 𝑚𝑑 nhận giá trị là trung bình cộng của 2
giá trị đứng giữa.
▪ Ví dụ với dữ liệu: 3, 8, 12, 14
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 29
Mốt (mode)
▪ Là giá trị xuất hiện ít nhất 2 lần và xuất hiện thường
xuyên nhất trong bộ dữ liệu
▪ Sử dụng số liệu về số lần mua hàng:
• Dữ liệu : 2, 5, 7, 4, 2 → 𝑚0 = 𝟐
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 30
Các thống kê
Xu thế
Trung tâm
Các loại biến
Định danh
(Nomial)
Thứ bậc
(Ordinal)
Định tính
(Interval)
Trung bình
Trung vị
Mốt
Nhóm thống kê đo độ phân tán
Đo độ phân tán hoặc mức độ “đồng đều” (homogeneity)
của biến định lượng
▪ Khoảng biến thiên (Range)
▪ Phương sai (Variance)
▪ Độ lệch chuẩn (Standard Deviation)
▪ Hệ số biến thiên (Coefficient of Variation)
▪ Khoảng tứ phân vị (Interquartile Range)
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 31
Khoảng biến thiên
▪ Thống kê đơn giản nhất đo độ biến động của bộ dữ
liệu là khoảng biến thiên:
▪ Range = Giá trị lớn nhất – Giá trị nhỏ nhất
▪ Ví dụ:
Khoảng biến thiên thu nhập 5 lao động:
12, 10, 8, 20, 21
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 32
Phương sai và độ lệch chuẩn
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 33
Tổng thể Mẫu
Số liệu {𝑥1, 𝑥2, , 𝑥𝑁} {𝑥1, 𝑥2, , 𝑥𝑛}
Trung bình 𝝁 =
σ𝒙𝒊
𝑵
ഥ𝒙 =
σ𝒙𝒊
𝒏
Tổng bình
phương
𝑆𝑆 = σ 𝑥𝑖 − 𝜇
2 𝑆𝑆 = σ 𝑥𝑖 − ҧ𝑥
2
Phương
sai
𝝈𝟐 =
𝑆𝑆
𝑵
𝒔𝟐 =
𝑆𝑆
𝒏 − 𝟏
Độ lệch
chuẩn
𝜎 = 𝜎2 𝑠 = 𝑠2
Phương sai và độ lệch chuẩn
▪ Ví dụ: Tính các thống kê phương sai, độ lệch chuẩn
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 34
Tổng thể Mẫu
Số liệu 10, 12, 15, 10, 12,
13, 18, 19, 14, 15
10, 12, 14, 15,
19
Trung bình 𝝁 = ഥ𝒙 =
Tổng bình phương 𝑆𝑆 = 𝑆𝑆 =
Phương sai 𝝈𝟐 = 𝒔𝟐 =
Độ lệch chuẩn 𝜎 = 𝑠 =
Hệ số biến thiên
▪ Phương sai, độ lệch chuẩn đo độ biến động tuyệt đối
▪ Hệ số biến thiên đo độ biến động tương đối
𝐶𝑉𝑡ổ𝑛𝑔 𝑡ℎể =
𝜎
𝜇
× 100% 𝐶𝑉𝑚ẫ𝑢 =
𝑠
ҧ𝑥
× 100%
▪ Ví dụ: Tính hệ số biến thiên của hai số liệu trong ví dụ
trước
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 35
Tứ phân vị (Quartile)
▪ 𝑄1, 𝑄2, 𝑄3 chia bộ dữ liệu thành 4 phần với số lượng
phần tử bằng nhau
▪ Tứ phân vị thứ hai chính là trung vị
▪ Khoảng tứ phân vị:
𝐼𝑄𝑅 = 𝑄3 − 𝑄1
▪ IQR cũng dùng để đánh giá độ phân tán của bộ dữ liệu
▪ Sử dụng khoảng (𝑄1 − 1,5 ⋅ 𝐼𝑄𝑅 ; 𝑄3 + 1,5 ⋅ 𝐼𝑄𝑅) là 1
tiêu chuẩn để xác định giá trị ngoại lai (outlier)
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 36
Giá trị chuẩn hóa
▪ Giá trị chuẩn hóa còn gọi là Z-score, dùng để xác định
vị trí tương đối của 1 giá trị cụ thể so với trung bình
của tập dữ liệu
𝑧𝑖 (tổng thể) =
𝑥𝑖 − 𝜇
𝜎
𝑧𝑖 (mẫu) =
𝑥𝑖 − ҧ𝑥
𝑠
▪ Z-score có trung bình bằng 0, phương sai bằng 1
▪ Ví dụ: Tính Z-score của các giá trị của mẫu sau
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 37
𝒙𝒊 5 8 9 10 15
𝑧𝑖
Thống kê mô tả hình dạng phân phối
▪ Tính cho mẫu
▪ Hệ số bất đối xứng (Skewness) 𝑎3:
𝑎3 =
σ 𝑥𝑖 − ҧ𝑥
3/𝑛
𝑠3
▪ Hệ số nhọn 𝑎4:
𝑎4 =
σ 𝑥𝑖 − ҧ𝑥
4/𝑛
𝑠4
▪ Lưu ý: trong một số phần mềm như Excel, hệ số bất
đối xứng Kurtosis = 𝑎4 − 3
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 38
Thống kê mô tả mức độ liên hệ
▪ Hai biến 𝑋 và 𝑌 là số liệu theo cặp (𝑥𝑖 , 𝑦𝑖)
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 39
Tổng thể Mẫu
Hiệp
phương sai
Covariance
𝐶𝑜𝑣 𝑋, 𝑌
=
σ 𝑥𝑖 − 𝜇𝑋 𝑦𝑖 − 𝜇𝑌
𝑁
𝑐𝑜𝑣 𝑋, 𝑌
=
σ 𝑥𝑖 − ҧ𝑥 𝑦𝑖 − ത𝑦
𝑛 − 1
Hệ số
tương quan
Correlation
𝜌𝑋,𝑌 =
𝐶𝑜𝑣 𝑋, 𝑌
𝜎𝑋𝜎𝑌
𝑟𝑋,𝑌 =
𝐶𝑜𝑣 𝑋, 𝑌
𝑠𝑋𝑠𝑌
Hiệp phương sai - hệ số tương quan
▪ Hệ số tương quan nằm trong đoạn [−1,1]
▪ Hệ số tương quan càng gần 0: càng yếu, lỏng
▪ Hệ số tương quan càng gần ±1: càng mạnh, chặt
▪ Ví dụ: Tính hiệp phương sai và hệ số tương quan của
mẫu sau
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 40
𝒙𝒊 𝒚𝒊
2 4
5 5
8 7
7 8
9 10