Phép thử
Một phép thử có hai đặc tính:
1) Không biết chắc kết quả nào xảy ra
2) Nhưng biết được các kết quả có thể xảy ra
Không gian mẫu hay tổng thể
Tập hợp tất cả các kết quả có thể xảy ra của một phép thử
được gọi là tổng thể hay không gian mẫu.
55 trang |
Chia sẻ: lylyngoc | Lượt xem: 1826 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Một số vấn đề cơ bản về xác suất thống kê trong kinh tế lượng, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ
ThS Phùng Thanh Bình
1
BÀI GIẢNG 3
MỘT SỐ VẤN ĐỀ CƠ BẢN
VỀ XÁC SUẤT THỐNG KÊ
TRONG KINH TẾ LƯỢNG
MỤC TIÊU BÀI GIẢNG:
1. Ký hiệu tổng
2. Phép thử, không gian mẫu và biến cố
3. Biến ngẫu nhiên
4. Xác suất
5. Biến ngẫu nhiên và hàm phân phối xác suất
6. Hàm mật độ xác suất đa biến
7. Đặc điểm của các phân phối xác suất
8. Một số phân phối xác suất quan trọng
9. Một số phép toán ma trận
10. Suy diễn thống kê
ĐỐI TƯỢNG BÀI GIẢNG:
1. Tài liệu bài giảng cho sinh viên đại học
2. Tài liệu tham khảo ôn tập cho học viên cao học
KÝ HIỆU TỔNG
Ký hiệu tổng
Ký tự (sigma) được thống nhất sử dụng để chỉ tổng:
n21
n
1i
ii X...XXXX
(3.1)
Thao tác với Eviews
Trên cửa sổ lệnh của Eviews ta nhập: scalar sumX=@sum(x)
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ
ThS Phùng Thanh Bình
2
Tính chất của phép toán tổng
1. Khi k là một hằng số
nkk
n
1i
(3.2)
2. Khi k là một hằng số
n
1i
i
n
1i
i XkkX (3.3)
3. Tổng của tổng hai biến Xi và Yi
iiii YX)YX( (3.4)
4. Tổng của một hàm tuyến tính
ii Xbna)bXa( (3.5)
PHÉP THỬ, KHÔNG GIAN MẪU, VÀ BIẾN CỐ
Phép thử
Một phép thử có hai đặc tính:
1) Không biết chắc kết quả nào xảy ra
2) Nhưng biết được các kết quả có thể xảy ra
Không gian mẫu hay tổng thể
Tập hợp tất cả các kết quả có thể xảy ra của một phép thử
được gọi là tổng thể hay không gian mẫu.
Biến cố
Một biến cố là một nhóm các kết quả có thể xảy ra củ một
phép thử. Nói cách khác, đó là một tập hợp con của không
gian mẫu.
Các phép tính về biến cố:
Biến cố hội (AB): A xảy ra hay B xảy ra
Biến cố giao (AB): A xảy ra vả B xảy ra
Biến cố phụ (A ):A xảy ra, A không xảy ra
Biến cố xung khắc: AB =
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ
ThS Phùng Thanh Bình
3
BIẾN NGẪU NHIÊN
Ví dụ, tung hai đồng xu, quan sát và lập thành bảng kết
quả của các phép thử như sau:
BẢNG 3.1: Định nghĩa khái niệm biến ngẫu nhiên
Đồng xu thứ
nhất
Đồng xu thứ
hai
Số mặt ngửa
T
T
T
H
H
T
H
H
T
H
0
1
1
1
2
Nguồn: Gujarati, 2006, trang 25
Ta gọi biến “số mặt ngửa” là một biến ngẫu nhiên. Nói một
cách tổng quát, một biến mà giá trị (bằng số) của nó được
xác định bởi kết quả của một phép thử được gọi là một
biến ngẫu nhiên. Như vậy, biến ngẫu nhiên là biến mà giá
trị của nó được xác định một cách ngẫu nhiên.
Một biến ngẫu nhiên có thể có giá trị rời rạc hoặc
liên tục. Một biến ngẫu nhiên rời rạc chỉ có một số giá
trị hữu hạn (hoặc vô hạn có thể đếm được). Một biến ngẫu
nhiên liên tục là một biến ngẫu nhiên có bất kỳ giá trị
nào trong một khoảng giá trị nào đó.
XÁC SUẤT
Xác suất của một biến cố: Định nghĩa cổ điển
Nếu một phép thử có thể có n kết quả loại trừ nhau và có
khả năng xảy ra như nhau, và nếu m kết quả từ phép thử
này hợp thành biến cố A, thì P(A), xác suất để A xảy ra,
là tỷ số m/n.
n
m
)A(P (3.6)
Xác suất của một biến cố: Tần suất tương đối
Để giới thiệu khái niệm này, ta xem ví dụ sau đây. Dữ
liệu trong bảng 3.1 là phân phối điểm điểm thi mô kinh tế
vi mô của 200 sinh viên. Đây là một ví dụ về phân phối
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ
ThS Phùng Thanh Bình
4
tần suất cho biết các điểm ngẫu nhiên được phân phối như
thế nào. Các con số trong cột 3 là các tần suất tuyệt
đối, nghĩa là số lần xảy ra của một biến cố nhất định.
Các con số trong cột 4 được gọi là các tần suất tương
đối, nghĩa là số tần suất tuyệt đối chia tổng số lần xảy
ra.
BẢNG 3.2: Phân phối điểm KTL của 200 sinh viên
Điểm Điểm giữa của
khoảng
Tần suất
tuyệt đối
Tần suất tương
đối
0-9
10-19
20-29
30-39
40-49
50-59
60-69
70-79
80-89
90-99
5
15
25
35
45
55
65
75
85
95
0
0
0
10
20
35
50
45
30
10
Tổng 200
0
0
0
0.050
0.100
0.175
0.250
0.225
0.150
0.050
1.000
Nguồn: Gujarati, 2006, trang 28
PHÂN PHỐI XÁC SUẤT
Phân phối xác suất của một biến ngẫu nhiên rời rạc
Giả sử X là một biến ngẫu nhiên rời rạc với các giá trị
x1, x2, ... thì hàm f được xác định bởi
f(X=xi) = P(X=xi) i = 1, 2, … (3.7)
=0 nếu x ≠ xi
được gọi là hàm phân phối xác suất của biến ngẫu nhiên X,
ký hiệu là PMF hay PF, trong đó, P(X=xi) là xác suất X có
giá trị xi. Hàm PMF có các tính chất sau:
0 f(xi) 1 (3.8)
n
1i
i 1)x(f (3.9)
Ví dụ, biến X là số mặt ngửa khi tung hai đồng xu, ta xét
bảng sau đây:
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ
ThS Phùng Thanh Bình
5
0.25
0.5
0.25
0 1 2
Hình 3.1: PMF của biến ngẫu nhiên rời rạc
BẢNG 3.3: PMF của biến ngẫu nhiên rời rạc
Nguồn: Gujarati, 2006, trang 34
Phân phối xác suất của biến ngẫu nhiên liên tục
Ví dụ, gọi X là biến chiều cao của một người, được đo
bằng mét. Giả sử ta muốn tính xác suất để chiều cao của
một người trong khoảng 1.56m đến 1.80m.
Hình 3.2: PDF của một biến ngẫu nhiên liên tục
0.04924276
0.54924276
1.04924276
1.54924276
2.04924276
2.54924276
3.04924276
3.54924276
4.04924276
1.4 1.44 1.48 1.52 1.56 1.6 1.64 1.68 1.72 1.76 1.8 1.84 1.88 1.92 1.96
Xác suất để chiều cao của một cá nhân nằm trong khoảng từ
1.56m đến 1.80m là diện tích dưới dường phân phối giữa
hai giá trị 1.56 và 1.80. Đối với một biến ngẫu nhiên
liên tục X, thì hàm mật độ xác suất f(X) như sau:
P(x1 X x2) =
2
1
x
x
dx)x(f (3.10)
Hàm mật độ xác suất của một biến ngẫu nhiên X có các tính
chất sau đây:
Số mặt ngửa
X
PMF
f(X)
0 ¼
1 ½
2 ¼
Tổng 1.00
Xác suất để chiều cao trong
khoảng 1.56 đến 1.8
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ
ThS Phùng Thanh Bình
6
Tổng diện tích dưới đường f(x) bằng 1
P(x1 X x2) là diện tích dưới đường f(x) giữa x1 và
x2, với x2 > x1.
Vì xác suất để một biến ngẫu nhiên nhận một giá trị
nhất định bằng không, nên các công thức dưới đây là
tương đương nhau:
P(x1 X x2) = P(x1 X x2) = P(x1 X x2) = P(x1 X x2) (3.11)
Hàm phân phối tích lũy của một biến ngẫu nhiên
Liên quan đến PMF hay PDF của một biến ngẫu nhiên X là
hàm phân phối tích lũy của biến đó, được xác định như
sau:
F(X) = P(X x) (3.12)
P(X x) nghĩa là xác suất để một biến ngẫu nhiên X có
giá trị nhỏ thua hoặc bằng x, với x đã biết. CDF có các
tính chất như sau:
F(-) = 0 và F(+) = 1
F(x) là một hàm không giảm, nghĩa là nếu x2 > x1, thì
F(x2) F(x1)
P(X k) = 1 – F(k)
P(x1 X x2) = F(x2) – F(x1)
BẢNG 3.4: Hàm phân phối xác suất tích lũy của một biến ngẫu nhiên
Số mặt ngửa
(X)
PDF CDF
X PDF X CDF
0 0 X < 1 1/16 X 0 1/16
1 1 X < 2 4/16 X 1 5/16
2 2 X < 3 6/16 X 2 11/16
3 3 X < 4 4/16 X 3 15/16
4 4 X 1/16 X 4 16/16
Nguồn: Gujarati, 2006, trang 37
Như vậy, CDF chỉ là tích lũy hay đơn giản là tổng của các
PDF của các giá trị X nhỏ thua hoặc bằng x.
Các hàm mật độ xác suất đa biến
Ví dụ, một đại lý bán lẻ máy tính bán hai loại thiết bị
là máy tính cá nhân và máy in. Số máy tính và máy in được
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ
ThS Phùng Thanh Bình
7
bán thay đổi giữa các ngày khác nhau, nhưng giám đốc đại
lý đã thu thập doanh số của 200 ngày qua như trong bảng
sau.
BẢNG 3.5: Phân phối tần suất của hai biến ngẫu nhiên X và Y
Số máy in được bán
(Y)
Số máy tính được bán (X)
Tổng
0 1 2 3 4
0 6 6 4 4 2 22
1 4 10 12 4 2 32
2 2 4 20 10 10 40
3 2 2 10 20 20 54
4 2 2 2 10 30 46
Tổng 16 24 48 48 64 200
Nguồn: Gujarati, 2006, trang 39
Bảng trên cho thấy trong 200 ngày có 30 ngày đại lý bán
được 4 máy tính và 4 máy in, có 2 ngày bán được 4 máy
tính nhưng không bán được máy in nào. Giải thích tương tự
cho các con số còn lại. Đây là một ví dụ về phân phối tần
suất kết hợp. Nếu chia từng con số trong bảng trên cho
200, ta sẽ có các tần suất tương đối.
BẢNG 3.6: Phân phối xác suất của hai biến ngẫu nhiên X và Y
Số máy in được bán
(Y)
Số máy tính được bán (X)
Tổng
0 1 2 3 4
0 0.03 0.03 0.02 0.02 0.01 0.11
1 0.02 0.05 0.06 0.02 0.01 0.16
2 0.01 0.02 0.01 0.05 0.05 0.23
3 0.01 0.01 0.05 0.10 0.10 0.27
4 0.01 0.01 0.01 0.05 0.05 0.23
Tổng 0.08 0.12 0.24 0.24 0.32 1.00
Nguồn: Gujarati, 2006, trang 39
Do hai biến X và Y là các biến ngẫu nhiên rời rạc, nên
bảng 3.6 được gọi là hàm phân phối xác suất kết hợp của
hai biến ngẫu nhiên.
f(X,Y) = P(X = x và Y = y) (3.13)
= 0 khi X x và Y y
Hàm xác suất kết hợp có các tính chất sau:
f(X,Y) 0
x y
1)Y,X(f
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ
ThS Phùng Thanh Bình
8
Hàm xác suất biên
Xác suất X nhận một giá trị nhất định bất kể Y nhận giá
trị gì được gọi là xác suất biên của X, và phân phối của
các xác suất này được gọi là hàm phân phối xác suất biên.
BẢNG 3.7: Phân phối xác suất biên của X và Y
X f(X) Y f(Y)
0
1
2
3
4
0.08
0.12
0.24
0.24
0.32
0
1
2
3
4
0.11
0.16
0.23
0.27
0.23
Tổng 1.00. 1.00
Nguồn: Gujarati, 2006, trang 41
Từ bảng xác suất kết hợp giữa X và Y ta có thể tính các
hàm xác suất biên như sau:
f(X) =
y
)Y,X(f
f(Y) =
x
)Y,X(f
Nếu hai biến X và Y là hai biến ngẫu nhiên liện tục thì
ta sẽ thay ký hiệu tổng thành ký hiệu tích phân.
Hàm xác suất điều kiện
Giả sử ta muốn tìm xác suất có 4 máy in được bán nếu biết
có 4 máy tính được bán trong này, và đó chính là xác suất
có điều kiện. Hàm phân phối xác suất có điều kiện của một
biến ngẫu nhiên có thể được định nghĩa như sau:
F(YX) = P(Y=yX=x) (3.14)
F(XY) = P(X=xY=y) (3.15)
Một công thức đơn giản để tính hàm phân phối xác suất có
điều kiện sẽ như sau:
F(YX) =
)X(f
)Y,X(f
(3.16)
F(XY) =
)Y(f
)Y,X(f
(3.17)
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ
ThS Phùng Thanh Bình
9
CÁC ĐẶC ĐIỂM CỦA PHÂN PHỐI XÁC SUẤT
Giá trị kỳ vọng: Thước đo định tâm
Giá trị kỳ vọng của một biến ngẫu nhiên rời rạc, ký hiệu
là E(X), được định nghĩa như sau:
E(X) = X =
x
)X(xf (3.18)
Giá trị kỳ vọng của một biến ngẫu nhiên là trung bình có
trọng số của các giá trị có thể có của biến đó, với xác
suất của các giá trị này, f(X), đóng vai trò như các
trọng số. Giá trị kỳ vọng của một biến ngẫu nhiên cũng
được gọi là giá trị trung bình, mặc dù chính xác hơn là
giá trị trung bình tổng thể.
Tính chất của giá trị kỳ vọng
E(b) = b (3.19)
E(X+Y) = E(X) + E(Y) (3.20)
E(X/Y)
)Y(E
)X(E
(3.21)
E(XY) E(X)E(Y) (3.22)
Nếu X và Y là hai biến ngẫu nhiên độc lập, thì
E(XY) = E(X)E(Y) (3.23)
E(X2) [E(X)]2 (3.24)
E(aX) = aE(X) (3.25)
E(aX+b) = aE(X) + b (3.26)
Phương sai: Thước đo phân tán
Giá trị kỳ vọng của một biến ngẫu nhiên đơn giản chỉ cho
biết trọng tâm của biến đó ở đâu chứ không cho biết các
giá trị riêng lẻ của biến đó phân tán như thế nào xung
quanh giá trị trung bình. Thước đo phổ biến nhất cho sự
phân tán này là phương sai, và được định nghĩa như sau:
var(X) =
2
x = E(X-x)
2
(3.27)
var(X) = )X(f)X(
2
x (3.28)
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ
ThS Phùng Thanh Bình
10
Phương sai cho biết các giá trị X riêng lẻ được phân phối
hay phân tán xung quanh giá trị trung bình như thế nào.
Nếu các giá trị X phân tán rộng quanh giá trị trung bình
thì phương sai sẽ tương đối lớn (xem Hình 3.3). Căn bậc
hai của phương sai là độ lệch chuẩn, ký hiệu là x.
Hình 3.3: PDF của các biến ngẫu nhiên liên tục cùng giá trị kỳ vọng
Tính chất của phương sai
Phương sai của một hằng số bằng không.
Nếu X và Y là hai biến ngẫu nhiên độc lập, thì
var(X+Y) = var(X) + var(Y) (3.29)
var(X-Y) = var(X) – var(Y)
Nếu b là hằng số, thì
var(aX) = a
2
var(X) (3.30)
Nếu a và b là hằng số, thì
var(aX+b) = a
2
var(X) (3.31)
Nếu X và Y là hai biến độc lập và a và b là hằng số,
thì
var(aX+bY) = a
2
var(X) + b
2
var(Y) (3.32)
Phương sai
quá nhỏ
Phương sai
quá lớn
X
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ
ThS Phùng Thanh Bình
11
Để tiện lợi cho việc tính toán, công thức phương sai
cũng có thể được viết lại như sau:
var(X) = E(X
2
) – [E(X)]2 (3.33)
Hệ số biến thiên
Lưu ý rằng, vì độ lệch chuẩn (hay phương sai) phụ thuộc
vào các đơn vị đo lường khác nhau, cho nên sẽ khó cho
việc so sánh giữa các độ lệch chuẩn nếu chúng có các
thước đo khác nhau. Để giải quyết vấn đề này, ta có thể
sử dụng hệ số biến thiên (V) như sau:
V = 100.
x
x
(3.34)
Hiệp phương sai
Giả sử X và Y là hai biến ngẫu nhiên với E(X) = x và E(Y)
= y, thì hiệp phương sai (cov) giữa hai biến sẽ như sau:
Cov(X,Y) = E[(X-x)(Y-y)]
= E(XY) - xy (3.35)
Hiệp phương sai giữa hai biến có thể dương, âm, hoặc bằng
không. Nếu hai biến vận động theo cùng chiều, thì hiệp
phương sai sẽ dương, nếu khác chiều, thì hiệp phương sai
sẽ âm. Nếu hiệp phương sai giữa hai biến bằng không, thì
có nghĩa là không có mối quan hệ tuyến tính nào giữa hai
biến đó.
Ta có thể tính hiệp phương sai theo công thức sau
đây:
cov(X,Y) =
x y
yx )Y,X(f)Y)(X(
=
x y
yx)Y,X(XYf (3.36)
= E(XY) - xy
Tính chất của hiệp phương sai
Nếu X và Y là hai biến ngẫu nhiên độc lập, hiệp
phương sai của chúng bằng không vì khi đó E(XY) =
E(X)E(Y) = xy.
cov(a+bX, c+dY) = bdcov(X,Y) (3.37)
cov(X,X) = var(X) (3.38)
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ
ThS Phùng Thanh Bình
12
Nếu X và Y là hai biến ngẫu nhiên nhưng không nhất
thiết phải độc lập, thì công thức tính phương sai
(3.29) được viết lại như sau:
var(X+Y) = var(X) + var(Y) + 2cov(X,Y) (3.39)
var(X-Y) = var(X) + var(Y) – 2cov(X,Y) (3.40)
Hệ số tương quan
Hệ số tương quan là thước đo mối quan hệ tuyến tính giữa
hai biến ngẫu nhiên, nghĩa là nó cho biết hai đó có quan
hệ với nhau như thế nào: mạnh hay yếu. Hệ số tương quan
tổng thể (, rho) được xác định như sau:
=
yx
)Y,Xcov(
(3.36)
Tính chất của hệ số tương quan
Giống hiệp phương sai, hệ số tương quan có thể âm
hoặc dương.
Hệ số tương quan là một thước đo mối quan hệ tuyến
tính giữa hai biến.
-1 1 (3.37)
Hệ số tương quan là một con số thuần túy không có đơn
vị đo lường.
Nếu hai biến độc lập, hệ số tương quan bằng không.
Hệ số tương quan không hàm ý mối quan hệ nhân quả.
Kỳ vọng có điều kiện
Một khái niệm thống kê khác đặc biệt quan trọng trong
phân tích hồi qui là khái niệm kỳ vọng có điều kiện.
E(XY=y) =
X
)yY/X(Xf (3.38)
Độ nghiêng và độ nhọn
Độ nghiêng và độ nhọn cho ta biết điều gì đó về hình dạng
của phân phối xác suất. Độ nghiêng (S) là một thước đo sự
mất cân xứng của đồ thị phân phối xác suất, và độ nhọn
(K) là một thước đo độ cao hay thấp của đồ thị phân phối
xác suất.
Mô men thứ ba: E(X-x)
3
(3.39)
Mô men thứ tư: E(X-x)
4
(3.40)
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ
ThS Phùng Thanh Bình
13
S = 3
x
3
x )X(E
(3.41)
Hình 3.4: Độ nghiêng của phân phối
Có ba khả năng xảy ra như sau:
Nếu S = 0, PDF đối xứng quanh giá trị trung bình
Nếu S > 0, PDF bị nghiêng phải
Nếu S < 0, PDF bị nghiêng trái
K = 2 2
x
4
x
])X(E[
)X(E
(3.42)
Có ba khả năng xảy ra như sau:
Nếu K = 3, PDF có độ nhọn chuẩn và được gọi là
mesokurtic
Nếu K < 3, PDF có đuôi ngắn và được gọi là
platykurtic
Nếu K > 3, PDF có đuôi dài và được gọi là
leptokurtic
X
Nghiêng phải Nghiêng trái
Đối xứng
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ
ThS Phùng Thanh Bình
14
Hình 3.5: Độ nhọn của phân phối
TỪ TỔNG THỂ ĐẾN MẪU
Trung bình mẫu
Trung bình mẫu của một biến ngẫu nhiên X có n quan sát
được ký hiệu là X (đọc là X ngang) và được định nghĩa như
sau:
n
1i
i
n
X
X (3.43)
Trung bình mẫu được xem là một ước lượng của E(X), từ
trung bình tổng thể. Một ước lượng đơn giản là một qui
tắc, một công thức, hay một thống kê cho ta biết làm sao
để ước lượng một đại lượng của tổng thể. Giả sử X có 7
quan sát với các giá trị như sau: 8, 9, 10, 11, 12, 13,
14. Vậy X = 11, và con số 11 này được gọi là một giá trị
ước lượng của trung bình tổng thể.
Thao tác với Eviews
Trên cửa sổ lệnh của Eviews ta nhập: scalar
meanX=@mean(x)
Đuôi ngắn
Đuôi dài
Độ nhọn chuẩn
X
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ
ThS Phùng Thanh Bình
15
Phương sai mẫu
Phương sai mẫu được ký hiệu bằng
2
xS , là ước lượng của
phương sai tổng thể
2
x . Phương sai mẫu được định nghĩa
như sau:
n
1i
2
i2
x
1n
)XX(
S (3.44)
n-1 được gọi là số bậc tự do (d.f.). Bậc tự do là số
nguồn thông tin (piece of information) về một biến ngẫu
nhiên. Để hiểu khái niệm này, ta xét ví dụ sau đây.
BẢNG 3.8: Định nghĩa khái niệm bậc tự do
Quan sát X (X- )X (X- )X
2
1 8 -3 9
2 9 -2 4
3 10 -1 1
4 11 0 0
5 12 1 1
6 13 2 4
7 14 3 9
Tổng 0 28
Nguồn: Tác giả
Ta biết rằng tổng độ lệch luôn luôn bằng không1, nên để
xem độ lệch của các giá trị X so với giá trị trung bình
ta phải lấy độ lệch bình phương. Tổng của 7 độ lệch bình
phương là 28, nhưng thực sự con số 28 này chỉ do 6
“nguồn” đóng góp, vì quan sát thứ tư trùng với giá trị
trung bình. Như vậy, để xem độ lệch trung bình ta chỉ lấy
28 chia cho số nguồn thực sự tạo ra nó, tức 7-1 = 6. Vậy
phương sai là 4.67 (là một giá trị ước lượng của phương
sai tổng thể) và căn bậc hai của phương sai mẫu được gọi
là độ lệch chuẩn mẫu (s.d.). Độ lệch chuẩn (2.16) được
xem như một thước đo sấp xỉ cho trung bình của 6 độ lệch
tuyệt đối ở trên. Mở rộng cho trường hợp một biến ngẫu
nhiên liên tục.
Thao tác với Eviews
Trên cửa sổ lệnh của Eviews ta nhập: scalar varX=@var(x)
1
Chứng minh: 0XXXnXXX)XX(
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ
ThS Phùng Thanh Bình
16
Hiệp phương sai mẫu
Hiệp phương sai mẫu giữa hai biến ngẫu nhiên X và Y là
ước lượng của hiệp phương sai tổng thể, và được định
nghĩa như sau:
Cov(X,Y) =
1n
)YY)(XX( ii
(3.45)
Thao tác với Eviews
Trên cửa sổ lệnh của Eviews ta nhập: scalar
covXY=@cov(x,y)
Hệ số biến thiên mẫu
Hệ số biến thiên mẫu của X được xác định bằng công
thức sau đây:
V = 100.
X
S
x (3.46)
Thao tác với Eviews
Trên cửa sổ lệnh của Eview ta nhập: scalar
cvX=@stdev(x)/@mean(x)
Hệ số tương quan mẫu
Hệ số tương quan mẫu giữa hai biến ngẫu nhiên X và Y là
ước lượng của hệ số tương quan tổng thể, và được định
nghĩa như sau:
)Y.(d.s)X.(d.s
)1n/()YY)(XX(
r ii
(3.47)
Thao tác với Eviews
Trên cửa sổ lệnh của Eviews ta nhập: scalar
corXY=@cor(x,y)
Độ nghiêng và độ nhọn mẫu
Để tính độ nghiêng và độ nhọn mẫu, ta sử dụng các mô men
mẫu thứ ba và thứ tư như sau:
Mô men thứ ba:
)1n(
)XX( 3
(3.48)
Mô men thứ tư:
)1n(
)XX( 4
(3.49)
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ
ThS Phùng Thanh Bình
17
Thao tác với Eviews
Trên cửa sổ lệnh của Eviews ta nhập:
scalar skewX=@skew (x)
scalar kurtX=@kurt(x)
MỘT SỐ PHÂN PHỐI XÁC SUẤT QUAN TRỌNG
Phân phối chuẩn
Kinh nghiệm cho thấy rằng phân phối chuẩn là một mô hình
hợp lý cho một biến ngẫu nhiên liên tục với giá trị của
nó phụ thuộc vào nhiều yếu tố, nhưng mỗi yếu tố chỉ có
ảnh hưởng tương đối nhỏ lên giá trị của biến số đó. Phân
phối chuẩn của một biến ngẫu nhiên X được thể hiện thông
qua hai tham số cơ bản là giá trị trung bình và phương
sai. Cụ thể như sau:
X ~ N(x,
2
x ) (3.50)
Hình 3.6: Đồ thị phân phối chuẩn
-3 -2 -1 0 1 2 3
-
khoảng 68%
-2 2 -3 3
khoảng 99.7%
khoảng 95%
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ
ThS Phùng Thanh Bình
18
Tính chất của phân phối chuẩn
Đường phân phối chuẩn đối xứng quanh giá trị trung
bình x.
Hàm phân phối xác suất PDF của một biến ngẫu nhiên
theo phân phối chuẩn cao nhất tại giá trị trung bình
nhưng nhỏ dần về các cực trị của nó. Nghĩa là, xác
suất để có một giá trị của một biến ngẫu nhiên theo
phân phối chuẩn càng xa giá trị trung bình càng nhỏ.