1.2.2 Bảng phân phối thành phần Bảng PPXS của các ĐLNN thành phần của ĐLNN 2-chiều rời rạc gọi là Bảng phân phối xác suất thành phần (bảng PPXSTP). Từ bảng PPXSĐT, ta lập bảng PPXSTP X là (xi, pi), i=1,m và bảng PPXSTP Y là (yj, qj), j=1,n. Bảng PPXSTP còn gọi là bảng phân phối biên hay bảng phân phối lề. Kỳ vọng, phương sai, độ lệch chuẩn của các ĐLNN thành phần gọi là kỳ vọng lề, phương sai lề, độ lệch chuẩn lề. Các tham số đặc trưng này của ĐLNN thành phần X ký hiệu là E(X), 2X σ , σX.
22 trang |
Chia sẻ: thanhle95 | Lượt xem: 303 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Bài giảng Lý thuyết xác suất và thống kê - Chương 4: Đại lượng ngẫu nhiên 2 chiều - Hàm của đại lượng ngẫu nhiên, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
CHƯƠNG 4
ĐLNN 2-chiều – Hàm của ĐLNN
1. Đại lượng ngẫu nhiên 2-chiều
1.1 Khái niệm
Khi cho tương ứng mỗi kết quả của phép thử với
hai số có thứ tự, ta có ĐLNN 2-chiều.
Xét ĐLNN 2-chiều (X, Y). X, Y gọi là các ĐLNN
thành phần. Nếu X, Y đều rời rạc thì (X, Y) gọi là
ĐLNN 2-chiều rời rạc. Nếu X, Y đều liên tục thì
(X, Y) gọi là ĐLNN 2-chiều liên tục.
Xét (X, Y) là ĐLNN 2-chiều rời rạc. Biến cố X
nhận giá trị x và Y nhận giá trị y ghi là (X=x, Y=y)
hay (X=x)(Y=y). Xác suất của biến cố này ghi là
P(X=x, Y=y) hay P((X=x)(Y=y)).
Ví dụ
(1) Gọi X và Y là điểm thi môn Toán và tuổi của
một sinh viên gặp ngẫu nhiên thì (X, Y) là ĐLNN 2-
chiều rời rạc.
(2) Gọi X là chiều dài, Y là trọng lượng của một con
gia súc được chọn ngẫu nhiên thì (X, Y) là ĐLNN 2-
chiều liên tục.
1.2 Bảng phân phối xác suất
1.2.1 Bảng phân phối đồng thời
Quy luật phân phối xác suất của ĐLNN 2-chiều
rời rạc được xác định bởi bảng phân phối xác suất
đồng thời (bảng PPXSĐT). Bảng PPXSĐT của
ĐLNN (X, Y) liệt kê tất cả giá trị xi, yj mà X, Y có
thể nhận và các giá trị pij là P((X=xi)(Y=yj)):
X Y y1 y2 ... yn Σ
x1 p11 p12 ... p1n p1
x2 p21 p22 ... p2n p2
... ... ... ... ... ...
xm pm1 pm2 ... pmn pm
Σ q1 q2 ... qn
Bảng PPXSĐT ký hiệu ((xi, yj), pij), i=1,m; j=1,n.
Đặt:
pi = pi1 + pi2 +... + pin i=1,m (cộng theo dòng)
qj = p1j + p2j +... + pmj j=1,n (cộng theo cột)
Ta phải có:
pi > 0, qj > 0 i=1,m; j=1,n
pij ≥ 0 i=1,m; j=1,n
p11 + p12 +... + p1n +... + pmn = Σpi = Σqj = 1
1.2.2 Bảng phân phối thành phần
Bảng PPXS của các ĐLNN thành phần của
ĐLNN 2-chiều rời rạc gọi là Bảng phân phối xác
suất thành phần (bảng PPXSTP). Từ bảng
PPXSĐT, ta lập bảng PPXSTP X là (xi, pi), i=1,m và
bảng PPXSTP Y là (yj, qj), j=1,n.
Bảng PPXSTP còn gọi là bảng phân phối biên
hay bảng phân phối lề. Kỳ vọng, phương sai, độ lệch
chuẩn của các ĐLNN thành phần gọi là kỳ vọng lề,
phương sai lề, độ lệch chuẩn lề. Các tham số đặc
trưng này của ĐLNN thành phần X ký hiệu là E(X),
2
Xσ , Xσ .
Ví dụ
Xét ĐLNN (X, Y) có bảng PPXSĐT sau:
X Y –1 0 1 3
0 0,12 0,10 0,05 0,10 0,37
1 0,03 0,11 0,07 0,05 0,26
2 0,10 0,04 0,03 0,20 0,37
0,25 0,25 0,15 0,35
Bảng phân phối theo thành phần X và Y là:
X 0 1 2 Y –1 0 1 3
P 0,37 0,26 0,37 P 0,25 0,25 0,15 0,35
E(X) = 1 2Xσ = 0,74 E(Y) = 0,95
2
Yσ = 2,6475
1.2.3 Bảng phân phối có điều kiện
Xét ĐLNN 2-chiều. Nếu biết một thành phần đã
xảy ra thì thành phần còn lại gọi là ĐLNN thành
phần có điều kiện. Bảng PPXS của ĐLNN thành
phần có điều kiện gọi là Bảng phân phối có điều
kiện. (Bảng PPXSCĐK). Kỳ vọng, phương sai, độ
lệch chuẩn của ĐLNN loại này gọi là kỳ vọng
phương sai, độ lệch chuẩn có điều kiện.
Xét ĐLNN (X, Y) có bảng phân phối đồng thời
((xi,yj), pij), i=1,m; j=1,n. Giả sử biết biến cố (Y=yj)
xảy ra. ĐLNN theo X có điều kiện Y=yj ký hiệu là
X /Y=yj hay X /yj. Xác suất để X nhận giá trị xi là xác
suất có điều kiện của biến cố (X=xi) biết (Y=yj), ký
hiệu P(X=xi /yj) hay P(X=xi /Y=yj). Ta có:
P(X=xi /yj) =
i j
j
P(X x ,Y y )
P(Y y )
= =
=
= ij
j
p
q
Kỳ vọng của ĐLNN X /Y=yj ký hiệu là E(X /yj)
hay E(X /Y=yj).
Tương tự, bảng phân phối của ĐLNN có điều
kiện Y /X=xi sẽ có:
P(Y=yj /xi) =
i j
i
P(X x ,Y y )
P(X x )
= =
=
= ij
i
p
p
Ví dụ
Xét ĐLNN (X, Y) có bảng phân phối sau:
X Y –1 0 1 3
0 0,12 0,10 0,05 0,10
1 0,03 0,11 0,07 0,05
2 0,10 0,04 0,03 0,20
Lấy 2 số lẻ, bảng phân phối của X có điều kiện
Y=0 và bảng phân phối của Y có điều kiện X=1 là:
E(X /0) = 0,76
E(Y /1) = 0,72
X /Y=0 0 1 2
P 0,40 0,44 0,16
Y /X=1 –1 0 1 3
P 0,12 0,42 0,27 0,19
Ghi chú
Lấy mỗi thành phần của cột Y=0 chia cho tổng
của cột này ta có P của X. Lấy mỗi thành phần của
dòng X=1 chia cho tổng của dòng này ta có P của Y.
1.3 Hiệp phương sai và hệ số tương quan
Để đánh giá mức độ phụ thuộc giữa hai ĐLNN
thành phần, ta đưa ra khái niệm hiệp phương sai và
hệ số tương quan.
1.3.1 Hiệp phương sai
Hiệp phương sai của hai ĐLNN thành phần X
và Y, ký hiệu cov(X, Y), được định nghĩa:
cov(X, Y) = E([X – E(X)].[Y – E(Y)])
cov(X, Y) thường được tính theo công thức:
cov(X, Y) = E(X.Y) – E(X).E(Y)
=
m n m n
i j ij i i j j
i 1 j 1 i 1 j 1
x y p x p y q
= = = =
−
∑∑ ∑ ∑
Hiệp phương sai đo mức độ phụ thuộc giữa X, Y:
X, Y độc lập thì E(X.Y) = E(X).E(Y) nên cov(X,Y) = 0.
Hiệp phương sai có các tính chất sau:
(i) cov(X, X) = var(X)
(ii) var(aX ± bY) = a2var(X) + b2var(Y)
± 2ab.cov(X, Y)
Ví dụ
Xét ĐLNN (X, Y) có bảng phân phối:
X Y –1 0 1 3
0 0,12 0,10 0,05 0,10
1 0,03 0,11 0,07 0,05
2 0,10 0,04 0,03 0,20
Từ các bảng phân phối lề, ta đã có E(X) = 1 và
E(Y) = 0,95. Vậy:
cov(X, Y) =
m n
i j ij
i 1 j 1
x y p E(X).E(Y)
= =
−∑∑
= 1,25 − 1×0,95 = 0,3
1.3.2 Hệ số tương quan
Hệ số tương quan của hai ĐLNN thành phần X
và Y, ký hiệu XYρ , được định nghĩa:
XY
X Y
Cov( X , Y)
.
ρ =
σ σ
Hệ số tương quan có các tính chất sau:
(i) XYρ ≤ 1
(ii) XYρ > 0 ⇒ X, Y đồng biến
XYρ < 0 ⇒ X, Y nghịch biến.
(iii) XYρ = 1 ⇔ P(Y = aX + b) = 1.
Hệ số tương quan đo mức độ phụ thuộc tuyến
tính giữa hai ĐLNN thành phần.
Ví dụ
Xét ĐLNN (X, Y) có bảng phân phối sau:
X Y –1 0 1 3
0 0,12 0,10 0,05 0,10
1 0,03 0,11 0,07 0,05
2 0,10 0,04 0,03 0,20
Ta đã tính được:
cov(X, Y) = 0,3
2Xσ = 0,74 ⇒ σX = 0,86
2Yσ = 2,6475 ⇒ σY = 1,6371
⇒ XYρ = cov(X, Y)/(σX.σY) = 0,2144
2. Hàm của ĐLNN
2.1 Khái niệm
2.1.1 Hàm một biến ngẫu nhiên
Xét hàm số y = g(x). Nếu thay x bởi ĐLNN X thì
Y = g(X) là ĐLNN gọi là hàm một biến ngẫu
nhiên.
Kỳ vọng, phương sai, độ lệch chuẩn của ĐLNN
g(X) khi biết g và X tính theo các công thức quen
thuộc, miễn là thay x bởi g(x). Chẳng hạn với ĐLNN
X có bảng phân phối (xi, pi), i=1,n thì:
E(g(X)) =
n
i i
i 1
g (x )p
=
∑
var(g(X)) = E(g(X)2) – [E(g(X))]2
Ví dụ
Cho ĐLNN X có bảng phân phối:
X –2 –1 2 4 5
p 6% 14% 30% 20% 10%
Đặt Y = X2 + X − 1 thì:
E(X2+X−1) =
5
2
i ii
i 1
(x x 1)p
=
+ −∑ = 8,12
var(X2+X−1) =
2
5 5
2 2 2
i i i ii i
i 1 i 1
(x x 1) p (x x 1)p
= =
+ − − + −
∑ ∑
= 98,0656
2.1.2 Hàm n-biến ngẫu nhiên
Xét hàm số n-biến y = g(x1, x2, ..., xn). Nếu thay
x1, x2, ..., xn bởi các ĐLNN X1, X2, ..., Xn thì
Y = g(X1, X2, ..., Xn) là ĐLNN gọi là hàm n-biến
ngẫu nhiên.
Các biểu thức Y = X1+X2, Y = X1.X2 trong đó X1, X2
là ĐLNN là các ví dụ về hàm 2-biến ngẫu nhiên.
Ví dụ
Lô hàng I gồm 8 chính phẩm và 2 phế phẩm. Lô
hàng II gồm 6 chính phẩm và 4 phế phẩm. Một
người mua 2 sản phẩm từ lô hàng I và 1 sản phẩm
từ lô hàng II. Gọi X là số chính phẩm mua được. Lập
bảng phân phối của ĐLNN X.
Gọi X1, X2 là số chính phẩm mua được từ lô
hàng I, II thì Y = X1 + X2.
Do X1~H(10; 8; 2) và X2~H(10; 6; 1) nên bảng
phân phối của X1, X2 như sau:
Do hai lô hàng độc lập nhau nên ta có:
X1 0 1 2 X2 0 1
p 1/45 16/45 28/45 p 0,4 0,6
P(Y = x) = ΣP(X1=xi, X2=x–xi)
= ΣP(X1=xi).P(X2=x–xi)
Lập bảng để tính các giá trị mà Y có thể nhận
và xác suất tương ứng:
X1 (P)
X2 (P)
0 (1/45) 1 (16/45) 2 (28/45)
0 (0,4) Y=0 (4/450) Y=1 (64/450) Y=2(112/450)
1 (0,6) Y=1 (6/450) Y=2 (96/450) Y=3(168/450)
Suy ra bảng phân phối của Y:
Y 0 1 2 3
p 4/450 70/450 208/450 168/450
3.2 Phân phối của hàm n-biến ngẫu nhiên
Không có công thức tổng quát để tìm ra quy luật
phân phối của ĐLNN Y = g(X1, X2, ..., Xn) khi biết quy
luật phân phối của các ĐLNN X1, X2, ..., Xn. Tuy
nhiên, ta cũng đã biết một số kết quả khi các ĐLNN
thành phần có cùng phân phối Nhị Thức, cùng phân
phối Poisson hay cùng phân phối Chuẩn.