Bài giảng Lý thuyết xác suất và thống kê - Chương 4: Đại lượng ngẫu nhiên 2 chiều - Hàm của đại lượng ngẫu nhiên

1.2.2 Bảng phân phối thành phần Bảng PPXS của các ĐLNN thành phần của ĐLNN 2-chiều rời rạc gọi là Bảng phân phối xác suất thành phần (bảng PPXSTP). Từ bảng PPXSĐT, ta lập bảng PPXSTP X là (xi, pi), i=1,m và bảng PPXSTP Y là (yj, qj), j=1,n. Bảng PPXSTP còn gọi là bảng phân phối biên hay bảng phân phối lề. Kỳ vọng, phương sai, độ lệch chuẩn của các ĐLNN thành phần gọi là kỳ vọng lề, phương sai lề, độ lệch chuẩn lề. Các tham số đặc trưng này của ĐLNN thành phần X ký hiệu là E(X), 2X σ , σX.

pdf22 trang | Chia sẻ: thanhle95 | Lượt xem: 303 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Bài giảng Lý thuyết xác suất và thống kê - Chương 4: Đại lượng ngẫu nhiên 2 chiều - Hàm của đại lượng ngẫu nhiên, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
CHƯƠNG 4 ĐLNN 2-chiều – Hàm của ĐLNN 1. Đại lượng ngẫu nhiên 2-chiều 1.1 Khái niệm Khi cho tương ứng mỗi kết quả của phép thử với hai số có thứ tự, ta có ĐLNN 2-chiều. Xét ĐLNN 2-chiều (X, Y). X, Y gọi là các ĐLNN thành phần. Nếu X, Y đều rời rạc thì (X, Y) gọi là ĐLNN 2-chiều rời rạc. Nếu X, Y đều liên tục thì (X, Y) gọi là ĐLNN 2-chiều liên tục. Xét (X, Y) là ĐLNN 2-chiều rời rạc. Biến cố X nhận giá trị x và Y nhận giá trị y ghi là (X=x, Y=y) hay (X=x)(Y=y). Xác suất của biến cố này ghi là P(X=x, Y=y) hay P((X=x)(Y=y)). Ví dụ (1) Gọi X và Y là điểm thi môn Toán và tuổi của một sinh viên gặp ngẫu nhiên thì (X, Y) là ĐLNN 2- chiều rời rạc. (2) Gọi X là chiều dài, Y là trọng lượng của một con gia súc được chọn ngẫu nhiên thì (X, Y) là ĐLNN 2- chiều liên tục. 1.2 Bảng phân phối xác suất 1.2.1 Bảng phân phối đồng thời Quy luật phân phối xác suất của ĐLNN 2-chiều rời rạc được xác định bởi bảng phân phối xác suất đồng thời (bảng PPXSĐT). Bảng PPXSĐT của ĐLNN (X, Y) liệt kê tất cả giá trị xi, yj mà X, Y có thể nhận và các giá trị pij là P((X=xi)(Y=yj)): X Y y1 y2 ... yn Σ x1 p11 p12 ... p1n p1 x2 p21 p22 ... p2n p2 ... ... ... ... ... ... xm pm1 pm2 ... pmn pm Σ q1 q2 ... qn Bảng PPXSĐT ký hiệu ((xi, yj), pij), i=1,m; j=1,n. Đặt: pi = pi1 + pi2 +... + pin i=1,m (cộng theo dòng) qj = p1j + p2j +... + pmj j=1,n (cộng theo cột) Ta phải có: pi > 0, qj > 0 i=1,m; j=1,n pij ≥ 0 i=1,m; j=1,n p11 + p12 +... + p1n +... + pmn = Σpi = Σqj = 1 1.2.2 Bảng phân phối thành phần Bảng PPXS của các ĐLNN thành phần của ĐLNN 2-chiều rời rạc gọi là Bảng phân phối xác suất thành phần (bảng PPXSTP). Từ bảng PPXSĐT, ta lập bảng PPXSTP X là (xi, pi), i=1,m và bảng PPXSTP Y là (yj, qj), j=1,n. Bảng PPXSTP còn gọi là bảng phân phối biên hay bảng phân phối lề. Kỳ vọng, phương sai, độ lệch chuẩn của các ĐLNN thành phần gọi là kỳ vọng lề, phương sai lề, độ lệch chuẩn lề. Các tham số đặc trưng này của ĐLNN thành phần X ký hiệu là E(X), 2 Xσ , Xσ . Ví dụ Xét ĐLNN (X, Y) có bảng PPXSĐT sau: X Y –1 0 1 3 0 0,12 0,10 0,05 0,10 0,37 1 0,03 0,11 0,07 0,05 0,26 2 0,10 0,04 0,03 0,20 0,37 0,25 0,25 0,15 0,35 Bảng phân phối theo thành phần X và Y là: X 0 1 2 Y –1 0 1 3 P 0,37 0,26 0,37 P 0,25 0,25 0,15 0,35 E(X) = 1 2Xσ = 0,74 E(Y) = 0,95 2 Yσ = 2,6475 1.2.3 Bảng phân phối có điều kiện Xét ĐLNN 2-chiều. Nếu biết một thành phần đã xảy ra thì thành phần còn lại gọi là ĐLNN thành phần có điều kiện. Bảng PPXS của ĐLNN thành phần có điều kiện gọi là Bảng phân phối có điều kiện. (Bảng PPXSCĐK). Kỳ vọng, phương sai, độ lệch chuẩn của ĐLNN loại này gọi là kỳ vọng phương sai, độ lệch chuẩn có điều kiện. Xét ĐLNN (X, Y) có bảng phân phối đồng thời ((xi,yj), pij), i=1,m; j=1,n. Giả sử biết biến cố (Y=yj) xảy ra. ĐLNN theo X có điều kiện Y=yj ký hiệu là X /Y=yj hay X /yj. Xác suất để X nhận giá trị xi là xác suất có điều kiện của biến cố (X=xi) biết (Y=yj), ký hiệu P(X=xi /yj) hay P(X=xi /Y=yj). Ta có: P(X=xi /yj) = i j j P(X x ,Y y ) P(Y y ) = = = = ij j p q Kỳ vọng của ĐLNN X /Y=yj ký hiệu là E(X /yj) hay E(X /Y=yj). Tương tự, bảng phân phối của ĐLNN có điều kiện Y /X=xi sẽ có: P(Y=yj /xi) = i j i P(X x ,Y y ) P(X x ) = = = = ij i p p Ví dụ Xét ĐLNN (X, Y) có bảng phân phối sau: X Y –1 0 1 3 0 0,12 0,10 0,05 0,10 1 0,03 0,11 0,07 0,05 2 0,10 0,04 0,03 0,20 Lấy 2 số lẻ, bảng phân phối của X có điều kiện Y=0 và bảng phân phối của Y có điều kiện X=1 là: E(X /0) = 0,76 E(Y /1) = 0,72 X /Y=0 0 1 2 P 0,40 0,44 0,16 Y /X=1 –1 0 1 3 P 0,12 0,42 0,27 0,19 Ghi chú Lấy mỗi thành phần của cột Y=0 chia cho tổng của cột này ta có P của X. Lấy mỗi thành phần của dòng X=1 chia cho tổng của dòng này ta có P của Y. 1.3 Hiệp phương sai và hệ số tương quan Để đánh giá mức độ phụ thuộc giữa hai ĐLNN thành phần, ta đưa ra khái niệm hiệp phương sai và hệ số tương quan. 1.3.1 Hiệp phương sai Hiệp phương sai của hai ĐLNN thành phần X và Y, ký hiệu cov(X, Y), được định nghĩa: cov(X, Y) = E([X – E(X)].[Y – E(Y)]) cov(X, Y) thường được tính theo công thức: cov(X, Y) = E(X.Y) – E(X).E(Y) = m n m n i j ij i i j j i 1 j 1 i 1 j 1 x y p x p y q = = = =    −           ∑∑ ∑ ∑ Hiệp phương sai đo mức độ phụ thuộc giữa X, Y: X, Y độc lập thì E(X.Y) = E(X).E(Y) nên cov(X,Y) = 0. Hiệp phương sai có các tính chất sau: (i) cov(X, X) = var(X) (ii) var(aX ± bY) = a2var(X) + b2var(Y) ± 2ab.cov(X, Y) Ví dụ Xét ĐLNN (X, Y) có bảng phân phối: X Y –1 0 1 3 0 0,12 0,10 0,05 0,10 1 0,03 0,11 0,07 0,05 2 0,10 0,04 0,03 0,20 Từ các bảng phân phối lề, ta đã có E(X) = 1 và E(Y) = 0,95. Vậy: cov(X, Y) = m n i j ij i 1 j 1 x y p E(X).E(Y) = = −∑∑ = 1,25 − 1×0,95 = 0,3 1.3.2 Hệ số tương quan Hệ số tương quan của hai ĐLNN thành phần X và Y, ký hiệu XYρ , được định nghĩa: XY X Y Cov( X , Y) . ρ = σ σ Hệ số tương quan có các tính chất sau: (i)  XYρ  ≤ 1 (ii) XYρ > 0 ⇒ X, Y đồng biến XYρ < 0 ⇒ X, Y nghịch biến. (iii)  XYρ  = 1 ⇔ P(Y = aX + b) = 1. Hệ số tương quan đo mức độ phụ thuộc tuyến tính giữa hai ĐLNN thành phần. Ví dụ Xét ĐLNN (X, Y) có bảng phân phối sau: X Y –1 0 1 3 0 0,12 0,10 0,05 0,10 1 0,03 0,11 0,07 0,05 2 0,10 0,04 0,03 0,20 Ta đã tính được: cov(X, Y) = 0,3 2Xσ = 0,74 ⇒ σX = 0,86 2Yσ = 2,6475 ⇒ σY = 1,6371 ⇒ XYρ = cov(X, Y)/(σX.σY) = 0,2144 2. Hàm của ĐLNN 2.1 Khái niệm 2.1.1 Hàm một biến ngẫu nhiên Xét hàm số y = g(x). Nếu thay x bởi ĐLNN X thì Y = g(X) là ĐLNN gọi là hàm một biến ngẫu nhiên. Kỳ vọng, phương sai, độ lệch chuẩn của ĐLNN g(X) khi biết g và X tính theo các công thức quen thuộc, miễn là thay x bởi g(x). Chẳng hạn với ĐLNN X có bảng phân phối (xi, pi), i=1,n thì: E(g(X)) = n i i i 1 g (x )p = ∑ var(g(X)) = E(g(X)2) – [E(g(X))]2 Ví dụ Cho ĐLNN X có bảng phân phối: X –2 –1 2 4 5 p 6% 14% 30% 20% 10% Đặt Y = X2 + X − 1 thì: E(X2+X−1) = 5 2 i ii i 1 (x x 1)p = + −∑ = 8,12 var(X2+X−1) = 2 5 5 2 2 2 i i i ii i i 1 i 1 (x x 1) p (x x 1)p = =   + − − + −    ∑ ∑ = 98,0656 2.1.2 Hàm n-biến ngẫu nhiên Xét hàm số n-biến y = g(x1, x2, ..., xn). Nếu thay x1, x2, ..., xn bởi các ĐLNN X1, X2, ..., Xn thì Y = g(X1, X2, ..., Xn) là ĐLNN gọi là hàm n-biến ngẫu nhiên. Các biểu thức Y = X1+X2, Y = X1.X2 trong đó X1, X2 là ĐLNN là các ví dụ về hàm 2-biến ngẫu nhiên. Ví dụ Lô hàng I gồm 8 chính phẩm và 2 phế phẩm. Lô hàng II gồm 6 chính phẩm và 4 phế phẩm. Một người mua 2 sản phẩm từ lô hàng I và 1 sản phẩm từ lô hàng II. Gọi X là số chính phẩm mua được. Lập bảng phân phối của ĐLNN X. Gọi X1, X2 là số chính phẩm mua được từ lô hàng I, II thì Y = X1 + X2. Do X1~H(10; 8; 2) và X2~H(10; 6; 1) nên bảng phân phối của X1, X2 như sau: Do hai lô hàng độc lập nhau nên ta có: X1 0 1 2 X2 0 1 p 1/45 16/45 28/45 p 0,4 0,6 P(Y = x) = ΣP(X1=xi, X2=x–xi) = ΣP(X1=xi).P(X2=x–xi) Lập bảng để tính các giá trị mà Y có thể nhận và xác suất tương ứng: X1 (P) X2 (P) 0 (1/45) 1 (16/45) 2 (28/45) 0 (0,4) Y=0 (4/450) Y=1 (64/450) Y=2(112/450) 1 (0,6) Y=1 (6/450) Y=2 (96/450) Y=3(168/450) Suy ra bảng phân phối của Y: Y 0 1 2 3 p 4/450 70/450 208/450 168/450 3.2 Phân phối của hàm n-biến ngẫu nhiên Không có công thức tổng quát để tìm ra quy luật phân phối của ĐLNN Y = g(X1, X2, ..., Xn) khi biết quy luật phân phối của các ĐLNN X1, X2, ..., Xn. Tuy nhiên, ta cũng đã biết một số kết quả khi các ĐLNN thành phần có cùng phân phối Nhị Thức, cùng phân phối Poisson hay cùng phân phối Chuẩn.