Bài giảng Lý thuyết xác suất và thống kê - Chương 3: Các phân phối xác suất thông dụng

Ví dụ (1) Lấy ngẫu nhiên có hoàn lại 10 sản phẩm từ lô hàng có 80% chính phẩm. Tính xác suất có 8 chính phẩm. Biến cố "lấy được chính phẩm" có xác suất p = 80%. Số lần lặp lại phép thử là n = 10. Gọi X là số chính phẩm đếm được thì X ~ B(10; 80%). Xác suất cần tính là P(X=8). Theo công thức: P(X=8) = C10 8 (0,8)8(0,2)2 ≈ 30% =BINOMDIST(8, 10, 80%, 0)(2) Cho X~B(79; 75%), Y~B(30; 25%). Tính Mod(X), Mod(Y). Lưu ý Mod(X), Mod(Y) đều là số nguyên, ta có: 59 ≤ Mod(X) ≤ 60 ⇒ Mod(X) = 59 hay Mod(X) = 60 6,75 ≤ Mod(Y) ≤ 7,75 ⇒ Mod(Y) = 7 (3) Một xạ thủ bắn trúng bia với xác suất 20%. Tính xác suất xạ thủ này bắn vào bia 5 phát thì có không quá 2 phát trúng bia.

34 trang | Chia sẻ: thanhle95 | Lượt xem: 566 | Lượt tải: 0

Bạn đang xem trước 20 trang tài liệu Bài giảng Lý thuyết xác suất và thống kê - Chương 3: Các phân phối xác suất thông dụng, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

CHƯƠNG 3 Các phân phối xác suất thông dụng 1. Các phân phối của ĐLNN rời rạc 1.1 Phân phối Nhị thức 1.1.1 Định nghĩa và các số đặc trưng Trong một phép thử, biến cố A xảy ra với xác suất p. Thực hiện phép thử n lần độc lập. Gọi X là số lần biến cố A xảy ra thì X là ĐLNN. Theo công thức Nhị thức: P(X=k) = k k n knC p q − ĐLNN X có phân phối xác suất như trên được được gọi là ĐLNN có phân phối Nhị thức, ký hiệu X ~ B(n, p). Giá trị của X là 0, 1, ..., n. Đặt q = 1–p. Ta tính được: E(X) = np Var(X) = npq (n+1)p – 1 ≤ Mod(X) ≤ (n+1)p Excel Pk = P(X=k) =BINOMDIST(k, n, p, 0) P(X ≤ k) =BINOMDIST(k, n, p, 1) Ví dụ (1) Lấy ngẫu nhiên có hoàn lại 10 sản phẩm từ lô hàng có 80% chính phẩm. Tính xác suất có 8 chính phẩm. Biến cố "lấy được chính phẩm" có xác suất p = 80%. Số lần lặp lại phép thử là n = 10. Gọi X là số chính phẩm đếm được thì X ~ B(10; 80%). Xác suất cần tính là P(X=8). Theo công thức: P(X=8) = 810C (0,8) 8(0,2)2 ≈ 30% =BINOMDIST(8, 10, 80%, 0) (2) Cho X~B(79; 75%), Y~B(30; 25%). Tính Mod(X), Mod(Y). Lưu ý Mod(X), Mod(Y) đều là số nguyên, ta có: 59 ≤ Mod(X) ≤ 60 ⇒ Mod(X) = 59 hay Mod(X) = 60 6,75 ≤ Mod(Y) ≤ 7,75 ⇒ Mod(Y) = 7 (3) Một xạ thủ bắn trúng bia với xác suất 20%. Tính xác suất xạ thủ này bắn vào bia 5 phát thì có không quá 2 phát trúng bia. 1.1.2 Xấp xỉ Nhị thức bởi phân phối Chuẩn Xét B(n, p). Nếu n đủ lớn và p không quá gần 0 hay 1 thì phân phối Nhị thức được xấp xỉ bởi phân phối Chuẩn có cùng kỳ vọng và phương sai: B(n, p) ≈ N(np, npq) Ta cũng có công thức tính gần đúng: P(X = k) ≈ 1 k np ( ) npq npq − ϕ =NORMDIST(k, n*p, (n*p*q)^.5, 0) P(a ≤ X ≤ b) ≈ Φ( b np npq − ) − Φ( a np npq − ) Trong đó ϕ là hàm Gauss ϕ(z) = 2z / 21 e 2 − pi . Ghi chú "n đủ lớn và p không quá gần 0 hay 1" nghĩa là p ≥ 10%, q ≥ 10%, np > 5 và nq > 5. Ví dụ Xác suất chữa khỏi bệnh của một loại thuốc là 80%. Có 1.000 người dùng thuốc này. Tính xác suất có ít ra 790 người khỏi bệnh. Biến cố "một người khỏi bệnh sau khi dùng thuốc" có xác suất p = 85%. Số người dùng thuốc là n = 1.000. Gọi X là số người khỏi bệnh sau khi dùng thuốc thì X~B(1.000; 80%). Xác suất cần tính là P(X ≥ 790). Do n đủ lớn và p không quá gần 0 hay 1 nên B(1.000; 80%) ≈ N(800, 160). P(X ≥ 790) ≈ 0,5 – 790 800 ( ) 160 − Φ = 0,5 + Φ(0,79) ≈ 79% =1–NORMDIST(790, 800, 160^.5, 1) 1.2 Phân phối Poisson 1.2.1 Định nghĩa và các số đặc trưng ĐLNN rời rạc X nhận các giá trị 0, 1, ... với P(X=k) định bởi công thức sau gọi là ĐLNN có phân phối Poisson với tham số λ (λ > 0), ký hiệu X ~ P(λ): P(X=k) = k e k ! −λλ Ta tính được: E(X) = λ Var(X) = λ λ – 1 ≤ Mod(X) ≤ λ Excel P(X=k) =POISSON(k, λ, 0) P(X ≤ k) =POISSON(k, λ, 1) Ghi chú Khi λ > 10 thì P(λ) ≈ N(λ, λ). 1.2.2 Xấp xỉ Nhị thức bởi phân phối Poisson Xét ĐLNN B(n, p). Nếu n đủ lớn và p đủ nhỏ thì phân phối Nhị thức được xấp xỉ bởi phân phối Poisson có cùng kỳ vọng: B(n, p) ≈ P(np) Ghi chú "n đủ lớn và p đủ nhỏ" nghĩa là n ≥ 20 và p ≤ 5%. Điều kiện khác là n ≥ 30, p ≤ 10% và np < 10. Xấp xỉ sẽ tốt hơn nếu n ≥ 100 và np < 10. Ví dụ (1) Xác suất bị đứt trong 1 giờ hoạt động của một ống sợi là 0,2%. Một máy dệt có 1.000 ống sợi. Tính xác suất trong 1 giờ hoạt động của máy dệt có nhiều hơn 2 ống sợi bị đứt. Biến cố "ống sợi bị đứt" có xác suất p = 0,2%. Gọi X là số ống sợi bị đứt trong số n = 1.000 ống sợi thì X~B(1.000, 0,2%). Xác suất cần tính là P(X > 2). Do n đủ lớn và p đủ nhỏ nên ta xấp xỉ X bởi P(λ) với λ = 1.000×0,2% = 2. Ta có: P(X > 2) = 1 – P(X=0) – P(X=1) – P(X=2) = 1 – 0 22 e 0 ! − – 1 22 e 1 ! − – 2 22 e 2 ! − = 1 – e–2(1+2+2) ≈ 32% =1−POISSON(2, 2, 1) (2) Một cộng đồng có khoảng 2% người sống đến 90 tuổi. Cộng đồng hiện có 1.000 người. a) Tính trung bình cộng đồng có bao nhiêu người sống đến 90 tuổi? b) Tính xác suất cộng đồng có đúng 20 người sống đến 90 tuổi. c) Tính xác suất cộng đồng có hơn 20 người sống đến 90 tuổi. (3) Trung bình một ngày bãi giữ xe nhận 600 xe. Tính xác suất ngày mai có 700 xe được gởi tại bãi giữ xe này. 1.3 Phân phối Siêu bội 1.3.1 Định nghĩa và các số đặc trưng Xét tập hợp gồm N phần tử trong đó có M phần tử có tính chất tốt. Gọi X là số phần tử có tính chất tốt có được khi lấy ngẫu nhiên n phần tử. Xét k là một số nguyên từ max(0, n+M–N) đến min(M, n). Theo công thức Siêu bội ta có: P(X=k) = k n k M N M n N C .C C − − =HYPGEOMDIST(k, n, M, N) X được gọi là ĐLNN có phân phối Siêu bội, ký hiệu X ~ H(N, M, n). Đặt p = M/N và q = 1 – p. Ta tính được: E(X) = np Var(X) = N n npq N 1 − − Mod(X) = (n 1)(M 1) N 2  + +  +  Ví dụ (1) Một công ty có 10 chiếc xe trong đó có 3 chiếc Lexus. Điều ngẫu nhiên 4 chiếc xe để đi công tác. Tính xác suất trong các xe đó có 1 chiếc Lexus. Mô hình Siêu bội. N = 10 M = 3 n = 4 Gọi X là số xe Lexus có trong các xe được điều thì X~H(10, 3, 4). Cần tính là P(X=1). P(X=1) = 1 3 3 7 4 10 C .C C = 50% =HYPGEOMDIST(1, 4, 3, 10) (2) Một lớp 70 sinh viên trong đó có 40 sinh viên giỏi Toán. Chọn ngẫu nhiên 10 sinh viên. Tính xác suất có ít ra là 3 sinh viên giỏi Toán. 1.3.2 Xấp xỉ Siêu bội bởi phân phối Nhị thức Nếu n đủ nhỏ so với N, M và p = M/N không quá gần 0 hay 1 thì ta có xấp xỉ: H(N, M, n) ≈ B(n, M N ) Ghi chú "n đủ nhỏ so với N, M và p = M/N không quá gần 0 hay 1" nghĩa là 20n < N, 20n < M và 10% ≤ p ≤ 90%. * Khi n đủ nhỏ so với N thì việc lấy ngẫu nhiên có hoàn lại hoặc không hoàn lại là gần như nhau. Ví dụ (1) Lô hàng gồm 10.000 sản phẩm trong số có 9.000 chính phẩm. Lấy ra 10 sản phẩm. Tính xác suất trong các sản phẩm này có 9 chính phẩm. Mô hình Siêu bội. Gọi X là số chính phẩm có trong 10 sản phẩm lấy ra thì X ~ H(1.000, 900, 10). Cần tính P(X=9). Vì n đủ nhỏ so với N, M và p = M/N không quá gần 0 hay 1 nên: H(1.000, 900, 10) ≈ B(10, 900/1.000) = B(10, 90%) Vậy: P(X=9) = 910C .(90%) 9.(10%)1 ≈ 39% =BINOMDIST(9, 10, 90%, 0) (2) Tỷ lệ phế phẩm của nhà máy là 90%. Khách hàng lấy 100 sản phẩm để kiểm tra và nếu thấy có ít ra là 93 chính phẩm thì đồng ý mua sản phẩm của nhà máy. Tính xác suất khách hàng đồng ý mua. Gọi N, M là tổng số sản phẩm, chính phẩm của nhà máy, X là số chính phẩm có trong 100 sản phẩm lấy ra kiểm tra thì X ~ H(N, M, 100). Cần tính P(X ≥ 93). Do số sản phẩm lấy ra kiểm tra đủ nhỏ so với số sản phẩm cũng như số chính phẩm của nhà máy và tỷ chính phẩm M/N = 90% không quá gần 0 hay 1 nên: H(N, M, 100) ≈ B(100, 90%) Lại do n = 100 đủ lớn và p = 90% không quá gần 0 hay 1 nên B(100, 90%) ≈ N(90, 9). Vậy: P(X ≥ 93) = 0,5 – 93 90 ( ) 9 − Φ = 0,5 – Φ(1) ≈ 15,87% =1–NORMDIST(93, 90, 9^.5, 1) Xác suất khách hàng đồng ý mua sản phẩm của nhà máy là 15,87%. 2. Các phân phối của ĐLNN liên tục 2.1 Phân phối Chuẩn Theo Liapunov, một ĐLNN X là tổng của một số lớn các ĐLNN độc lập và mỗi giá trị của ĐLNN thành phần có vai trò rất nhỏ trong tổng thì X sẽ là một ĐLNN có quy luật phân phối Chuẩn. Xét Z ~ N(0; 1), ta có P(–zα/2 < Z < zα/2) = 1–α. Lấy α = 5% thì P(–1,96 < Z < 1,96) = 95%. Điều này chứng tỏ một ĐLNN có phân phối Chuẩn Chính tắc thì 95% giá trị của nó đều nằm trong khoảng (–1,96; 1,96). Nói theo nguyên lý Xác suất Lớn thì hầu hết giá trị của phân phối Chuẩn Chính tắc đều nằm trong khoảng (–1,96; 1,96). Lấy α = 5% thì P(Z < 1,6449) = 95%. Điều này chứng to một ĐLNN có phân phối Chuẩn Chính tắc thì 95% giá trị của nó đều nhỏ hơn 1,6449. Nói theo nguyên lý Xác suất Lớn thì hầu hết giá trị của phân phối Chuẩn Chính tắc đều nhỏ hơn 1,6449. Nếu X ~ N(µ; σ2) thì X − µ σ là phân phối Chuẩn Chính tắc. Giá trị X − µ σ gọi là điểm−Z. ĐLNN X có phân phối Chuẩn thì hầu hết giá trị điểm−Z của X đều nằm trong khoảng (–1,96; 1,96) và hầu hết đều nhỏ hơn 1,6449. Ví dụ Trọng lượng ghi trên bao bì của một bao cám là 5Kg với độ lệch chuẩn là 0,1Kg. Biết trọng lượng của một bao cám lấy ngẫu nhiên là một ĐLNN có phân phối Chuẩn. a) Một bao cám được coi là đạt tiêu chuẩn nếu trọng lượng sai lệch không quá 200g trọng lượng ghi trên bao bì. Tính tỷ lệ bao cám đạt tiêu chuẩn. b) Tính xác suất mua được một bao cám có trọng lượng từ 4,9Kg đến 5,2Kg. c) Trọng lượng tối đa của một bao cám trong số 95% bao cám nhẹ nhất là bao nhiêu? Gọi X là trọng lượng một bao cám (đơn vị: Kg). Theo giả thiết thì X ~ N(µ, σ2) với µ = 5, σ = 0,1. a) Cần tính P(X − 5 < 0,2). Ta có: P(X−5< 0,2) = 2Φ(0,2/0,1) = 2Φ(2) ≈ 95% =2*NORMSDIST(.2/.1)−1 b) Cần tính P(4,9 < X < 5,2). Ta có: P(4,9 < X < 5,2) = Φ( 5, 2 5 0, 1 − ) − Φ( 4, 9 5 0, 1 − ) = Φ(2) – Φ(–1) = Φ(2)+Φ(1) ≈ 82% =NORMDIST(5.2, 5, .1, 1) − NORMDIST(4.9, 5, .1, 1) c) Gọi x là trọng lượng cần tìm. Trọng lượng của một bao cám trong số 95% bao cám nhẹ nhất có điểm−Z không quá 1,6449. Vậy: x 5 0, 1 − = 1,6449 ⇒ x = 5,1645 Trọng lượng tối đa của một bao cám trong số 95% bao cám nhẹ nhất là 5,1645Kg. 2.2 Phân phối Chi Bình phương Xét X1, X2, , Xk là các ĐLNN độc lập và có phân phối Chuẩn Chính tắc. Đặt: χ2 = 2 2 21 2 kX X ... X+ + + χ2 là ĐLNN liên tục gọi là có phân phối Chi Bình phương bậc tự do k, ký hiệu χ2~χ2(k). Ta có: E(χ2(k)) = k Var(χ2(k)) = 2k Khi k ≥ 30 thì phân phối Chi Bình phương được xấp xỉ bởi phân phối Chuẩn Chính tắc. Trong ứng dụng, ta cần tìm phân vị mức α của phân phối Chi Bình phương χ2~χ2(k), tức là tìm χ2α sao cho P(χ2 > χ2α) = α. Giá trị χ 2 α được tìm bằng cách tra bảng kê số hoặc dùng hàm Excel =CHIINV(α, k). 2.3 Phân phối Student Xét hai ĐLNN độc lập Z~N(0, 1), χ2~χ2(k). Đặt: T = 2Z / / kχ T là ĐLNN liên tục gọi là có phân phối Student bậc tự do k, ký hiệu T ~ T(k). Ta có: E(T) = 0 Var(T) = k k 2− Khi k ≥ 30 thì phân phối Student được xấp xỉ bởi phân phối Chuẩn Chính tắc. Trong ứng dụng, ta cần tìm phân vị mức α của phân phối Student T~T(k), tức là tìm tα sao cho P(T > tα) = α. Giá trị tα được tìm bằng cách tra bảng kê số hoặc dùng hàm Excel =TINV(2*α, k). 2.4 Phân phối Fisher–Snedecor Xét hai ĐLNN độc lập là χ2(n1) và χ 2 (n2). Đặt: F = 2 1 1 2 2 2 (n ) / n (n ) / n χ χ F là ĐLNN liên tục gọi là có phân phối Fisher– Snedecor bậc tự do n1 và n2, ký hiệu F ~ F(n1, n2). Khi n2 > 4, ta tính được: E(F) = 2 2 n n 2− Var(F) = 2 2 1 2 2 1 2 2 2n (n n 2) n (n 2) (n 4) + − − − Trong ứng dụng, ta cần tìm phân vị mức α của phân phối Fisher-Snedecor F ~ F(n1, n2), tức là tìm fα sao cho P(F > fα) = α. Giá trị fα được tìm bằng cách tra bảng kê số hoặc dùng hàm Excel =FINV(α, n1, n2). 3. Phép toán trên các phân phối 3.1 Tổng của các phân phối Nhị thức Nếu X1~B(n1, p), X2~B(n2, p),..., Xm~B(nm, p) là các ĐLNN độc lập thì tổng của chúng sẽ là ĐLNN có phân phối Nhị thức với n = n1 + n2 +...+ nm. Tức là: B(n1, p) + B(n2, p) + B(nm, p) = B(n1 + n2 +...+ nm, p) Ví dụ Lô hàng I (II) gồm 500 (750) sản phẩm trong đó có 200 (300) sản phẩm tốt. Mua 5 sản phẩm thuộc lô hàng I và 10 sản phẩm thuộc lô hàng II. Tính xác suất mua được 8 sản phẩm tốt. Gọi X1 (X2) là số sản phẩm tốt mua được tại cửa hàng I (II) thì số sản phẩm tốt mua được là Y = X1 + X2. Xác suất cần tính là P(X = 8). Ta có: X1 ~ H(500, 200, 5) X2 ~ H(750, 300, 10) Do n đủ nhỏ so với N, M và p = M/N không quá gần 0 hay 1 nên X1 ≈ B(5, 40%) X2 ≈ B(10, 40%) Vậy Y = X1+X2 ≈ B(5, 40%) + B(10, 40%) = B(15, 40%) ⇒ P(Y = 8) ≈ 11,8% 3.2 Tổng của các phân phối Poisson Nếu X1~P(λ1), X2~P(λ2),..., Xn~P(λn) là các ĐLNN độc lập thì tổng của chúng sẽ là ĐLNN có phân phối Poisson với tham số λ = λ1 + λ2 +...+ λn. Tức là: P(λ1) + P(λ2) + ... + P(λn) = P(λ1 + λ2 +...+ λn) Ví dụ Máy dệt I (II, III) có 1.000 (1.500, 1.000) ống sợi. Xác suất bị đứt một ống sợi trên máy I (II, III) là 0,2% (0,1%, 0,15%). Tính xác suất 3 máy dệt có từ 5 ống sợi các loại bị đứt trở lên. Gọi X1, X2, X3 là số ống sợi loại A, B, C bị đứt thì tổng số ống sợi bị đứt là Y = X1 + X2 + X3. Cần tính P(Y ≥ 5). Ta có: X1~B(1000;0,2%) X2~B(1500;0,1%) X3~B(1000;0,15%) Do n đủ lớn và p đủ nhỏ nên X1, X2, X3 được xấp xỉ: X1 ≈ P(2) X2 ≈ P(1,5) X3 ≈ P(1,5) ⇒ Y ≈ P(2) + P(1,5) + P(1,5) = P(2 + 1,5 + 1,5) = P(5) ⇒ P(Y ≥ 5) = 1 − P(Y ≤ 4) ≈ 56% =1 − POISSON(4, 5, 1) 3.3 Tổ hợp tuyến tính các phân phối Chuẩn Nếu X1~N(µ1, 21σ ), X2~N(µ2, 2 2σ ),..., Xn~N(µn, 2 nσ ) là các ĐLNN độc lập thì tổ hợp tuyến tính của chúng a1X1 + a2X2 +...+ anXn cũng là ĐLNN có phân phối Chuẩn với kỳ vọng là a1µ1 + a2µ2 +...+ anµn, phương sai là 2 2 2 2 2 2n1 1 2 2 2a a ... aσ + σ + + σ . Tức là: a1N(µ1, 21σ ) + a2N(µ2, 2 2σ ) +...+ anN(µn, 2 nσ ) = N(a1µ1 + a2µ2 +...+ anµn, 2 2 2 2 2 2n1 1 2 2 2a a ... aσ + σ + + σ ) Ví dụ Trong một nông trại, trọng lượng trung bình của một con gà trống là 1,5Kg với độ lệch chuẩn 100g, trọng lượng trung bình của một con gà mái là 1,7Kg với độ lệch chuẩn 200g. Được biết, trọng lượng của một con gà được chọn ngẫu nhiên là ĐLNN có phân phối Chuẩn. Một người mua 2 con gà trống và 3 con gà mái. Tính xác suất trọng lượng của 5 con gà này không vượt quá 8,5Kg. Gọi X1 (X2) là trọng lượng (Kg) một con gà trống (mái). Trọng lượng 5 con gà được mua là Y = 2X1 + 3X2. Cần tính P(X ≤ 8,5). Theo giả thiết X1~N(1,5; 0,1 2), X2~N(1,7; 0,2 2) nên Y = 2X1 + 3X2 là phân phối Chuẩn với kỳ vọng và phương sai là: µ = 2×1,5 + 3×1,7 = 8,1 σ2 = 22×0,12 + 32×0,22 = 2,46 Vậy: P(Y ≤ 8,5) = 0,5 + Φ( 8, 5 8, 1 2, 46 − ) = 0,5+Φ(0,25) ≈ 60% =NORMDIST(8, 8.1, 2.46^.5, 1)