Chương 3 Một số phân phối xác suất thường dùng

Định nghĩa. Người ta nói rằng biến ngẫu nhiên rời rạc X có phân phối nhị thức, với các tham sốn và p (n nguyên dương và 0 < p < 1 ), nếu X có Im(X) = {0, 1, 2, , n}; và với mọi k ∈{0, 1, 2, , n},

pdf26 trang | Chia sẻ: lylyngoc | Lượt xem: 1893 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Chương 3 Một số phân phối xác suất thường dùng, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Chng 3 MT S PHÂN PHI THNG DÙNG 67 Chương 3 Một số phân phối xác suất thường dùng 1. P HÂN PHỐI NHỊ THỨC 1.1. Định nghĩa. Người ta nói rằng biến ngẫu nhiên rời rạc X có phân phối nhị thức, với các tham số n và p (n nguyên dương và 0 < p < 1 ), nếu X có Im(X) = {0, 1, 2,…, n}; và với mọi k ∈ {0, 1, 2,…, n}, P( ) = C (1 )k k n knX k p p −= − Ký hiệu: X ~ B (n;p). Phân phối B(1,p) còn được gọi là Phân phối Bernoulli với tham số p, ký hiệu: B (p). Nếu Z ~ B(p) thì Im(Z) = {0, 1}. P(Z = 0) = 1 − p và P(Z = 1) = p. Do đó, E(Z) = p và D(Z) = p(1 − p). 1.2. Định lý. Cho hai BNN X và Y độc lập. Nếu X ~ B(n;p) và Y ~ B(m;p) thì BNN Z = X + Y tuân theo luật phân phối B(n + m; p). 1.3. Hệ quả. (a) Nếu các biến ngẫu nhiên X1, X2, . . . , Xn độc lập, cùng có phân phối B(p), thì biến ngẫu nhiên X = X1 + X2 +....+ Xn có phân phối B(n; p). (b) Giả sử X ~ B(n,p). Chúng ta có thể xem X = X1 + X2 +....+ Xn, trong đó, các biến ngẫu nhiên Xk (k = 1, ..., n) độc lập và có phân phối B(p). Vậy, E(X) = np và D(X) = np(1 − p). Chng 3 MT S PHÂN PHI THNG DÙNG 68 Ngoài ra, Mod(X) = [(n + 1)p] (do 1.6.2) Mô hình. Trong quá trình B(n;p), nếu X là biến ngẫu nhiên chỉ số thành công thì X ~ B(n; p). 1.4. Thí dụ. Một công nhân quản lý 12 máy dệt. Các máy dệt hoạt động độc lập nhau, và xác suất để mỗi máy, trong ca làm việc, cần sự chăm sóc của công nhân (viết tắt là CCN) là 0,3. (1) Tính xác suất để, trong ca làm việc, có (a) 4 máy CCN (b) từ 3 đến 7 máy CCN (2) Trung bình, trong ca làm việc, có bao nhiêu máy CCN? (3) Trong ca làm việc, tìm số máy CCN nhiều khả năng nhất; tính xác suất tương ứng. Giải. Gọi X là BNN chỉ số máy CCN trong ca làm việc thì X ~ B(12; 0,3) 12 12P( ) C (0,3) (0,7)k k kX k −= = , k ∈ {0,1,2,…,12} (1.a) Xác suất phải tính: 4 4 8 12P( 4) C (0,3) (0,7)X = = = 0,2311 (1.b) Xác suất phải tính: 7 =3 P(3 7) P( ) k X X k≤ ≤ = =∑ = 0,2397 + 0,2311 + 0,1585 + 0,0792 + 0,0291 = 0,7376. (2) Số máy CCN trung bình: E(X) = 12 × 0,3 = 3,6. (3) Số máy CCN nhiều khả năng nhất: Mod(X) = [13 × 0,3] = 3. Xác suất tương ứng: P(X = 3) = 0,2397. Chú ý. Giả sử X ~ B (n; p). Khi số phép thử n khá lớn, việc tính các xác suất P(X = k) gặp nhiều khó khăn. Ngoài ra, trong thực tế, chúng ta thường phải tính xác suất của biến cố {α ≤ X ≤ β}: P(α ≤ X ≤ β) = Pn(α) + Pn(α + 1) + ... + Pn(β) Tổng trên gồm nhiều số hạng và việc tính trực tiếp tổng đó quả là khó thực hiện. Do đó, người ta đã tìm cách tính gần đúng các xác suất trên khi số phép thử n khá lớn. Chúng ta tìm hiểu cách tính gần đúng phân phối nhị thức thông Chng 3 MT S PHÂN PHI THNG DÙNG 69 qua các định lý mang tên các nhà toán học Siméon D. Poisson (1781 - 1840), Abraham DeMoivre (1667 - 1745) và Pierre S. Laplace (1749 - 1827): 1.5. Định lý. ( De Moivre − Laplace địa phương ). Giả sử X ~ B (n, p). Đặt q = 1 − p, khi đó: 2( )1 1 22 lim P ( ) .exp 0k np npqnpqn X k − pi→∞    = − − =       1.6. Định lý. ( De Moivre − Laplace tích phân ). Giả sử X ~ B(n, p). Đặt q = 1 − p, khi đó với mọi số thực a và b (a < b): 2( )1 1 22 lim P ( ) . exp 0 b x np npqnpqn a a X b dx− pi→∞     ≤ ≤ − − =      ∫ Chứng minh. ( Định lý 1.5): Theo công thức Stirling; khi n lớn, ( ) 2 .( ) ~ 2 2 ( ) ( ) n n k n k k k n k n k n n e p q P X k k k e n k n k e − − − − − − pi = pi pi − − = 1 ( ) ( )( )2 k n kn np nq k n k k n k − − −pi Đặt: k np npq x − = , chúng ta có: 1 ; 1k q n k px x np np nq nq − = + = − ; k np npqx= + và n k nq npqx− = − Vì ln(1 + t) ~ t − 22 t (t → 0) nên: Khi n lớn, ( )ln .ln 1k qknp npk x−  = − +   2 2~ ( ) q q np np np npq x x x − + −    ; ( ) ( )ln ( ).ln 1n kn k pnq nqn k x− −−  = − − −   Chng 3 MT S PHÂN PHI THNG DÙNG 70 22~ ( ) p p nq nqnq npq x x x   − − − −    Do đó, ( ) ( ) 22lim ln n kk xnp nqk n kn −−→∞ = − và ( ) ( ) 22lim expk n k xnp nqk n kn −−→∞  = −   Ngoài ra: 1 ( ) .lim lim lim n n k n k np nq npqn n n−→∞ →∞ →∞ = = nên cuối cùng: 2 2 2 1 1 ( )( ) ~ exp exp 22 2 x k npP X k npqnpq npq    − = − = −    pi pi    hay: 2( )1 1 22 lim ( ) .exp 0k np npqnpqn P X k − pi→∞    = − − =       Phép chứng minh Định lý 1.6 được xem như bài tập. ■ 1.7. Chú ý. Để ý hai hàm xác định trên  như sau: (i) Hàm Gauss: ( ) 22 1 exp 2 xx   = −    ϕ pi với mọi x ∈  (ii) Hàm Φ: ( ) 22 1 exp 2 x tx dt − ∞   = −    ∫Φ pi với mọi x ∈  Từ kết quả của các định lý De Moivre - Laplace và sử dụng hai hàm ϕ và Φ, chúng ta có công thức gần đúng để tính các xác suất trong phân phối nhị thức: Nếu X ~ B(n, p), với n lớn và p không quá gần 0 và không quá gần 1 ( n > 30, np ≥ 5 và n(1 − p) ≥ 5 ), thì: ( q = 1 – p) ( ) 1P k npX k npq npq   − = ≈      ϕ Chng 3 MT S PHÂN PHI THNG DÙNG 71 2 1 1 2P( ) k np k npk X k npq npq     − − ≤ ≤ ≈ −           Φ Φ Giá trị các hàm ϕ và Φ đã được tính sẵn và trình bày, theo thứ tự, trên bảng 3 và bảng 4, để tiện việc tính toán. Hai công thức gần đúng trên được gọi là các công thức DeMoivre − Laplace. Chúng cho phép chúng ta tính xấp xỉ xác suất luật nhị thức khá chính xác khi n đủ lớn và p không quá gần 0 và không quá gần 1. Các số liệu sau đây minh hoạ điều trên. Giả sử X ~ B(n; 0,5). Ký hiệu Pn(k) và Gn(k) lần lượt là giá trị đúng và giá trị gần đúng của P(X = k), chúng ta có: n k Pn(k) Gn(k) Pn(k) − Gn(k) Pn(k) / Gn(k) 25 100 400 1156 15 55 210 595 0,09742 0,04847 0,024207 0,014236 0,09679 0,04839 0,024194 0,014234 0,00063 0,00008 0,000013 0,000002 1,0065 1,0017 1,0005 1,0001 1.8. Thí dụ. Người ta muốn lấy một số hạt lúa từ một kho lúa có tỉ lệ hạt lép là 0,2 để kiểm tra. Biết rằng kho lúa có rất nhiều hạt. (a) Phải lấy ít nhất bao nhiêu hạt lúa để xác suất có ít nhất một hạt lép không bé hơn 95% ? (b) Lấy ngẫu nhiên 100 hạt lúa, tính xác suất để trong đó có 25 hạt lép; có từ 10 đến 40 hạt lép. Giải. (a) Gọi n là số hạt lúa cần lấy. Vì số hạt lúa trong kho rất lớn, nên các lần lấy xem như độc lập. Xác suất để trong n hạt lúa lấy ra, không có hạt lép nào là (0,8)n. Theo giả thiết: 1 − (0,8)n ≥ 0,95 ⇔ (0,8)n ≤ 0,05 ⇔ ln (0,05)ln (0,8)n≥ Vậy, phải lấy ít nhất 14 hạt lúa. (b) Gọi X là biến ngẫu nhiên chỉ số hạt lép trong mẫu thì X ~ B(n;p), với n = 100 và p = 0,2. Vì n > 30, np = 20 > 5 và n(1 − p) = 80 > 5 nên chúng ta có thể áp dụng các công thức gần đúng DeMoivre − Laplace. (i) Xác suất để có 25 hạt lép: 25 25 75 100P( 25) C (0,2) (0,8) 0,04388X = = = Chng 3 MT S PHÂN PHI THNG DÙNG 72 (ii) Xác suất để có từ 10 đến 40 hạt lép: P(10 ≤ X ≤ 40) ≈ 40 100 0,2 10 100 0,2 100 0,2 0,8 100 0,2 0,8 − × − × × × × ×    Φ − Φ        = (5) ( 2,5)Φ − Φ − = 1 (1 (2,5)) (2,5)− − Φ = Φ P(10 ≤ X ≤ 40) ≈ 0,9938 1.9. Thí dụ. Cần xét nghiệm máu cho 5000 người để tìm dấu hiệu một loại bệnh B tại một địa phương có tỉ lệ người mắc bệnh B theo thống kê là 10%. Có 2 phương pháp: 1. Xét nghiệm từng người một. 2. Mỗi lần lấy máu một nhóm 10 người trộn lẫn vào nhau rồi xét nghiệm. Nếu kết quả âm tính thì thông qua, nếu dương tính thì phải làm thêm 10 xét nghiệm để xét nghiệm lại từng người một trong nhóm. Hỏi phương pháp nào có lợi hơn, biết rằng mỗi xét nghiệm đều tốn kém như nhau và khả năng mắc bệnh của mỗi người độc lập nhau? Giải. Nếu dùng phương pháp (1) thì phải thực hiện 5000 xét nghiệm. Bây giờ chúng ta xem phương pháp (2): Đặt X chỉ số nhóm có kết quả dương tính thì X ~ B (500; 1 − (0,9)10 ) Đặt Y chỉ số xét nghiệm theo phương pháp (2) thì Y = 500 + 10X. Số xét nghiệm trung bình theo phương pháp (2) là: E(Y) = 500 + 10E(X) = 500 + 5000(1 − (0,9)10 ) ≈ 3757. Vậy, áp dụng theo phương pháp (2) có lợi hơn. 2. PHÂN PHỐI SIÊU HÌNH HỌC Người ta nói rằng biến ngẫu nhiên rời rạc X có phân phối siêu hình học (hay siêu bội) kích thước N, với các tham số nguyên dương T và n không lớn hơn N nếu X có Im(X) = [max(0, -( - )],. . .,min( , )]n N T T n∩ , và với mọi k ∈ Im(X), − − = = C . C C P( ) k n k T N T n N X k Ký hiệu: X ~ H(N, T, n). Kỳ vọng: E(X) = np; Chng 3 MT S PHÂN PHI THNG DÙNG 73 Phương sai: D(X) = 1 − − N n Nnpq (với = T Np và q = 1 − p) Chú ý: Khi N rất lớn so với n thì tỷ số = TNp được xem như xác suất cho thành công và tỷ số 1N nN − − tiến đến 1. Khi đó, E(X) = np, D(X) = npq và chúng ta có thể xem như X ~ B( ; )TNn . 3. PHÂN PHỐI POISSON 3.1. Định nghĩa. Người ta nói rằng biến ngẫu nhiên rời rạc X có phân phối Poisson với tham số λ (λ > 0) nếu Im(X) = , và với mọi k ∈ , −λλ = = !P( ) . k kX k e Ký hiệu: X ~ Poisson(λ) Kỳ vọng: 0 1 e eE ( ) ! ( 1)! k k k k X k k k −λ −λ+∞ +∞ = = λ λ = = − ∑ ∑ 1 1 e ( 1)! k k k −+∞ −λ = λ = λ = λ − ∑ Phương sai : D(X) = λ (xem như bài tập) Do đó, chúng ta có thể viết: X ~ Poisson(µ). Mô hình: Giả sử chúng ta quan tâm đến số lần xảy ra của một sự kiện A trong một khoảng thời gian hoặc không gian liên tục có chiều dài w; với điều kiện là số lần xảy ra trong những khoảng không giao nhau là độc lập nhau, và xác suất xuất hiện A nhiều hơn một lần trong khoảng đó là rất bé. Hơn nữa, “cường độ” xuất hiện A là không thay đổi, i.e. số lần xuất hiện trung bình của A trong một khoảng chỉ phụ thuộc vào độ dài của khoảng đó. Với các điều kiện trên, nếu gọi X là BNN chỉ số lần xuất hiện A trong một khoảng chiều dài w thì người ta chứng minh được rằng X tuân theo kuật phân phối Poisson với tham số λ = mw, trong đó m là một hằng số dương chỉ “cường độ” xuất hiện của A (xem phần chứng minh trong giáo trình Xác suất – Thống kê dùng cho các lớp chuyên ngành Toán của cùng tác giả). Thí dụ, số cuộc điện thoại gọi đến trong một phút tại một trạm nào đó; số lỗi trên một trang giấy trong một quyển sách dầy; số đơn đặt hàng gửi tới một cơ sở trong một tháng; . . . . Chng 3 MT S PHÂN PHI THNG DÙNG 74 Biến ngẫu nhiên chỉ số lần xuất hiện nêu trên đã được nhà toán học Simeon D. Poisson nghiên cứu và hình thành phân phối Poisson. Ngoài ra, phân phối Poisson còn được dùng để tính xấp xỉ phân phối nhị thức B(n;p) khi n lớn và p khá gần 0 hoặc gần 1, dựa vào định lý sau: 3.2. Định lý Poisson. Giả sử trong một dãy n phép thử độc lập, một biến cố A xuất hiện với xác suất pn trong mỗi phép thử. Nếu khi n → ∞ mà pn → 0 sao cho n.pn = λ (λ là một hằng số dương) thì với mọi k ∈ {0,1,2,…,n}, chúng ta có: !lim C (1 ) λ− −λ → ∞ − = kk k n k n n n kn p p e Chứng minh. ( ) ( )( 1)( 2)...( 1)!C (1 ) 1k n kn n n n kk k n kn n n k n np p −− − − +− λ λ− = − ( )( ) ( ) ( )11 2! 1 1 ... 1 . 1k n kkk n n n n −−λ λ= − − − − Do đó, !lim C (1 ) λ− −λ → ∞ − = kk k n k n n n kn p p e Hệ quả. Nếu X ~ B(n, p), với n > 30 và (np < 5 hay n(1 − p) < 5)), thì chúng ta có thể xem như X ~ Poisson (np). 3.3. Định lý. Cho hai BNN X và Y độc lập. Nếu X ~ Poisson(µ) và Y ~ Poisson (λ) thì BNN X + Y ~ Poisson (µ + λ). Chứng minh. Với mọi k ∈ , 0 0 ( ) ( , ) ( ). ( ) k k i i P X Y k P X i Y k i P X i P Y k i = = + = = = = − = = = −∑ ∑ ( ) ( ) ! ( )! 0 ! 0 ! . ( ) i k ik i k i i k i i k ie kk i ke k e e C − − µ + λ − µ + λ µ −µ −λ λ − = − = = = µ λ = µ + λ ∑ ∑ Vậy, X + Y ~ Poisson (µ + λ). 3.4. Thí dụ. Chng 3 MT S PHÂN PHI THNG DÙNG 75 3.4.1. Một cơ sở sản xuất, trung bình trong một tuần, nhận được 4 đơn đặt hàng. Biết rằng số đơn đặt hàng X mà cơ sở nhận được trong một tuần là một BNN có phân phối Poisson. Tính xác suất để cơ sở đó (a) nhận được hơn 5 đơn đặt hàng trong một tuần (b) nhận được 6 đơn đặt hàng trong hai tuần liên tiếp Giải. (a) X ~ Poisson (4). Xác suất phải tính: P(X > 5) = 1 − P(X ≤ 5) = − = − ∑ 5 44 ! 0 1 e k k k = 1 − 0,7851 = 0,2149. (b) Gọi Y là BNN chỉ số đơn đặt hàng của cơ sở trong hai tuần liên tiếp thì Y ~ Poisson (8). Xác suất phải tính: P(Y = 6) = 6 886! e − = 0,1221 3.4.2. Một xe tải vận chuyển 1000 chai rượu vào kho. Xác suất để mỗi chai bị vỡ trong khi vận chuyển là 0,0035. Tính xác suất để sau khi vận chuyển, có 6 chai rượu bị vỡ; có từ 2 đến 8 chai rượu bị vỡ. (giả sử rằng sự kiện các chai rượu bị vỡ là độc lập nhau, do chất lượng riêng của mỗi chai) Giải. Gọi X là BNN chỉ số chai rượu bị vỡ sau khi vận chuyển, thì X ~ B(1000; 0,0035). Xác suất để có 6 chai rượu bị vỡ: 6 6 994 1000P( 6) (0,0035) (0,9965) 0,07709X C= = = Tính gần đúng: Vì n = 1000 và n.p = 3,5 < 5, nên có thể xem: X ~ Poisson(3,5). Do đó: 6(3,5) 3,5 6!P( 6) 0,0771X e − = ≈ = Xác suất để có từ 2 đến 8 chai rượu bị vỡ 8 (3,5) 3,5 ! 2 P(2 8) k k k X e− = ≤ ≤ ≈ =∑ 0,8543 Chng 3 MT S PHÂN PHI THNG DÙNG 76 4. PHÂN PHỐI CHUẨN 4.1. Định nghĩa. Người ta nói rằng biến ngẫu nhiên liên tục X tuân theo luật phân phối chuẩn với các tham số a và b2 (b > 0) nếu X có hàm mật độ f được xác định bởi: ( ) 2121 2 ( ) . x a b b f x e − − pi = với mọi x ∈  Ký hiệu: X ~ N(a, b2). • Kỳ vọng của X: µ = 2 2 ( )1 2 2 E ( ) . .exp x a b b X x dx + ∞ − pi − ∞   = −    ∫ 21 22 ( ) exp tb t a dt +∞ pi −∞   = + −    ∫ 2 2 2 22 2 exp expb t a tt dt dt a +∞ +∞ pi pi −∞ −∞     = − + − =        ∫ ∫ • Phương sai của X: σ2 = D(X) = 2 2 ( )21 2 2 . ( ) . exp x b b x dx +∞ − µ pi −∞   − µ −    ∫ = 2 22 22 . .expb tt dt + ∞ pi − ∞   −    ∫ = b2. Vậy, hai tham số a và b2 trong phân phối N(a, b2), theo thứ tự, là kỳ vọng và phương sai của X. Do đó, h.m.đ. f của BNN X ~ N(a, b2) có thể được viết dưới dạng: −   = −    2 2 ( )1 2 2 ( ) .exp xf x µ σ pi σ với mọi x ∈ . và ký hiệu: X ~ N(µ, σ2). • Trường hợp đặc biệt: µ = 0 và σ = 1: Chúng ta có phân phối N(0, 1). Hàm Gauss ϕ và Φ xác định trong chú ý 3.1.7, theo thứ tự, là hàm mật độ và hàm phân phối của N(0,1). Đồ thị hàm mật độ f của phân phối N(µ, σ2): Chng 3 MT S PHÂN PHI THNG DÙNG 77 Hai dồ thị hàm mật độ chuẩn với µ bằng nhau và σ khác nhau. 2 0 2 0.2 0.4 µ . Nếu X ~ N (µ, σ2) và đặt X* X − µ σ = thì X* ~ N(0, 1) Với α và β cho trước (α ≤ β), chúng ta có: P (α ≤ X ≤ β) =       σ µ−αΦ−      σ µ−βΦ=      σ µ−β≤≤ σ µ−α *XP . Trong nhiều vấn đề kỹ thuật, thường phải tính xác suất để một biến ngẫu nhiên X có phân phối chuẩn N(µ, σ2) lấy giá trị lệch khỏi kỳ vọng µ không quá một số dương α cho trước: ( ) ( )− ≤ = Φ −P 2 1X ασµ α Đặc biệt : ( )P 2 (1) 1 0,6826X −µ ≤σ = Φ − = ( )P 2 2 (2) 1 0,9544X −µ ≤ σ = Φ − = ( )P 3 2 (3) 1 0,9974 1X −µ ≤ σ = Φ − = ≈ Từ đó, người ta đưa ra " Qui tắc 3σ ": Nếu X ~ N(µ,σ2) thì hầu như chắc chắn X sẽ lấy giá trị trong khoảng [ µ − 3σ ; µ + 3σ ]. Nhờ qui tắc 3σ, chúng ta có thể biết ngay một cách hầu như chắc chắn biến ngẫu nhiên có phân phối chuẩn nhận giá trị trong khoảng nào. 4.2. Thí dụ. 4.2.1. Thời gian để sản xuất một sản phẩm loại A là một BNN tuân theo luật phân phối chuẩn với các tham số µ = 10 và σ = 1 (đơn vị là phút) (a) Tính xác suất để một sản phẩm loại A nào đó được sản xuất trong khoảng thời gian từ 9 phút đến 12 phút. (b) Tính thời gian cần thiết để sản xuất một sản phẩm loại A bất kỳ. Giải. Đồ thị hàm mật độ chuẩn N(0,1) ( Hàm Gauss ) σ = 1 σ = 2 Chng 3 MT S PHÂN PHI THNG DÙNG 78 Gọi X là BNN chỉ thời gian dể sản xuất một sản phẩm loại A , X ~ N(10; 1). (a) Xác suất phải tính: P(9 ≤ X ≤ 12) = ( ) ( )12 10 9 101 1− −Φ − Φ = Φ(2) – Φ(-1) = Φ(2) + Φ(1) –1 = 0,9772 + 0,8413 – 1 = 0,88185. (b) Theo qui tắc 3σ, hầu như chắc chắn X lấy giá trị trong khoảng: [ ]10 3 1; 10 3 1− × + × = [ ]7; 13 Vậy, thời gian cần thiết để sản xuất một sản phẩm loại A bất kỳ là từ 7 phút đến 13 phút (hầu như chắc chắn). 4.2.2. Cho biến ngẫu nhiên X tuân theo luật phân phối N(µ, σ2). Biết rằng X lấy giá trị nhỏ hơn 60 với xác suất 0,1003 và lấy giá trị lớn hơn 90 với xác suất 0,0516, hãy tính µ và σ. Giải. Theo giả thiết, ( ) ( ) 60 90 0,1003( 60) 0,1003 ( 90) 0,0516 1 0,0516 − µ σ − µ σ  Φ =< =  ⇔  > =  − Φ =  P X P X ( ) ( ) 60 90 0,8997 0,9484 µ − σ − µ σ  Φ = ⇔   Φ =  60 90 1, 28 1,64 µ − σ − µ σ  = ⇔   =  Vậy, µ = 73,15 và σ = 10,27. 4.3. Định nghĩa. Giả sử U ~ N(0,1). Nếu P(U < c) = α thì c được gọi là Bách phân vị mức α của phân phối chuẩn, ký hiệu uα. Vậy, Φ( uα) = α. 4.4. Chú ý. Theo định lý DeMoivre - Laplace, nếu X ~ B(n, p) với n khá lớn và p không quá gần 0 và gần 1 (n > 30, np ≥ 5 và n(1 − p) ≥ 5) thì chúng ta có thể xem như X ~ N (np, npq). Phân phối chuẩn chiếm vị trí rất quan trọng trong lý thuyết xác suất và thống kê toán. Theo Borel, một biến ngẫu nhiên là kết quả của nhiều nguyên nhân, mỗi nguyên nhân tác động một ít và không nguyên nhân nào là quyết định, sẽ theo luật phân phối chuẩn hoặc tiệm cận chuẩn. Chẳng hạn: Chng 3 MT S PHÂN PHI THNG DÙNG 79 Các số đo về đặc tính sinh học như chiều cao, cân nặng, huyết áp,... hầu như có phân phối chuẩn; các sai số trong đo lường vật lý; lực chịu nén của một thanh xà... cũng tuân theo luật phân phối chuẩn. Trong xã hội, số con trong một gia đình, số lợi tức hằng năm, sản lượng một vụ mùa trên một đơn vị diện tích... tuân theo luật phân phối chuẩn. 4.4. Định lý. Cho hai biến ngẫu nhiên X và Y độc lập. Khi đó, nếu X ~ 21 1( , )µ σN và Y ~ 22 2( , )µ σN thì biến ngẫu nhiên k1X + k2Y tuân theo luật phân phối 2 2 2 21 1 2 2 1 1 2 2( , )µ + µ σ + σN k k k k , trong đó k1 và k2 là 2 hằng số thực. 5. PHÂN PHỐI ĐỀU 5.1. Định nghĩa. Người ta nói rằng biến ngẫu nhiên liên tục X có phân phối đều trên đoạn [a, b] nếu X có h.m.đ. f được xác định bởi: f (x) = 1b a− nếu x ∈ [ ]ba, và f (x) = 0 nơi khác Ký hiệu: X ~ u [ ]ba, . 5.2. Định lý. Nếu BNN X ~ u [ ]ba, thì X có kỳ vọng và phương sai lần lượt là: 2( ) a bE X += và ( ) 2 12( ) b a D X − = Chứng minh. 21 2 2( ) b b x dx a bx b a b a aa E X + − −   = = =  ∫ Phần chứng minh D(X) dành cho bạn đọc. ■ 6. PHÂN PHỐI χ2 6.1. Định nghĩa. Người ta nói rằng biến ngẫu nhiên liên tục X có phân phối χ2 với n bậc tự do (n ∈ *) nếu X có hàm mật độ f được xác định trên  bởi: 2 2 / 2 11 2 ( / 2) , 0( ) 0 , 0 n x n n x e xf x x − − Γ  > =   ≤ víi víi , trong đó, ký hiệu Γ chỉ hàm Gamma. Ký hiệu: X ~ χ2(n). Chng 3 MT S PHÂN PHI THNG DÙNG 80 n = 2 0 5 10 15 0.2 Đồ thị hàm mật độ của phân phối χ2 với các bậc tự do khác nhau Giả sử X ~ χ2(n), nếu P(X < c) = α thì c được gọi là Bách phân vị mức α của phân phối χ2(n), ký hiệu: 2 (n)αχ . Vậy, P(X < 2 (n)αχ ) = α. Nếu X ~ χ2(n) thì E(X) = n và D(X) = 2n. Chúng ta công nhận: 6.2. Định lý. Giả sử các biến ngẫu nhiên X1, X2, ... , Xn độc lập và cùng có phân phối chuẩn N(0,1). Khi đó, (a) Các BNN 2iX (i = 1,…, n) tuân theo luật χ2(1); (b) BNN 2 2 2 21 2 . . . nQ X X X= + + + tuân theo luật χ2(n).  7. PHÂN PHỐI STUDENT 7.1. Định nghĩa. Người ta nói rằng biến ngẫu nhiên liên tục X có phân phối Student (hay phân phối t ) với n bậc tự do khi X có h.m.đ. f được xác định bởi: 1 2 2 2 1 2 ( ) ( ) 1 + − + Γ     pi Γ   = +    n n n x nn f x với mọi x ∈  Ký hiệu: X ~ Student (n) hay X ~ t(n). n = 2 n = 4 n = 10 Chng 3 MT S PHÂN PHI THNG DÙNG 81 0 0.2 0.4 0 0.2 0.4 0 0.2 0.4 Giả sử T ~ t(n); nếu P(T < c) = α thì c được gọi là Bách phân vị mức α của phân phối t(n), ký hiệu là (n)tα . Vậy, P(T <