Bài giảng chương 2: Biến ngẫu nhiên

Kiểm tra 100 sản phẩm của một nhà máy theo kiểu có hoàn lại. Ta thấy Có dãy 100 phép thửvới kết quảcủa mỗi phép thửlà A= “Chính phẩm”, A= “Phếphẩm” Chúng có xác suất không đổi qua mỗi lần kiểm tra. Kết quảcủa mỗi lần kiểm tra không ảnh hưởng đến các kết quảcủa những lần kiểm tra còn lại.

pdf66 trang | Chia sẻ: haohao89 | Lượt xem: 4336 | Lượt tải: 3download
Bạn đang xem trước 20 trang tài liệu Bài giảng chương 2: Biến ngẫu nhiên, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
TRẦN AN HẢI    TUẦN 4  HÀ NỘI - 2009 Chương 2 BIẾN NGẪU NHIÊN …………. tiếp theo §4  MỘT SỐ QUY LUẬT PPXS THÔNG DỤNG  Phân bố nhị thức Ví dụ Kiểm tra 100 sản phẩm của một nhà máy theo kiểu có hoàn lại. Ta thấy  Có dãy 100 phép thử với kết quả của mỗi phép thử là A = “Chính phẩm”, A = “Phế phẩm” Chúng có xác suất không đổi qua mỗi lần kiểm tra.  Kết quả của mỗi lần kiểm tra không ảnh hưởng đến các kết quả của những lần kiểm tra còn lại. Tổng quát hóa ta có định nghĩa  Một dãy n phép thử được gọi là đc lp nếu các kết quả của mỗi phép thử không ảnh hưởng đến kết quả của những phép thử còn lại.  Một dãy n phép thử độc lập được gọi là một lc đ Bernoulli khi thỏa 2 điều kiện: ∗ Mỗi phép thử chỉ xét tới biến cố A và A. ∗ P(A) = p trong mỗi phép thử. Ta xét một lược đồ Bernoulli gồm n phép thử. Đặt X = số lần xuất hiện A trong n phép thử. X là một bnn có tập giá trị là {0, 1, 2, …, n}. Ta tìm quy luật ppxs của X. Trường hợp n = 3 Ký hiệu Bi = “A xảy ra ở phép thử thứ i” P(Bi) = p, qpBP i =−= 1)( P{X = 0} = P( 321 BBB ) = P( 1B ) P( 2B )P( 3B ) = q3 = 3003 qpC P{X = 1} = P( 321 BBB ∪ 321 BBB ∪ 321 BBB ) = 3pq2 = 2113 qpC P{X = 2} = P( 321 BBB ∪ 321 BBB ∪ 321 BBB ) = 3p2q = 1223 qpC P{X = 3} = P( 321 BBB ) = p3 = 0333 qpC Trường hợp tổng quát Chứng minh tương tự trường hợp trên, ta có: Quy luật ppxs của X là P{X = i} = iniin qpC − (i = 0, 1, …, n). Ta nói X có phân b nh th c với tham số n, p. Ta ký hiệu X ∼ B(n, p) (B viết tắt binomial). Đặc biệt, khi X ∼ B(1, p) ta nói X có phân bố không- mt với tham số p X 0 1 P q p Định lý Nếu X ∼ B(n, p), thì 1) E(X) = np 2) D(X) = npq 3) mod(X) = [(n+1)p] ( phần nguyên của (n+1)p) Ví dụ Tỉ lệ cử tri ủng hộ ứng cử viên Bush trong bầu cử tổng thống là 60%. Người ta hỏi ý kiến 20 cử tri được chọn một cách ngẫu nhiên. Gọi X là số người bỏ phiếu cho Bush trong 20 người đó. a) Tính số người bỏ phiếu có khả năng nhất và tính trung bình số người bỏ phiếu trong 20 người trên. b) Tính P{X ≤ 10}, P{X>12}, P{X = 11}. Giải X ∼ B(20; 0,6) a) số người bỏ phiếu có khả năng nhất = mod(X) = [21⋅0,6] = 12. b) P{X ≤ 10} = ∑ = − ⋅ 10 0 20 20 4,06,0 i iiiC = 0,245 (tra bảng). P{X > 12} = 1 - P{X≤12} = 1- ∑ = − ⋅ 12 0 20 20 4,06,0 i iiiC = 1- 0,584 = 0,416. P{X = 11} = 9111120 4,06,0 ⋅C Muốn tra bảng, ta dùng P{X = 11} = P{X ≤ 11} - P{X ≤ 10} = 0,404 – 0,245 = 0,159. ☺  Phân bố siêu bội Xét một tập gồm N đối tượng, trong đó có M đối tượng có tính chất T và N-M đối tượng không có tính chất T. Chọn ngẫu nhiên n (n ≤ M) đối tượng theo kiểu không hoàn lại. Ta có dãy n phép thử với kết quả của mỗi phép thử là A = “Đối tượng có tính chất T” và A Chúng có xác suất thay đổi qua mỗi phép thử. Trong dãy này kết quả của mỗi phép thử ảnh hưởng đến các kết quả của những phép thử khác nên dãy này không phải là lược đồ Bernoulli. Gọi X = số đối tượng được chọn có tính chất T. X có tập giá trị là {0, 1, 2, …, n} với quy luật phân bố cho bởi P{X = i} = n N in MN i M C CC − − ⋅ . Ta nói X có phân b siêu bi với các tham số (N, M, n). Định lý Nếu X có phân bố siêu bội với các tham số (N, M, n), thì E(X) = N M n ⋅ và D(X) = 1− − ⋅ − ⋅⋅ N nN N MN N M n . Ví dụ Trong 500 vé xổ số bán ra có 50 vé trúng thưởng. Một người mua 20 vé. Tính: 1) Xác suất để anh ta có đúng 3 vé trúng thưởng; 2) Trung bình của số vé trúng thưởng. Giải X = số vé trúng thưởng. X có phân bố siêu bội với tham số (500, 50, 20) P{X = 3} = 3 500 17 450 3 50 C CC ⋅ ≈ 0,194. EX = 2 500 5020 =⋅ . ☺ Chú ý Khi n là rất bé so với N thì ini i nn N in MN i M N M N MC C CC −− −       −      ≈ ⋅ 1 nên quy luật phân phối trong phương pháp lấy không hoàn và lấy có hoàn lại gần không khác nhau. Vì thế ta có thể tính toán như trong trường hợp có hoàn lại cho đơn giản. Ví dụ Một kho chứa sản phẩm của 2 xí nghiệp A và B với tỉ lệ bằng nhau. Tỉ lệ chính phẩm của A, B lần lượt là 80% và 85%. Tính xác suất để trong 2 sản phẩm lấy ngẫu nhiên từ kho có đúng một chính phẩm. Giải Kết quả của việc lấy 2 sản phẩm là H1 = “Cả 2 sản phẩm là của A” H2 = “Cả 2 sản phẩm là của B” H3 = “1 sản phẩm là của A, 1 sản phẩm là của B” K =“Trong 2 sản phẩm lấy ra có đúng 1 chính phẩm” Hi (i =1, 2, 3) là nhóm đầy đủ P(H1) = 0,5⋅0,5= 0,25, P(H2) = 0,5⋅0,5= 0,25 P(H3) = 1 - P(H1) - P(H2) = 0,5. P(K/H1) = 12C 0,8⋅0,2 = 0,32 P(K/H2) = 12C 0,85⋅0,15 = 0,255 P(K/H3) = 0,8⋅0,15 + 0,2⋅0,85 = 0,29 Theo công thức xác suất đầy đủ P(A) = ∑ = 3 1i ii HKPHP )/()( = … ☺  Phân bố Poisson Các b.n.n như : số cuộc điện thoại tại một trạm điện thoại trong một phút, số khách vào một cửa hàng trong một ngày, số xe cộ đi qua một trạm quan sát trong một giờ, … có cùng kiểu ppxs, gọi là lut phân b Poisson (do nhà toán học Siméon-Denis Poisson tìm ra 1837). • B.n.n X được nói là có phân b Poisson với tham số λ, ký hiệu X ∼ Poisson(λ), nếu tập giá trị của nó là N và P{X = k} = !k e kλλ− , trong đó λ > 0 cho trước. Siméon Denis Poisson (1781-1840) Định lý Nếu X ∼ Poisson(λ), thì E(X) = D(X) = λ, mod(X) = [λ]. Ví dụ  Nếu ở một tổng đài các cú điện thoại gọi đến xuất hiện ngẫu nhiên, độc lập với nhau và trung bình có 2 cuộc gọi trong một phút, thì X = Số cú điện thoại xuất hiện trong 1 phút là bnn có luật ppxs cho bởi P{X = k} = !k e k22− . Nếu các khách vào một cửa hàng một cách ngẫu nhiên, độc lập với nhau và trung bình một giờ có 4,5 khách vào, thì X = Số khách vào cửa hàng trong 1 giờ là bnn có luật ppxs cho bởi P{X = k} = ! ,, k e k5454− . Ví dụ Một gara cho thuê ôtô thấy rằng số người đến thuê ôtô vào ngày Thứ Bảy cuối tuần là một bnn X ∼ Poisson(2). Giả sử gara có 4 chiếc ôtô. Hãy tìm xác suất để a) Không phải tất cả 4 chiếc đều được thuê. b) Tất cả 4 ôtô đều được thuê. c) Gara không đáp ứng được yêu cầu. d) Gara cần có ít nhất bao nhiêu ôtô để xác suất không đáp ứng nhu cầu thuê bé hơn 2%. Giải a) P{X ≤ 3} = { }∑ = = 3 0k kXP = ∑ = − 3 0 2 2 k k k e ! = 0,857. b) P{X ≥ 4} = 1- P{X ≤ 3} = 0,143. c) P{X > 4} = 1- P{X ≤ 4} = 1 – 0,947 = 0,053. d) Ta cần tìm n để P{X > n} < 0,02, hay P{X ≤ n} > 0,98. Tra bảng thấy: P{X ≤ 4} = 0,947, P{X ≤ 5} = 0,983 Nên n = 5. ☺ Phân bố đều • B.n.n X được nói là có phân b đ u trên đo n [a, b], ký hiệu X ∼ U[a, b], nếu hàm mật độ của nó cho bởi     ∉ ∈ − = ],[ ],[)( baxkhi baxkhi abxp 0 1 . Đồ thị của hàm mật độ Nhận xét X nhận giá trị trong các khoảng con có độ dài bằng nhau của [a, b] với xác suất bằng nhau. Định lý Nếu X ∼ U[a, b], thì E(X) = 2 ba + , D(X) = 12 2)( ab − , mod(X) = giá trị bất kỳ trong [a, b], md = 2 ba + . Quy luật phân bố đều có ứng dụng rộng trong thống kê toán. Ví dụ Khi thâm nhập một thị trường mới, doanh nghiệp không thể khẳng định được một cách chắc chắn doanh số hàng tháng có thể đạt là bao nhiêu mà chỉ dự kiến: tối thiểu = 20 tr/th và tối đa = 40 tr/th. Tìm xác suất để doanh nghiệp đạt doanh số từ 35 tr/th trở lên. Giải X = doanh số hàng tháng (triệu đồng). Do không biết gì hơn về X nên ta quan niệm X ∼ U[20; 40]. P{X > 35} = ∫ ∫ ∞+ = − = 35 40 35 250 2040 ,)( dxdxxp . ☺ Phân bố chuẩn • B.n.n X được nói là có phân b chu n v i tham s µ và σ2 (σ>0), ký hiệu X ∼ N(µ, σ2), nếu hàm mật độ của nó cho bởi 2 2 2 2 1 σ µ− − piσ = )( )( x exp . Đồ thị hàm mật độ của bnn X ∼ N(µ, σ2) Định lý Nếu X ∼ N(µ, σ2), thì E(X) = µ, D(X) = σ2, mod(X) = md = µ. Phân bố chuẩn được Gauss phát minh năm 1809. Tờ 10 DM có đồ thị hàm mật độ của phân bố chuẩn Luật phân bố chuẩn gặp rất nhiều trong đời sống Phân phối xác suất của VN Index cuối tháng 11, đầu tháng 12 năm 2008 Phân phối xác suất của tỷ suất sinh lợi VaR (Value at Risk ) của một danh mục tài sản tài chính = khoản tiền lỗ tối đa trong một thời hạn nhất định, nếu ta loại trừ những trường hợp xấu nhất hiếm khi xảy ra. Phân phối xác suất của lợi nhận . Phân phối xác suất của chỉ số IQ Phân phối xác suất của chiều cao phụ nữ Việt Nam Diễn biến của điểm thi đại học khối A một số năm • Khi Y ∼ N(0, 12), nói Y có phân b chu n tc. Ký hiệu hàm phân bố của Y là ∫ ∞− − pi =Φ z x dxez 2 2 2 1)( . Người ta đã lập bảng tính sẵn các giá trị của Φ(z) với z ≥ 0. Với z < 0, ta dùng công thức sau Φ(z) = 1 - Φ(-z). Định lý Nếu X ∼ N(µ, σ2), thì: • Y = σ µ−X ∼ N(0, 12); • Hàm phân bố của X là F(x) =       σ µ−Φ x ; Bình luận Định lý này cho phép ta đưa các tính toán liên quan tới X∼ N(µ, σ2) về các tính toán liên quan đến phân phối chuẩn tắc. Ví dụ Một loại chi tiết được sản xuất có độ dài quy định là 20cm. Biết độ dài X của chi tiết được sản xuất ra tuân theo quy luật phân bố chuẩn với độ lệch tiêu chuẩn 0,2cm. a) Tính xác suất để độ dài chi tiết lệch so với độ dài quy định không quá 0,3cm ; b) Nếu muốn đảm bảo tỉ lệ phế phẩm ≤ 5% thì sai số cho phép phải xác định bằng bao nhiêu? Giải a) X∼ N(20, 0,22). P{|X – 20|< 0,3} = P{19,7< X < 20,3} = ( ) ),(, , , , , 5151 20 20719 20 20320 −Φ−Φ=      −Φ−      −Φ = ( ) 151251151 −Φ=Φ+−Φ ),(),(, 1933202 −⋅≈ , = 0,8664. (Gần 87% chi tiết có độ dài trong (19,7 ; 20,3)). b) Gọi sai số cho phép cần xác định là ε. Ta có: P{|X – 20| 0,95 ⇔ P{20 - ε 0,95 ⇔       ε−Φ−      εΦ 2020 ,, > 0,95 ⇔ 1 20 2 −      εΦ , > 0,95 ⇔       εΦ 20, > 0,975 ⇔       εΦ 20, > ( )961,Φ ⇔ 20, ε > 1,96 ⇔ ε > 0,392. ☺ Ví dụ Khối lượng một gói đường (đóng bằng máy) có phân bố chuẩn. Trong 1000 gói đường có 70 gói có khối lượng > 1015g. Hãy ước lượng xem có bao nhiêu gói đường có khối lượng ít hơn 1008g, biết rằng khối lượng trung bình của 1000 gói đường là 1012g. Giải X = khối lượng một gói đường∼ N(1012; σ2). σ chưa biết, phải ước lượng. P{X > 1015} ≈ 070 1000 70 ,= ⇔ 1 - P{X < 1015} ≈ 0,07 ⇔ 1-       σ −Φ 10121015 ≈ 0,07 ⇔       σ Φ 3 ≈ 0,93 ( )47613 ,Φ≈      σ Φ ⇔ σ 3 ≈ 1,476 ⇔ σ ≈ 2,0325. P{X < 1008} ≈       −Φ 03252 10121008 , = ( )9681,−Φ ≈ 0,0245. ⇒ Trong 1000 gói có khoảng 1000×0,0245 = 24,5 gói khối lượng ít hơn 1008g. ☺ Quy tắc "Hai sigma" và "Ba sigma" Nếu X ∼ N(µ, σ2), thì: • P{µ - 2σ < X < µ + 2σ} ≈ 0,9544 ; • P{µ - 3σ < X < µ + 3σ} ≈ 0,9972. Áp dụng Một bnn mà chưa biết luật ppxs, song nó thỏa mãn một trong 2 quy tắc trên, thì có thể xem nó có phân bố chuẩn. Phân bố Student • B.n.n T được nói là có phân b Student v i n bc t do, nếu hàm mật độ của nó cho bởi 2 1 2 1 + −       += n n xCxp )( . Phân bố χ2 • B.n.n X được nói là có phân b χ2 v i n bc t do, nếu hàm mật độ của nó cho bởi     > ≤ = + 0 00 2 1 xkhieCx xkhi xp n)( . Phân bố Fisher-Snedecor • B.n.n F được nói là có phân b Fisher- Snedecor v i (n, m) bc t do, nếu hàm mật độ của nó cho bởi ( )       > + ≤ = + − 0 00 2 2 1 xkhi mxn Cx xkhi xp mn n )( . §6  XẤP XỈ PHÂN BỐ NHỊ THỨC Đối với X ∼ B(n, p) với n khá lớn thì việc tính cụ thể các P{X = k} = knkkn qpC − nói chung là khó. Dưới đây đưa ra một số công thức cho phép tính xấp xỉ các giá trị này.  Trường hợp n khá lớn và p khá bé P{X = k} ≈ ! )( k np e k np− . Xấp xỉ này là tốt khi n> 50 và p<0,1. Ví dụ Một máy dệt có 4000 ống sợi. Xác suất đứt sợi của mỗi ống trong 1 phút là 0,0005. Tính xác suất để trong 1 phút a) Có 3 ống sợi bị đứt; b) Có ít nhất 2 ống sợi bị đứt. Giải Ta có 4000 phép thử độc lập. Trong mỗi phép thử có hai biến cố: A = "Ống sợi bị đứt" và A. ⇒ ta có Lược đồ Bernoulli với X ∼ B(4000 ; 2) a) P"Ba ống sợi bị đứt" = P{X = 3} ≈ !3 232−e ≈ 0,18. b) P"Ít nhất 2 ống sợi bị đứt" = 1 – P{X ≤ 1} ≈ 1-∑ = − 1 0 2 2 k k k e ! ≈ 1 – 0,406 = 0,594. ☺  Trường hợp n khá lớn và p khá gần 1 Trường hợp này q = P(A)= 1 – p khá bé nên đổi vai trò p và q cho nhau, rồi sử dụng công thức của trường hợp trên, ta có P{X = k} = knkkn qpC − = kknknn pqC −− ≈ )!( )( kn np e kn nq − − − .  Trường hợp n khá lớn và p không quá gần 0 và không quá gần 1 P{X = k} ≈       −ϕ npq npk npq 1 (k = 0, …, n), trong đó ( ) 2 2 2 1 x ex − pi =ϕ là hàm Gauss. P{k1 ≤ X ≤ k2} ≈       −−Φ−      −+Φ npq npk npq npk 5050 12 ,, với k1 và k2 ∈N. Các xấp xỉ này là tốt khi np và nq >5 hoặc npq>20. Ví dụ Một máy dệt có 599 ống sợi. Xác suất đứt sợi của mỗi ống trong 1 phút là 0,01. a) Tìm giá trị có xác suất lớn nhất của số ống sợi bị đứt trong 1 phút và tìm xác suất đó; b) Tìm xác suất để trong 1 phút có ≤ 10 ống sợi bị đứt. §7  BIẾN NGẪU NHIÊN 2-CHIỀU RỜI RẠC Trong thực tế ta phải xét đồng thời cặp bnn rời rạc (X, Y). Ta gọi cặp này là một bnn 2-chi u ri r c. Ví dụ Gieo đồng thời 2 con xúc xắc cân đối. Gọi X và Y là số chấm xuất hiện của mỗi con. Ta có bnn 2-chiều (X, Y). • Một hình thức cho phép tính được xác suất để bnn (X, Y) rơi vào một điểm bất kỳ của (Oxy) được gọi là quy lut phân phi xác sut của nó. Những hình thức cho quy luật ppxs của bnn 2-chiều rời rạc: công thức, bảng ppxs, hàm pbxs. Ví dụ Gieo đồng thời 2 con xúc xắc cân đối. Gọi X và Y là số chấm xuất hiện của mỗi con. Bnn 2-chiều (X, Y) có luật ppxs P{(X, Y) = (i, j)} = 36 1 , ∀ i =1,…, 6 và ∀ j =1,…, 6. Y X x1 x2 x3 … y1 p11 p12 p13 … y2 … … … Chương 33 LUẬT SỐ LỚN Luật số lớn là tên gọi chung cho những mệnh đề khẳng định rằng :