Bài giảng Xác suất và thống kê - Trần An Hải

Ta còn gặp rất nhiều phép thửngẫu nhiên khác như: quan sát thịtrường chứng khoán, chơi xổsố và các trò may rủi, thống kê tai nạn và bảo hiểm, thống kê khách hàng đến các máy rút tiền ATM, đếm sốlần gọi đến các tổng đài, xét chất lượng sản phẩm, quan sát thời tiết, xét khảnăng phòng thủ trong quân sự,

pdf60 trang | Chia sẻ: haohao89 | Lượt xem: 4539 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Bài giảng Xác suất và thống kê - Trần An Hải, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
TRẦN AN HẢI   BÀI GIẢNG XÁC SUẤT & THỐNG KÊ HÀ NỘI - 2009 TÀI LIỆU THAM KHẢO [1] Trần Mạnh Tuấn, Xác suất & Thống kê, Lí thuyết và thực hành tính toán, Nhà xuất bản Đại học Quốc gia Hà Nội, 2004 [2] Đặng Hùng Thắng, Mở đầu về lí thuyết xác suất và các ứng dụng, Nhà xuất bản Giáo dục, 2005 [3] Đặng Hùng Thắng, Thống kê và ứng dụng, Nhà xuất bản Giáo dục, 2005 [4] Nguyễn Cao Văn - Trương Giêu, Bài tập Lý thuyết xác suất & Thống kê toán, Nhà xuất bản KHKT, 2006 NỘI DUNG Chương 1 Các định nghĩa xác suất Chương 2 Biến ngẫu nhiên Chương 3 Luật số lớn Chương 4 Thống kê mô tả Chương 5 Ước lượng tham số Chương 6 Kiểm định giả thuyết thống kê Sau khi học hết chương 3 kiểm tra lần 1 Sau khi học hết chương 6 kiểm tra lần 2  TUẦN 1  Chương 1 CÁC ĐỊNH NGHĨA XÁC SUẤT _________________________________________________ '1 PHÉP THỬ NGẪU NHIÊN VÀ KHÔNG GIAN MẪU Khi cho cuộn dây quay đều trong từ trường của một thanh nam châm, kết quả là chắc chắn xuất hiện dòng điện trong cuộn dây Đây là một phép th không ngu nhiên. Khi gieo 1 con xúc xắc cân đối và đồng chất, ta không đoán chắc chắn được kết quả. Chỉ biết được kết quả là xuất hiện số chấm trong {1, …, 6}. Đây là một phép th ngu nhiên. Ta còn gặp rất nhiều phép thử ngẫu nhiên khác như: quan sát thị trường chứng khoán, chơi xổ số và các trò may rủi, thống kê tai nạn và bảo hiểm, thống kê khách hàng đến các máy rút tiền ATM, đếm số lần gọi đến các tổng đài, xét chất lượng sản phẩm, quan sát thời tiết, xét khả năng phòng thủ trong quân sự,… Vào năm 1651 nhà quý tộc Pháp De Méré nhờ nhà toán học Blaise Pascal giải đáp một số vấn đề rắc rối nảy sinh trong các trò cờ bạc. Pascal đã “toán học hóa” các trò chơi này, nâng lên thành những bài toán phức tạp hơn và trao đổi vấn đề này với nhà toán học Pierre de Fermat, người được mệnh danh là “quái kiệt” trong giới toán học đương thời. Những cuộc trao đổi đó đã khai sinh ra Lý thuyết xác suất, một ngành toán học nghiên cứu các phép thử ngẫu nhiên. Blaise Pascal (1623-1662) Ngày nay Lý thuyết xác suất đã trở thành một ngành toán học quan trọng, được ứng dụng trong rất nhiều lĩnh vực của khoa học tự nhiên, khoa học xã hội, công nghệ, kinh tế, y học, sinh học,… Chẳng hạn như nó cho phép xác định rủi ro trong buôn bán hàng hóa. Chính phủ cũng áp dụng các phương pháp xác suất để điều tiết môi trường hay còn gọi là phân tích đường lối. Nhiều sản phẩm tiêu dùng như xe hơi, đồ điện tử áp dụng lý thuyết xác suất trong thiết kế để giảm thiểu sự hỏng hóc. Do bài giảng này chỉ xét các phép thử ngẫu nhiên, nên ta gọi tắt chúng là phép thử. • Phép thử ngẫu nhiên được ký hiệu bởi chữ T . Mỗi kết quả của T được gọi là một bin c s cp. Tập hợp tất cả các kết quả có thể xảy ra của T được gọi là không gian mu của T và được ký hiệu bởi chữ Ω. Ví dụ T = gieo một con xúc xắc và i = số chấm xuất hiện. Không gian mẫu của T là Ω = {1, 2, 3, 4, 5, 6}. '2 BIẾN CỐ VÀ MỐI QUAN HỆ GIỮA CHÚNG Khi gieo một con xúc xắc, sẽ ra số chấm lẻ nếu kết quả là ra mặt có số chấm ∈ {1, 3, 5}. Như vậy, các kết quả này thuận lợi cho sự kiện ra số chấm lẻ. • Một bin c liên quan đến phép thử T là một sự kiện mà việc nó xảy ra hay không xảy ra tùy thuộc vào kết quả của T. Kết quả ω của T được gọi là một kt qu thun l i cho bin c A nếu A xảy ra khi kết quả của T là ω. Tập hợp các kết quả thuận lợi cho A được ký hiệu là ΩA. Ví dụ A là biến cố “ra số chấm chẵn” khi gieo một con xúc xắc , thì ΩA = {2, 4, 6}. Chú ý • Mỗi biến cố A tương ứng với một và chỉ một tập con ΩA ⊂ Ω. • Mỗi biến cố sơ cấp ω cũng là một biến cố, và đó là biến cố mà Ωω = {ω}. • Bin c không th là biến cố không bao giờ xảy ra khi thực hiện T. Nó tương ứng với tập ∅⊂ Ω nên cũng được ký hiệu là ∅. • Bin c ch c ch n là biến cố luôn luôn xảy ra khi thực hiện T. Nó tương ứng với chính Ω nên cũng được ký hiệu là Ω. a) Quan hệ giữa các biến cố • Biến cố A được gọi là kéo theo biến cố B, ký hiệu A ⊂ B, nếu A xảy ra thì B cũng xảy ra. Ta có ΩA ⊂ ΩB. • Biến cố A được gọi là tưng đưng với biến cố B, ký hiệu A = B, nếu A xảy ra thì B xảy ra và ngược lại. Ta có ΩA = ΩB. • Bin c đi của biến cố A, ký hiệu A, là biến cố xảy ra khi và chỉ khi A không xảy ra. Ta có AΩ = Ω \ ΩA. Ví dụ A là biến cố “ra số chấm chẵn” khi gieo một con xúc xắc , thì A = “ra số chấm lẻ” và AΩ = {1, 3, 5} = {1, 2, 3, 4, 5, 6} \ {2, 4, 6} = Ω \ ΩA . b) Hợp của các biến cố • Nếu A1, A2, …, An là các biến cố liên quan đến cùng một phép thử, thì h p (hay tng) của chúng, ký hiệu là A1∪A2∪ …∪An, là biến cố xảy ra nếu có ít nhất một biến cố nào đó trong các biến cố A1, A2, …, An xảy ra. Ta có nn AAAAAA Ω∪∪Ω∪Ω=Ω ∪∪ K2121 ... . c) Giao của các biến cố • Nếu A1, A2, …, An là các biến cố liên quan đến cùng một phép thử, thì giao (hay tích) của chúng, ký hiệu là A1A2 …An, là biến cố xảy ra nếu tất cả các biến cố A1, A2, …, An đều xảy ra. Ta có nn AAAAAA Ω∩∩Ω∩Ω=Ω K2121 ... . • Hai biến cố A và B được gọi là xung kh c nếu AB = ∅. Ví dụ T = gieo một con xúc xắc cân đối và Ai = "Ra i chấm", A = "Ra số chấm chẵn", B = "Ra số chấm chia hết cho 3". Ta có A = A2∪A4∪A6, B = A3∪A6, AB = A6. A1, A2, …, A6 đôi một xung khắc. Chú ý • A∪B =B∪A, AB =BA • A∪A = A, AA = A • A∪Ω = Ω, AΩ = A, A∪∅ = A, A∅ = ∅ • (A∪B)C = AC∪BC, AB∪C = (A∪C)(B∪C) • AA = • nn AAAAAA LL 2121 =∪∪∪ • nn AAAAAA ∪∪∪= LL 2121 Ngôn ngữ xác suất Ngôn ngữ tập hợp Biến cố sơ cấp ω Không gian mẫu Ω Biến cố A ΩA B.c A kéo theo b.c B ΩA ⊂ ΩB B.c A, B tương đương ΩA = ΩB Biến cố hợp A∪B ΩA ∪ ΩB Biến cố giao AB ΩA ∩ ΩB Các biến cố A, B xung khắc ΩA ∩ ΩB = ∅ '3 XÁC SUẤT CỦA MỘT BIẾN CỐ Trong cuộc sống hàng ngày có những câu nói kiểu như “Chiều nay có thể mưa”, “Giá vàng ngày mai có thể giảm”, “Mua loại cổ phiếu này có thể thắng lợi”. Đây chính là khẳng định về khả năng xảy ra của biến cố. Toán học đã định lượng hóa các khả năng này bằng cách gán cho mỗi biến cố một con số thuộc [0; 1], gọi là xác sut ca bin c đó. Ký hiệu xác suất của biến cố A là P(A). a) Định nghĩa xác suất cổ điển • Giả sử một phép thử T có tất cả n kết quả đồng khả năng, trong đó m kết quả thuận lợi cho biến cố A (tức là |Ω| = n, |ΩA| = m). Khi đó P(A) = n m . Nói cách khác, P(A) bằng tỉ số của số kết quả thuận lợi cho A trên số kết quả có thể xảy ra. Ví dụ T = gieo một con xúc xắc cân đối. A = “Ra số chấm chẵn”, B = “Ra số chấm chia hết cho 3”. Ta có P(A) = 6 3 và P(B) = 6 2 . Chú ý Từ tính đối xứng của phép thử (đồng tiền cân đối, con xúc xắc cân đối,…) ta suy ra các kết quả của nó đồng khả năng. b) Định nghĩa xác suất theo hình học Bài toán Hai người hẹn gặp nhau tại một địa điểm đã định trước trong khoảng thời gian từ 19 đến 20 giờ. Mỗi người có thể đến điểm hẹn một cách ngẫu nhiên tại một thời điểm trong khoảng thời gian nói trên và họ qui ước rằng người đến trước sẽ chỉ đợi người đến sau trong vòng 10 phút. Tính xác suất để hai người này có thể gặp nhau. Phân tích Gọi x và y lần lượt là thời điểm (tính bằng phút) người thứ nhất và người thứ hai đến điểm hẹn. x và y thuộc [0; 60]. Ở đây phép thử là hành động hai người gặp nhau, còn mỗi cặp thời điểm (x; y) là một kết quả. Trong mặt phẳng (Oxy) tập hợp các cặp thời điểm này là hình vuông Ω có cạnh bằng 60. Biến cố A = “hai người gặp nhau” xảy ra khi và chỉ khi |x – y| ≤ 10 hay x – 10 ≤ y ≤ x + 10. Tập hợp các kết quả thuận lợi cho A được biểu diễn bởi miền hình học ΩA gạch chéo. Xác suất của biến cố A được tính theo định nghĩa sau đây. • Giả sử một phép thử T có vô hạn biến cố sơ cấp đồng khả năng có thể biểu diễn như các điểm của một miền hình học Ω nào đó, các biến cố sơ cấp thuận lợi cho biến cố A được biểu diễn như các điểm của miền hình học ΩA. Khi đó P(A) = độ đo của ΩA/độ đo của Ω. Độ đo sẽ là độ dài, diện tích hay thể tích tùy theo Ω là đoạn thẳng, miền phẳng hay khối không gian. Trong bài toán trên P(A) = 2 22 60 5060 − = 36 11 . c) Định nghĩa xác suất bằng tần suất Việc tính: khả năng để một máy nào đó sản xuất ra một phế phẩm, khả năng để doanh nghiệp đạt được doanh số tối thiểu 50 triệu đ/tháng,…rõ ràng phải dựa vào quan sát thực tế để giải quyết nên không thể dùng hai định nghĩa trên. • Giả sử phép thử T có thể được thực hiện lặp lại rất nhiều lần trong những điều kiện giống hệt nhau. Nếu trong n lần thực hiện T, biến cố A xuất hiện m(A) lần thì tỉ số fn(A) = n Am )( được gọi là tn sut xut hin của biến cố A trong n phép thử. Khi số phép thử n tăng ra vô hạn, nếu fn(A) dần tới một con số p thì P(A) = p. Ví dụ người gieo số lần gieo số lần sấp tần suất để sấp Buffon 4040 2048 0.5069 Pearson 12000 6019 0.5016 Pearson 24000 12012 0.5005 Tần suất dần tới số 0.5 Ví dụ Thống kê của Đacnon tại Pháp năm 1806 1816 1836 1856 1903 1920 tần suất sinh con gái 0.485 0.484 0.485 0.487 0.488 0.489 Trên thực tế lấy P(A) ≈ fn(A) với n đủ lớn. Ví dụ Muốn xác định xác suất để một máy sản xuất ra một phế phẩm, người ta theo dõi 100000 sản phẩm do nó sản xuất và thấy có 138 phế phẩm. Vậy xác suất cần tìm xấp xỉ bằng 100000 138 . Trong 3 định nghĩa trên: • 0 ≤ P(A) ≤ 1 ; • P(∅) = 0, P(Ω) = 1 ; • Nếu P(A) > P(B) thì khả năng xuất hiện của A cao hơn khả năng xuất hiện của B. d) Nguyên lý xác suất nhỏ Qua thực nghiệm và quan sát thực tế, người ta thấy rằng các biến cố có xác suất bé sẽ khó xảy ra khi chỉ thực hiện một hay một vài phép thử. Chẳng hạn việc một vé số trúng giải độc đắc là rất hiếm. Từ đó người ta thừa nhận nguyên lý sau đây Nguyên lý xác suất nhỏ: Nếu một biến cố có xác suất rất nhỏ thì thực tế có thể cho rằng trong một phép thử biến cố đó sẽ không xảy ra. Tương tự như vậy, ta có Nguyên lý xác suất lớn: Nếu một biến cố có xác suất gần bằng 1 thì thực tế có thể cho rằng biến cố đó sẽ xảy ra trong một phép thử. Hai nguyên lý này được ứng dụng rộng rãi trong đời sống khi xét sự tin cậy của khẳng định nào đó. Ví dụ Trong một lớp có 50 người, nhất định có các bạn sinh nhật trùng nhau, bởi vì biến cố "Không có 2 người nào có ngày sinh giống nhau" có xác suất rất bé (xấp xỉ 0,0295). '4 CÁC QUY TẮC TÍNH XÁC SUẤT a) Quy tắc cộng xác suất: Nếu các biến cố A1, A2, …, An liên quan đến phép thử T và xung khắc từng đôi một, thì ∑=      ∪ == n i ii n i APAP 11 )( . Ví dụ Trong một lớp gồm 100 sinh viên có 60 em ở tỉnh X còn 12 em ở tỉnh Y. Chọn ngẫu nhiên một em. Tính xác suất để em này ở tỉnh X hoặc tỉnh Y. Giải A = “Em đó ở tỉnh X”, B = “Em đó ở tỉnh Y”. A và B xung khắc, nên P(A∪B) = P(A) + P(B) = 100 12 100 60 + = 0, 72. ☺ b) Quy tắc cộng xác suất tổng quát: Nếu các biến cố A1, A2, …, An liên quan đến phép thử T, thì ( ) ( ) ( ) ( ) ( ).nn kji kjiji ji n i ii n i AAAPAAAPAAP APAP LL 21 1 11 1 − <<< == −++∑+∑− ∑ −=      ∪ c) Quy tắc chuyển sang biến cố đối ( ) ( )APAP −=1 . Ví dụ Theo thống kê trung bình một năm (365 ngày) có 60 ngày mưa thật to, 40 ngày gió thật lớn và 20 ngày có bão (vừa mưa thật to, vừa gió thật lớn). Tính xác suất để một ngày chọn ngẫu nhiên trong năm có thời tiết bất thường. Giải A = “Ngày đó có mưa thật to”, B = “Ngày đó có gió thật lớn” ⇒ AB = “Ngày đó có bão”. P(A∪B) = P(A) + P(B) – P(AB) = 365 80 365 20 365 40 365 60 =−+ . ☺ Ví dụ Chọn ngẫu nhiên 3 người X, Y, Z. Tính xác suất để trong đó có ít nhất 2 người có cùng ngày sinh nhật. Giải A = “Có ít nhất 2 người có cùng ngày sinh nhật” ⇒ A = “Cả 3 người đều có ngày sinh nhật khác nhau”. Ký hiệu x, y, z tương ứng là ngày sinh nhật của X, Y, Z thì mỗi (x, y, z) với 1≤ x, y, z ≤ 365 là một kết quả. Ta có |Ω| = 3653, AΩ = 365⋅364⋅363 nên ( ) ( )APAP −=1 = 0820 365 3633643651 3 ,= ⋅⋅ − . ☺ d) Xác suất có điều kiện Có những biến cố mà sự xảy ra của chúng có ảnh hưởng nhau. Ví dụ Chọn ngẫu nhiên một gia đình có 3 con. Tính xác suất để gia đình này có hai con trai trong mỗi trường hợp sau: i) Nếu không biết số con gái của gia đình này; ii) Nếu được thông báo gia đình này có đứa con cả là con gái. Giải A1 := “Gia đình đó có đứa con cả là con gái”. A2 := “Gia đình đó có 2 con trai”, Ω = {TTT, TTG, TGT, GTT, TGG, GTG, GGT, GGG}, 2AΩ = {TTG, TGT, GTT}, nên P(A2) = 3/8. Nếu biết rằng A1 đã xảy ra thì không gian mẫu bây giờ thu hẹp lại chỉ còn là {GTT, GTG, GGT, GGG} = 1AΩ . Còn tập hợp các kết quả thuận lợi cho A2 là {GTT} = 21AAΩ . Vậy đáp số của ii) bằng 4 1 1 21 = Ω Ω || || A AA . ☺ Trong bài toán này ta thấy rằng khả năng để gia đình đó có hai con trai phụ thuộc vào việc biết biến cố A1 đã xảy ra hay chưa. Điều này dẫn tới khái niệm xác sut có điu kin. Nhưng nên định nghĩa xác suất có điều kiện như thế nào ? Xem lại lời giải của ii) ta có ( ) ( )1 21 1 21 1 21 4 1 AP AAP A AA A AA =         Ω Ω         Ω Ω = Ω Ω = || || . Nhận xét này cho phép ta định nghĩa xác suất có điều kiện như sau • Nếu P(A1)>0 thì xác suất có điều kiện của A2 khi A1 đã xảy ra, ký hiệu là ( )12 AAP / , được cho bởi ( ) ( )( )1 21 12 AP AAPAAP =/ . Chú ý Xác suất có điều kiện có thể tính trực tiếp từ bối cảnh bài toán mà không cần thông qua công thức trên. Ví dụ Gieo đồng thời 2 con xúc xắc cân đối. Tính xác suất để tổng số nốt trên 2 con là 7, biết rằng có ít nhất một con ra mặt 5. Giải Cách 1 Không gian mẫu thu gọn bao gồm 11 biến cố sơ cấp có ít nhất một con ra mặt 5 là: (i, 5) với i∈{1, 2, 3, 4, 5, 6} và (5, j) với j∈{1, 2, 3, 4, 6}. Trong tập này có 2 trường hợp mà tổng bằng 7. ⇒ 11 2 =P . Cách 2 A = “Ít nhất một con ra 5”, B = “Tổng số chấm trên hai con bằng 7”. |Ω| = 62, AΩ = {(i, j)| i và j ∈ {1, 2, 3, 4, 6}}. ΩAB = {(2, 5), (5, 2)} ⇒P(A) = ( )AP−1 = 36 11 6 51 2 =      − và P(AB) 36 2 = ⇒ ( ) ( )( ) 11 2 == AP ABPABP / . ☺ e) Quy tắc nhân xác suất Từ Định nghĩa Xác suất có điều kiện của A2 khi A1 (P(A1) > 0) đã xảy ra: ( ) ( )( )1 21 12 AP AAPAAP =/ , ta suy ra Quy tắc nhân xác suất Nếu P(A1) > 0, thì P(A1A2) = P(A1)P(A2/A1). Mở rộng công thức P(A1A2) = P(A1)P(A2/A1) cho n biến cố, ta có Quy tắc nhân xác suất tổng quát Nếu P(A1A2⋅⋅⋅An-1) > 0 (n>1), thì P(A1A2⋅⋅⋅An) = P(A1)P(A2/A1)P(A3/A1A2)⋅⋅⋅P(An/A1A2⋅⋅⋅An-1). Chứng minh Từ A1A2⋅⋅⋅An-1⊂ A1A2⋅⋅⋅An-2 ⊂ ⋅⋅⋅⊂ A1 ta có ( ) ( ) ( )12211210 APAAAPAAAP nn ≤≤≤< −− KLL . Vì vậy, ta có thể áp dụng công thức tính xác suất có điều kiện để có: P(A2/A1) = P(A1A2) / P(A1) P(A3/A1A2) = P(A1A2A3) / P(A1A2) …………………………………….. P(An-1/A1A2⋅⋅⋅An-2) = P(A1A2⋅⋅⋅An-1) / P(A1A2⋅⋅⋅An-2) P(An/A1A2⋅⋅⋅An-1) = P(A1A2⋅⋅⋅An) / P(A1A2⋅⋅⋅An-1) Từ đây ta suy ra P(A2/A1)P(A3/A1A2)⋅⋅⋅P(An/A1A2⋅⋅⋅An-1) = P(A1A2⋅⋅⋅An) / P(A1). Nhân hai vế với P(A1) ta có Công thức nhân xác suất tổng quát. ☺ Ví dụ Một lô hàng gồm 100 sản phẩm, trong đó có 10 phế phẩm. Rút ngẫu nhiên lần lượt 4 sản phẩm theo kiểu mỗi lần rút không hoàn lại và kiểm tra. Nếu tất cả 4 sản phẩm này đều tốt thì lô hàng được nhận. Tìm xác suất để lô hàng này được nhận. Giải H = “Lô hàng được nhận”, Ai = “Sản phẩm rút ở lần thứ i là tốt”, (i = 1, 2, 3, 4) H = A1A2A3A4 ⇒ P(H) = P(A1A2A3A4) = P(A1)P(A2/A1)P(A3/A1A2)P(A4/A1A2A3) = 97 87 98 88 99 89 100 90 ⋅⋅⋅ ≈ 0,6516. ☺