Bài giảng Xác suất và thống kê chương 5: Ước lượng tham số

Biết chiều dài một sản phẩm do một xưởng sản xuất ra là bnn X . Hãy ước lượng giá trị của . là một tham số cần ước lượng. Muốn ước lượng nó, ta phải dựa vào mẫu gồm một số sản phẩm do xưởng này sản xuất. Ta có thể ước đoán bởi một giá trị hoặc ước đoán thuộc khoảng (a; b) nào đấy.

pdf50 trang | Chia sẻ: haohao89 | Lượt xem: 26043 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Bài giảng Xác suất và thống kê chương 5: Ước lượng tham số, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
TRẦN AN HẢI    TUẦN 6  HÀ NỘI - 2009 Chương 5 ƯỚC LƯỢNG THAM SỐ _________________________________________________ §1 ĐẶT VẤN ĐỀ Biết chiều dài một sản phẩm do một xưởng sản xuất ra là bnn X . Hãy ước lượng giá trị của . là một tham số cần ước lượng. Muốn ước lượng nó, ta phải dựa vào mẫu gồm một số sản phẩm do xưởng này sản xuất. Ta có thể ước đoán bởi một giá trị hoặc ước đoán thuộc khoảng (a; b) nào đấy. Trong thống kê, gọi là ước lượng điểm của , còn (a; b) là ước lượng khoảng của . §2 ƯỚC LƯỢNG ĐIỂM Giả sử bnn X đã biết được dạng của quy luật ppxs nhưng chưa biết tham số nào đó. Ta ước đoán bởi một con số * như sau: Ta xây dựng hàm của mẫu ngẫu nhiên tổng quát là . Với mỗi mẫu ngẫu nhiên cụ thể (x1, x2, …, xn), ta lấy làm ước lượng cho . Gọi hay là ước lượng điểm của . Để đánh giá chất lượng * xem “tốt” hay không ta không thể mong muốn nó thật gần bởi vì ta chưa biết . Vì vậy, dưới đây người ta đưa ra các tiêu chuẩn để dựa vào đó kết luận về chất lượng của *.  Ước lượng không chệch (ưlkc) Gọi là ước lượng không chệch của , nếu = . Ngược lại, nếu thì gọi là ước lượng chệch của .  Ước lượng hiệu quả (ưlhq) Gọi là ước lượng hiệu quả của , nếu nó là ưlkc của và nhỏ nhất so với phương sai của mọi ưlkc khác của .  Ước lượng vững (ưlv) Gọi là ước lượng vững của , nếu Ý nghĩa của công thức này Hầu như chắc chắn sai khác không nhiều miễn là n đủ lớn. Các kết quả về ước lượng điểm là ưlkc, ưlhq, ưlv của E(X). , là ưlkc, ưlv của D(X). là ưlkc, ưlhq, ưlv của P(A). , là ước lượng chệch của D(X). §3 ƯỚC LƯỢNG KHOẢNG Phương pháp ước lượng điểm có nhược điểm là khi kích thước mẫu nhỏ thì ước lượng điểm tìm được có thể sai lệch rất nhiều so với tham số cần ước lượng. Ngoài ra không thể đánh giá được khả năng mắc sai lầm khi ước lượng. Để khắc phục các nhược điểm này, ta thường dùng phương pháp ước lượng bằng khoảng tin cậy. Giả sử bnn X đã biết được dạng của quy luật ppxs nhưng chưa biết tham số nào đó. Ta đi tìm một khoảng để nó chứa với xác suất bằng như sau: Ta xây dựng như là các hàm của mẫu ngẫu nhiên tổng quát và . sao cho . Khi ấy ta gọi . là ước lượng khoảng (hay khoảng tin cậy của ), còn là độ tin cậy của ước lượng này. Số đo khả năng để rơi vào khoảng này, nên người ta thường chọn nó gần 1. Chú ý Với một mẫu ngẫu nhiên cụ thể (x1, x2, …, xn), ta cũng gọi là ước lượng khoảng (hay khoảng tin cậy) của . I – Tìm khoảng tin cậy cho kỳ vọng a) Trường hợp X Nếu đã biết, ta dùng công thức trong đó n = kích thước mẫu, còn không âm thỏa , , . Như vậy, khoảng tin cậy của E(X) với độ tin cậy là Đặc biệt:  Nếu chọn , thì ta có khoảng tin cậy đối xứng là .  Nếu chọn , thì ta có khoảng tin cậy bên phải là .  Nếu chọn , thì ta có khoảng tin cậy bên trái là . Ví dụ Khối lượng của một loại sản phẩm là bnn tuân theo luật phân phối chuẩn với độ lệch tiêu chuẩn là 1g. Cân 25 sản phẩm loại này ta thu được kết quả sau Khối lượng (g) 18 19 20 21 Số sản phẩm 3 5 15 2 Hãy tìm khoảng tin cậy đối xứng của khối lượng trung bình với độ tin cậy 0,95. Giải Với 0,95, ta có . , . Vì vậy, khoảng tin cậy đối xứng của khối lượng trung bình là  Nếu chưa biết, ta dùng công thức trong đó n = kích thước mẫu, và không âm thỏa , còn tra từ Bảng giá trị hàm Student. Đặc biệt:  Nếu chọn , thì ta có khoảng tin cậy đối xứng là .  Nếu chọn , thì ta có khoảng tin cậy bên phải là .  Nếu chọn , thì ta có khoảng tin cậy bên trái là . Ví dụ Chiều cao của thanh niên một vùng là bnn tuân theo luật phân phối chuẩn. Đo chiều cao của 16 thanh niên được chọn ngẫu nhiên của vùng đó ta thu được kết quả sau 172 173 173 174 174 175 175 176 166 167 165 173 171 170 171 170 Hãy tìm khoảng tin cậy đối xứng của chiều cao trung bình với độ tin cậy 0,95. Giải Ta tính được . Với 0,95, ta có . . Vì vậy, khoảng tin cậy đối xứng của chiều cao trung bình là  b) Trường hợp X có phân bố bất kỳ, và kích thước mẫu lớn Khi kích thước mẫu là , ta dùng công thức và không âm thỏa , , . Ví dụ Do khu rừng trồng bạch đàn rộng, không có điều kiện đo chiều cao toàn bộ cây, nên người ta đo ngẫu nhiên 35 cây và thu được kết quả sau chiều cao (m) 6,5-7,0 7,0-7,5 7,5-8 8-8,5 8,5-9 9-9,5 số cây 2 4 10 11 5 3 Với xác suất 0,95 ta có thể nói chiều cao trung bình của cây bạch đàn thuộc khu rừng trên nằm trong khoảng nào. Giải Ta tính được . Với 0,95, ta có . , . Vì vậy, khoảng tin cậy đối xứng của khối lượng trung bình là  II – Tìm khoảng tin cậy cho phương sai Giả sử X , nhưng chưa biết . Nếu đã biết, ta dùng công thức trong đó n = kích thước mẫu, , và không âm thỏa , tra từ Bảng giá trị hàm Khi bình phương. Đặc biệt:  Nếu chọn , thì ta có khoảng tin cậy đối xứng là .  Nếu chọn , thì ta có khoảng tin cậy bên phải là .  Nếu chọn , thì ta có khoảng tin cậy bên trái là . Ví dụ Mức hao phí nguyên liệu ở một cơ sở sản xuất là bnn có phân phối chuẩn với trung bình là 20g. Để ước lượng sự phân tán của mức hao phí này, người ta cân ngẫu nhiên 25 sản phẩm và thu được kết quả sau Hao phí nguyên liệu (g) 19,5 20,0 20,5 Số sản phẩm tương ứng 5 18 2 Với độ tin cậy 0,90, hãy ước lượng mức độ phân tán này. Giải Ta tính được . Với 0,90, ta có . , . Vì vậy, ước lượng của mức độ phân tán là  Nếu chưa biết, ta dùng công thức trong đó n = kích thước mẫu, và không âm thỏa . Đặc biệt:  Nếu chọn , thì ta có khoảng tin cậy đối xứng là .  Nếu chọn , thì ta có khoảng tin cậy bên phải là .  Nếu chọn , thì ta có khoảng tin cậy bên trái là . Ví dụ Mức hao phí nguyên liệu ở một cơ sở sản xuất là bnn có phân phối chuẩn. Để ước lượng sự phân tán của mức hao phí này, người ta cân ngẫu nhiên 25 sản phẩm và thu được kết quả sau Hao phí nguyên liệu (g) 19,5 20,0 20,5 Số sản phẩm tương ứng 5 18 2 Với độ tin cậy 0,90, hãy ước lượng mức độ phân tán này. Giải Ta tính được . Với 0,90, ta có . , . Vì vậy, ước lượng của mức độ phân tán là  III – Tìm khoảng tin cậy cho xác suất Cho mẫu định tính kích thước n, trong đó biến cố A xuất hiện m lần. là tỉ lệ mẫu, p = P(A), q = 1 - p. không âm thỏa . , . Với điều kiện ta có Đặc biệt:  Nếu chọn , thì ta có khoảng tin cậy đối xứng là .  Nếu chọn , thì ta có khoảng tin cậy bên phải là .  Nếu chọn , thì ta có khoảng tin cậy bên trái là . Ví dụ Để ước lượng số cá trong hồ, người ta vớt lên 2000 con để đánh dấu rồi lại thả xuống hồ. Sau một thời gian, người ta bắt lên 400 con và thấy trong số đó có 80 con đã đánh dấu. Hãy ước lượng số cá có trong hồ, với độ tin cậy 95%. Giải Gọi p là xác suất bắt được một con cá đã đánh dấu. Kích thước mẫu n = 400. Tần suất bắt được con cá có dấu là . Ta có . Với 0,95, ta có . , . Vì vậy, khoảng tin cậy đối xứng của p là Mặt khác, với N = số cá trong hồ, nên với độ tin cậy 95%.  Ví dụ Kiểm tra ngẫu nhiên 400 sản phẩm do một máy sản xuất, thấy có 20 phế phẩm. Với độ tin cậy 0,95, hãy ước lượng tỉ lệ phế phẩm tối đa của máy đó. Giải Gọi p là tỉ lệ phế phẩm. Kích thước mẫu n = 400. Tỉ lệ mẫu là . Ta có . Với 0,95, ta có . , . Vì vậy, khoảng tin cậy bên trái của p là , hay tỉ lệ phế phẩm tối đa của máy là gần 6,79%.  IV – Xác định độ tin cậy và kích thước mẫu Nếu * là ưlkc của tham số và ước lượng khoảng của có dạng , thì gọi là độ chính xác của ước lượng. Ba con số: độ tin cậy , kích thước mẫu n, độ chính xác có quan hệ chặt chẽ với nhau. Chẳng hạn: Với cho trước, nếu n càng lớn thì càng nhỏ (tức là độ chính xác càng cao hay sai số càng nhỏ). Sau đây là 2 bài toán ngược của bài toán ước lượng khoảng. Bài toán 1: Cho độ tin cậy và độ chính xác . Hãy xác định kích thước mẫu n định lấy. Bài toán 2: Cho kích thước mẫu n định lấy và độ chính xác . Hãy xác định độ tin cậy . Ví dụ Đo đường kính của 100 chi tiết do một máy sản xuất, được Đường kính (cm) 9,75 9,80 9,85 9,90 Số chi tiết 5 37 42 16 a) Với độ chính xác = 0,006, hãy xác định độ tin cậy của ưlkc cho đường kính trung bình. b) Muốn độ chính xác của ưlkc cho đường kính trung bình là 0,003 và độ tin cậy là 95%, thì cần đo thêm bao nhiêu chi tiết? Giải Từ mẫu có s = 0,04. Theo công thức với , có độ chính xác của ước lượng là . . a) b) Từ . Vì vậy phải kiểm tra thêm 683 - 100 = 583 chi tiết nữa.  Ví dụ Lấy ngẫu nhiên 200 sản phẩm trong một kho hàng thấy có 25 phế phẩm. a) Nếu muốn độ chính xác của ưlkc cho tỉ lệ phế phẩm là = 0,035, thì độ tin cậy của ước lượng là bao nhiêu? b) Muốn độ chính xác của ưlkc cho tỉ lệ phế phẩm là 0,001 và độ tin cậy là 95%, thì cần kiểm tra thêm bao nhiêu sản phẩm? Giải Ta có f = 0,125. Theo công thức với , có độ chính xác của ước lượng là . . a) b) Từ . Vì vậy phải kiểm tra thêm 420175 - 200 = 419975 sản phẩm nữa. 