Bài giảng Lý thuyết xác suất và thống kê - Chương 7: Ước lượng các số đặc trưng tổng thể

1. Ước lượng điểm Ta tuyên bố mỗi số đặc trưng ứng với một mẫu cụ thể là số đặc trưng tương ứng của tổng thể. 1.1 Ước lượng điểm trung bình tổng thể µ Trung bình tổng thể µ được ước lượng bởi trung bình mẫu ngẫu nhiên X. Công thức ước lượng này có tính chất: Không chệch: Kỳ vọng của sai số khi ước lượng bằng 0, tức là E(X – µ) = 0. Hiệu quả: Phương sai của (X – µ) là nhỏ nhất trong các công thức ước lượng µ. Vững: X càng gần µ khi kích thước mẫu càng lớn.

pdf31 trang | Chia sẻ: thanhle95 | Lượt xem: 412 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Bài giảng Lý thuyết xác suất và thống kê - Chương 7: Ước lượng các số đặc trưng tổng thể, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
CHƯƠNG 7 Ước lượng các số đặc trưng tổng thể * Không thể tính được các số đặc trưng tổng thể. Từ một mẫu cụ thể, ta ước lượng đặc trưng tổng thể θ bằng cách tuyên bố θ là θo (ước lượng điểm) hoặc tuyên bố θ thuộc một khoảng (ước lượng khoảng). 1. Ước lượng điểm Ta tuyên bố mỗi số đặc trưng ứng với một mẫu cụ thể là số đặc trưng tương ứng của tổng thể. 1.1 Ước lượng điểm trung bình tổng thể µ Trung bình tổng thể µ được ước lượng bởi trung bình mẫu ngẫu nhiên X . Công thức ước lượng này có tính chất: Không chệch: Kỳ vọng của sai số khi ước lượng bằng 0, tức là E(X – µ) = 0. Hiệu quả: Phương sai của (X – µ) là nhỏ nhất trong các công thức ước lượng µ. Vững: X càng gần µ khi kích thước mẫu càng lớn. 1.2 Ước lượng điểm phương sai tổng thể σ2 Phương sai tổng thể σ2 được ước lượng bởi phương sai mẫu ngẫu nhiên S2. Công thức ước lượng điểm này là không chệch, vững. 1.3 Ước lượng điểm tỷ lệ tổng thể p Tỷ lệ tổng thể p được ước lượng bằng với tỷ lệ mẫu ngẫu nhiên F. Công thức ước lượng điểm này là không chệch. Ví dụ Đo chiều cao (m) của 50 cây rừng ta có bảng: Chiều cao Số lượng Chiều cao Số lượng 6,25–6,75 1 8,25–8,75 18 6,75–7,25 2 8,75–9,25 9 7,25–7,75 5 9,25–9,75 3 7,75–8,25 11 9,75–10,2 1 Ứớc lượng chiều cao trung bình, độ lệch chuẩn và tỷ lệ cây cao từ 7,75m đến 8,75m. 2. Ước lượng khoảng Xét mẫu ngẫu nhiên X1, X2, ..., Xn. Chọn 2 thống kê 1 ˆ θ , 2 ˆ θ , tức là lập 2 hàm n-biến X1, X2, ..., Xn. Số đặc trưng tổng thể θ được xem thuộc khoảng [ 1 ˆ θ , 2 ˆ θ ] (khoảng tin cậy) với xác suất 1–α. 1–α gọi là độ tin cậy. Với độ tin cậy 1–α từ 95% trở lên, ta cho rằng biến cố 1 ˆ θ ≤ θ ≤ 2 ˆ θ chắc chắn xảy ra trong thực tế. Ghi chú Ta cũng có thể xét khoảng ước lượng một phía 2.1 Ước lượng khoảng trung bình tổng thể µ Xét mẫu ngẫu nhiên X1, X2,, Xn và độ tin cậy 1–α. Ta chọn khoảng ngẫu nhiên dạng (X − ε, X + ε) để ước lượng µ. ε gọi là độ chính xác của ước lượng. Để tìm khoảng ngẫu nhiên ước lượng µ, ta cần xác định công thức tính độ chính xác ε. TH1 n ≥ 30 và biết phương sai tổng thể σ2 Xét Z = X / n − µ σ . Nếu X có phân phối Chuẩn thì Z có phân phối Chuẩn Chính tắc. Nếu chưa biết quy luật phân phối của X thì từ giả thiết n ≥ 30, ta xấp xỉ Z với phân phối Chuẩn Chính tắc. Ta có: P(X – ε < µ < X + ε) = 1−α ⇔ P(X – µ ε) = α ⇔ P( X / n − µ σ > / n ε σ ) = α ⇔ P(Z> / n ε σ ) = α ⇔ P(Z > / n ε σ ) + P(Z < − / n ε σ ) = α ⇔ 2P(Z > / n ε σ ) = α ⇔ P(Z > / n ε σ ) = α/2 Đẳng thức cuối chứng tỏ / n ε σ là phân vị mức α/2 của phân phối Chuẩn Chính tắc. Vậy: / n ε σ = zα/2 ⇒ ε = / 2z n α σ Lấy mẫu cụ thể kích thước n, ta tính được giá trị ε và do đó tìm được khoảng tin cậy (x−ε, x+ε) với độ tin cậy 1–α để ước lượng µ. TH2 n < 30, biết phương sai tổng thể σ2 và X có phân phối Chuẩn Lúc này X / n − µ σ có phân phối Chuẩn Chính tắc. Vậy tất cả lập luận cũng như công thức nêu trên đều áp dụng được. TH3 n ≥ 30 và chưa biết phương sai tổng thể σ2 Lúc này X S / n − µ có phân phối Student bậc tự do (n–1). Theo giả thiết n ≥ 30, phân phối Student được xấp xỉ với phân phối Chuẩn Chính tắc; hơn nữa, S cũng được xấp xỉ bởi s. Vậy tất cả lập luận cũng như công thức nêu trên đều áp dụng được, miễn là thay σ bởi s khi tính ε ứng với mẫu cụ thể. TH4 n ≤ 30, chưa biết phương sai tổng thể σ2, X có phân phối Chuẩn Lúc này X S / n − µ có phân phối Student bậc tự do (n–1). Tất cả lập luận trên cũng áp dụng được cho phân phối Student. Công thức tính độ chính xác ε ứng với mẫu cụ thể lúc này là công thức đã biết nhưng thay σ bởi s và thay zα/2 bởi tα/2(n–1). Tóm tắt – Khoảng tin cậy trung bình tổng thể µ Cho trước một mẫu cụ thể kích thước n và độ tin cậy 1–α. Trung bình tổng thể µ được ước lượng thuộc khoảng tin cậy (x−ε, x+ ε). Độ chính xác ε được tính theo công thức gồm hai trường hợp sau: n > 30 hoặc "n ≤ 30, biết σ2 và tổng thể có phân phối Chuẩn" ε = / 2z n α σ (σ ≈ s) n ≤ 30, chưa biết σ2 và tổng thể có phân phối Chuẩn ε = /2 s t (n 1) n α − Excel ε trong trường hợp đầu được tính theo công thức =CONFIDENCE(α, σ, n) Ví dụ (1) Thống kê về tuổi thọ (giờ) của một số bóng đèn do một nhà máy sản xuất ta có bảng: Tuổi thọ Số bóng đèn Tuổi thọ Số bóng đèn 1000–1100 4 1600–1700 42 1100–1200 10 1700–1800 32 1200–1300 16 1800–1900 26 1300–1400 20 1900–2000 14 1400–1500 36 2000–2100 8 1500–1600 48 Lấy trung điểm mỗi khoảng. Ta có: n = 256 x= 1.587,50 s2 = 51.450,98 ⇒ s = 226,83 a) Tính tuổi thọ trung bình của bóng đèn với độ tin cậy 95%. 1−α = 95% ⇒ zα/2 = z0,025 = 1,96 =NORMSINV(1–.025) ⇒ ε = / 2 s z n α = 27,79 Tuổi thọ trung bình của bóng đèn là 1.587,50 ± 27,79 giờ (độ tin cậy 95%). b) Nếu muốn độ tin cậy đạt đến 98% và độ chính xác như trên thì phải có số liệu về tuổi thọ của bao nhiêu bóng đèn? 1−α = 98% ⇒ zα/2 = z0,01 = 2,33 =NORMSINV(1–0,01) Từ công thức tính ε ta có: n = 2 /2 s zα    ε  = 360,66 ≈ 361 Phải có số liệu của 361 bóng đèn. c) Nếu lấy độ chính xác là 20 giờ và dùng số liệu điều tra 256 bóng đèn như trên thì độ tin cậy đạt bao nhiêu? s = 226,83 n = 256 ε = 20 Từ công thức tính ε ta có: zα/2 = n s ε ≈ 1,41 ⇒ α/2 = 0,5 – Φ(1,41) = 0,5 – 0,42 ⇒ 1–α = 84% Khi độ chính xác là 20 thì độ tin cậy là 84%. (2) Trọng lượng của một sản phẩm lấy ngẫu nhiên tại một nhà máy là một ĐLNN có phân phối Chuẩn. Cân 20 sản phẩm lấy ngẫu nhiên thì tính được trung bình trọng lượng của một sản phẩm là 1.100g và độ lệch chuẩn là 25,649g. Ước lượng trọng lượng một sản phẩm của nhà máy này với độ tin cậy 98%. n = 20 (< 30) x = 1.100 s = 25,649 1−α = 98% ⇒ tα/2(n–1) = t0,01(19) = 2,539 =TINV(.01*2; 19) ⇒ ε = /2 s t (n 1) n α − = 14,56 Trọng lượng một sản phẩm là 1.100 ± 14,56 g (độ tin cậy 98%). 2.2 Ước lượng khoảng tỷ lệ tổng thể p Xét mẫu ngẫu nhiên X1, X2,, Xn và độ tin cậy 1−α. Ta tìm khoảng ngẫu nhiên dạng (F−ε, F+ε) để ước lượng p. ε gọi là độ chính xác của ước lượng. Cần xác định công thức tính độ chính xác ε. Xét n ≥ 30. Z = − − F p p(1 p) / n được xấp xỉ với phân phối Chuẩn Chính tắc. Ta có: P(F−ε < p < F+ε) = 1−α ⇔ P(F – p ε) = α ⇔ P( − − F p p(1 p) / n > ε −p(1 p) / n ) = α ⇔ P(Z > ε −p(1 p) / n ) = α ⇔ P(Z > ε −p(1 p) / n ) = α/2 Đẳng thức cuối chứng tỏ ε −p(1 p) / n là phân vị mức α/2 của phân phối Chuẩn Chính tắc. Theo giả thiết n > 30, p được xấp xỉ bởi F. Vậy: ε = α −/ 2z F(1 F) / n Lấy mẫu cụ thể kích thước n, ta tính được giá trị ε và do đó tìm được khoảng tin cậy (f−ε, f+ε) với độ tin cậy 1−α để ước lượng p. Tóm tắt – Khoảng tin cậy tỷ lệ tổng thể p Cho trước một mẫu cụ thể kích thước n (n ≥ 30) và độ tin cậy 1−α. Tỷ lệ tổng thể p được ước lượng thuộc khoảng tin cậy (f−ε, f+ε). Độ chính xác ε được tính theo công thức: ε = / 2 f(1 f) z n α − Ví dụ Điều tra thu nhập hàng tháng của 100 công nhân gặp ngẫu nhiên tại một nhà máy thì thấy có 81 lần được trả lời là trên 3 triệu đồng/tháng. Ta có: n = 100 f = 81% a) Ước lượng tỷ lệ công nhân đạt mức thu nhập trên với độ tin cậy 96%. 1−α = 96% ⇒ zα/2 = z0,02 = 2,0537 =NORMSINV(1–.02) ⇒ ε = / 2 f (1 f ) z n α − = 8,06% Tỷ lệ công nhân đạt mức thu nhập trên 3 triệu đồng/tháng từ 72,94% đến 89,06% (độ tin cậy 96%). b) Nếu muốn độ tin cậy đạt đến 98% và độ chính xác như trên thì phải điều tra thêm bao nhiêu công nhân nữa? 1−α = 98% ⇒ zα/2 = z0,01 = 2,3263 =NORMSINV(1–.01) Từ công thức tính ε ta có: n = 2 /2z f (1 f )α   − ε  = 128,21 ≈ 129 Phải điều tra thêm 129−100 = 29 công nhân. c) Nếu lấy độ chính xác là 7% và dùng số liệu điều tra 100 công nhân như trên thì độ tin cậy đạt được bao nhiêu? n = 100 f = 81% ε = 7% Từ công thức tính ε ta có: zα/2 = n f (1 f ) ε − ≈ 1,78 ⇒ α/2 = 0,5 – Φ(1,78) ⇒ α/2 = 0,0375 ⇒ 1–α = 92,5% Khi độ chính xác là 7% thì độ tin cậy là 92,5%. 2.3 Ước lượng khoảng phương sai tổng thể σ2 Xét mẫu ngẫu nhiên X1, X2,, Xn và độ tin cậy 1–α. Ta tìm khoảng ngẫu nhiên dạng (a, b) để ước lượng σ2. Ta chỉ xét tổng thể có phân phối Chuẩn. TH1 chưa biết trung bình tổng thể µ Lúc này 2 2 (n 1)S− σ có phân phối Chi Bình n–1 bậc tự do. Ta có: P(a b) + P(σ2 < a) = α Để có đẳng thức trên, ta chọn P(σ2 > b) = α/2 và P(σ2 < a) = α/2. Ta có: P(σ2 > b) = α/2 ⇔ P( 2 2 (n 1)S− σ < 2(n 1)S b − ) = α/2 ⇔ P( 2 2 (n 1)S− σ > 2(n 1)S b − ) = 1–α/2 Đẳng thức trên chứng tỏ 2(n 1)S b − là phân vị mức 1–α/2 của phân phối Chi Bình n–1 bậc tự do. Vậy: 2(n 1)S b − = χ21–α/2 ⇒ b = −α − χ 2 2 1 /2 (n 1)S Tương tự: P(σ2 < a) = α/2 ⇔ P( 2 2 (n 1)S− σ > 2(n 1)S a − ) = α/2 Đẳng thức trên chứng tỏ 2(n 1)S a − là phân vị mức α/2 của phân phối Chi Bình n–1 bậc tự do. Vậy: 2(n 1)S a − = χ2α/2 ⇒ a = α − χ 2 2 /2 (n 1)S Lấy mẫu cụ thể kích thước n, ta tính được giá trị a, b và do đó tìm được khoảng tin cậy [a, b] với độ tin cậy 1–α để ước lượng σ2. TH2 biết trung bình tổng thể µ Lúc này ( )2n i 2 i 1 X = − µ σ ∑ có phân phối Chi Bình n bậc tự do. Lập luận tương tự trên, ta chọn được: a = ( ) = α − µ χ ∑ n 2 i i 1 2 /2 X b = ( ) = −α − µ χ ∑ n 2 i i 1 2 1 /2 X Tóm tắt – Khoảng tin cậy phương sai tổng thể σ 2 Xét tổng thể là ĐLNN có phân phối Chuẩn. Cho trước một mẫu cụ thể kích thước n và độ tin cậy 1–α. Phương sai tổng thể σ2 được ước lượng thuộc khoảng tin cậy [a, b]. a và b được tính theo công thức gồm hai trường hợp sau: Chưa biết trung bình tổng thể µ a = 2 2 /2 (n 1)s (n 1)α − χ − và b = 2 2 1 /2 (n 1)s (n 1) −α − χ − Biết trung bình tổng thể µ a = ( ) n 2 i i 1 2 /2 x (n) = α − µ χ ∑ và b = ( ) n 2 i i 1 2 /2 x (n) = −α − µ χ ∑ 1 Ví dụ Lượng nguyên liệu dùng để sản xuất một sản phẩm A là một ĐLNN có phân phối Chuẩn. Quan sát một số sản phẩm ngẫu nhiên tại một nhà máy ta có bảng sau: Nguyên Liệu (g) 19,0 19,5 20,0 20,5 Số sản phẩm 5 6 14 3 Hãy ước lượng phương sai với độ tin cậy 95% trong trường hợp: a) Biết lượng nguyên liệu tiêu hao để sản xuất một sản phẩm trung bình là 20g. b) Chưa biết lượng tiêu hao nguyên liệu trung bình. a) Do đã biết µ = 20 nên ta cần tính ( ) n 2 i i 1 x = − µ∑ . Do bảng số liệu có tần số nên ta lập bảng để tính ( ) n 2 i i 1 x = − µ∑ theo công thức Σnixi2 – 2µΣnixi + nµ2: xi ni nixi nixi 2 19,0 5 95 1.805,00 19,5 6 117 2.281,50 20,0 14 280 5.600,00 20,5 3 61,5 1.260,75 Σ 28 553,5 10.947,25 ( ) n 2 i i 1 x = − µ∑ = Σnixi2 – 2µΣnixi + nµ2 = 7,25 Theo giả thiết: n = 28 1−α = 95% ⇒ χ2(n)α/2 = χ 2(28)0,025 = 44,4608 =CHIINV(0,025; 28) ⇒ χ2(n)1–α/2 = χ 2(28)0,975 =15,3079 =CHIINV(0,975; 28) ⇒ a = ( ) n 2 i i 1 2 /2 x (n) = α − µ χ ∑  0,1631 b = ( ) − n 2 i i 1 2 /2 x (n) = α − µ χ ∑ 1  0,4736 Với độ tin cậy 95% thì 0,1631 ≤ σ2 ≤ 0,4736. b) Từ số liệu trên bảng ta tính được: s2 = [Σnixi2 – (Σnixi)2/n]/(n–1) = 0,2126. Theo giả thiết: n = 28 1−α = 95% ⇒ χ2(n–1)α/2 = χ 2(27)0,025 = 43,1945 =CHIIN(0,025; 27) ⇒ χ2(n–1)1–α/2 = χ 2(27)0,975 = 14,5734 =CHIIN(0,975; 27) ⇒ a = 2 2 /2 (n 1)s (n 1)α − χ −  0,1329 b = 2 2 1 /2 (n 1)s (n 1) −α − χ −  0,3939 Với độ tin cậy 95% thì 0,1329 ≤ σ2 ≤ 0,3939.