1. Ước lượng điểm
Ta tuyên bố mỗi số đặc trưng ứng với một mẫu
cụ thể là số đặc trưng tương ứng của tổng thể.
1.1 Ước lượng điểm trung bình tổng thể µ
Trung bình tổng thể µ được ước lượng bởi trung
bình mẫu ngẫu nhiên X.
Công thức ước lượng này có tính chất:
Không chệch: Kỳ vọng của sai số khi ước lượng
bằng 0, tức là E(X – µ) = 0.
Hiệu quả: Phương sai của (X – µ) là nhỏ nhất
trong các công thức ước lượng µ.
Vững: X càng gần µ khi kích thước mẫu càng
lớn.
31 trang |
Chia sẻ: thanhle95 | Lượt xem: 388 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Bài giảng Lý thuyết xác suất và thống kê - Chương 7: Ước lượng các số đặc trưng tổng thể, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
CHƯƠNG 7
Ước lượng các số đặc trưng tổng thể
* Không thể tính được các số đặc trưng tổng thể.
Từ một mẫu cụ thể, ta ước lượng đặc trưng tổng thể θ
bằng cách tuyên bố θ là θo (ước lượng điểm) hoặc
tuyên bố θ thuộc một khoảng (ước lượng khoảng).
1. Ước lượng điểm
Ta tuyên bố mỗi số đặc trưng ứng với một mẫu
cụ thể là số đặc trưng tương ứng của tổng thể.
1.1 Ước lượng điểm trung bình tổng thể µ
Trung bình tổng thể µ được ước lượng bởi trung
bình mẫu ngẫu nhiên X .
Công thức ước lượng này có tính chất:
Không chệch: Kỳ vọng của sai số khi ước lượng
bằng 0, tức là E(X – µ) = 0.
Hiệu quả: Phương sai của (X – µ) là nhỏ nhất
trong các công thức ước lượng µ.
Vững: X càng gần µ khi kích thước mẫu càng
lớn.
1.2 Ước lượng điểm phương sai tổng thể σ2
Phương sai tổng thể σ2 được ước lượng bởi
phương sai mẫu ngẫu nhiên S2.
Công thức ước lượng điểm này là không chệch,
vững.
1.3 Ước lượng điểm tỷ lệ tổng thể p
Tỷ lệ tổng thể p được ước lượng bằng với tỷ lệ
mẫu ngẫu nhiên F.
Công thức ước lượng điểm này là không chệch.
Ví dụ
Đo chiều cao (m) của 50 cây rừng ta có bảng:
Chiều cao Số lượng Chiều cao Số lượng
6,25–6,75 1 8,25–8,75 18
6,75–7,25 2 8,75–9,25 9
7,25–7,75 5 9,25–9,75 3
7,75–8,25 11 9,75–10,2 1
Ứớc lượng chiều cao trung bình, độ lệch chuẩn
và tỷ lệ cây cao từ 7,75m đến 8,75m.
2. Ước lượng khoảng
Xét mẫu ngẫu nhiên X1, X2, ..., Xn. Chọn 2 thống
kê 1
ˆ
θ , 2
ˆ
θ , tức là lập 2 hàm n-biến X1, X2, ..., Xn. Số
đặc trưng tổng thể θ được xem thuộc khoảng [ 1
ˆ
θ , 2
ˆ
θ ]
(khoảng tin cậy) với xác suất 1–α. 1–α gọi là độ
tin cậy.
Với độ tin cậy 1–α từ 95% trở lên, ta cho rằng
biến cố 1
ˆ
θ ≤ θ ≤ 2
ˆ
θ chắc chắn xảy ra trong thực tế.
Ghi chú
Ta cũng có thể xét khoảng ước lượng một phía
2.1 Ước lượng khoảng trung bình tổng thể µ
Xét mẫu ngẫu nhiên X1, X2,, Xn và độ tin cậy
1–α.
Ta chọn khoảng ngẫu nhiên dạng (X − ε, X + ε)
để ước lượng µ. ε gọi là độ chính xác của ước lượng.
Để tìm khoảng ngẫu nhiên ước lượng µ, ta cần
xác định công thức tính độ chính xác ε.
TH1 n ≥ 30 và biết phương sai tổng thể σ2
Xét Z =
X
/ n
− µ
σ
. Nếu X có phân phối Chuẩn thì Z
có phân phối Chuẩn Chính tắc. Nếu chưa biết quy
luật phân phối của X thì từ giả thiết n ≥ 30, ta xấp
xỉ Z với phân phối Chuẩn Chính tắc.
Ta có:
P(X – ε < µ < X + ε) = 1−α
⇔ P(X – µ ε) = α
⇔ P(
X
/ n
− µ
σ
>
/ n
ε
σ
) = α ⇔ P(Z>
/ n
ε
σ
) = α
⇔ P(Z >
/ n
ε
σ
) + P(Z < −
/ n
ε
σ
) = α
⇔ 2P(Z >
/ n
ε
σ
) = α ⇔ P(Z >
/ n
ε
σ
) = α/2
Đẳng thức cuối chứng tỏ
/ n
ε
σ
là phân vị mức
α/2 của phân phối Chuẩn Chính tắc. Vậy:
/ n
ε
σ
= zα/2 ⇒ ε = / 2z
n
α
σ
Lấy mẫu cụ thể kích thước n, ta tính được giá trị
ε và do đó tìm được khoảng tin cậy (x−ε, x+ε) với độ
tin cậy 1–α để ước lượng µ.
TH2 n < 30, biết phương sai tổng thể σ2 và X
có phân phối Chuẩn
Lúc này
X
/ n
− µ
σ
có phân phối Chuẩn Chính tắc.
Vậy tất cả lập luận cũng như công thức nêu trên đều
áp dụng được.
TH3 n ≥ 30 và chưa biết phương sai tổng
thể σ2
Lúc này
X
S / n
− µ
có phân phối Student bậc tự do
(n–1). Theo giả thiết n ≥ 30, phân phối Student được
xấp xỉ với phân phối Chuẩn Chính tắc; hơn nữa, S
cũng được xấp xỉ bởi s. Vậy tất cả lập luận cũng như
công thức nêu trên đều áp dụng được, miễn là thay σ
bởi s khi tính ε ứng với mẫu cụ thể.
TH4 n ≤ 30, chưa biết phương sai tổng thể
σ2, X có phân phối Chuẩn
Lúc này
X
S / n
− µ
có phân phối Student bậc tự do
(n–1). Tất cả lập luận trên cũng áp dụng được cho
phân phối Student. Công thức tính độ chính xác ε
ứng với mẫu cụ thể lúc này là công thức đã biết
nhưng thay σ bởi s và thay zα/2 bởi tα/2(n–1).
Tóm tắt – Khoảng tin cậy trung bình tổng thể µ
Cho trước một mẫu cụ thể kích thước n và độ tin
cậy 1–α. Trung bình tổng thể µ được ước lượng thuộc
khoảng tin cậy (x−ε, x+ ε). Độ chính xác ε được tính
theo công thức gồm hai trường hợp sau:
n > 30 hoặc "n ≤ 30, biết σ2 và tổng thể có
phân phối Chuẩn"
ε = / 2z
n
α
σ
(σ ≈ s)
n ≤ 30, chưa biết σ2 và tổng thể có phân
phối Chuẩn
ε = /2
s
t (n 1)
n
α −
Excel
ε trong trường hợp đầu được tính theo công thức
=CONFIDENCE(α, σ, n)
Ví dụ
(1) Thống kê về tuổi thọ (giờ) của một số bóng đèn
do một nhà máy sản xuất ta có bảng:
Tuổi thọ Số bóng đèn Tuổi thọ Số bóng đèn
1000–1100 4 1600–1700 42
1100–1200 10 1700–1800 32
1200–1300 16 1800–1900 26
1300–1400 20 1900–2000 14
1400–1500 36 2000–2100 8
1500–1600 48
Lấy trung điểm mỗi khoảng. Ta có:
n = 256 x= 1.587,50 s2 = 51.450,98 ⇒ s = 226,83
a) Tính tuổi thọ trung bình của bóng đèn với độ tin
cậy 95%.
1−α = 95% ⇒ zα/2 = z0,025 = 1,96
=NORMSINV(1–.025)
⇒ ε = / 2
s
z
n
α = 27,79
Tuổi thọ trung bình của bóng đèn là 1.587,50 ± 27,79
giờ (độ tin cậy 95%).
b) Nếu muốn độ tin cậy đạt đến 98% và độ chính
xác như trên thì phải có số liệu về tuổi thọ của bao
nhiêu bóng đèn?
1−α = 98% ⇒ zα/2 = z0,01 = 2,33
=NORMSINV(1–0,01)
Từ công thức tính ε ta có:
n =
2
/2
s
zα
ε
= 360,66 ≈ 361
Phải có số liệu của 361 bóng đèn.
c) Nếu lấy độ chính xác là 20 giờ và dùng số liệu
điều tra 256 bóng đèn như trên thì độ tin cậy đạt
bao nhiêu?
s = 226,83 n = 256 ε = 20
Từ công thức tính ε ta có:
zα/2 =
n
s
ε ≈ 1,41
⇒ α/2 = 0,5 – Φ(1,41) = 0,5 – 0,42 ⇒ 1–α = 84%
Khi độ chính xác là 20 thì độ tin cậy là 84%.
(2) Trọng lượng của một sản phẩm lấy ngẫu nhiên
tại một nhà máy là một ĐLNN có phân phối Chuẩn.
Cân 20 sản phẩm lấy ngẫu nhiên thì tính được trung
bình trọng lượng của một sản phẩm là 1.100g và độ
lệch chuẩn là 25,649g. Ước lượng trọng lượng một
sản phẩm của nhà máy này với độ tin cậy 98%.
n = 20 (< 30) x = 1.100 s = 25,649
1−α = 98% ⇒ tα/2(n–1) = t0,01(19) = 2,539
=TINV(.01*2; 19)
⇒ ε = /2
s
t (n 1)
n
α − = 14,56
Trọng lượng một sản phẩm là 1.100 ± 14,56 g (độ tin
cậy 98%).
2.2 Ước lượng khoảng tỷ lệ tổng thể p
Xét mẫu ngẫu nhiên X1, X2,, Xn và độ tin cậy
1−α.
Ta tìm khoảng ngẫu nhiên dạng (F−ε, F+ε) để
ước lượng p. ε gọi là độ chính xác của ước lượng.
Cần xác định công thức tính độ chính xác ε.
Xét n ≥ 30. Z =
−
−
F p
p(1 p) / n
được xấp xỉ với
phân phối Chuẩn Chính tắc. Ta có:
P(F−ε < p < F+ε) = 1−α
⇔ P(F – p ε) = α
⇔ P(
−
−
F p
p(1 p) / n
>
ε
−p(1 p) / n
) = α
⇔ P(Z >
ε
−p(1 p) / n
) = α
⇔ P(Z >
ε
−p(1 p) / n
) = α/2
Đẳng thức cuối chứng tỏ
ε
−p(1 p) / n
là phân vị
mức α/2 của phân phối Chuẩn Chính tắc. Theo giả
thiết n > 30, p được xấp xỉ bởi F. Vậy:
ε = α −/ 2z F(1 F) / n
Lấy mẫu cụ thể kích thước n, ta tính được giá trị
ε và do đó tìm được khoảng tin cậy (f−ε, f+ε) với độ
tin cậy 1−α để ước lượng p.
Tóm tắt – Khoảng tin cậy tỷ lệ tổng thể p
Cho trước một mẫu cụ thể kích thước n (n ≥ 30)
và độ tin cậy 1−α. Tỷ lệ tổng thể p được ước lượng
thuộc khoảng tin cậy (f−ε, f+ε). Độ chính xác ε được
tính theo công thức:
ε = / 2
f(1 f)
z
n
α
−
Ví dụ
Điều tra thu nhập hàng tháng của 100 công
nhân gặp ngẫu nhiên tại một nhà máy thì thấy có
81 lần được trả lời là trên 3 triệu đồng/tháng.
Ta có: n = 100 f = 81%
a) Ước lượng tỷ lệ công nhân đạt mức thu nhập
trên với độ tin cậy 96%.
1−α = 96% ⇒ zα/2 = z0,02 = 2,0537
=NORMSINV(1–.02)
⇒ ε = / 2
f (1 f )
z
n
α
−
= 8,06%
Tỷ lệ công nhân đạt mức thu nhập trên 3 triệu
đồng/tháng từ 72,94% đến 89,06% (độ tin cậy 96%).
b) Nếu muốn độ tin cậy đạt đến 98% và độ chính
xác như trên thì phải điều tra thêm bao nhiêu công
nhân nữa?
1−α = 98% ⇒ zα/2 = z0,01 = 2,3263
=NORMSINV(1–.01)
Từ công thức tính ε ta có:
n =
2
/2z f (1 f )α
− ε
= 128,21 ≈ 129
Phải điều tra thêm 129−100 = 29 công nhân.
c) Nếu lấy độ chính xác là 7% và dùng số liệu điều
tra 100 công nhân như trên thì độ tin cậy đạt được
bao nhiêu?
n = 100 f = 81% ε = 7%
Từ công thức tính ε ta có:
zα/2 =
n
f (1 f )
ε
−
≈ 1,78 ⇒ α/2 = 0,5 – Φ(1,78)
⇒ α/2 = 0,0375 ⇒ 1–α = 92,5%
Khi độ chính xác là 7% thì độ tin cậy là 92,5%.
2.3 Ước lượng khoảng phương sai tổng thể σ2
Xét mẫu ngẫu nhiên X1, X2,, Xn và độ tin cậy
1–α.
Ta tìm khoảng ngẫu nhiên dạng (a, b) để ước
lượng σ2.
Ta chỉ xét tổng thể có phân phối Chuẩn.
TH1 chưa biết trung bình tổng thể µ
Lúc này
2
2
(n 1)S−
σ
có phân phối Chi Bình n–1
bậc tự do. Ta có:
P(a b) + P(σ2 < a) = α
Để có đẳng thức trên, ta chọn P(σ2 > b) = α/2 và
P(σ2 < a) = α/2. Ta có:
P(σ2 > b) = α/2
⇔ P(
2
2
(n 1)S−
σ
<
2(n 1)S
b
−
) = α/2
⇔ P(
2
2
(n 1)S−
σ
>
2(n 1)S
b
−
) = 1–α/2
Đẳng thức trên chứng tỏ
2(n 1)S
b
−
là phân vị
mức 1–α/2 của phân phối Chi Bình n–1 bậc tự do.
Vậy:
2(n 1)S
b
−
= χ21–α/2 ⇒ b =
−α
−
χ
2
2
1 /2
(n 1)S
Tương tự:
P(σ2 < a) = α/2 ⇔ P(
2
2
(n 1)S−
σ
>
2(n 1)S
a
−
) = α/2
Đẳng thức trên chứng tỏ
2(n 1)S
a
−
là phân vị
mức α/2 của phân phối Chi Bình n–1 bậc tự do. Vậy:
2(n 1)S
a
−
= χ2α/2 ⇒ a =
α
−
χ
2
2
/2
(n 1)S
Lấy mẫu cụ thể kích thước n, ta tính được giá trị
a, b và do đó tìm được khoảng tin cậy [a, b] với độ
tin cậy 1–α để ước lượng σ2.
TH2 biết trung bình tổng thể µ
Lúc này
( )2n i
2
i 1
X
=
− µ
σ
∑ có phân phối Chi Bình n
bậc tự do. Lập luận tương tự trên, ta chọn được:
a =
( )
=
α
− µ
χ
∑
n 2
i
i 1
2
/2
X
b =
( )
=
−α
− µ
χ
∑
n 2
i
i 1
2
1 /2
X
Tóm tắt – Khoảng tin cậy phương sai tổng thể σ 2
Xét tổng thể là ĐLNN có phân phối Chuẩn. Cho
trước một mẫu cụ thể kích thước n và độ tin cậy 1–α.
Phương sai tổng thể σ2 được ước lượng thuộc khoảng
tin cậy [a, b]. a và b được tính theo công thức gồm
hai trường hợp sau:
Chưa biết trung bình tổng thể µ
a =
2
2
/2
(n 1)s
(n 1)α
−
χ −
và b =
2
2
1 /2
(n 1)s
(n 1) −α
−
χ −
Biết trung bình tổng thể µ
a =
( )
n 2
i
i 1
2
/2
x
(n)
=
α
− µ
χ
∑
và b =
( )
n 2
i
i 1
2
/2
x
(n)
=
−α
− µ
χ
∑
1
Ví dụ
Lượng nguyên liệu dùng để sản xuất một sản
phẩm A là một ĐLNN có phân phối Chuẩn. Quan sát
một số sản phẩm ngẫu nhiên tại một nhà máy ta có
bảng sau:
Nguyên Liệu (g) 19,0 19,5 20,0 20,5
Số sản phẩm 5 6 14 3
Hãy ước lượng phương sai với độ tin cậy 95%
trong trường hợp:
a) Biết lượng nguyên liệu tiêu hao để sản xuất một
sản phẩm trung bình là 20g.
b) Chưa biết lượng tiêu hao nguyên liệu trung bình.
a) Do đã biết µ = 20 nên ta cần tính ( )
n 2
i
i 1
x
=
− µ∑ .
Do bảng số liệu có tần số nên ta lập bảng để tính
( )
n 2
i
i 1
x
=
− µ∑ theo công thức Σnixi2 – 2µΣnixi + nµ2:
xi ni nixi nixi
2
19,0 5 95 1.805,00
19,5 6 117 2.281,50
20,0 14 280 5.600,00
20,5 3 61,5 1.260,75
Σ 28 553,5 10.947,25
( )
n 2
i
i 1
x
=
− µ∑ = Σnixi2 – 2µΣnixi + nµ2 = 7,25
Theo giả thiết: n = 28 1−α = 95%
⇒ χ2(n)α/2 = χ
2(28)0,025 = 44,4608
=CHIINV(0,025; 28)
⇒ χ2(n)1–α/2 = χ
2(28)0,975 =15,3079
=CHIINV(0,975; 28)
⇒ a =
( )
n 2
i
i 1
2
/2
x
(n)
=
α
− µ
χ
∑
0,1631
b =
( )
−
n 2
i
i 1
2
/2
x
(n)
=
α
− µ
χ
∑
1
0,4736
Với độ tin cậy 95% thì 0,1631 ≤ σ2 ≤ 0,4736.
b) Từ số liệu trên bảng ta tính được:
s2 = [Σnixi2 – (Σnixi)2/n]/(n–1) = 0,2126.
Theo giả thiết: n = 28 1−α = 95%
⇒ χ2(n–1)α/2 = χ
2(27)0,025 = 43,1945
=CHIIN(0,025; 27)
⇒ χ2(n–1)1–α/2 = χ
2(27)0,975 = 14,5734
=CHIIN(0,975; 27)
⇒ a =
2
2
/2
(n 1)s
(n 1)α
−
χ −
0,1329
b =
2
2
1 /2
(n 1)s
(n 1) −α
−
χ −
0,3939
Với độ tin cậy 95% thì 0,1329 ≤ σ2 ≤ 0,3939.