Định nghĩa 1. Giả thuyết thống kê là những phát biểu về các tham số, quy
luật phân phối, hoặc tính độc lập của các đại lượng ngẫu nhiên. Việc tìm ra
kết luận để bác bỏ hay chấp nhận một giả thuyết gọi là kiểm định giả thuyết
thống kê
105 trang |
Chia sẻ: lylyngoc | Lượt xem: 2777 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Kiểm định giả thuyết thống kê - Hoàng Văn Hà, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Kiểm định giả thuyết thống kê
Hoàng Văn Hà
Ngày 6 tháng 4 năm 2012
Bài toán kiểm định giả thuyết
thống kê
Bài toán kiểm định giả thuyết thống kê
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 3
n Định nghĩa
n Giả thuyết không và đối thuyết
n Cách đặt giả thuyết
n Miền bác bỏ - Tiêu chuẩn kiểm định
n Sai lầm loại I và loại II
n Bổ đề Neyman - Pearson
n Kiểm định tỷ lệ hợp lý
n p - giá trị
Định nghĩa
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 4
Định nghĩa 1. Giả thuyết thống kê là những phát biểu về các tham số, quy
luật phân phối, hoặc tính độc lập của các đại lượng ngẫu nhiên. Việc tìm ra
kết luận để bác bỏ hay chấp nhận một giả thuyết gọi là kiểm định giả thuyết
thống kê.
Ví dụ 1. Giám đốc một nhà máy sản xuất bo mạch chủ máy vi tính tuyên bố
rằng tuổi thọ trung bình của một bo mạch chủ do nhà máy sản xuất ra là 5
năm; đây là một giả thuyết về kỳ vọng của biến ngẫu nhiên X = tuổi thọ của
một bo mạch chủ. Để đưa ra kết luận là chấp nhận hay bác bỏ giả thuyết
trên, ta cần dựa vào mẫu điều tra và quy tắc kiểm định thống kê.
Giả thuyết không và đối thuyết
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 5
Định nghĩa 2. Trong bài toán kiểm định giả thuyết, giả thuyết cần được
kiểm định gọi là Giả thuyết không (null hypothesis), ký hiệu là H0. Mệnh đề
đối lập với H0 gọi là đối thuyết (alternative hypothesis), ký hiệu là H1.
Xét bài toán kiểm định tham số, giả sử ta quan trắc mẫu ngẫu nhiên
(X1, . . . , Xn) từ biến ngẫu nhiên X có hàm mật độ xác suất f(x; θ) phụ
thuộc vào tham số θ. Gọi Θ là không gian tham số, và Θ0 và Θc0 là hai tập
con rời nhau của Θ sao cho Θ0 ∪Θc0 = Θ. Giả thuyết (giả thuyết không) và
đối thuyết của bài toán có dạng như sau{
H0 : θ ∈ Θ0
H1 : θ ∈ Θc0
(1)
Giả thuyết không và đối thuyết
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 6
Ví dụ 2.
1. Gọi µ là độ thay đổi trung bình trong huyết áp của một bệnh nhân sau khi
dùng thuốc; bác sĩ điều trị cần quan tâm đến giả thuyết sau{
H0 : µ = 0 Không có ảnh hưởng của thuốc lên huyết áp của bệnh nhân
H1 : µ 6= 0 Có ảnh hưởng của thuốc lên huyết áp của bệnh nhân
2. Một khách hàng quan tâm đến tỷ lệ sản phẩm kém chất lượng trong một
lô hàng mua của một nhà cung cấp. Giả sử tỷ lệ sản phấm kém tối đa được
phép là 5%. Khách hàng cần quan tâm đến giả thuyết sau{
H0 : p ≥ 0.05 Tỷ lệ sản phẩm kém cao hơn mức cho phép
H1 : p < 0.05 Tỷ lệ sản phẩm kém ở mức chấp nhận được
Cách đặt giả thuyết
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 7
1. Giả thuyết được đặt ra với ý đồ bác bỏ nó, nghĩa lã giả thuyết đặt ra
ngược lại với điều ta muốn chứng minh, muốn thuyết phục.
2. Giả thuyết được đặt ra sao cho khi chấp nhận hay bác bỏ nó sẽ có tác
dụng trả lời bài toán thực tế đặt ra.
3. Giả thuyết được đặt ra sao cho nếu nó đúng thì ta sẽ xác định được quy
luật phân phối xác suất của đại lượng ngẫu nhiên được chọn làm tiểu
chuẩn kiểm định.
4. Khi đặt giả thuyết, ta thường so sánh cái chưa biết với cái đã biết. Cái
chưa biết là điều mà ta cần kiểm định, kiểm tra, làm rõ. "Cái đã biết" là
những thông tin trong quá khứ, các định mức kinh tế, kỹ thuật.
5. Giả thuyết đặt ra thường mang ý nghĩa: "không khác nhau" hoặc "khác
nhau không có ý nghĩa" hoặc "bằng nhau".
Cách đặt giả thuyết
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 8
Tổng quát, một bài toán kiểm định giả thuyết cho tham số θ sẽ có một trong
3 dạng dưới đây (θ0 là giá trị kiểm định đã biết):
Hai phía: {
H0 : θ = θ0
H1 : θ 6= θ0
Một phía bên trái: {
H0 : θ ≥ θ0
H1 : θ < θ0
Một phía bên phải: {
H0 : θ ≤ θ0
H1 : θ > θ0
Miền bác bỏ - Tiêu chuẩn kiểm định
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 9
Định nghĩa 3. Xét bài toán kiểm định giả thuyết có giả thuyết H0 và đối
thuyết H1. Giả sử rằng H0 đúng, từ mẫu ngẫu nhiên X = (X1, . . . , Xn) chọn
hàm Z = h(X1, . . . , Xn; θ0) sao cho với số α > 0 bé tùy ý ta có thể tìm được
tập hợp Wα thỏa điều kiện
P (Z ∈Wα) = α (2)
Tập hợp Wα gọi là miền bác bỏ giả thuyết H0 và phần bù W cα gọi là miền
chấp nhận giả thuyết H0. Đại lượng ngẫu nhiên Z = h(X1, . . . , Xn; θ0) gọi là
tiêu chuẩn kiểm định giả thuyết H0. Giá trị α gọi là mức ý nghĩa của bài toán
kiểm định.
Miền bác bỏ - Tiêu chuẩn kiểm định
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 10
Thực hiện quan trắc dựa trên mẫu ngẫu nhiên (X1, . . . , Xn) ta thu được mẫu
thực nghiệm (x1, . . . , xn). Từ mẫu thực nghiệm này, ta tính được giá trị của
Z là z = h(x1, . . . , xn; θ0).
n Nếu z ∈Wα thì ta bác bỏ giả thuyết H0.
n Nếu z ∈W cα thì ta kết luận chưa đủ cơ sở để bác bỏ H0.
Sai lầm loại I và loại II
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 11
Trong bài toán kiểm định giả thuyết thống kê, ta có thể mắc phải các sai lầm
sau
a. Sai lầm loại I: là sai lầm mắc phải khi ta bác bỏ H0 trong khi thực tế
giả thuyết H0 đúng. Sai lầm loại I ký hiệu là α, chính là mức ý nghĩa
của kiểm định.
α = P (Wα|H0) (3)
b. Sai lầm loại II: là sai lầm mắc phải khi ta chấp nhận giả thuyết H0 trong
khi thực tế H0 sai. Sai lầm loại II ký hiệu là β.
β = P (W cα|H1) (4)
Sai lầm loại I và loại II
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 12
XXXXXXXXXXXX
Quyết định
Thực tế
H0 đúng H0 sai
Không bác bỏ H0
Không có sai lầm Sai lầm loại II
(1− α) β
Bác bỏ H0
Sai lầm loại I Không có sai lầm
α (1− β)
Sai lầm loại I và loại II - Ví dụ
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 13
Khảo sát tốc độ cháy của một loại nhiên liệu rắn dùng để đẩy tên lửa ra khỏi
giàn phóng. Giả sử biến ngẫu nhiên X = tốc độ cháy của nhiên liệu (cm/s)
có phân phối chuẩn với kỳ vọng µ và độ lệch chuẩn σ = 2.5.
Ta cần kiểm định giả thuyết {
H0 : µ = 50
H1 : µ 6= 50
Giả sử bác bỏ H0 khi: x¯ 51.5. Các giá trị 48.5 và 51.5 gọi là
giá trị tới hạn (critical value). Giả sử khảo sát mẫu ngẫu nhiên cỡ n = 10, ta
tìm xác suất sai lầm loại I.
α = P(Bác bỏ H0 khi H0 đúng)
Sai lầm loại I và loại II - Ví dụ
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 14
Tức là,
α = P(X¯ 51.5|µ = 50)
= P
(
X¯ − 50
2.5/
√
10
<
48.5− 50
2.5/
√
10
)
+ P
(
X¯ − 50
2.5/
√
10
<
51.5− 50
2.5/
√
10
)
= P(Z 1.90) = 0.0287 + 0.0287 = 0.0574
nghĩa là có 5.74% số mẫu ngẫu nhiên khảo sát được sẽ dẫn đến kết luận bác
bỏ giả thuyết H0 : µ = 50 (cm/s) khi tốc độ cháy trung bình thực sự là 50
(cm/s).
Ta có thể giảm sai lầm α bằng cách mở rộng miền chấp nhận. Giả sử với cỡ
mẫu n = 10, miền chấp nhận là 48 ≤ x¯ ≤ 52, khi đó giá trị của α là
α = P
(
Z <
48− 50
2.5/
√
10
)
+ P
(
Z >
52− 50
2.5/
√
10
)
= 0.0057 + 0.0057 = 0.0114
Sai lầm loại I và loại II - Ví dụ
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 15
Cách thứ hai để giảm α là tăng cỡ mẫu khảo sát, giả sử cỡ mẫu n = 16, ta có
σ/
√
n = 2.5/
√
16 = 0.625, với miền bác bỏ là x¯ 51.5, ta có
α = P(X¯ 51.5|µ = 50)
= P
(
Z <
48.5− 50
0.625
)
+ P
(
Z >
51.5
0.625
)
= 0.0082 + 0.0082 = 0.0164
Xác suất sai lầm loại II β được tính như sau
β = P(Không bác bỏ H0 khi H0 sai)
Để tính β, ta cần chỉ ra một giá trị cụ thể cho tham số trong đối thuyết H1.
Sai lầm loại I và loại II - Ví dụ
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 16
Giả sử với cỡ mẫu n = 10, miền chấp nhận của giả thuyết H0 là
48.5 ≤ X¯ ≤ 51.5 trong khi giá trị thực sự của µ = 52. Sai lầm β cho bởi
β = P(48.5 ≤ X¯ ≤ 51.5|µ = 52)
= P
(
48.5− 52
2.5/
√
10
≤ X¯ − 52
2.5/
√
10
≤ 51.5− 52
2.5/
√
10
)
= P(−4.43 ≤ Z ≤ −0.63) = P(Z ≤ −0.63)− P(Z ≤ −4.43)
= 0.2643− 0.0000 = 0.2643
Giả sử giá trị thực sự µ = 50.5, khi đó
β = P(48.5 ≤ X¯ ≤ 51.5|µ = 50.5)
= P
(
48.5− 50.5
2.5/
√
10
≤ X¯ − 50.5
2.5/
√
10
≤ 51.5− 50.5
2.5/
√
10
)
= P(−2.53 ≤ Z ≤ 1.27) = 0.8980− 0.0057 = 0.8923
Sai lầm loại I và loại II - Ví dụ
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 17
Tương tự α, tăng cỡ mẫu sẽ làm giảm sai lầm β, với cỡ mẫu n = 16 và miền
chấp nhận là 48 < X¯ < 52, ta tính được β = 0.229.
Bảng 1 tổng kết sai lầm lầm loại I và loại II với miền chấp nhận và cỡ mẫu
khác nhau
Miền chấp nhận n α β với µ = 52 β với µ = 50.5
48.5 < x¯ < 51.5 10 0.0574 0.2643 0.8923
48 < x¯ < 52 10 0.0114 0.5000 0.9705
48.5 < x¯ < 51.5 16 0.0164 0.2119 0.9445
48 < x¯ < 52 16 0.0014 0.5000 0.9918
Bảng 1: Sai lầm loại I và loại II
Sai lầm loại I và loại II - Nhận xét
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 18
1. Ta có thể giảm kích thước của miền bác bỏ (tương ứng tăng kích thước
miền chấp nhận), và xác suất sai lầm loại I α bằng cách chọn những
điểm tới hạn thích hợp.
2. Xác suất sai lầm loại I và loại II có liên quan với nhau. Với một cỡ mẫu
cố định, việc giảm sai lầm loại này sẽ làm tăng sai lầm loại kia.
3. Cố định các điểm tới hạn, tăng cỡ mẫu n sẽ làm giảm xác suất sai lầm
loại I α và loại II β.
4. Nếu H0 sai, sai lầm β sẽ tăng khi giá trị thực của tham số tiến gần đến
giá trị được phát biểu trong giả thuyết H0.
Sai lầm loại I và loại II - Ví dụ
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 19
Ví dụ 3.
1. Xét X là biến ngẫu nhiên có phân phối nhị thức. Ta cần kiểm định giả
thuyết H0 : p = 0.8 và đối thuyết H1 : p < 0.8. Hãy tìm miền bác bỏ
{X ≤ c} và tính xác suất sai lầm loại I α và loại II β tương ứng với đối
thuyết H1 : p = 0.6 khi n = 10 và n = 20.
2. Một mẫu ngẫu nhiên cỡ n được chọn từ tổng thể có phân phối chuẩn với
phương sai σ2 = 9, tính được x¯ = 17. Ta cần kiểm định giả thuyết
H0 : µ = 15 và H1 : µ > 15. Giả sử α = 0.05,
a. Tìm miền bác bỏ có dạng {X¯ > c}.
b. Với đối thuyết H1 : µ = 16, tính β.
Bổ đề Neyman-Pearson
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 20
Định nghĩa 4. Giả sử Z = h(X1, . . . , Xn) là một tiêu chuẩn kiểm định và
Wα là miền bác bỏ của một bài toán kiểm định giả thuyết thống liên quan
đến tham số θ. Độ mạnh của kiểm định là xác suất bác bỏ giả thuyết H0 khi
đối thuyết H1 đúng, ký hiệu pi.
pi = P(Wα|H1) = 1− P(W cα|H1) = 1− β (5)
Một tiêu chuẩn kiểm định tốt sẽ có độ mạnh cao.
Định nghĩa 5. Xét bài toán kiểm định giả thuyết thống kê có giả thuyết H0,
đối thuyết H1, miền bác bỏ Wα và miền chấp nhận W cα. Cho α, β lần lượt là
sai lầm loại I và loại II. Cố định giá trị α nhỏ, trong tất cả các tiêu chuẩn
kiểm định Z = h(X1, . . . , Xn) có cùng mức sai lầm α thì tiêu chuẩn nào có
độ mạnh pi = 1− β lớn nhất thì được gọi là tiêu chuẩn tốt nhất (tối ưu).
Bổ đề Neyman-Pearson
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 21
Định lý 6 (Bổ đề Neyman-Pearson). Xét bài toán kiểm định giả thuyết thống
kê H0, đối thuyết H1 dựa trên một mẫu ngẫu nhiên (X1, . . . , Xn) lấy từ một
phân phối phụ thuộc vào tham số θ. Xét L(θ) = L(θ|X1, . . . , Xn) > 0 là hàm
hợp lý dựa trên mẫu ngẫu nhiên X = (X1, . . . , Xn). Nếu tồn tại một hằng số
dương C và một tập con W ⊂ Rn sao cho
1.
L(θ0)
L(θ1)
≤ C với x = (x1, . . . , xn) ∈W
2.
L(θ0)
L(θ1)
> C với x = (x1, . . . , xn) ∈W c, với W ∪W c = Rn
3. P [(X1, . . . , Xn) ∈W ; θ0] = α.
thì kiểm định với miền bác bỏ W sẽ có độ mạnh lớn nhất với giả thuyết H0
và đối thuyết H1. Ta gọi α là độ lớn (size) của kiểm định và W là miền bác
bỏ tốt nhất với độ lớn α.
Bổ đề Neyman-Pearson - Ví dụ
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 22
Xét X1, . . . , Xn là mẫu ngẫu nhiên chọn từ tổng thể có phân phối Poisson với
trung bình λ. Tìm kiểm định có độ mạnh lớn nhất cho giả thuyết H0 : λ = 2
và H1 : λ = 1/2.
Hàm xác suất của X ∼ P (λ): f(x) = e
−λλx
x!
, với x = 0, 1, 2, . . .
Hàm hợp lý là
L(λ) =
n∏
i=1
f(xi) = λ
me−λn
(
n∏
i=1
(xi!)
)
−1
với m =
n∑
i=1
xi
Với λ = 2
L(2) = 2me−2n
(
n∏
i=1
(xi!)
)
−1
Bổ đề Neyman-Pearson - Ví dụ
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 23
và λ = 1/2,
L(1/2) = (1/2)me−(1/2)n
(
n∏
i=1
(xi!)
)
−1
Theo bổ đề Neyman-Pearson, miền bác bỏ thỏa
L(2)
L(1/2)
=
2me−2n(
1
2
)m
e−
n
2
= 4me−
3n
2 ≤ C
Lấy logarit 2 vế ta được,
m log(4)− 3n
2
< log(C)⇒ m < log(C) + (3n/2)
log(4)
Đặt C ′ =
log(C) + (3n/2)
log(4)
, ta sẽ bác bỏ H0 khi
∑n
i=1 xi ≤ C ′.
Kiểm định tỷ lệ hợp lý (LRT)
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 24
Xét bài toán kiểm định giả thuyết{
H0 : θ ∈ Θ0
H1 : θ ∈ Θc0
Với θ là tham số chưa biết của tổng thể nhận giá trị trong không gian tham
số Θ, và Θ0 ⊂ Θ. Xét mẫu ngẫu nhiên cỡ n: X = (X1, . . . , Xn) và hàm hợp
lý L(θ|x1, . . . , xn) = L(θ|x).
Định nghĩa 7. Kiểm định tỷ lệ hợp lý (Likelihood ratio test) cho kiểm định
thống kê với giả thuyết H0 : θ ∈ Θ0 và đối thuyết H1 : θ ∈ Θc0 là
λ(x) =
sup
Θ0
L(θ|x)
sup
Θ
L(θ|x) (6)
Chú ý rằng 0 ≤ λ(x) ≤ 1.
Kiểm định tỷ lệ hợp lý
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 25
Gọi θˆ0 và θˆ lần lượt là ước lượng hợp lý cực đại của tham số θ xác định trên
không gian tham số Θ0 và Θ. Khi đó, kiểm định tỷ lệ hợp lý là
λ(x) =
L(θˆ0|x)
L(θˆ|x) (7)
Bác bỏ giả thuyết H0 khi
λ(x) ≤ C
Hằng số C được chọn sao cho kiểm định có mức ý nghĩa cho trước là α.
Kiểm định tỷ lệ hợp lý - Ví dụ
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 26
Ví dụ 4. Xét X1, X2, . . . , Xn
i.i.d∼ N (µ, σ2). Giả sử σ2 đã biết. Ta cần kiểm
định, với mức ý nghĩa α, H0 : µ = µ0 và H1 : µ 6= µ0. Hãy tìm một kiểm định
tỷ lệ hợp lý.
Với σ2 đã biết, hàm hợp lý có dạng
L(µ) =
1
(σ
√
2pi)n
e−
1
2σ2
∑n
i=1(xi−µ)
2
Các không gian tham số: Θ0 = {µ0}, Θc0 = R\{µ0}. Khi đó,
L(µ0) =
1
(σ
√
2pi)n
e−
1
2σ2
∑n
i=1(xi−µ0)
2
Ước lượng hợp lý cực đại của µ trên R là µˆ = X¯. Do đó,
L(µˆ) =
1
(σ
√
2pi)n
e−
1
2σ2
∑n
i=1(xi−X¯)
2
Kiểm định tỷ lệ hợp lý - Ví dụ
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 27
Kiểm định tỷ lệ hợp lý
λ(x) =
L(µ0)
L(µˆ)
=
e−
1
2σ2
∑n
i=1(xi−µ0)
2
e−
1
2σ2
∑n
i=1(xi−X¯)
2
= e−n(X¯−µ0)
2/2σ2
Bác bỏ H0 khi: λ(x) ≤ C, tương đương với
− n
2σ2
(X¯ − µ0)2 ≤ log(C)⇔ (X¯ − µ0)
2
σ2/n
≥ 2 log(C)
⇔
∣∣∣∣X¯ − µ0σ/√n
∣∣∣∣ ≥ 2 log(C) = C1
Tìm C1: ta có nhận xét rằng nếu H0 đúng,
X¯ − µ0
σ/
√
n
∼ N (0, 1)
Kiểm định tỷ lệ hợp lý - Ví dụ
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 28
Với mức ý nghĩa α cho trước
P
(∣∣∣∣X¯ − µ0σ/√n
∣∣∣∣ ≥ C1
)
= P (|Z| ≥ C1) = α
hay
P (Z ≤ −C1) + P (Z ≥ C1) = α
Ta tính được C1 = z1−α/2: phân vị mức 1− α/2 của Z ∼ N (0, 1).
Vậy, bác bỏ H0 khi ∣∣∣∣X¯ − µ0σ/√n
∣∣∣∣ ≥ z1−α/2
p - giá trị (p - value)
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 29
Định nghĩa 8. Tương ứng với một giá trị thống kê kiểm định tính trên một
mẫu các giá trị quan trắc xác định, p - giá trị là mức ý nghĩa nhỏ nhất dùng
để bác bỏ giả thuyết H0.
Dựa vào đối thuyết H1, các bước tính p-giá trị như sau:
1. Xác định thống kê kiểm định: TS. Tính giá trị thống kê kiểm định dựa
trên mẫu (x1, . . . , xn), giả sử bằng a.
2. p-giá trị cho bởi
p =
P(|TS| > |a||H0), kiểm định hai phía
P(TS < a|H0), kiểm định một phía - bên trái
P(TS > a|H0), kiểm định một phía - bên phải
(8)
Kết luận: Bác bỏ giả thuyết H0 nếu p-giá trị ≤ α.
Kiểm định giả thuyết cho trường
hợp một mẫu
Kiểm định giả thuyết cho trường hợp một
mẫu
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 31
n Kiểm định giả thuyết cho kỳ vọng
u Trường hợp biết phương sai,
u Trường hợp không biết phương sai, mẫu nhỏ,
u Trường hợp không biết phương sai, mẫu lớn.
n Kiểm định giả thuyết cho tỷ lệ
Kiểm định giả thuyết cho kỳ vọng - TH
biết σ2
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 32
• Các giả định:
n Mẫu ngẫu nhiên X1, . . . , Xn được chọn từ tổng thể có phân phối chuẩn
N (µ, σ2) với kỳ vọng µ chưa biết.
n Phương sai σ2 đã biết.
n Cho trước giá trị µ0, cần so sánh kỳ vọng µ với µ0.
• Bài toán kiểm định có 3 trường hợp:
(a)
{
H0 : µ = µ0
H1 : µ 6= µ0
(b)
{
H0 : µ = µ0
H1 : µ < µ0
(c)
{
H0 : µ = µ0
H1 : µ > µ0
với mức ý nghĩa α cho trước.
Kiểm định giả thuyết cho kỳ vọng - TH
biết σ2
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 33
Các bước kiểm định
1. Phát biểu giả thuyết không và đối thuyết
2. Xác định mức ý nghĩa α
3. Lấy mẫu ngẫu nhiên cỡ n: X1, . . . , Xn và tính thống kê kiểm định
Z0 =
X¯ − µ0
σ/
√
n
(9)
4. Xác định miền bác bỏ Wα: bảng 2
Kiểm định giả thuyết cho kỳ vọng - TH
biết σ2
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 34
Giả thuyết Miền bác bỏ
H0 : µ = µ0 Wα =
{
z0 : |z0| > z1−α/2
}
H1 : µ 6= µ0
H0 : µ = µ0 Wα =
{
z0 : z0 < −z1−α
}
H1 : µ < µ0
H0 : µ = µ0 Wα =
{
z0 : z0 > z1−α
}
H1 : µ > µ0
Bảng 2: Miền bác bỏ với đối thuyết tương ứng
5. Kết luận: Bác bỏ H0/ Chưa đủ cơ sở để bác bỏ H0.
Kiểm định giả thuyết cho kỳ vọng - TH
biết σ2
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 35
• Sử dụng p-giá trị (p - value): tính p-giá trị dựa theo đối thuyết và kết
luận bác bỏ H0 khi p -giá trị ≤ α, với mức ý nghĩa α cho trước. Công thức
tính p - giá trị theo các trường hợp xem ở bảng 3.
Giả thuyết p - giá trị
H0 : µ = µ0 p = 2 [1− Φ(|z0|)]H1 : µ 6= µ0
H0 : µ = µ0 p = Φ(z0)H1 : µ < µ0
H0 : µ = µ0 p = 1− Φ(z0)H1 : µ > µ0
Bảng 3: p-giá trị với đối thuyết tương ứng
Kiểm định giả thuyết cho kỳ vọng - TH
biết σ2 - Ví dụ
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 36
Ví dụ 5 (Kiểm định 2 phía). Dây chuyền sản xuất kem đánh răng P/S được
thiết kế để đóng hộp những tuýt kem có trọng lượng trung bình là 6 oz (1 oz
= 28g). Một mẫu gồm 30 tuýt kem được chọn ngẫu nhiên để kiểm tra định
kỳ. Bộ phận điều khiển dây chuyền phải đảm bảo để trọng lượng trung bình
mỗi tuýt kem là 6 oz; nếu nhiều hơn hoặc ít hơn, dây chuyền phải được điều
chỉnh lại.
Giả sử trung bình mẫu của 30 tuýt kem là 6.1 oz và độ lệch tiêu chuẩn của
tổng thể σ = 0.2 oz.
Thực hiện kiểm định giả thuyết với mức ý nghĩa 3% để xác định xem dây
chuyền sản xuất có vận hành tốt hay không?
Kiểm định giả thuyết cho kỳ vọng - TH
biết σ2 - Ví dụ
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 37
Gọi X là trọng lượng của một tuýt kem đánh răng, giả sử X ∼ N (µ, 0.22).
Các bước kiểm định như sau:
1. Phát biểu giả thuyết: {
H0 : µ = 6
H1 : µ 6= 6
2. Xác định mức ý nghĩa: α = 0.03
3. Tính giá trị thống kê kiểm định
z0 =
x¯− µ0
σ/
√
n
=
6.1− 6.0
0.2/
√
30
= 2.74
4. Xác định miền bác bỏ: Bác bỏ H0 khi |z0| > z1−α/2
Kiểm định giả thuyết cho kỳ vọng - TH
biết σ2 - Ví dụ
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 38
α = 3% nên z1−α/2 = z0.985 = 2.17. Vậy bác bỏ H0 nếu
z0 2.17
5. Kết luận: do z0 = 2.74 > 2.17 nên bác bỏ H0. Ta kết luận với 97% độ
tin cậy rằng trọng lượng trung bình mỗi tuýt kem không bằng 6.
• Sử dụng p - giá trị:
4a. Tính p-giá trị, bài toán kiểm định hai phía
p = 2[1− Φ(|z0|)] = 2[1− Φ(2.74)] = 2[1− 0.9969] = 0.0062
5a. Kết luận: với α = 0.03, ta có p = 0.0062 < 0.03 nên bác bỏ H0. Ta kết
luận với 97% độ tin cậy rằng trọng lượng trung bình mỗi tuýt kem
không bằng 6.
Kiểm định giả thuyết cho kỳ vọng - TH
biết σ2 - Ví dụ
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 39
Ví dụ 6 (Kiểm định một phía). Metro EMS: Một bệnh viện tại trung tâm
thành phố cung cấp dịch vụ cấp cứu tại nhà. Với khoảng 20 xe cấp cứu, mục
tiêu của trung tâm là cung cấp dịch vụ cấp cứu trong khoảng thời gian trung
bình là 12 phút sau khi nhận được điện thoại yêu cầu. Một mẫu ngẫu nhiên
gồm thời gian đáp ứng khi có yêu cầu của 40 ca cấp cứu được chọn. Trung
bình mẫu là 13.25 phút. Biết rằng độ lệch tiêu chuẩn của tổng thể là σ = 3.2
phút. Giám đốc EMS muốn thực hiện một kiểm định, với mức ý nghĩa 5%, để
xác định xem liệu thời gian một ca cấp cứu có bé hơn hoặc bằng 12 phút hay
không?
Các bước kiểm định:
1. Phát biểu giả thuyết
H0 : µ = 12: Thời gian đáp ứng của dịch vụ cấp cứu đạt yêu cầu, không
cần phải thay đổi.
H1 : µ > 12: Thời gian đáp ứng của dịch vụ không đạt yêu cầu, cần
thay đổi.
Kiểm định giả thuyết cho kỳ vọng - TH
biết σ2 - Ví dụ
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 40
2. Xác định mức ý nghĩa: α = 0.05
3. Tính giá trị thống kê kiểm định
z0 =
x¯− 12
σ/
√
n
=
13.25− 12
3.2/
√
40
= 2.47
4. Xác định miền bác bỏ: bác bỏ H0 nếu z0 > z1−α = z0.95 = 1.645
5. Kết luận: z0 = 2.47 > 1.645 nên bác bỏ H0. Ta kết luận rằng với 95%
độ tin cậy, Mertro EMS không đáp ứng được mục tiêu thời gian phục vụ
khách hàng từ 12 phút trở xuống.
Kiểm định giả thuyết