Kiểm định giả thuyết thống kê - Hoàng Văn Hà

Định nghĩa 1. Giả thuyết thống kê là những phát biểu về các tham số, quy luật phân phối, hoặc tính độc lập của các đại lượng ngẫu nhiên. Việc tìm ra kết luận để bác bỏ hay chấp nhận một giả thuyết gọi là kiểm định giả thuyết thống kê

pdf105 trang | Chia sẻ: lylyngoc | Lượt xem: 2522 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Kiểm định giả thuyết thống kê - Hoàng Văn Hà, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Kiểm định giả thuyết thống kê Hoàng Văn Hà Ngày 6 tháng 4 năm 2012 Bài toán kiểm định giả thuyết thống kê Bài toán kiểm định giả thuyết thống kê Kiểm định giả thuyết thống kê Hoàng Văn Hà – 3 n Định nghĩa n Giả thuyết không và đối thuyết n Cách đặt giả thuyết n Miền bác bỏ - Tiêu chuẩn kiểm định n Sai lầm loại I và loại II n Bổ đề Neyman - Pearson n Kiểm định tỷ lệ hợp lý n p - giá trị Định nghĩa Kiểm định giả thuyết thống kê Hoàng Văn Hà – 4 Định nghĩa 1. Giả thuyết thống kê là những phát biểu về các tham số, quy luật phân phối, hoặc tính độc lập của các đại lượng ngẫu nhiên. Việc tìm ra kết luận để bác bỏ hay chấp nhận một giả thuyết gọi là kiểm định giả thuyết thống kê. Ví dụ 1. Giám đốc một nhà máy sản xuất bo mạch chủ máy vi tính tuyên bố rằng tuổi thọ trung bình của một bo mạch chủ do nhà máy sản xuất ra là 5 năm; đây là một giả thuyết về kỳ vọng của biến ngẫu nhiên X = tuổi thọ của một bo mạch chủ. Để đưa ra kết luận là chấp nhận hay bác bỏ giả thuyết trên, ta cần dựa vào mẫu điều tra và quy tắc kiểm định thống kê. Giả thuyết không và đối thuyết Kiểm định giả thuyết thống kê Hoàng Văn Hà – 5 Định nghĩa 2. Trong bài toán kiểm định giả thuyết, giả thuyết cần được kiểm định gọi là Giả thuyết không (null hypothesis), ký hiệu là H0. Mệnh đề đối lập với H0 gọi là đối thuyết (alternative hypothesis), ký hiệu là H1. Xét bài toán kiểm định tham số, giả sử ta quan trắc mẫu ngẫu nhiên (X1, . . . , Xn) từ biến ngẫu nhiên X có hàm mật độ xác suất f(x; θ) phụ thuộc vào tham số θ. Gọi Θ là không gian tham số, và Θ0 và Θc0 là hai tập con rời nhau của Θ sao cho Θ0 ∪Θc0 = Θ. Giả thuyết (giả thuyết không) và đối thuyết của bài toán có dạng như sau{ H0 : θ ∈ Θ0 H1 : θ ∈ Θc0 (1) Giả thuyết không và đối thuyết Kiểm định giả thuyết thống kê Hoàng Văn Hà – 6 Ví dụ 2. 1. Gọi µ là độ thay đổi trung bình trong huyết áp của một bệnh nhân sau khi dùng thuốc; bác sĩ điều trị cần quan tâm đến giả thuyết sau{ H0 : µ = 0 Không có ảnh hưởng của thuốc lên huyết áp của bệnh nhân H1 : µ 6= 0 Có ảnh hưởng của thuốc lên huyết áp của bệnh nhân 2. Một khách hàng quan tâm đến tỷ lệ sản phẩm kém chất lượng trong một lô hàng mua của một nhà cung cấp. Giả sử tỷ lệ sản phấm kém tối đa được phép là 5%. Khách hàng cần quan tâm đến giả thuyết sau{ H0 : p ≥ 0.05 Tỷ lệ sản phẩm kém cao hơn mức cho phép H1 : p < 0.05 Tỷ lệ sản phẩm kém ở mức chấp nhận được Cách đặt giả thuyết Kiểm định giả thuyết thống kê Hoàng Văn Hà – 7 1. Giả thuyết được đặt ra với ý đồ bác bỏ nó, nghĩa lã giả thuyết đặt ra ngược lại với điều ta muốn chứng minh, muốn thuyết phục. 2. Giả thuyết được đặt ra sao cho khi chấp nhận hay bác bỏ nó sẽ có tác dụng trả lời bài toán thực tế đặt ra. 3. Giả thuyết được đặt ra sao cho nếu nó đúng thì ta sẽ xác định được quy luật phân phối xác suất của đại lượng ngẫu nhiên được chọn làm tiểu chuẩn kiểm định. 4. Khi đặt giả thuyết, ta thường so sánh cái chưa biết với cái đã biết. Cái chưa biết là điều mà ta cần kiểm định, kiểm tra, làm rõ. "Cái đã biết" là những thông tin trong quá khứ, các định mức kinh tế, kỹ thuật. 5. Giả thuyết đặt ra thường mang ý nghĩa: "không khác nhau" hoặc "khác nhau không có ý nghĩa" hoặc "bằng nhau". Cách đặt giả thuyết Kiểm định giả thuyết thống kê Hoàng Văn Hà – 8 Tổng quát, một bài toán kiểm định giả thuyết cho tham số θ sẽ có một trong 3 dạng dưới đây (θ0 là giá trị kiểm định đã biết): Hai phía: { H0 : θ = θ0 H1 : θ 6= θ0 Một phía bên trái: { H0 : θ ≥ θ0 H1 : θ < θ0 Một phía bên phải: { H0 : θ ≤ θ0 H1 : θ > θ0 Miền bác bỏ - Tiêu chuẩn kiểm định Kiểm định giả thuyết thống kê Hoàng Văn Hà – 9 Định nghĩa 3. Xét bài toán kiểm định giả thuyết có giả thuyết H0 và đối thuyết H1. Giả sử rằng H0 đúng, từ mẫu ngẫu nhiên X = (X1, . . . , Xn) chọn hàm Z = h(X1, . . . , Xn; θ0) sao cho với số α > 0 bé tùy ý ta có thể tìm được tập hợp Wα thỏa điều kiện P (Z ∈Wα) = α (2) Tập hợp Wα gọi là miền bác bỏ giả thuyết H0 và phần bù W cα gọi là miền chấp nhận giả thuyết H0. Đại lượng ngẫu nhiên Z = h(X1, . . . , Xn; θ0) gọi là tiêu chuẩn kiểm định giả thuyết H0. Giá trị α gọi là mức ý nghĩa của bài toán kiểm định. Miền bác bỏ - Tiêu chuẩn kiểm định Kiểm định giả thuyết thống kê Hoàng Văn Hà – 10 Thực hiện quan trắc dựa trên mẫu ngẫu nhiên (X1, . . . , Xn) ta thu được mẫu thực nghiệm (x1, . . . , xn). Từ mẫu thực nghiệm này, ta tính được giá trị của Z là z = h(x1, . . . , xn; θ0). n Nếu z ∈Wα thì ta bác bỏ giả thuyết H0. n Nếu z ∈W cα thì ta kết luận chưa đủ cơ sở để bác bỏ H0. Sai lầm loại I và loại II Kiểm định giả thuyết thống kê Hoàng Văn Hà – 11 Trong bài toán kiểm định giả thuyết thống kê, ta có thể mắc phải các sai lầm sau a. Sai lầm loại I: là sai lầm mắc phải khi ta bác bỏ H0 trong khi thực tế giả thuyết H0 đúng. Sai lầm loại I ký hiệu là α, chính là mức ý nghĩa của kiểm định. α = P (Wα|H0) (3) b. Sai lầm loại II: là sai lầm mắc phải khi ta chấp nhận giả thuyết H0 trong khi thực tế H0 sai. Sai lầm loại II ký hiệu là β. β = P (W cα|H1) (4) Sai lầm loại I và loại II Kiểm định giả thuyết thống kê Hoàng Văn Hà – 12 XXXXXXXXXXXX Quyết định Thực tế H0 đúng H0 sai Không bác bỏ H0 Không có sai lầm Sai lầm loại II (1− α) β Bác bỏ H0 Sai lầm loại I Không có sai lầm α (1− β) Sai lầm loại I và loại II - Ví dụ Kiểm định giả thuyết thống kê Hoàng Văn Hà – 13 Khảo sát tốc độ cháy của một loại nhiên liệu rắn dùng để đẩy tên lửa ra khỏi giàn phóng. Giả sử biến ngẫu nhiên X = tốc độ cháy của nhiên liệu (cm/s) có phân phối chuẩn với kỳ vọng µ và độ lệch chuẩn σ = 2.5. Ta cần kiểm định giả thuyết { H0 : µ = 50 H1 : µ 6= 50 Giả sử bác bỏ H0 khi: x¯ 51.5. Các giá trị 48.5 và 51.5 gọi là giá trị tới hạn (critical value). Giả sử khảo sát mẫu ngẫu nhiên cỡ n = 10, ta tìm xác suất sai lầm loại I. α = P(Bác bỏ H0 khi H0 đúng) Sai lầm loại I và loại II - Ví dụ Kiểm định giả thuyết thống kê Hoàng Văn Hà – 14 Tức là, α = P(X¯ 51.5|µ = 50) = P ( X¯ − 50 2.5/ √ 10 < 48.5− 50 2.5/ √ 10 ) + P ( X¯ − 50 2.5/ √ 10 < 51.5− 50 2.5/ √ 10 ) = P(Z 1.90) = 0.0287 + 0.0287 = 0.0574 nghĩa là có 5.74% số mẫu ngẫu nhiên khảo sát được sẽ dẫn đến kết luận bác bỏ giả thuyết H0 : µ = 50 (cm/s) khi tốc độ cháy trung bình thực sự là 50 (cm/s). Ta có thể giảm sai lầm α bằng cách mở rộng miền chấp nhận. Giả sử với cỡ mẫu n = 10, miền chấp nhận là 48 ≤ x¯ ≤ 52, khi đó giá trị của α là α = P ( Z < 48− 50 2.5/ √ 10 ) + P ( Z > 52− 50 2.5/ √ 10 ) = 0.0057 + 0.0057 = 0.0114 Sai lầm loại I và loại II - Ví dụ Kiểm định giả thuyết thống kê Hoàng Văn Hà – 15 Cách thứ hai để giảm α là tăng cỡ mẫu khảo sát, giả sử cỡ mẫu n = 16, ta có σ/ √ n = 2.5/ √ 16 = 0.625, với miền bác bỏ là x¯ 51.5, ta có α = P(X¯ 51.5|µ = 50) = P ( Z < 48.5− 50 0.625 ) + P ( Z > 51.5 0.625 ) = 0.0082 + 0.0082 = 0.0164 Xác suất sai lầm loại II β được tính như sau β = P(Không bác bỏ H0 khi H0 sai) Để tính β, ta cần chỉ ra một giá trị cụ thể cho tham số trong đối thuyết H1. Sai lầm loại I và loại II - Ví dụ Kiểm định giả thuyết thống kê Hoàng Văn Hà – 16 Giả sử với cỡ mẫu n = 10, miền chấp nhận của giả thuyết H0 là 48.5 ≤ X¯ ≤ 51.5 trong khi giá trị thực sự của µ = 52. Sai lầm β cho bởi β = P(48.5 ≤ X¯ ≤ 51.5|µ = 52) = P ( 48.5− 52 2.5/ √ 10 ≤ X¯ − 52 2.5/ √ 10 ≤ 51.5− 52 2.5/ √ 10 ) = P(−4.43 ≤ Z ≤ −0.63) = P(Z ≤ −0.63)− P(Z ≤ −4.43) = 0.2643− 0.0000 = 0.2643 Giả sử giá trị thực sự µ = 50.5, khi đó β = P(48.5 ≤ X¯ ≤ 51.5|µ = 50.5) = P ( 48.5− 50.5 2.5/ √ 10 ≤ X¯ − 50.5 2.5/ √ 10 ≤ 51.5− 50.5 2.5/ √ 10 ) = P(−2.53 ≤ Z ≤ 1.27) = 0.8980− 0.0057 = 0.8923 Sai lầm loại I và loại II - Ví dụ Kiểm định giả thuyết thống kê Hoàng Văn Hà – 17 Tương tự α, tăng cỡ mẫu sẽ làm giảm sai lầm β, với cỡ mẫu n = 16 và miền chấp nhận là 48 < X¯ < 52, ta tính được β = 0.229. Bảng 1 tổng kết sai lầm lầm loại I và loại II với miền chấp nhận và cỡ mẫu khác nhau Miền chấp nhận n α β với µ = 52 β với µ = 50.5 48.5 < x¯ < 51.5 10 0.0574 0.2643 0.8923 48 < x¯ < 52 10 0.0114 0.5000 0.9705 48.5 < x¯ < 51.5 16 0.0164 0.2119 0.9445 48 < x¯ < 52 16 0.0014 0.5000 0.9918 Bảng 1: Sai lầm loại I và loại II Sai lầm loại I và loại II - Nhận xét Kiểm định giả thuyết thống kê Hoàng Văn Hà – 18 1. Ta có thể giảm kích thước của miền bác bỏ (tương ứng tăng kích thước miền chấp nhận), và xác suất sai lầm loại I α bằng cách chọn những điểm tới hạn thích hợp. 2. Xác suất sai lầm loại I và loại II có liên quan với nhau. Với một cỡ mẫu cố định, việc giảm sai lầm loại này sẽ làm tăng sai lầm loại kia. 3. Cố định các điểm tới hạn, tăng cỡ mẫu n sẽ làm giảm xác suất sai lầm loại I α và loại II β. 4. Nếu H0 sai, sai lầm β sẽ tăng khi giá trị thực của tham số tiến gần đến giá trị được phát biểu trong giả thuyết H0. Sai lầm loại I và loại II - Ví dụ Kiểm định giả thuyết thống kê Hoàng Văn Hà – 19 Ví dụ 3. 1. Xét X là biến ngẫu nhiên có phân phối nhị thức. Ta cần kiểm định giả thuyết H0 : p = 0.8 và đối thuyết H1 : p < 0.8. Hãy tìm miền bác bỏ {X ≤ c} và tính xác suất sai lầm loại I α và loại II β tương ứng với đối thuyết H1 : p = 0.6 khi n = 10 và n = 20. 2. Một mẫu ngẫu nhiên cỡ n được chọn từ tổng thể có phân phối chuẩn với phương sai σ2 = 9, tính được x¯ = 17. Ta cần kiểm định giả thuyết H0 : µ = 15 và H1 : µ > 15. Giả sử α = 0.05, a. Tìm miền bác bỏ có dạng {X¯ > c}. b. Với đối thuyết H1 : µ = 16, tính β. Bổ đề Neyman-Pearson Kiểm định giả thuyết thống kê Hoàng Văn Hà – 20 Định nghĩa 4. Giả sử Z = h(X1, . . . , Xn) là một tiêu chuẩn kiểm định và Wα là miền bác bỏ của một bài toán kiểm định giả thuyết thống liên quan đến tham số θ. Độ mạnh của kiểm định là xác suất bác bỏ giả thuyết H0 khi đối thuyết H1 đúng, ký hiệu pi. pi = P(Wα|H1) = 1− P(W cα|H1) = 1− β (5) Một tiêu chuẩn kiểm định tốt sẽ có độ mạnh cao. Định nghĩa 5. Xét bài toán kiểm định giả thuyết thống kê có giả thuyết H0, đối thuyết H1, miền bác bỏ Wα và miền chấp nhận W cα. Cho α, β lần lượt là sai lầm loại I và loại II. Cố định giá trị α nhỏ, trong tất cả các tiêu chuẩn kiểm định Z = h(X1, . . . , Xn) có cùng mức sai lầm α thì tiêu chuẩn nào có độ mạnh pi = 1− β lớn nhất thì được gọi là tiêu chuẩn tốt nhất (tối ưu). Bổ đề Neyman-Pearson Kiểm định giả thuyết thống kê Hoàng Văn Hà – 21 Định lý 6 (Bổ đề Neyman-Pearson). Xét bài toán kiểm định giả thuyết thống kê H0, đối thuyết H1 dựa trên một mẫu ngẫu nhiên (X1, . . . , Xn) lấy từ một phân phối phụ thuộc vào tham số θ. Xét L(θ) = L(θ|X1, . . . , Xn) > 0 là hàm hợp lý dựa trên mẫu ngẫu nhiên X = (X1, . . . , Xn). Nếu tồn tại một hằng số dương C và một tập con W ⊂ Rn sao cho 1. L(θ0) L(θ1) ≤ C với x = (x1, . . . , xn) ∈W 2. L(θ0) L(θ1) > C với x = (x1, . . . , xn) ∈W c, với W ∪W c = Rn 3. P [(X1, . . . , Xn) ∈W ; θ0] = α. thì kiểm định với miền bác bỏ W sẽ có độ mạnh lớn nhất với giả thuyết H0 và đối thuyết H1. Ta gọi α là độ lớn (size) của kiểm định và W là miền bác bỏ tốt nhất với độ lớn α. Bổ đề Neyman-Pearson - Ví dụ Kiểm định giả thuyết thống kê Hoàng Văn Hà – 22 Xét X1, . . . , Xn là mẫu ngẫu nhiên chọn từ tổng thể có phân phối Poisson với trung bình λ. Tìm kiểm định có độ mạnh lớn nhất cho giả thuyết H0 : λ = 2 và H1 : λ = 1/2. Hàm xác suất của X ∼ P (λ): f(x) = e −λλx x! , với x = 0, 1, 2, . . . Hàm hợp lý là L(λ) = n∏ i=1 f(xi) = λ me−λn ( n∏ i=1 (xi!) ) −1 với m = n∑ i=1 xi Với λ = 2 L(2) = 2me−2n ( n∏ i=1 (xi!) ) −1 Bổ đề Neyman-Pearson - Ví dụ Kiểm định giả thuyết thống kê Hoàng Văn Hà – 23 và λ = 1/2, L(1/2) = (1/2)me−(1/2)n ( n∏ i=1 (xi!) ) −1 Theo bổ đề Neyman-Pearson, miền bác bỏ thỏa L(2) L(1/2) = 2me−2n( 1 2 )m e− n 2 = 4me− 3n 2 ≤ C Lấy logarit 2 vế ta được, m log(4)− 3n 2 < log(C)⇒ m < log(C) + (3n/2) log(4) Đặt C ′ = log(C) + (3n/2) log(4) , ta sẽ bác bỏ H0 khi ∑n i=1 xi ≤ C ′. Kiểm định tỷ lệ hợp lý (LRT) Kiểm định giả thuyết thống kê Hoàng Văn Hà – 24 Xét bài toán kiểm định giả thuyết{ H0 : θ ∈ Θ0 H1 : θ ∈ Θc0 Với θ là tham số chưa biết của tổng thể nhận giá trị trong không gian tham số Θ, và Θ0 ⊂ Θ. Xét mẫu ngẫu nhiên cỡ n: X = (X1, . . . , Xn) và hàm hợp lý L(θ|x1, . . . , xn) = L(θ|x). Định nghĩa 7. Kiểm định tỷ lệ hợp lý (Likelihood ratio test) cho kiểm định thống kê với giả thuyết H0 : θ ∈ Θ0 và đối thuyết H1 : θ ∈ Θc0 là λ(x) = sup Θ0 L(θ|x) sup Θ L(θ|x) (6) Chú ý rằng 0 ≤ λ(x) ≤ 1. Kiểm định tỷ lệ hợp lý Kiểm định giả thuyết thống kê Hoàng Văn Hà – 25 Gọi θˆ0 và θˆ lần lượt là ước lượng hợp lý cực đại của tham số θ xác định trên không gian tham số Θ0 và Θ. Khi đó, kiểm định tỷ lệ hợp lý là λ(x) = L(θˆ0|x) L(θˆ|x) (7) Bác bỏ giả thuyết H0 khi λ(x) ≤ C Hằng số C được chọn sao cho kiểm định có mức ý nghĩa cho trước là α. Kiểm định tỷ lệ hợp lý - Ví dụ Kiểm định giả thuyết thống kê Hoàng Văn Hà – 26 Ví dụ 4. Xét X1, X2, . . . , Xn i.i.d∼ N (µ, σ2). Giả sử σ2 đã biết. Ta cần kiểm định, với mức ý nghĩa α, H0 : µ = µ0 và H1 : µ 6= µ0. Hãy tìm một kiểm định tỷ lệ hợp lý. Với σ2 đã biết, hàm hợp lý có dạng L(µ) = 1 (σ √ 2pi)n e− 1 2σ2 ∑n i=1(xi−µ) 2 Các không gian tham số: Θ0 = {µ0}, Θc0 = R\{µ0}. Khi đó, L(µ0) = 1 (σ √ 2pi)n e− 1 2σ2 ∑n i=1(xi−µ0) 2 Ước lượng hợp lý cực đại của µ trên R là µˆ = X¯. Do đó, L(µˆ) = 1 (σ √ 2pi)n e− 1 2σ2 ∑n i=1(xi−X¯) 2 Kiểm định tỷ lệ hợp lý - Ví dụ Kiểm định giả thuyết thống kê Hoàng Văn Hà – 27 Kiểm định tỷ lệ hợp lý λ(x) = L(µ0) L(µˆ) = e− 1 2σ2 ∑n i=1(xi−µ0) 2 e− 1 2σ2 ∑n i=1(xi−X¯) 2 = e−n(X¯−µ0) 2/2σ2 Bác bỏ H0 khi: λ(x) ≤ C, tương đương với − n 2σ2 (X¯ − µ0)2 ≤ log(C)⇔ (X¯ − µ0) 2 σ2/n ≥ 2 log(C) ⇔ ∣∣∣∣X¯ − µ0σ/√n ∣∣∣∣ ≥ 2 log(C) = C1 Tìm C1: ta có nhận xét rằng nếu H0 đúng, X¯ − µ0 σ/ √ n ∼ N (0, 1) Kiểm định tỷ lệ hợp lý - Ví dụ Kiểm định giả thuyết thống kê Hoàng Văn Hà – 28 Với mức ý nghĩa α cho trước P (∣∣∣∣X¯ − µ0σ/√n ∣∣∣∣ ≥ C1 ) = P (|Z| ≥ C1) = α hay P (Z ≤ −C1) + P (Z ≥ C1) = α Ta tính được C1 = z1−α/2: phân vị mức 1− α/2 của Z ∼ N (0, 1). Vậy, bác bỏ H0 khi ∣∣∣∣X¯ − µ0σ/√n ∣∣∣∣ ≥ z1−α/2 p - giá trị (p - value) Kiểm định giả thuyết thống kê Hoàng Văn Hà – 29 Định nghĩa 8. Tương ứng với một giá trị thống kê kiểm định tính trên một mẫu các giá trị quan trắc xác định, p - giá trị là mức ý nghĩa nhỏ nhất dùng để bác bỏ giả thuyết H0. Dựa vào đối thuyết H1, các bước tính p-giá trị như sau: 1. Xác định thống kê kiểm định: TS. Tính giá trị thống kê kiểm định dựa trên mẫu (x1, . . . , xn), giả sử bằng a. 2. p-giá trị cho bởi p =   P(|TS| > |a||H0), kiểm định hai phía P(TS < a|H0), kiểm định một phía - bên trái P(TS > a|H0), kiểm định một phía - bên phải (8) Kết luận: Bác bỏ giả thuyết H0 nếu p-giá trị ≤ α. Kiểm định giả thuyết cho trường hợp một mẫu Kiểm định giả thuyết cho trường hợp một mẫu Kiểm định giả thuyết thống kê Hoàng Văn Hà – 31 n Kiểm định giả thuyết cho kỳ vọng u Trường hợp biết phương sai, u Trường hợp không biết phương sai, mẫu nhỏ, u Trường hợp không biết phương sai, mẫu lớn. n Kiểm định giả thuyết cho tỷ lệ Kiểm định giả thuyết cho kỳ vọng - TH biết σ2 Kiểm định giả thuyết thống kê Hoàng Văn Hà – 32 • Các giả định: n Mẫu ngẫu nhiên X1, . . . , Xn được chọn từ tổng thể có phân phối chuẩn N (µ, σ2) với kỳ vọng µ chưa biết. n Phương sai σ2 đã biết. n Cho trước giá trị µ0, cần so sánh kỳ vọng µ với µ0. • Bài toán kiểm định có 3 trường hợp: (a) { H0 : µ = µ0 H1 : µ 6= µ0 (b) { H0 : µ = µ0 H1 : µ < µ0 (c) { H0 : µ = µ0 H1 : µ > µ0 với mức ý nghĩa α cho trước. Kiểm định giả thuyết cho kỳ vọng - TH biết σ2 Kiểm định giả thuyết thống kê Hoàng Văn Hà – 33 Các bước kiểm định 1. Phát biểu giả thuyết không và đối thuyết 2. Xác định mức ý nghĩa α 3. Lấy mẫu ngẫu nhiên cỡ n: X1, . . . , Xn và tính thống kê kiểm định Z0 = X¯ − µ0 σ/ √ n (9) 4. Xác định miền bác bỏ Wα: bảng 2 Kiểm định giả thuyết cho kỳ vọng - TH biết σ2 Kiểm định giả thuyết thống kê Hoàng Văn Hà – 34 Giả thuyết Miền bác bỏ H0 : µ = µ0 Wα = { z0 : |z0| > z1−α/2 } H1 : µ 6= µ0 H0 : µ = µ0 Wα = { z0 : z0 < −z1−α } H1 : µ < µ0 H0 : µ = µ0 Wα = { z0 : z0 > z1−α } H1 : µ > µ0 Bảng 2: Miền bác bỏ với đối thuyết tương ứng 5. Kết luận: Bác bỏ H0/ Chưa đủ cơ sở để bác bỏ H0. Kiểm định giả thuyết cho kỳ vọng - TH biết σ2 Kiểm định giả thuyết thống kê Hoàng Văn Hà – 35 • Sử dụng p-giá trị (p - value): tính p-giá trị dựa theo đối thuyết và kết luận bác bỏ H0 khi p -giá trị ≤ α, với mức ý nghĩa α cho trước. Công thức tính p - giá trị theo các trường hợp xem ở bảng 3. Giả thuyết p - giá trị H0 : µ = µ0 p = 2 [1− Φ(|z0|)]H1 : µ 6= µ0 H0 : µ = µ0 p = Φ(z0)H1 : µ < µ0 H0 : µ = µ0 p = 1− Φ(z0)H1 : µ > µ0 Bảng 3: p-giá trị với đối thuyết tương ứng Kiểm định giả thuyết cho kỳ vọng - TH biết σ2 - Ví dụ Kiểm định giả thuyết thống kê Hoàng Văn Hà – 36 Ví dụ 5 (Kiểm định 2 phía). Dây chuyền sản xuất kem đánh răng P/S được thiết kế để đóng hộp những tuýt kem có trọng lượng trung bình là 6 oz (1 oz = 28g). Một mẫu gồm 30 tuýt kem được chọn ngẫu nhiên để kiểm tra định kỳ. Bộ phận điều khiển dây chuyền phải đảm bảo để trọng lượng trung bình mỗi tuýt kem là 6 oz; nếu nhiều hơn hoặc ít hơn, dây chuyền phải được điều chỉnh lại. Giả sử trung bình mẫu của 30 tuýt kem là 6.1 oz và độ lệch tiêu chuẩn của tổng thể σ = 0.2 oz. Thực hiện kiểm định giả thuyết với mức ý nghĩa 3% để xác định xem dây chuyền sản xuất có vận hành tốt hay không? Kiểm định giả thuyết cho kỳ vọng - TH biết σ2 - Ví dụ Kiểm định giả thuyết thống kê Hoàng Văn Hà – 37 Gọi X là trọng lượng của một tuýt kem đánh răng, giả sử X ∼ N (µ, 0.22). Các bước kiểm định như sau: 1. Phát biểu giả thuyết: { H0 : µ = 6 H1 : µ 6= 6 2. Xác định mức ý nghĩa: α = 0.03 3. Tính giá trị thống kê kiểm định z0 = x¯− µ0 σ/ √ n = 6.1− 6.0 0.2/ √ 30 = 2.74 4. Xác định miền bác bỏ: Bác bỏ H0 khi |z0| > z1−α/2 Kiểm định giả thuyết cho kỳ vọng - TH biết σ2 - Ví dụ Kiểm định giả thuyết thống kê Hoàng Văn Hà – 38 α = 3% nên z1−α/2 = z0.985 = 2.17. Vậy bác bỏ H0 nếu z0 2.17 5. Kết luận: do z0 = 2.74 > 2.17 nên bác bỏ H0. Ta kết luận với 97% độ tin cậy rằng trọng lượng trung bình mỗi tuýt kem không bằng 6. • Sử dụng p - giá trị: 4a. Tính p-giá trị, bài toán kiểm định hai phía p = 2[1− Φ(|z0|)] = 2[1− Φ(2.74)] = 2[1− 0.9969] = 0.0062 5a. Kết luận: với α = 0.03, ta có p = 0.0062 < 0.03 nên bác bỏ H0. Ta kết luận với 97% độ tin cậy rằng trọng lượng trung bình mỗi tuýt kem không bằng 6. Kiểm định giả thuyết cho kỳ vọng - TH biết σ2 - Ví dụ Kiểm định giả thuyết thống kê Hoàng Văn Hà – 39 Ví dụ 6 (Kiểm định một phía). Metro EMS: Một bệnh viện tại trung tâm thành phố cung cấp dịch vụ cấp cứu tại nhà. Với khoảng 20 xe cấp cứu, mục tiêu của trung tâm là cung cấp dịch vụ cấp cứu trong khoảng thời gian trung bình là 12 phút sau khi nhận được điện thoại yêu cầu. Một mẫu ngẫu nhiên gồm thời gian đáp ứng khi có yêu cầu của 40 ca cấp cứu được chọn. Trung bình mẫu là 13.25 phút. Biết rằng độ lệch tiêu chuẩn của tổng thể là σ = 3.2 phút. Giám đốc EMS muốn thực hiện một kiểm định, với mức ý nghĩa 5%, để xác định xem liệu thời gian một ca cấp cứu có bé hơn hoặc bằng 12 phút hay không? Các bước kiểm định: 1. Phát biểu giả thuyết H0 : µ = 12: Thời gian đáp ứng của dịch vụ cấp cứu đạt yêu cầu, không cần phải thay đổi. H1 : µ > 12: Thời gian đáp ứng của dịch vụ không đạt yêu cầu, cần thay đổi. Kiểm định giả thuyết cho kỳ vọng - TH biết σ2 - Ví dụ Kiểm định giả thuyết thống kê Hoàng Văn Hà – 40 2. Xác định mức ý nghĩa: α = 0.05 3. Tính giá trị thống kê kiểm định z0 = x¯− 12 σ/ √ n = 13.25− 12 3.2/ √ 40 = 2.47 4. Xác định miền bác bỏ: bác bỏ H0 nếu z0 > z1−α = z0.95 = 1.645 5. Kết luận: z0 = 2.47 > 1.645 nên bác bỏ H0. Ta kết luận rằng với 95% độ tin cậy, Mertro EMS không đáp ứng được mục tiêu thời gian phục vụ khách hàng từ 12 phút trở xuống. Kiểm định giả thuyết