Bài giảng Lý thuyết xác suất và thống kê - Bài 7: Kiểm định giả thuyết thống kê - Nguyễn Mạnh Thế

1. KHÁI NIỆM GIẢ THUYẾT THỐNG KÊ Khái niệm: Giả thuyết thống kê là một mệnh đề về tham số của tổng thể. Ký hiệu H0 là giả thuyết của tham số tổng thể, đi kèm với giả thuyết là mệnh đề đối lập được gọi là đối thuyết, ký hiệu là H1. Bài toán kiểm định giả thuyết thống kê gồm một cặp giả thuyết H0 và đối thuyết H1. • Sai lầm loại I: Bác bỏ giả thuyết H0 nhưng thực tế H0 là đúng. α là xác suất mắc sai lầm loại 1. • Sai lầm loại II: Chấp nhận giả thuyết H0 nhưng thực tế H0 là sai. β là xác suất mắc sai lầm loại 2. v1.0012107210  được gọi là mức ý nghĩa, thường được lấy nhỏ: 0,05; 0,02; 0,01

pdf58 trang | Chia sẻ: thanhle95 | Lượt xem: 1088 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Bài giảng Lý thuyết xác suất và thống kê - Bài 7: Kiểm định giả thuyết thống kê - Nguyễn Mạnh Thế, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
BÀI 7 Ể Ả Ế Ố ÊKI M ĐỊNH GI THUY T TH NG K TS N ễ M h Thế. guy n ạn v1.0012107210 1 TÌNH HUỐNG KHỞI ĐỘNG BÀI Kết luậnTình h ố g • Kiểm định so sánh kỳ vọng của biến ngẫu nhiên có phân phối chuẩn (với một giá trị cho trước của kỳ vọng). Công ty Hoà g Lâm sản xuất mỳ chính theo dây chuyền của Đức. Theo tiêu chuẩn thì trọn lượng các gói mỳ chính được đóng trên một máy tự động Trường hợp đã biết: Bài toán 1: 2  là 453g. Nghi ngờ máy tự động làm việc không còn đủ chính xác, công ty Hoàng Lâm tiến hành kiểm tra ngẫu nhiên 81 gói ta thấy trọng lượng trung bình là 448g. Với mức ý nghĩa 0.05 có thể cho rằng trọng lượng các gói mỳ Tiê h ẩ kiể đị h 0 0 1 0 H : H :       chính không đạt tiêu chuẩn hay không? Biết rằng trọng lượng gói mỳ chính là biến ngẫu nhiên có phân phối chuẩn với độ lệch chuẩn là 36g. u c u n m n : 0(X )U n ~ N(0,1)    Hình 1. Miền tiêu chuẩn đối với phân phối chuẩn Câu hỏi gợi mở Câu 1: Trọng lượng trung bình của 01 gói mỳ • Với mức ý nghĩa a cho trước, ta có miền bác bỏ: với   / 2 / 2; U U ;       / 2P U U   . chính theo điều tra là bao nhiêu? Câu 2: Để bác bỏ giả thuyết “dây chuyền vẫn hoạt ộ ố ỳ í ú ê ẩ Nếu giá trị kỳ vọng của biến X thực sự  0 qs x U n W     0  đ ng t t, trọng lượng m ch nh đ ng ti u chu n” thì tiêu chuẩn kiểm định phải không nằm trong khoảng nào? v1.0012107210 2 Câu 3: Dây chuyền còn hoạt động tốt không? TÌNH HUỐNG KHỞI ĐỘNG BÀI (tiếp theo) Kết luận • Kiểm định so sánh kỳ vọng của biến ngẫu nhiên có phân phối chuẩn (với một giá trị cho trước của kỳ vọng). Trường hợp đã biết: Bài toán 1: 2  Tiê h ẩ kiể đị h 0 0 1 0 H : H :       u c u n m n : 0(X )U n ~ N(0,1)    Hình 1. Miền tiêu chuẩn đối với phân phối chuẩn • Với mức ý nghĩa a cho trước, ta có miền bác bỏ: với   / 2 / 2; U U ;       / 2P U U   . Nếu giá trị kỳ vọng của biến X thực sự  0 qs x U n W     0  v1.0012107210 3 MỤC TIÊU Khái niệm giả ế ố ê • Miền bác bỏ; thuy t th ng k • Các bước làm bài toán kiểm định. Kiểm định • Tham số kỳ vọng; Th ố hươ i tham số • am s p ng sa ; • Tham số tỉ lệ. Một số tiêu chuẩn • Kiểm định giả thuyết phân phối; kiểm định phi tham số • So sánh nhiều tỉ lệ; • Kiểm định tính độc lập. v1.0012107210 4 1. KHÁI NIỆM GIẢ THUYẾT THỐNG KÊ hái iệK n m: Giả thuyết thống kê là một mệnh đề về tham số của tổng thể. Ký hiệu H là giả thuyết của tham số tổng thể đi kèm với giả thuyết là mệnh0 , đề đối lập được gọi là đối thuyết, ký hiệu là H1. Bài toán kiểm định giả thuyết thống kê gồm một cặp giả thuyết H0 và đối thuyết H1. • Sai lầm loại I: Bác bỏ giả thuyết H0 nhưng thực tế H0 là đúng. α là xác suất mắc sai lầm loại 1. • Sai lầm loại II: Chấp nhận giả thuyết H0 nhưng thực tế H0 là sai. β là xác suất mắc sai lầm loại 2. v1.0012107210 5  được gọi là mức ý nghĩa, thường được lấy nhỏ: 0,05; 0,02; 0,01. 1.1. MIỀN BÁC BỎ Để giải quyết bài toán kiểm định giả thuyết ta xây dựng một thống kê. G gọi là tiêu chuẩn thống kê. Định nghĩa 1: Thống kê được gọi là một tiêu chuẩn thống kê nếu giá trị của nó được dùng để xem xét bác bỏ hay chấp nhận giả 1 2 nT G(X X ... X )    thuyết H0. Định nghĩa 2: Miền này được dùng cùng với tiêu chuẩn thống kê T và giá trị cụ thể tqs của tiêu chuẩn đó để đưa ra kết luận về giả thuyết H0. bác bỏ giả thuyết H0. hấ hậ iả th ết H qst W ct W c p n n g uy 0.qs  v1.0012107210 6 1.2. CÁC BƯỚC LÀM BÀI TOÁN KIỂM ĐỊNH Xác định tham số kiểm định, đặt giả thuyết và đối thuyết Bước 1 Xác định tiêu chuẩn và giá trị tiêu chuẩn với giá trị mẫu đã choBước 2 Xác định miền bác bỏ WBước 3 So sánh giá trị của tiêu chuẩn thống kê với miền bác bỏ, kết l ậ bá bỏ h hấ hậ iả th ếtBước 4 u n c ay c p n n g uy v1.0012107210 7 2. KIỂM ĐỊNH THAM SỐ Kiểm định bằng miền tiêu chuẩn Kiểm định bằng xác suất ý nghĩa Kiểm định bằng khoảng tin cậy Kiể đị h iả th ết kì (miền bác bỏ) • m n g uy vọng • Kiểm định giả thuyết phương sai • Kiểm định giả thuyết xác suất Kiểm định giả thuyết hai phía Kiểm định giả thuyết một phía ẫ ẩ v1.0012107210 8 Ta coi tất cả các biến ng u nhiên được xét tới đều có phân phối chu n. 2.1. KIỂM ĐỊNH GIẢ THUYẾT KỲ VỌNG Trường hợp đã biết Bài toán 1. Nếu giả thuyết H0 là đúng thì: H  0 0 1 0 : H :       0(X )U n ~ N(0,1)    Giả thuyết H0 bị bác bỏ nếu Ta có miền bác bỏ /2 /2W ( ; -u ) (u ; )      /2P{ |U| u }   Trong đó uα/2 thỏa mãn điều kiện: 0 /2(u ) 1 /2    Với mẫu cụ thể giá trị của tiêu chuẩn thống kê U là: 0 qs x u n    v1.0012107210 9 2.1. KIỂM ĐỊNH GIẢ THUYẾT KỲ VỌNG (tiếp theo) Ví dụ: Th tiê h ẩ thì t lượ á ói ì hí h đượ đó Giải: Gọi X là trọng lượng gói mì chính ể eo u c u n rọng ng c c g m c n c ng trên một máy tự động là 453g. Kiểm tra ngẫu nhiên 81 gói ta thấy trọng lượng trung bình là 448g. Giả thiết cần ki m định Ta có X ~ N(μ σ2) trong đó σ=36 với mức ý nghĩa α=0 05 0 1 H : 453 H : 453     Với mức ý nghĩa 0,05 có thể cho rằng trọng lượng các gói mì chính không đạt tiêu chuẩn hay không? Biết ằ t lượ ói ì hí h là biế ẫ hiê ó hâ , , , . Tra bảng phân phối chuẩn ta tính được: uα/2 = u0 025 = 1,96r ng rọng ng g m c n n ng u n n c p n phối chuẩn với độ lệch chuẩn là 36g. , Vậy miền bác bỏ là: Ta có: W ( ; -1,96) (1,96; )     448 453 Kiểm tra ta thấy qsx 448 u 81 1,2536      u 1 25 W  . Vậy ta chấp nhận giả thuyết H0, tức là trọng lượng các gói mì chính không đạt tiêu chuẩn . qs , v1.0012107210 10 2.1. KIỂM ĐỊNH GIẢ THUYẾT KỲ VỌNG (tiếp theo) Bài toán kiểm định một phía HBài toán 2 ể 0 0 1 0 : H :       Đ bác bỏ giả thuyết H0 thì giá trị của thống kê U phải đủ lớn để T đó thỏ ã P{U u }   rong u a m n: Ta có miền bác bỏ: 0(u ) 1    W (u ; ).  v1.0012107210 11 2.1. KIỂM ĐỊNH GIẢ THUYẾT KỲ VỌNG (tiếp theo) Ví dụ: Năng suất trung bình của một giống lúa ở các năm trước là 32,5 (tạ/ha). Năm nay người ta đưa vào phương pháp chăm sóc mới và hy vọng năng suất cao hơn năm trước. Điều tra trên 15 thửa ruộng thu được kết quả sau: 33,7 35,4 32,7 36,3 37,3 32,4 30,0 32,4 31,7 34,5 42,0 33,9 38,1 35,0 33,8 (tạ/ha) Với mức ý nghĩa 1% có thể chấp nhận hy vọng đó hay không? Biết rằng năng suất lúa là biến ngẫu nhiên có phân phối chuẩn với phương sai là 10. v1.0012107210 12 2.1. KIỂM ĐỊNH GIẢ THUYẾT KỲ VỌNG (tiếp theo) Giải: Gọi X là năng suất lúa, ta có X ~ N(μ,σ2) trong đó σ2=10. Ta cần kiểm định giả thiết: 0 1 H : 32,5 H : 32,5     Với mức ý nghĩa: Tra bảng phân phối chuẩn ta có u0 01 = 2 33 00,01 nên 1 0,01 0,99      , , Vậy miền bác bỏ là: Với mẫu cụ thể đã cho ta tính được W (2,33; )   x 34,613 Ta có: 0 qs x 34,613 32,5 u n 15 2,587 10      Vậ bá bỏ giả th ết H tứ là năng s ất lúa đã tăng lên qsu 2,587 W  v1.0012107210 13 y c uy 0 c u . 2.1. KIỂM ĐỊNH GIẢ THUYẾT KỲ VỌNG (tiếp theo) Bài toán 3: 0 0 1 0 H : H :       Để bác bỏ giả thuyết H0 thì giá trị của thống kê U phải đủ nhỏ, tồn tại giá trị uα h { }sao c o: Miền bác bỏ: P U u    W ( ; u )    v1.0012107210 14 2.1. KIỂM ĐỊNH GIẢ THUYẾT KỲ VỌNG (tiếp theo) Ví dụ: Theo tiêu chuẩn thì trọng lượng các bao gạo do một máy tự động đóng là 50kg. Sau một thời gian hoạt động người ta nghi ngờ máy hoạt động không bình thường làm cho trọng lượng các bao gạo giảm đi. Lấy ngẫu nhiên 90 bao và cân thử thu được trọng lượng trung bình là 48 5kg, . Với mức ý nghĩa 5%, có thể kết luận về điều nghi ngờ trên? ẫBiết rằng trong lượng bao gạo là biến ng u nhiên có phân phối chuẩn với độ lệch chuẩn là 2kg. v1.0012107210 15 2.1. KIỂM ĐỊNH GIẢ THUYẾT KỲ VỌNG (tiếp theo) Giải: Gọi X là trọng lượng bao gạo X ~ N(μ,σ2) và σ = 2 Ta cần kiểm định 0H : 50  mức ý nghĩa: 1H : 50 0 05 (u ) 1 0 05 0 95      Tra bảng phân phối chuẩn ta có u0,05 = 1,65 0 0,05, , , . Vậy miền bác bỏ là: ẫ W ( ; -1,65).  Với m u đã cho ta có: Giá t ị ủ tiê h ẩ thố kê là 0x 48,5 50 90 7 11   x 48,5 r c a u c u n ng : Kiểm tra ta thấy vậy ta bác bỏ giả thuyết H0 qsu n ,2     u W v1.0012107210 16 . qs ờ h h biế 2.1. KIỂM ĐỊNH GIẢ THUYẾT KỲ VỌNG (tiếp theo) Trư ng ợp c ưa t Xét thống kê nếu giả thuyết H là đúng thì T có quy luật0XT n    0 phân phối student với n-1 bậc tự do. ' ,S  Bài toán 1 0 0 1 0 H : H :       Ta bác bỏ giả thuyết H0 nếu giá trị tuyệt đối của thống kê T đủ lớn, ứ là  t c : trong đó phân vị tìm từ bảng phân phối student. miền bác bỏ là: n-1 /2P |T| t   n 1 / 2t   n-1 n-1W ( ; t ) (t ; )  với mẫu cụ thể giá trị của tiêu chuẩn thống kê 0x   /2 /2 -     v1.0012107210 17 qst ns '  2.1. KIỂM ĐỊNH GIẢ THUYẾT KỲ VỌNG (tiếp theo) Ví dụ: T á ă t ướ th hậ t bì h ủ ô hâ là 15rong c c n m r c u n p rung n c a c ng n n (triệu/năm), năm nay điều tra thu nhập của 25 công nhân ta có số liệu sau: Thu nhập 10-12 12-14 14-16 16-18 18-20 Số công nhân 2 4 10 6 3 Với mức ý nghĩa 5% hãy kiểm định xem thu nhập trung bình của công nhân năm nay có khác so với năm trước hay không? Biết rằng thu nhập của công nhân là biến ngẫu nhiên có phân phối chuẩn. v1.0012107210 18 2.1. KIỂM ĐỊNH GIẢ THUYẾT KỲ VỌNG (tiếp theo) Giải: Gọi X là thu nhập của công nhân X ~ N(μ,σ2) Ta kiểm định 0H : 15 H 15   Ta có: 1 :  2x 15,32, s' 4,893, s' 2,212   Vậy ta có miền bác bỏ: ớ ẫ ó W (- ; -2,06) (2,06; ).     V i m u đã cho ta c : 24 0,025t 2,06. 15 32 15Giá trị tiêu chuẩn thống kê: Ta thấy do đó chưa bác bỏ được giả thuyết H0. qs , t 25 0,723. 2,212   t W, v1.0012107210 19 qs 2.1. KIỂM ĐỊNH GIẢ THUYẾT KỲ VỌNG (tiếp theo) Bài toán 2: 0 0 1 0 H : H :       Miền bác bỏ: n 1W (t ; )   Bài toán 3: 0 0H : H :       Tương tự ta có miền bác bỏ 1 0 1 phân vị tìm từ bảng phân phối student.n 1t  nW (- ; -t )   v1.0012107210 20 2.1. KIỂM ĐỊNH GIẢ THUYẾT KỲ VỌNG (tiếp theo) Ví dụ: Mức xăng hao phí cho một xe ôtô chạy trên đoạn đường AB ở năm ớ à í ă ờ ố ấ à ứ ătrư c l 50 l t. N m nay do đoạn đư ng bị xu ng c p v m c x ng hao phí tăng lên. Điều tra 30 chuyến xe chạy trên đoạn đường AB ta có số liệu sau: Mức xăng hao phí 49-49,5 49,5-50 50-50,5 50,5-51 51-51,5 Số chuyến 5 7 10 6 2 Với mức ý nghĩa 1% hãy kết luận về điều nghi ngờ trên. Biết rằng mức xăng hao phí là biến ngẫu nhiên có phân phối chuẩn. v1.0012107210 21 2.1. KIỂM ĐỊNH GIẢ THUYẾT KỲ VỌNG (tiếp theo) Giải: Gọi X là mức xăng hao phí, X ~ N(μ,σ2) Ta kiểm định 0 1 H : 50 H : 50     tra bảng phân phối student ta có ẫ ể 29 0,01t 2,46. Với m u cụ th đã cho, tính toán ta được: 2x 50,133; s' 0,339; s' 0,583.   Giá trị của tiêu chuẩn thống kê: qs 50,133 50 t 30 1,254 0,538   Ta thấy do đó chưa có cơ sở để bác bỏ giả thuyết H0.qst W v1.0012107210 22 2.2. KIỂM ĐỊNH GIẢ THUYẾT PHƯƠNG SAI Cho biến ngẫu nhiên X ~ N(μ σ2) Giả thuyết 2 2H :, . Trường hợp kỳ vọng µ đã biết 0 0.   Xét thông kê , trong đó 2 2 2 0 nS *   *2 2 i 1 S (X ) n    Khi đó có phân phối khi bình phương với n bậc tự do. Với mẫu cụ thể ta có : *2 2 qs 2 ns .    Bài toán 1: 0 2 2 0 0 2 2 0 H : H :        Mức ý nghĩa cho trước ta có miền bác bỏ: 1 2 2 1- /2,n /2,nW (0; ) ( ; )      2 2 Bài toán 2: Miền bác bỏ:0 0 2 2 1 0 H : H :       2 ,nW ( ; )    v1.0012107210 23 Bài toán 3: Miền bác bỏ: 2 2 0 0 2 2 1 0 H : H :       2 1 ,nW (0; )  Trường hợp kỳ vọng µ chưa biết 2.2. KIỂM ĐỊNH GIẢ THUYẾT PHƯƠNG SAI (tiếp theo) Ta có thống kê: '22 2 2 0 (n 1)S ~ (n 1)     Với mẫu cụ thể giá trị của tiêu chuẩn thống kê là: '22 2 (n 1)s  Bài toán 1 qs 0 2 2 0 0 2 2 H : H     Miền bác bỏ: Bài toán 2 2 2 1- /2,n-1 /2,n 1W (0; ) ( ; )        1 0:    2 2H :    Miền bác bỏ: 2 n 1W ( ; )    0 0 2 2 1 0H :     Bài toán 3 , - 2 2 0 0 2 2 H : H :        v1.0012107210 24Miền bác bỏ: 1 0 2 1 ,n-1W (0; )  Ví d 2.2. KIỂM ĐỊNH GIẢ THUYẾT PHƯƠNG SAI (tiếp theo) ụ: Lấy ngẫu nhiên 20 chai nước do một máy đóng chai tự động đóng ta thu được độ lệch chuẩn mẫu là s’2 = 0 0153 (l2) Máy được gọi, . là đạt chuẩn nếu độ phân tán không sai khác 0,01(l2). Với mức ý nghĩa 5% hãy kiểm định xem máy đóng chai có đạt chuẩn hay không? Biết rằng thể tích nước trong chai là biến ngẫu nhiên có phân phối chuẩn. v1.0012107210 25 2.2. KIỂM ĐỊNH GIẢ THUYẾT PHƯƠNG SAI (tiếp theo) Giải: Gọi X là thể tích nước trong chai ta có X ~ N(μ σ2) , , Ta cần kiểm định 2 0 2 1 H : 0,01 H : 0,01      Mức ý nghĩa  =0,05 T bả hâ hối khi bì h hươ t ó 2 232 9 8 91ra ng p n p n p ng a c : Miền bác bỏ: 0,025,19 0,975,19, , , .    W (0; 8,91) (32,9; ).    Ta có: do đó giá trị tiêu chuẩn thống kê: 2 2s ' 0,0153(l ). qs (19 1)0,0153 29,07. 0 01    Kiểm tra ta thấy Vậy ta chưa có cơ sở bác bỏ giả thuyết H0 tức là máy đóng chai vẫn đạt chuẩn. , qs W.  v1.0012107210 26 2.3. KIỂM ĐỊNH GIẢ THUYẾT CHO XÁC SUẤT (TỶ LỆ) Cho biến ngẫu nhiên X~A(p). Với p chưa biết. Lấy mẫu cỡ n từ biến ngẫu nhiên y, gọi m là số lần mẫu nhận giá trị 1. T ó là tầ ất ất hiệ biế ố 1 T đư iả th ết Hmfa c n su xu n n c . a a ra g uy 0: p = p0 . Xét thống kê khi đó U ~ N(0;1)0(f p )U n  n  , . Với mẫu cụ thể ta có giá trị của thống kê U là: ups 0 0p (1 p )   Bài toán 1 Miền bác bỏ: 0 0 1 0 H : p p H :p p   / 2 / 2W ( ; u ) (u ; )      với Bài t á 2 Miề bá bỏ ới 0 /2(u ) 1 /2    0 0H : p p ( ) ( ) 1o n n c : v Bài toán 3 Miền bác bỏ: 1 0H : p p W u ; ,  0 u    0 0H : p p W ( ; u ) v1.0012107210 271 0H : p p .  2.3. KIỂM ĐỊNH GIẢ THUYẾT CHO XÁC SUẤT (TỶ LỆ) (tiếp theo) Ví dụ: Những năm trước nhà máy áp dụng công nghệ A sản xuất cho tỷ lệ phế phẩm là 6%. Năm nay người ta nhập công nghệ B để sản xuất, lấy ngẫu nhiên 100 sản phẩm thấy có 5 phế phẩm. Có thể cho rằng tỷ lệ phế phẩm của công nghệ B nhỏ hơn công nghệ A hay không? Hãy kết luận với mức ý nghĩa 5%. v1.0012107210 28 2.3. KIỂM ĐỊNH GIẢ THUYẾT CHO XÁC SUẤT (TỶ LỆ) (tiếp theo) Giải: Gọi p là tỷ lệ phế phẩm của công nghệ B. Ta cần kiểm định 0 1 H : p 0,06 H :p 0,06   mức ý nghĩa  = 0,05, tra bảng phân phối chuẩn ta có u0,05 = 1,65 Ta có miền bác bỏ: W (- ; -1,65).  Ta có n =100; m = 5, do đó f = m/n = 0,05. Tính giá trị tiêu chuẩn thống kê ta thu được: (0 05 0 06) Kiểm tra ta thấy Vậy chấp nhận giả thuyết H0. qs , , u 100 0,42. 0,06(1 0,06)    u W. v1.0012107210 29 qs 2.4. KIỂM ĐỊNH GIẢ THUYẾT CHO HAI KỲ VỌNG Cho hai biến ngẫu nhiên độc lập X ~ N(μ1,σ12) ; Y ~ N(μ2,σ22) Mẫ ẫ hiê (X X X ) hậ iá t ị ( )u ng u n n 1, 2, n n n g r x1,x2,,xn Mẫu ngẫu nhiên (Y1,Y2,Ym) nhận giá trị (y1,y2,,ym). Ta cần kiểm định giả thuyết: H : 0 1 2. v1.0012107210 30 Trường hợp   đã biết: 2.4. KIỂM ĐỊNH GIẢ THUYẾT CHO HAI KỲ VỌNG (tiếp theo) Ta có thống kê có phân phối chuẩn N(0,1)1 2 2 2 (X Y) ( ) U      Nế iả th ết H là đú khi đó 1 2 n m   (X Y) U • u g uy 0 ng 2 2 1 2 . n m    • Với mẫu cụ thể giá trị của tiêu chuẩn thống kê là qs 2 2 1 2 (x y) u .    n m Bài toán 1: 0 1 2H : H    Bài toán 3: 0 1 2H : H   0 1 2H :H   Bài toán 2: Miền bác bỏ: 1 1 2:      W= ; u u ;   Miền bác bỏ: 1 1 2:    W 1 1 2:    W Miền bác bỏ: v1.0012107210 31 /2 /2-   = ; u = u ;  í d 2.4. KIỂM ĐỊNH GIẢ THUYẾT CHO HAI KỲ VỌNG (tiếp theo) V ụ: Hai trường A và B cùng học môn toán khảo sát kết quả thi hết, môn ta thu được kết quả sau: Trường A: n = 64; Trường B: m = 68; ằ ể ẫBiết r ng đi m thi của hai trường là biến ng u nhiên có phân phối chuẩn với độ lêch chuẩn tương ứng là σ1=1,09 và σ2=1,12. Với mức ý nghĩa 1% có thể cho rằng kết quả thi của trường B cao hơn trường A hay không? v1.0012107210 32 í d 2.4. KIỂM ĐỊNH GIẢ THUYẾT CHO HAI KỲ VỌNG (tiếp theo) V ụ: Hai trường A và B cùng học môn toán khảo sát kết quả thi hết, môn ta thu được kết quả sau: Trường A: n = 64; Trường B: m = 68; ằ ể ẫBiết r ng đi m thi của hai trường là biến ng u nhiên có phân phối chuẩn với độ lêch chuẩn tương ứng là σ1=1,09 và σ2=1,12. Với mức ý nghĩa 1% có thể cho rằng kết quả thi của trường B cao hơn trường A hay không? v1.0012107210 33 2.4. KIỂM ĐỊNH GIẢ THUYẾT CHO HAI KỲ VỌNG (tiếp theo) Giải: Gọi X và Y là kết quả thi của hai trường A và B, Ta cần kiểm định 2 2 1 1 2 2X ~ N( ; ); Y~N( ; ).    0 1 2H :   .66,7y 32.7x Với mức ý nghĩa đã cho, tra bảng phân phối chuẩn, ta có 1 1 2H :   Miền bác bỏ: Tí h iá t ị ủ tiê h ẩ thố kê t đượ 0,01u 2,33. W ( ; 2,33)   n g r c a u c u n ng a c qs 2 2 7,32 7,66 u 31,43 1 09 1 12    vậy ta bác bỏ giả thuyết H0, kết quả thi ở , , 64 68  qsu W, v1.0012107210 34 trường B cao hơn trường A. 2.4. KIỂM ĐỊNH GIẢ THUYẾT CHO HAI KỲ VỌNG (tiếp theo) Trường hợp phương sai chưa biết Giả sử rằng σ12 = σ22 = σ2. Xét thống kê: 2 2 X Y T nS mS n m    1 2,  khi đó T ~ T(n + m – 2). Với mẫu cụ thể ta tính giá trị của tiêu chuẩn thống kê T: x y n m 2 nm  , qs 2 2 x y t .  x yns ms n m n m 2 nm     Bài toán 1: 0 1 2 1 1 2 H : H :       Bài toán 3: 0 1 2 1 1 2 H : H :       0 1 2 1 1 2 H : H :       Bài toán 2: Miền bác bỏ:   n m 2 n m 2/2 / 2W= - ; t t ;        Miền bác bỏ:  n m 2/2W= ; t    n m 2/2W= t ;   Miền bác bỏ: v1.0012107210 35 Ví dụ: 2.4. KIỂM ĐỊNH GIẢ THUYẾT CHO HAI KỲ VỌNG (tiếp theo) Điều tra thu nhập (tính theo $) trong một tháng của công nhân ở hai nhà máy sản xuất thiết bị điện tử A và B ta thu được số liệu sau: Nhà máy A: 91,5 94,18 92,18 95,39 91,79 89,07 94,72 89,21. Nhà máy B: 89,19 90,95 90,46 93,21 97,19 97,04 91,07 92,75. Với mức ý nghĩa 5% có thể cho rằng thu nhập trung bình của công nhân trong hai nhà máy A và B là như nhau hay không? Biết rằng thu nhập của công nhân trong hai nhà máy có phân phối chuẩn. v1.0012107210 36 2.4. KIỂM ĐỊNH GIẢ THUYẾT CHO HAI KỲ VỌNG (tiếp theo) Giải: Gọi X và Y là thu nhập của công nhân trong hai nhà máy A và B . Ta cần kiểm định: 0 1 2H :   2 2 1 1 1 2X ~ N( ; ); N( ; )    Ta có n = 8; m = 8 2 1 2H :   2 2x 92 255; s 4 998; y 92 733; s 7 77   , Với mức ý nghĩa α=0,05 tra bảng phân phối Student ta được: 8 8 2 14t t 2 14  x y, , , , . Ta có miền bác bỏ: 0,025 0,025 , .  W ( ; -2,14) (2,14; ).    Với mẫu đã cho, tính toán ta được giá trị tiêu chuẩn thống kê: qst W, qs 92,255 92,733t 0,353.8 4 998 8 7 77 8 8    Vậy chấp nhận H tức là công nhân hai nhà máy có thu nhập như nhau . , . , 8 8 2 8.8     v1.0012107210 37 0, . 2.5. KIỂM ĐỊNH GIẢ THUYẾT CHO 2 XÁC SUẤT Cho hai biến ngẫu nhiên X ~ A(p1), Y ~ A(p2) Xét hai mẫu ngẫu nhiên rút từ X và Y tương ứng là: 1 2 n(X , X ,..., X ) 1 2 m(Y , Y ,..., Y )và Gọi k1 số lần mẫu ngẫu nhiên của X nhận giá trị 1 ẫ ẫGọi k2 số lần m u ng u nhiên của Y nhận giá trị 1 Đặt là các tần suất mẫu1 2k kf k f k f, , . Ta cần kiểm định giả thuyết H0: p1 = p2 và các đối thuyết n m   1 1 n  2 2 m  1 1 2 1 1 2 1 1 2H : p p ; H : p p ; H : p p   v1.0012107210 38 2.5. KIỂM ĐỊNH GIẢ THUYẾT CHO 2 XÁC SUẤT f fXét thống kê . Thống kê U có phân phối N(0,1)1 2U 1 1f(1 f) n m       Bài toán 1. , miền bác bỏ Bài toán 2. , miền bác bỏ Bài toán 3. , miền bác bỏ v1.0012107210 39 2.5. KIỂM ĐỊNH GIẢ THUYẾT CHO 2 XÁC SUẤT (tiếp theo) Ví dụ: Điều tra hiện tượng học sinh bỏ học ở hai vùng nông thôn A và B Giải: Gọi p1 và p2 là tỷ lệ học sinh bỏ học ở vùng nông thôn A và B. Ta cần kiểm định: H ta thu được số liệu sau: Vùng A. Điều tra 1900 em có 1