Chương 6: Kiểm định giả thiết thống kê

Dùng các thống kê từ một mẫu để khẳng định hay bác bỏ một giả thiết nào đó nói về tổng thể được gọi là kiểm định giả thiết thống kê. Giả sử cần kiểm tra giả thiết H. Khi kiểm định có thể xảy ra một trong hai loại sai lầm sau đây: Loại 1: bác bỏ H trong lúc H đúng; Loại 2: chấp nhận H trong lúc H sai.

pdf19 trang | Chia sẻ: lylyngoc | Lượt xem: 1689 | Lượt tải: 1download
Bạn đang xem nội dung tài liệu Chương 6: Kiểm định giả thiết thống kê, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Mở đầu Kiểm định giá trị trung bình Kiểm định tỷ lệ Kiểm định phương sai KiỂM ĐỊNH GiẢ THIẾT THỐNG KÊ Mở đầu Dùng các thống kê từ một mẫu để khẳng định hay bác bỏ một giả thiết nào đó nói về tổng thể được gọi là kiểm định giả thiết thống kê. Giả sử cần kiểm tra giả thiết H. Khi kiểm định có thể xảy ra một trong hai loại sai lầm sau đây: Loại 1: bác bỏ H trong lúc H đúng; Loại 2: chấp nhận H trong lúc H sai. Quy tắc kiểm định là cho phép xác suất xảy ra sai lầm loại 1 không quá α, số α gọi là mức ý nghĩa. Với mức ý nghĩa đã cho ta chấp nhận H nếu xác suất xảy ra sai lầm loại 2 nhỏ nhất. Kiểm định giá trị trung bình Bài toán: Giả sử tổng thể có trung bình (kỳ vọng) µ. Mẫu có kích thước n. Kiểm định giả thiết H với mức ý nghĩa α, là số cho trước. 0 0H: ,    1. Trường hợp: đã biết. 2n 30,  oTìm z ,2 (z ) 1    oTính 0 (x ) z n    Nếu z z chấp nhận H Nếu z z bác bỏ H 0 0x      0 0x       0(X ) n ~ N(0;1)   Kiểm định giá trị trung bình 2. Trường hợp: chưa biết. 2n 30,  Thay bởi s, thực hiện tương tự trường hợp 1.  3. Trường hợp: biết, X là BNN chuẩn. 2n 30,  Tương tự trường hợp 1. 4. chưa biết, X là BNN chuẩn. 2n 30,  oTìm ,n 1 ,n 1t ,P( t t ) 1      oTính 0 (x ) t n s   ,n 1t t  chấp nhận H ,n 1t t  bác bỏ H 0 0x      0 0x           ,n 1P( t t ) Kiểm định giá trị trung bình Thí dụ: Điểm trung bình môn XSTK năm học trước là 5,72. Năm nay theo dõi 100 sinh viên được bảng sau Điểm 3 4 5 6 7 8 9 Số SV 3 5 27 43 12 6 4 Với mức ý nghĩa 1%, có phải điểm trung bình năm nay cao hơn năm trước? Kiểm định giá trị trung bình Thí dụ: Một vườn ươm cây giống, theo quy định khi nào cây cao trung bình 1m thì đem ra trồng. Đo ngẫu nhiên 25 cây, được bảng số liệu: Chiều cao 0,8 0,9 1,0 1,1 1,2 1,3 Số cây 1 2 9 7 4 2 Với mức ý nghĩa 5%, có thể đem cây đi trồng được chưa? Giả thiết chiều cao của cây là BNN chuẩn. Kiểm định tỷ lệ Bài toán: Giả sử tổng thể có tỷ lệ p. Mẫu có kích thước n, tỷ lệ f. Kiểm định giả thiết H với mức ý nghĩa α, là số cho trước. 0 0H: p p ,p Giả thiết thêm n 30 oTìm z ,2 (z ) 1    oTính 0 0 0 (f p ) z n p (1 p )    Nếu z z chấp nhận H Nếu z z bác bỏ H 0 0f p p p   0 0f p p p    Kiểm định tỷ lệ Thí dụ: Theo báo cáo tỷ lệ hàng phế phẩm trong kho là 12%. Kiểm tra ngẫu nhiên 100 sản phẩm thấy có 8 phế phẩm. Với mức ý nghĩa 5%, báo cáo trên có đáng tin không? Thí dụ: Theo một nguồn tin thì tỷ lệ hộ dân thích xem dân ca trên tivi là 80%. Thăm dò 36 hộ dân thấy có 25 hộ thích xem dân ca. Với mức ý nghĩa 5%, kiểm định xem nguồn tin này có đáng tin cậy không? Kiểm định phương sai oTìm 2 2 1 2 2 (n 1), (n 1)       oTính 2 2 2 0 (n 1) s     Nếu 2 2 2 1 2 2 (n 1) (n 1)          chấp nhận H Nếu ngược lại thì bác bỏ H 2 2 2 2 0 0s       Bài toán: Giả sử tổng thể có phân phối chuẩn, phương sai . Mẫu có kích thước n, phương sai mẫu hiệu chỉnh . Kiểm định giả thiết H với mức ý nghĩa α, là số cho trước. 2 2 0 0H: ,    2 2s 2 2 2 2 0 0s      Kiểm định phương sai Thí dụ: Nếu máy móc hoạt động bình thường thì chiều dài của một loại sản phẩm là BNN chuẩn với phương sai . Nghi ngờ máy hoạt động không bình thường, người ta đo thử một số sản phẩm thì được bảng số liệu Chiều dài (cm) 105 107 109 111 Số sp 2 4 5 2 Với mức ý nghĩa 5%, có thể xem máy móc hoạt động bình thường không? 23cm Kiểm định so sánh 2 trung bình Tổng thể 1 Trung bình 1 Tổng thể 2 Trung bình 2 1n , 1x , 2 1s 2n , 2x , 2 2s   1 2H: mức ý nghĩa  Quan sát X Kiểm định so sánh 2 trung bình 1 2n ,n 30 oTìm z ,2 (z ) 1    oTính    1 2 2 2 1 2 1 2 x x z s s n n Nếu z z chấp nhận H Nếu z z bác bỏ H Ví dụ: Điểm trung bình học tập của 50 học sinh lớp 4 trường A là 6,72; độ lệch chuẩn mẫu hiệu chỉnh là 0,72. Điểm trung bình học tập của 80 học sinh lớp 4 trường B là 6,46; độ lệch chuẩn mẫu hiệu chỉnh là 0,91. Phải chăng điểm trung bình học tập của học sinh khối 4 của hai trường là khác nhau với mức ý nghĩa 5%? KĐ so sánh 2 trung bình   1 2n 30 n 30 oTính Nếu t t chấp nhận H Nếu t t bác bỏ H oTìm     1 2,n n 2t t từ bảng phân phối Student Hai tổng thể có phân phối chuẩn       2 2 2 1 1 2 2 p 1 2 (n 1)s (n 1)s s n n 2    1 2 p 1 2 x x t 1 1 s n n   1 2 Kiểm định so sánh 2 trung bình 1 2n ,n 30 Ví dụ: Trọng lượng một loại sản phẩm có phân phối chuẩn. Quan sát sản phẩm do máy 1 và máy 2 sản xuất ta có bảng số liệu sau: Máy 1 Trọng lượng (g) 9,0 9,5 10,0 10,5 Số sản phẩm 2 4 7 2 Máy 2 Trọng lượng (g) 9,0 9,5 10,0 10,5 Số sản phẩm 1 4 6 3 Với mức ý nghĩa 5%, phải chăng trọng lượng trung bình của sản phẩm do hai máy sản xuất là khác nhau? Kiểm định so sánh 2 tỷ lệ Tổng thể 1 Tỷ lệ 1p Tổng thể 2 Tỷ lệ 2p 1 2H: p p mức ý nghĩa  2n , 2fMẫu 2: 1n , 1fMẫu 1: Quan sát X Kiểm định so sánh 2 tỷ lệ oTìm z ,2 (z ) 1    oTính          1 2 0 0 1 2 f f z , 1 1 p (1 p ) n n Nếu z z chấp nhận H Nếu z z bác bỏ H    1 1 2 2 0 1 2 n f n f p n n với Ví dụ: Kiểm tra 100 sản phẩm ở kho 1, thấy có 6 phế phẩm. Kiểm tra 200 sản phẩm ở kho 2, thấy có 24 phế phẩm. Chất lượng hàng ở hai kho có khác nhau không với mức ý nghĩa 5%? Kiểm định so sánh 2 phương sai Tổng thể 1  21 1X N( ; ) Tổng thể 2  22 2X N( ; )   2 21 2H: mức ý nghĩa  2n , 2 2sMẫu 2: 1n , 2 1sMẫu 1: Quan sát X Kiểm định so sánh 2 phương sai oTính  2 1 2 2 S F S Nếu         1 2 1 2(n 1,n 1) (n 1,n 1) 1 2 2 F F F chấp nhận H bác bỏ H oTìm    1 2(n 1,n 1)F từ bảng phân phối Fisher Nếu ngược lại Kiểm định so sánh 2 phương sai Ví dụ: Có hai giống lúa có năng suất trung bình xấp xỉ nhau song mức độ phân tán năng suất có thể khác nhau. Để kiểm tra điều đó, người ta lấy hai mẫu ứng với hai giống lúa và thu được bảng sau: Giống lúa Kích thước mẫu Phương sai mẫu A B 2n 30 1n 41  2 1s 11,41 22s 6,52 Với mức ý nghĩa 5%, hãy kết luận xem mức ổn định của năng suất đối với hai giống lúa trên có khác nhau không? Biết năng suất của hai giống lúa có phân phối chuẩn .