Dùng các thống kê từ một mẫu để khẳng định
hay bác bỏ một giả thiết nào đó nói về tổng thể
được gọi là kiểm định giả thiết thống kê.
Giả sử cần kiểm tra giả thiết H. Khi kiểm định có
thể xảy ra một trong hai loại sai lầm sau đây:
Loại 1: bác bỏ H trong lúc H đúng;
Loại 2: chấp nhận H trong lúc H sai.
19 trang |
Chia sẻ: lylyngoc | Lượt xem: 1666 | Lượt tải: 1
Bạn đang xem nội dung tài liệu Chương 6: Kiểm định giả thiết thống kê, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Mở đầu
Kiểm định giá trị trung bình
Kiểm định tỷ lệ
Kiểm định phương sai
KiỂM ĐỊNH GiẢ THIẾT THỐNG KÊ
Mở đầu
Dùng các thống kê từ một mẫu để khẳng định
hay bác bỏ một giả thiết nào đó nói về tổng thể
được gọi là kiểm định giả thiết thống kê.
Giả sử cần kiểm tra giả thiết H. Khi kiểm định có
thể xảy ra một trong hai loại sai lầm sau đây:
Loại 1: bác bỏ H trong lúc H đúng;
Loại 2: chấp nhận H trong lúc H sai.
Quy tắc kiểm định là cho phép xác suất xảy ra
sai lầm loại 1 không quá α, số α gọi là mức ý
nghĩa. Với mức ý nghĩa đã cho ta chấp nhận H
nếu xác suất xảy ra sai lầm loại 2 nhỏ nhất.
Kiểm định giá trị trung bình
Bài toán: Giả sử tổng thể có trung bình (kỳ vọng)
µ. Mẫu có kích thước n. Kiểm định giả thiết H với
mức ý nghĩa α, là số cho trước.
0 0H: ,
1. Trường hợp: đã biết. 2n 30,
oTìm z ,2 (z ) 1
oTính 0
(x )
z n
Nếu z z chấp nhận H
Nếu z z bác bỏ H
0 0x
0 0x
0(X ) n ~ N(0;1)
Kiểm định giá trị trung bình
2. Trường hợp: chưa biết. 2n 30,
Thay bởi s, thực hiện tương tự trường hợp 1.
3. Trường hợp: biết, X là BNN chuẩn. 2n 30,
Tương tự trường hợp 1.
4. chưa biết, X là BNN chuẩn. 2n 30,
oTìm
,n 1 ,n 1t ,P( t t ) 1
oTính 0
(x )
t n
s
,n 1t t chấp nhận H
,n 1t t bác bỏ H
0 0x
0 0x
,n 1P( t t )
Kiểm định giá trị trung bình
Thí dụ: Điểm trung bình môn XSTK năm học trước
là 5,72. Năm nay theo dõi 100 sinh viên được bảng
sau
Điểm 3 4 5 6 7 8 9
Số SV 3 5 27 43 12 6 4
Với mức ý nghĩa 1%, có phải điểm trung bình năm
nay cao hơn năm trước?
Kiểm định giá trị trung bình
Thí dụ: Một vườn ươm cây giống, theo quy định khi
nào cây cao trung bình 1m thì đem ra trồng. Đo
ngẫu nhiên 25 cây, được bảng số liệu:
Chiều cao 0,8 0,9 1,0 1,1 1,2 1,3
Số cây 1 2 9 7 4 2
Với mức ý nghĩa 5%, có thể đem cây đi trồng được
chưa? Giả thiết chiều cao của cây là BNN chuẩn.
Kiểm định tỷ lệ
Bài toán: Giả sử tổng thể có tỷ lệ p. Mẫu có kích
thước n, tỷ lệ f. Kiểm định giả thiết H với mức ý
nghĩa α, là số cho trước. 0 0H: p p ,p
Giả thiết thêm n 30
oTìm z ,2 (z ) 1
oTính 0
0 0
(f p )
z n
p (1 p )
Nếu z z chấp nhận H
Nếu z z bác bỏ H
0 0f p p p
0 0f p p p
Kiểm định tỷ lệ
Thí dụ: Theo báo cáo tỷ lệ hàng phế phẩm trong
kho là 12%. Kiểm tra ngẫu nhiên 100 sản phẩm
thấy có 8 phế phẩm. Với mức ý nghĩa 5%, báo cáo
trên có đáng tin không?
Thí dụ: Theo một nguồn tin thì tỷ lệ hộ dân thích
xem dân ca trên tivi là 80%. Thăm dò 36 hộ dân
thấy có 25 hộ thích xem dân ca. Với mức ý nghĩa
5%, kiểm định xem nguồn tin này có đáng tin cậy
không?
Kiểm định phương sai
oTìm
2 2
1
2 2
(n 1), (n 1)
oTính 2 2
2
0
(n 1)
s
Nếu
2 2 2
1
2 2
(n 1) (n 1)
chấp nhận H
Nếu ngược lại thì bác bỏ H
2 2 2 2
0 0s
Bài toán: Giả sử tổng thể có phân phối chuẩn,
phương sai . Mẫu có kích thước n, phương sai
mẫu hiệu chỉnh . Kiểm định giả thiết H với mức ý
nghĩa α, là số cho trước.
2 2
0 0H: ,
2
2s
2 2 2 2
0 0s
Kiểm định phương sai
Thí dụ: Nếu máy móc hoạt động bình thường thì
chiều dài của một loại sản phẩm là BNN chuẩn với
phương sai . Nghi ngờ máy hoạt động không
bình thường, người ta đo thử một số sản phẩm thì
được bảng số liệu
Chiều dài (cm) 105 107 109 111
Số sp 2 4 5 2
Với mức ý nghĩa 5%, có thể xem máy móc hoạt
động bình thường không?
23cm
Kiểm định so sánh 2 trung bình
Tổng thể 1
Trung bình 1
Tổng thể 2
Trung bình 2
1n , 1x ,
2
1s 2n , 2x ,
2
2s
1 2H:
mức ý nghĩa
Quan sát X
Kiểm định so sánh 2 trung bình 1 2n ,n 30
oTìm z ,2 (z ) 1
oTính
1 2
2 2
1 2
1 2
x x
z
s s
n n
Nếu z z chấp nhận H
Nếu z z bác bỏ H
Ví dụ: Điểm trung bình
học tập của 50 học sinh
lớp 4 trường A là 6,72; độ
lệch chuẩn mẫu hiệu
chỉnh là 0,72. Điểm trung
bình học tập của 80 học
sinh lớp 4 trường B là
6,46; độ lệch chuẩn mẫu
hiệu chỉnh là 0,91. Phải
chăng điểm trung bình học
tập của học sinh khối 4
của hai trường là khác
nhau với mức ý nghĩa
5%?
KĐ so sánh 2 trung bình 1 2n 30 n 30
oTính
Nếu t t chấp nhận H
Nếu t t bác bỏ H
oTìm
1 2,n n 2t t từ bảng phân phối Student
Hai tổng thể có phân phối chuẩn
2 2
2 1 1 2 2
p
1 2
(n 1)s (n 1)s
s
n n 2
1 2
p
1 2
x x
t
1 1
s
n n
1 2
Kiểm định so sánh 2 trung bình 1 2n ,n 30
Ví dụ: Trọng lượng một loại sản phẩm có phân phối
chuẩn. Quan sát sản phẩm do máy 1 và máy 2 sản
xuất ta có bảng số liệu sau:
Máy 1
Trọng lượng (g) 9,0 9,5 10,0 10,5
Số sản phẩm 2 4 7 2
Máy 2
Trọng lượng (g) 9,0 9,5 10,0 10,5
Số sản phẩm 1 4 6 3
Với mức ý nghĩa 5%, phải chăng trọng lượng trung
bình của sản phẩm do hai máy sản xuất là khác
nhau?
Kiểm định so sánh 2 tỷ lệ
Tổng thể 1
Tỷ lệ 1p
Tổng thể 2
Tỷ lệ
2p
1 2H: p p
mức ý nghĩa
2n , 2fMẫu 2: 1n , 1fMẫu 1:
Quan sát X
Kiểm định so sánh 2 tỷ lệ
oTìm z ,2 (z ) 1
oTính
1 2
0 0
1 2
f f
z ,
1 1
p (1 p )
n n
Nếu z z chấp nhận H
Nếu z z bác bỏ H
1 1 2 2
0
1 2
n f n f
p
n n
với
Ví dụ: Kiểm tra 100 sản
phẩm ở kho 1, thấy có
6 phế phẩm. Kiểm tra
200 sản phẩm ở kho 2,
thấy có 24 phế phẩm.
Chất lượng hàng ở hai
kho có khác nhau
không với mức ý nghĩa
5%?
Kiểm định so sánh 2 phương sai
Tổng thể 1
21 1X N( ; )
Tổng thể 2
22 2X N( ; )
2 21 2H:
mức ý nghĩa
2n ,
2
2sMẫu 2: 1n ,
2
1sMẫu 1:
Quan sát X
Kiểm định so sánh 2 phương sai
oTính
2
1
2
2
S
F
S
Nếu
1 2 1 2(n 1,n 1) (n 1,n 1)
1
2 2
F F F chấp nhận H
bác bỏ H
oTìm
1 2(n 1,n 1)F từ bảng phân phối Fisher
Nếu ngược lại
Kiểm định so sánh 2 phương sai
Ví dụ: Có hai giống lúa có năng suất trung bình xấp xỉ
nhau song mức độ phân tán năng suất có thể khác
nhau. Để kiểm tra điều đó, người ta lấy hai mẫu ứng
với hai giống lúa và thu được bảng sau:
Giống lúa Kích thước mẫu Phương sai mẫu
A
B 2n 30
1n 41
2
1s 11,41
22s 6,52
Với mức ý nghĩa 5%, hãy kết luận xem mức ổn định
của năng suất đối với hai giống lúa trên có khác nhau
không? Biết năng suất của hai giống lúa có phân phối
chuẩn .