Khi nghiên cứu nhu cầu thị trường về một loại hàng hóa
nào đó, ta có thể đưa ra các cặp nhận định sau:
H0
: Nhu cầu trung bình về loại hàng hóa này là 1000
đơn vị/tháng.
H1
: Nhu cầu trung bình về loại hàng hóa này 1000
đơn vị/tháng.
H0
: 70% người thích dùng loại hàng hóa này.
H1
: Tỉ lệ người thích dùng loại hàng hóa này < 70%.
30 trang |
Chia sẻ: haohao89 | Lượt xem: 13970 | Lượt tải: 5
Bạn đang xem trước 20 trang tài liệu Bài giảng Xác suất và thống kê chương 6: Kiểm định giả thuyết thống kê, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
TRẦN AN HẢI
TUẦN 7
HÀ NỘI - 2009
Chƣơng 6
Kiểm định giả thuyết thống kê
_________________________________________________
§1 KHÁI NIỆM GIẢ THUYẾT THỐNG KÊ
Khi nghiên cứu nhu cầu thị trường về một loại hàng hóa
nào đó, ta có thể đưa ra các cặp nhận định sau:
H0: Nhu cầu trung bình về loại hàng hóa này là 1000
đơn vị/tháng.
H1: Nhu cầu trung bình về loại hàng hóa này 1000
đơn vị/tháng.
H0: 70% người thích dùng loại hàng hóa này.
H1: Tỉ lệ người thích dùng loại hàng hóa này < 70%.
Sự đúng hay sai của các nhận định này không thể biết
được một cách chắc chắn, trừ khi ta khảo sát được toàn
bộ tổng thể. Muốn chấp nhận hay bác bỏ các nhận định
này ta phải dựa vào lấy mẫu về nhu cầu loại hàng hóa
này, vì vậy H0, H1 được gọi là các giả thuyết thống kê.
Nói chung, một giả thuyết thống kê là một nhận định về
tổng thể. Giả thuyết mà ta nghi ngờ nó sai, muốn bác bỏ
được ký hiệu là H0 (gọi là “giả thuyết không”). Còn giả
thuyết đối lập với nó được ký hiệu là H1 (gọi là “đối
thuyết”)
Việc xuất phát từ một mẫu để chấp nhận hay bác bỏ các
giả thuyết H0, H1 được gọi là kiểm định giả thuyết.
§2 PHƢƠNG PHÁP CHUNG ĐỂ
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
Giả sử ta cần kiểm định một giả thuyết H0 nào đó. Trước
hết ta giả sử H0 đúng và từ đó dựa vào mẫu ngẫu nhiên
tổng quát và một số dương rất bé cho trước để tìm một
biến cố A sao cho
.
Theo nguyên lý xác suất nhỏ, A có thể xem như không
xảy ra trong một phép thử. Vì vậy, với một mẫu cụ thể
nếu A xảy ra thì ta xem như việc giả sử H0 đúng là không
hợp lý, và bác bỏ nó (thừa nhận H1). Còn nếu A không
xảy ra thì ta chưa có đủ cơ sở để bác bỏ H0 (bởi vì biết
đâu với một mẫu cụ thể khác, A lại xảy ra), nên ta tạm
chấp nhận H0 đúng (bác bỏ H1).
Chọn biến cố A như thế nào?
Từ giả thiết H0 đúng, ta xây dựng hàm .
Sau đó tìm miền sao cho
.
Ta chọn .
Với mẫu cụ thể (x1, x2, …, xn), nếu
, thì bác bỏ H0, thừa nhận H1. Nếu
, thì tạm chấp nhận H0, bác bỏ H1.
Ta gọi
là mức ý nghĩa (thường ).
là tiêu chuẩn kiểm định.
là miền bác bỏ H0.
Khi đưa ra lựa chọn về H0 và H1, ta có thể phạm một
trong hai loại sai lầm:
Sai lầm loại 1: Bác bỏ H0 khi thực ra H0 đúng.
Sai lầm loại 2: Chấp nhận H0 khi thực ra H0 sai.
Người ta muốn đưa ra một cách kiểm định làm giảm
thiểu cả hai loại sai lầm này, nhưng không bao giờ tồn tại
một cách như vậy.
Khả năng mắc sai làm loại 1 chính là .
Người ta thường lấy sai lầm nghiêm trọng hơn làm sai
lầm loại 1 và kiểm soát nó bằng cách ấn định rất bé.
Ví dụ
Khi định đầu tư vào một lĩnh vực nào đó, ta có thể đưa ra
cặp nhận định sau:
Đầu tư bị lỗ. Đầu tư có lãi.
Sai lầm khi bác bỏ “Đầu tư bị lỗ” sẽ rất nghiêm trọng vì
nó có thể dẫn ta đến sự phá sản. Vì vậy, để kiểm soát ta
chọn nó là sai lầm loại 1 và H0 là “Đầu tư bị lỗ”.
§3 KIỂM ĐỊNH GIẢ THUYẾT VỀ KÌ VỌNG
Bài toán kiểm định:
Cho mẫu (x1, x2, …, xn) rút ra từ bnn X. Với mức ý nghĩa
, hãy kiểm định
H0: H1:
H0: H1:
H0: H1:
Trƣờng hợp , đã biết
Ta dùng chỉ tiêu kiểm định
.
Miền bác bỏ tương ứng với ba bài toán trên
Ví dụ
Nếu máy móc hoạt động bình thường, thì khối lượng của sản phẩm
do một nhà máy sản suất là bnn X có phân bố chuẩn với độ lệch
tiêu chuẩn là 2kg và khối lượng trung bình là 20kg. Nghi ngờ máy
hoạt động không bình thường làm thay đổi khối lượng trung bình
của sản phẩm, người ta cân thử 100 sản phẩm và thu được kết quả
Khối lượng (g) 18 19 20 21 22
Số sản phẩm 5 25 40 20 10
Với mức ý nghĩa = 0,05 hãy kết luận về nghi ngờ trên.
Giải
khối lượng trung bình của sản phẩm hiện giờ.
Ta cần kiểm định H0: H1:
.
.
, nên tạm chấp nhận H0.
Trƣờng hợp , chƣa biết
Ta dùng chỉ tiêu kiểm định
.
Miền bác bỏ tương ứng với ba bài toán trên
Ví dụ
Định mức thời gian hoàn thành của một sản phẩm là 14 phút. Có
cần thay đổi định mức không, nếu theo dõi thời gian hoàn thành
một sản phẩm ở 25 công nhân, ta thu được số liệu sau
Thời gian sx 1
sản phẩm (phút)
10 - 12 12 - 14 14 - 16 16 - 18 18 - 20
Số công nhân 2 6 10 4 3
Yêu cầu kết luận với mức ý nghĩa = 0,05, biết rằng thời gian
hoàn thành một sản phẩm là bnn X có phân bố chuẩn.
Giải
định mức thời gian hoàn thành 1 sản phẩm hiện giờ.
Ta cần kiểm định H0: H1:
.
.
, nên bác bỏ H0 hay cần phải thay đổi định mức.
Trƣờng hợp X có phân phối bất kỳ và kích
thƣớc mẫu
Nếu biết , ta dùng chỉ tiêu kđ .
Nếu chưa biết , ta dùng chỉ tiêu kđ .
Miền bác bỏ tương ứng với ba bài toán trên
Ví dụ
Một giám đốc cho biết lương trung bình của một công nhân ở xí
nghiệp của ông là 3,8 triệu đ/tháng. Chọn ngẫu nhiên 36 công nhân
của xí nghiệp này thấy lương trung bình là 3,5 triệu đ/tháng, với độ
lệch chuẩn là 400000. Với mức ý nghĩa = 0,05, hãy xét xem
giám đốc có nói quá lên không?
Giải
lương trung bình thực sự hàng tháng của công nhân.
Ta cần kiểm định H0: H1:
.
.
, nên bác bỏ H0 hay không tin lời giám đốc.
§4 KIỂM ĐỊNH GIẢ THUYẾT VỀ PHƢƠNG SAI
Bài toán kiểm định:
Cho mẫu (x1, x2, …, xn) rút ra từ bnn X. Với mức ý nghĩa
, hãy kiểm định
H0: H1:
H0: H1:
H0: H1:
Giả sử X , nhưng chưa biết .
Ta dùng chỉ tiêu kiểm định
.
Miền bác bỏ tương ứng với ba cặp giả thuyết trên là
Ví dụ
Để kiểm tra độ chính xác của một máy đóng gói, người ta cân thử
một số sản phẩm do máy đó sản xuất, thu được kết quả sau
60 60,2 70 60,8 50,6 50,8 50,9 60,1
50,3 60,5 60,1 60,2 60,3 50,8 60 70
Với mức ý nghĩa = 0,05, hãy xét xem máy đóng bao có hoạt
động bình thường không, biết rằng khối lượng sản phẩm là bnn có
dung sai theo thiết kế là .
Giải
dung sai hiện thời của máy đóng gói.
Ta cần kiểm định H0: H1:
khối/lg 50,3 50,6 50,8 50,9 60 60,1 60,2 60,3 60,5 60,8 70
số sp 1 1 2 1 2 2 2 1 1 1 2
Ta tính được .
, nên bác bỏ H0 hay máy hoạt động không bình thường.
§5 KIỂM ĐỊNH GIẢ THUYẾT VỀ XÁC SUẤT
Bài toán kiểm định:
Cho mẫu định tính kích thước n, trong đó biến cố A xuất
hiện m lần. là tỉ lệ mẫu. p = P(A) chưa biết. Với
mức ý nghĩa , hãy kiểm định
H0: H1:
H0: H1:
H0: H1:
Với , ta dùng chỉ tiêu kđ
.
Miền bác bỏ tương ứng với ba cặp giả thuyết trên là
Ví dụ
Một báo cáo nói rằng 18% sinh viên ở Việt Nam có vi tính. Để
kiểm tra người ta chọn ngẫu nhiên 80 sinh viên Hà Nội và thấy
rằng có 22 người có vi tính. Với mức ý nghĩa = 0,02, hãy kiểm
định xem liệu tỉ lệ sinh viên có vi tính ở Hà Nội có cao hơn tỉ lệ
chung không?
Giải
tỉ lệ sinh viên Hà Nội có vi tính; f = 22/80 = 0,275.
Ta cần kiểm định H0: H1: .
Vì , ta có thể
dùng chỉ tiêu kđ
, nên bác bỏ H0 hay tỉ lệ sinh viên Hà Nội có vi tính cao hơn
tỉ lệ chung.