7.1.1. Giả thuyết thống kê
Chúng ta nghiên cứu vấn đề của một tổng thể thông qua một dấu hiệu nào đó. Trong
quá trình nghiên cứu cần kiểm tra xem dấu hiệu đó có hay không có một hoặc một số
tính chất nào đó.
Do không có đầy đủ thông tin trên tổng thể nên không thể đánh giá chính xác vấn đề
đó được. Thông tin trên mẫu sẽ được sử dụng để kiểm tra đánh giá tính chất đó theo
một phương pháp toán học. Những bài toán đó gọi là bài toán kiểm định giả thuyết
thống kê.
Dấu hiệu nghiên cứu được đặc trưng bởi (các) biến ngẫu nhiên – gọi là biến ngẫu
nhiên gốc. Việc kiểm tra một mệnh đề liên quan đến biến ngẫu nhiên gốc là kiểm định
một giả thuyết thống kê, bao gồm 3 loại:
Kiểm định về dạng phân phối xác suất (chẳng hạn, liệu một biến ngẫu nhiên nào
đó có phân phối Chuẩn hay không?).
Kiểm định về tham số đặc trưng (trung bình, phương sai, tỷ lệ).
Kiểm định về tính độc lập của các biến ngẫu nhiên (chẳng hạn, việc sắp xếp các
quầy hàng theo thứ tự khác nhau và sự hài lòng của khách hàng có liên quan với
nhau hay không?).
Trong giới hạn chương trình, ở bài này ta chỉ xét các giả thuyết thống kê về các tham
số đặc trưng của tổng thể (chính là các tham số đặc trưng của biến ngẫu nhiên gốc).
Để thuận tiện và chuẩn xác về mặt toán học, các mệnh đề cần được kiểm định sẽ được
đặt dưới dạng các cặp giả thuyết. Tùy mục đích nghiên cứu của từng trường hợp, cặp
giả thuyết sẽ tương ứng với các mệnh đề. Cặp giả thuyết gồm một giả thuyết gọi là giả
thuyết gốc, kí hiệu H0, và một giả thuyết đối, kí hiệu là H1. Khi bác bỏ giả thuyết H0
thì sẽ chấp nhận giả thuyết H1 đi kèm theo nó. Các cặp giả thuyết thống kê về tham số
đặc trưng nào đó của biến ngẫu nhiên gốc có thể quy về ba dạng sau:
15 trang |
Chia sẻ: thanhle95 | Lượt xem: 370 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Bài giảng Xác suất thống kê - Bài 7: Kiểm định giả thuyết thống kê, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Bài 7: Kiểm định giả thuyết thống kê
128 TXTOKT02_Bai7_v1.0014109205
BÀI 7 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
Hướng dẫn học
Cùng với bài toán ước lượng, bài toán kiểm định giả thuyết là kết hợp của tính toán số
liệu thống kê và quy luật phân phối xác suất để suy diễn các kết luận hợp lý. Do đó người
học cần nắm được ý nghĩa các tham số đặc trưng chủ yếu của biến ngẫu nhiên: kỳ vọng,
phương sai, độ lệch chuẩn (học ở bài 3), nắm được các nội dung cơ bản về một số quy
luật phân phối xác suất phổ biến trong thực tế: quy luật Không – Một, quy luật Nhị thức,
quy luật Chuẩn (học ở bài 3 và bài 4), nhớ được quy luật phân phối xác suất của một số
thống kê quan trọng (học ở bài số 5) và nhớ nội dung của nguyên lý xác suất nhỏ (học
trong bài số 1).
Để học tốt bài này, sinh viên cần tham khảo các phương pháp học sau:
Học đúng lịch trình của môn học theo tuần, làm các bài luyện tập đầy đủ và tham gia
thảo luận trên diễn đàn.
Đọc tài liệu: Giáo trình Lý thuyết xác suất và thống kê toán của NXB Đại học KTQD.
Sinh viên làm việc theo nhóm và trao đổi với giảng viên trực tiếp tại lớp học hoặc
qua email.
Tham khảo các thông tin từ trang Web môn học.
Nội dung
Lý thuyết cơ bản về kiểm định;
Thủ tục thực hiện bài toán kiểm định;
Kiểm định giá trị trung bình của tổng thể phân phối Chuẩn;
Kiểm định phương sai của tổng thể phân phối Chuẩn;
Kiểm định tỷ lệ tổng thể (kỳ vọng của biến ngẫu nhiên phân phối Không – Một).
Mục tiêu
Sau khi học xong bài này, sinh viên cần đảm bảo được các yêu cầu sau:
Nhận biết về giả thuyết thống kê;
Chuyển đổi giả thuyết thành cặp giả thuyết tương ứng, hiểu khái niệm sai lầm khi
kiểm định;
Biết cách sử dụng miền bác bỏ, kết luận đúng về việc bác bỏ hay chưa bác bỏ giả
thuyết thống kê;
Trả lời cho câu hỏi đặt ra một cách đúng đắn.
Bài 7: Kiểm định giả thuyết thống kê
TXTOKT02_Bai7_v1.0014109205 129
Tình huống dẫn nhập
Kiểm định đánh giá kế hoạch và chính sách
Sở Nông nghiệp của 1 tỉnh muốn biết liệu năng suất lúa năm nay có đạt mức trung bình là 5
tấn/ha hay không, để đánh giá được tổng sản lượng lúa toàn vùng, từ đó có kế hoạch phù hợp cho
việc tiêu thụ nông sản (dự trữ, xuất khẩu, tiêu thụ nội địa), xác định mức giá hợp lý.
Đơn vị nghiên cứu thị trường muốn biết giá cả trên thị trường năm nay có biến động nhiều hơn
so với năm ngoái hay không.
Một tổ chức quốc tế muốn đánh giá hiệu quả của Chương trình xóa đói giảm nghèo triển khai ở 1
quốc gia, và cần xem xét liệu tỷ lệ hộ nghèo có giảm xuống hay không, so với mức trước khi
triển khai chương trình (giả sử là 12%).
Trong thực tiễn kinh tế xã hội, có những bài toán đặt ra yêu cầu kiểm tra tính đúng sai của một
mệnh đề/một tình huống giả định, khi chưa có đầy đủ thông tin chính xác. Vì các mệnh đề này có
thể đúng hoặc không đúng nên cần kiểm định, để kết luận về tính thừa nhận hay không thừa nhận
được của mệnh đề đó. Khi đó phải thực hiện kiểm tra, kiểm định dựa trên thông tin có từ một
mẫu, bằng những phương pháp thống kê cụ thể. Bài toán kiểm định được áp dụng rất nhiều trong
các công việc nghiên cứu liên quan đến số liệu, kết quả của nó có mặt rộng rãi trong mọi lĩnh
vực, mọi cấp độ, của đời sống kinh tế xã hội.
Tất cả các câu hỏi trên sẽ hoàn toàn được giải đáp nếu như ta đã thu hoạch toàn
bộ các điểm trồng lúa ở tỉnh đó, đã đi điều tra về tình trạng đói nghèo của tất cả
các hộ gia đình ở quốc gia kia. Nhưng sẽ làm thế nào nếu như chúng ta không
làm được việc đó, vì những hạn chế về nguồn lực con người, tài chính, về thời
gian, về kỹ thuật?
Bài 7: Kiểm định giả thuyết thống kê
130 TXTOKT02_Bai7_v1.0014109205
7.1. Lý thuyết kiểm định giả thuyết
7.1.1. Giả thuyết thống kê
Chúng ta nghiên cứu vấn đề của một tổng thể thông qua một dấu hiệu nào đó. Trong
quá trình nghiên cứu cần kiểm tra xem dấu hiệu đó có hay không có một hoặc một số
tính chất nào đó.
Do không có đầy đủ thông tin trên tổng thể nên không thể đánh giá chính xác vấn đề
đó được. Thông tin trên mẫu sẽ được sử dụng để kiểm tra đánh giá tính chất đó theo
một phương pháp toán học. Những bài toán đó gọi là bài toán kiểm định giả thuyết
thống kê.
Dấu hiệu nghiên cứu được đặc trưng bởi (các) biến ngẫu nhiên – gọi là biến ngẫu
nhiên gốc. Việc kiểm tra một mệnh đề liên quan đến biến ngẫu nhiên gốc là kiểm định
một giả thuyết thống kê, bao gồm 3 loại:
Kiểm định về dạng phân phối xác suất (chẳng hạn, liệu một biến ngẫu nhiên nào
đó có phân phối Chuẩn hay không?).
Kiểm định về tham số đặc trưng (trung bình, phương sai, tỷ lệ).
Kiểm định về tính độc lập của các biến ngẫu nhiên (chẳng hạn, việc sắp xếp các
quầy hàng theo thứ tự khác nhau và sự hài lòng của khách hàng có liên quan với
nhau hay không?).
Trong giới hạn chương trình, ở bài này ta chỉ xét các giả thuyết thống kê về các tham
số đặc trưng của tổng thể (chính là các tham số đặc trưng của biến ngẫu nhiên gốc).
Để thuận tiện và chuẩn xác về mặt toán học, các mệnh đề cần được kiểm định sẽ được
đặt dưới dạng các cặp giả thuyết. Tùy mục đích nghiên cứu của từng trường hợp, cặp
giả thuyết sẽ tương ứng với các mệnh đề. Cặp giả thuyết gồm một giả thuyết gọi là giả
thuyết gốc, kí hiệu H0, và một giả thuyết đối, kí hiệu là H1. Khi bác bỏ giả thuyết H0
thì sẽ chấp nhận giả thuyết H1 đi kèm theo nó. Các cặp giả thuyết thống kê về tham số
đặc trưng nào đó của biến ngẫu nhiên gốc có thể quy về ba dạng sau:
01
00
:
:
H
H
01
00
:
:
H
H
01
00
:
:
H
H
(7.1)
Ví dụ 7.1. Một nhà máy sản xuất khẳng định trọng lượng trung bình của sản phẩm do
họ sản xuất ra là 350g. Khách hàng của nhà máy muốn kiểm tra điều khẳng định đó,
khi đó cặp giả thuyết có dạng:
01
00
:
350:
mmH
mmH
Với m là trung bình tổng thể, là kì vọng biến ngẫu nhiên X – “Trọng lượng sản
phẩm”. Giả thuyết H0 thể hiện điều khẳng định của nhà sản xuất là đúng, giả thuyết H1
thể hiện điều khẳng định đó sai.
Ví dụ 7.2. Một quan chức ngành ngân hàng cho rằng độ dao động của giá 1 ounce
vàng – đo bởi phương sai – là vượt quá 20 USD2, ta sẽ kiểm định mệnh đề đó thông
qua cặp giả thuyết:
2
0
2
1
2
0
2
0
:
20:
H
H
Bài 7: Kiểm định giả thuyết thống kê
TXTOKT02_Bai7_v1.0014109205 131
Ở đây 2 là phương sai tổng thể, phương sai của biến ngẫu nhiên X – “Giá 1 ounce
vàng”. Giả thuyết H0 thể hiện điều khẳng định của quan chức là sai, độ dao động của
giá vàng chỉ ở mức 20 USD2, H1 thể hiện điều khẳng định là đúng, độ dao động của
giá vàng đã vượt quá mức 20 USD2.
Ví dụ 7.3. Báo cáo của phòng chăm sóc khách hàng nói rằng tỷ lệ khách không hài
lòng là chưa đến 10%, cặp giả thuyết có dạng:
01
00
:
1,0:
ppH
ppH
Trong đó p là tỷ lệ khách không hài lòng trong tổng thể. Giả thuyết H0 thể hiện báo
cáo của phòng chăm sóc khách hàng là sai, tỷ lệ khách không hài lòng đến 10%, giả
thuyết H1 thể hiện báo cáo là đúng, tỷ lệ khách không hài lòng chưa đến 2%.
Để kiểm tra một giả thuyết là đúng hay không, cần phải kiểm định, chúng ta sử dụng
phương pháp thống kê, dựa trên một mẫu thực nghiệm để kết luận, với phương pháp
suy luận như sau:
Giả sử H0 đúng;
Khi H0 đúng, với một mẫu, biến cố A sẽ xảy ra với xác suất rất nhỏ;
Theo nguyên lý xác suất nhỏ, có thể nói với một phép thử, A sẽ không xảy ra;
Với mẫu cụ thể nếu A xảy ra thì có thể bác bỏ H0, nếu A không xảy ra thì chưa có
cơ sở bác bỏ H0.
7.1.2. Phương pháp kiểm định
Xét mẫu ngẫu nhiên (X1, X2,, Xn) được lập từ tổng thể, tùy thuộc cặp giả thuyết, ta
chọn lập một thống kê tương ứng với giả thuyết gốc, kí hiệu là 1 2( , ,..., ) nG f X X X .
Thống kê G được chọn sao cho nếu H0 đúng thì quy luật phân phối xác suất của G
hoàn toàn xác định.
Cùng với thống kê G, xác định một miền W sao cho với một giá trị là (0;1) đủ
nhỏ (thường lấy bằng 0,05 hoặc 0,1) thì xác suất để thống kê G thuộc miền W bằng
giá trị đủ nhỏ đó.
Tức là: P(G Wα | H0) = α (7.2)
Khi đó, theo nguyên lý xác suất lớn và nhỏ, khi H0 đúng, xác suất để biến cố (G Wα)
xảy ra là nhỏ, nên nếu với một mẫu, tính được giá trị cụ thể của G là Gqs = f(x1, x2,, xn),
và nếu biến cố (G Wα) xảy ra thì có thể cho rằng H0 là không đúng theo cách kiểm
định này.
Thống kê G được gọi là Tiêu chuẩn kiểm định;
Giá trị được gọi là Mức ý nghĩa của kiểm định;
Miền W được gọi là Miền bác bỏ giả thuyết H0 với mức ý nghĩa .
Với một mẫu cụ thể, tính được giá trị quan sát Gqs của tiêu chuẩn kiểm định:
Nếu giá trị quan sát thuộc miền bác bỏ bác bỏ H0.
Nếu giá trị quan sát không thuộc miền bác bỏ chưa bác bỏ H0.
Bài 7: Kiểm định giả thuyết thống kê
132 TXTOKT02_Bai7_v1.0014109205
7.1.3. Các loại sai lầm
Khi sử dụng phương pháp kiểm định thống kê trên, có thể mắc phải các sai lầm. Các
sai lầm gồm hai loại:
Sai lầm loại một: bác bỏ một điều đúng. Xác suất mắc sai lầm loại một bằng mức ý
nghĩa .
Sai lầm loại hai: thừa nhận một điều sai. Xác suất mắc sai lầm loại hai bằng ,
1 gọi là lực kiểm định.
7.1.4. Các bước thực hiện
Bài toán kiểm định ở đây được thực hiện với giá trị cho trước của mức ý nghĩa . Các
bước tiến hành tổng quát như sau:
Xây dựng giả thuyết gốc H0 cần kiểm định, từ đó viết cặp giả thuyết;
Lập mẫu ngẫu nhiên kích thước n;
Chọn tiêu chuẩn kiểm định G và xác định được quy luật phân phối xác suất của G
khi giả thuyết H0 là đúng;
Xác định miền bác bỏ tốt nhất tùy thuộc vào giả thuyết đối H1;
Lập mẫu cụ thể và tìm được giá trị quan sát của tiêu chuẩn kiểm định;
So sánh giá trị quan sát với miền bác bỏ và kết luận.
Trên thực tế, ta thường xét một số bài toán kiểm định các tham số cơ bản là trung bình
(μ), phương sai (2) của tổng thể phân phối Chuẩn, và tỷ lệ tổng thể (p) trên các mẫu
đã được cho thông tin. Do đó các tiêu chuẩn kiểm định, miền bác bỏ đã được xác định
trước. Công việc phải thực hiện là:
Xác định chính xác cặp giả thuyết;
Tìm đúng tiêu chuẩn kiểm định và miền bác bỏ;
Tính đúng các thống kê dựa trên mẫu, tính giá trị quan sát;
Tra bảng số để kết luận bác bỏ hoặc chưa bác bỏ H0;
Kết luận đúng về câu hỏi.
7.2. Kiểm định về trung bình tổng thể
Cũng tương tự bài toán ước lượng khoảng, ta chỉ xét bài toán kiểm định với tổng thể
phân phối Chuẩn.
Xét biến ngẫu nhiên gốc trong tổng thể phân phối chuẩn X ~ N(μ ; 2) với các tham số
tổng thể là chưa biết, hay chưa biết, trong đó chính là trung bình của tổng thể theo
dấu hiệu nghiên cứu. Ta kiểm định giả thiết về tham số , với việc so sánh với một số
thực 0 cho trước. Các chứng minh đã được trình bày trong giáo trình, tại đây ta áp
dụng các công thức để thực hiện kiểm định và đưa ra kết luận phù hợp với từng
trường hợp.
Xét cặp giả thuyết đầu tiên:
01
00
:
:
H
H
Bài 7: Kiểm định giả thuyết thống kê
TXTOKT02_Bai7_v1.0014109205 133
Trong đó μ0 là một con số được đưa ra trong giả thuyết cần kiểm định. Khi đó sử dụng
thống kê chứa tham số cần kiểm định và có quy luật phân phối xác suất xác định (tiêu
chuẩn kiểm định) như sau:
0( ) X nT
S
Nếu H0 đúng, chứng minh được rằng khi đó xác suất để ( 1)/2 nT t là bằng α đủ nhỏ,
như vậy theo nguyên lý xác suất nhỏ, có thể nói biến cố đó không xảy ra khi thực hiện
một phép thử.
Khi thực hiện một phép thử, nghĩa là với số liệu mẫu cụ thể, tính được:
0( )qs x nT s
Nếu ( 1)/2 nqsT t thì tức là biến cố “không xảy ra” đã xảy ra, từ đó cho rằng H0 là sai.
Trình tự thực hiện bài kiểm định như sau:
Với cặp giả thuyết:
01
00
:
:
H
H
Tiêu chuẩn kiểm định: 0( ) X nT
S
Với mức ý nghĩa α cho trước, miền bác bỏ H0 là:
Giá trị quan sát là: 0( )qs x nT s
Nếu Tqs Wα hay ( 1)/2 nqsT t thì bác bỏ H0
Nếu Tqs Wα hay ( 1)/2 nqsT t thì chưa bác bỏ H0
Với hai loại cặp giả thuyết có dấu lớn hơn và nhỏ hơn, tiêu chuẩn kiểm định và giá trị
quan sát không thay đổi so với cặp giả thuyết trên, chỉ có miền bác bỏ là thay đổi.
Loại cặp giả thuyết 0 0
1 0
H :
H :
Miền bác bỏ H0 : { }( 1): nW T T t -= >
Nếu TqsWα hay ( 1)nqsT t -> thì bác bỏ H0
Nếu TqsWα hay ( 1)nqsT t -< thì chưa bác bỏ H0
Sự khác biệt so với cặp giả thuyết trên là thay vì trị tuyệt đối |T| thì ở đây không có trị
tuyệt đối, và giá trị tới hạn không phải là mức α/2 mà là α: ( 1)nt - thay cho ( 1)/ 2nt -
Loại cặp giả thuyết 0 0
1 0
H :
H :
Miền bác bỏ H0 : { }( 1): nW T T t -= <-
Bài 7: Kiểm định giả thuyết thống kê
134 TXTOKT02_Bai7_v1.0014109205
Nếu TqsWα hay ( 1)nqsT t -<- thì bác bỏ H0
Nếu TqsWα hay ( 1)nqsT t ->- thì chưa bác bỏ H0
Như vậy ở đây sử dụng T không có trị tuyệt đối, và giá trị tới hạn ở mức α và có dấu
âm: ( 1)nt -- , quy cách bác bỏ cũng khác các cặp giả thuyết trên.
Có thể tóm tắt ba cặp giả thuyết trong bảng sau:
Tiêu chuẩn Cặp giả thuyết Miền bác bỏ H0 Bác bỏ H0 khi
01
00
:
:
H
H
( 1)/2: nW T T t
( 1)
/2
nqsT t
01
00
:
:
H
H
( 1): nW T T t
( 1)
nqsT t
0( ) X nT
S
Giá trị quan sát
0( )qs x nT s
01
00
:
:
H
H
( 1): nW T T t
( 1)
nqsT t
Để đơn giản, từ phần này về sau, các cặp giả thuyết, tiêu chuẩn kiểm định và miền bác
bỏ sẽ được tóm tắt trong các bảng.
Ví dụ 7.4. Xem xét về trọng lượng một loại quả (tính bằng gam), người ta tiến hành
cân thử một số quả lấy ngẫu nhiên, đựợc số liệu cho trong bảng dưới đây.
Trọng lượng (gam) 25 – 27 27 – 29 29 – 31 31 – 33 33 – 35 35 – 37
Số quả tương ứng 3 5 7 5 3 2
Biết rằng trọng lượng quả là đại lượng có phân phối chuẩn.
(a) Tiêu chuẩn đặt ra cho trọng lượng trung bình của quả là 30g. Với mức ý nghĩa 5%,
có thể nói loại quả trên đạt tiêu chuẩn hay không?
(b) Mùa vụ trước trọng lượng trung bình của loại quả này là 29g. Với mức ý nghĩa 5%
có thể nói trọng lượng trung bình đã tăng lên không?
Giải:
Đặt X là trọng lượng của loại quả này, theo giả thiết, X ~ N(μ ; 2), trong đó µ là trọng
lượng trung bình,2 là phương sai của trọng lượng, cả hai đại lượng này đều chưa
biết. Ta có thông tin của một mẫu cụ thể kích thước n = 25.
Với bộ số liệu này, tính các thống kê đặc trưng mẫu được kết quả:
2 230,48(g) ; 8,4267(g ) ; 2,903(g) x s s
(a) Câu hỏi yêu cầu kiểm định xem trọng lượng trung bình có bằng 30 hay không, hay
µ có bằng 30 hay không, với α = 0,05. Cặp giả thuyết là:
30:
30:
1
0
H
H
Trong đó giả thuyết H0 nghĩa là loại quả này đạt tiêu chuẩn, H1 là loại quả không
đạt tiêu chuẩn.
Bài 7: Kiểm định giả thuyết thống kê
TXTOKT02_Bai7_v1.0014109205 135
Lưu ý rằng ta không được sử dụng ngay giá trị trung bình mẫu là 30,48 để kết luận
trung bình tổng thể khác 30, vì con số 30,48 chỉ là của một mẫu. Phải thực hiện
kiểm định chi tiết.
Tiêu chuẩn kiểm định 0( ) X nT
S
; miền bác bỏ H0: ( 1)/2: nW T T t
Với mẫu cụ thể trên, 0( ) (30,48 30) 25 0,82672,903
qs x nT s
( 1) (24)/2 0,025 2,064 : 2,064 nt t W T T
Do đó |Tqs| < 2,064, chưa có cơ sở bác bỏ H0, hay có thể hiểu H0 được coi là đúng,
có thể nói loại quả này đạt tiêu chuẩn.
Như vậy dù trung bình mẫu không bằng 30 nhưng vẫn có thể coi trung bình tổng
thể là bằng 30, vẫn coi quả là đạt tiêu chuẩn. Chính xác hơn là chưa thấy bằng
chứng cho thấy quả không đạt tiêu chuẩn.
(b) Câu hỏi yêu cầu kiểm định xem trọng lượng trung bình có lớn hơn 29 hay không,
với α = 0,05. Cặp giả thuyết là:
29:
29:
1
0
H
H
Trong đó giả thuyết H0 nghĩa là trọng lượng trung bình không tăng, H1 là trọng
lượng trung bình có tăng lên
Tiêu chuẩn kiểm định
S
nXT )( 0 ; miền bác bỏ H0:
( 1): nW T T t
Với mẫu cụ thể trên,
0( ) (30,48 29) 25 2,54912,903qs
x nT
s
( 1) (24)0,05 1,711 : 1,711nt t W T T
Do đó Tqs > 1,711 bác bỏ H0, có thể nói trọng lượng trung bình đã tăng lên so với
mùa vụ trước.
7.3. Kiểm định giả thuyết về phương sai tổng thể
Giả sử trong tổng thể có biến ngẫu nhiên gốc phân phối chuẩn, X ~ N( , 2), trong đó
tham số 2 đặc trưng cho độ phân tán/độ biến động/độ ổn định/độ đồng đều của tổng
thể theo dấu hiệu nghiên cứu, là chưa biết.
Ta kiểm định giả thuyết về mối quan hệ giữa phương sai tổng thể 2 với một số 20
cho trước. Sử dụng một mẫu kích thước n với phương sai mẫu là S2, độ lệch chuẩn là S.
Bài 7: Kiểm định giả thuyết thống kê
136 TXTOKT02_Bai7_v1.0014109205
Ta thiết lập thủ tục kiểm định dựa trên quy luật phân phối xác suất của thống kê sau:
2
2 2
2
( 1) ~ ( 1)
n S n
Từ đó xây dựng được tiêu chuẩn kiểm định, công thức tính giá trị quan sát ứng với
một mẫu cụ thể kích thước n (phương sai mẫu s2, độ lệch chuẩn mẫu s) và miền bác
bỏ ứng với các cặp giả thuyết như sau:
Tiêu chuẩn Cặp giả thuyết Miền bác bỏ H0 Bác bỏ H0 khi
2
0
2
1
2
0
2
0
:
:
H
H
)1(2 2/12 nW
hoặc )1(2 2/2 n
2 2( 1)
1 /2
nqs
hoặc 2 2( 1)/2 nqs
2
0
2
1
2
0
2
0
:
:
H
H 2 2( 1) nW 2 2( 1) nqs
2
0
2
2 )1(
Sn
Giá trị quan sát
2
0
2
2 )1(
sn
qs
2
0
2
1
2
0
2
0
:
:
H
H 2 2( 1)1 nW 2 2( 1)1 nqs
Ví dụ 7.5. Với số liệu của ví dụ 7.4 trong phần trên, cân thử 25 quả thấy trọng lượng
trung bình mẫu là 30,48 gam, phương sai mẫu 8,4267 gam2, độ lệch chuẩn mẫu 2,903
gam. Biết trọng lượng quả là đại lượng phân phối chuẩn.
(a) Với mức ý nghĩa 5%, kiểm định ý kiến cho rằng phương sai trọng lượng quả là
bằng 5 gam2. Nếu mức ý nghĩa là 2% thì kết luận có thay đổi không?
(b) Mùa vụ trước trọng lượng quả có độ phân tán bằng 4 gam, với mức ý nghĩa 5% thì
có thể nói mùa vụ này trọng lượng quả đã đồng đều hơn không?
Giải:
Đặt X là trọng lượng của loại quả này, theo giả thiết, X ~ N( , 2), trong 2 là phương
sai, đo độ đồng đều của trọng lượng, là chưa biết. Thông tin có được chỉ là một mẫu
cụ thể kích thước n = 25, ta tính được các thống kê đặc trưng mẫu:
30,48( )x g ; 2 28, 4267( )s g ; 2,903( )s g
(a) Câu hỏi kiểm định giả thuyết 2 bằng 5, với α = 0,05. Cặp giả thuyết là
5:
5:
2
1
2
0
H
H
Trong đó giả thuyết H0 nghĩa là ý kiến đúng, H1 là ý kiến sai.
Tiêu chuẩn kiểm định
2
2
2
0
( 1)
n S ;
Miền bác bỏ H0: 2 2( 1)1 /2 nW hoặc 2 2( 1)/2 n
Với mẫu cụ thể trên ta tính được:
2
2
2
0
( 1) 24 8,4267 40,4485
qs
n s
Ta xác định được các giá trị tới hạn:
2( 1) 2(24)
1 /2 0,975 12, 4 n ; 2( 1) 2(24)/2 0,025 39,36 n
Bài 7: Kiểm định giả thuyết thống kê
TXTOKT02_Bai7_v1.0014109205 137
Như vậy bác bỏ H0 khi 2qs 39,36.
Như vậy 2qs > 39,36: bác bỏ giả thuyết H0, ý kiến cho rằng phương sai trọng
lượng bằng 5 gam2 là sai.
Nếu mức ý nghĩa α = 0,02 thì:
2( 1) 2(24)
1 /2 0,99 10,86 n ; 2( 1) 2(24)/2 0,01 42,98 n
Khi đó 10,86 < 2qs < 42,98: chưa có cơ sở bác bỏ H0, ý kiến cho rằng phương sai
trọng lượng bằng 5 gam2 là đúng.
(b) Độ đồng đều mùa vụ trước bằng 4 gam, tức là độ lệch chuẩn trọng lượng vụ trước
bằng 4, và phương sai mùa vụ trước là 42 = 16 gam2. Độ đồng đều tăng lên tức là
phương sai của trọng lượng nhỏ hơn so với ở mùa vụ trước. Câu hỏi kiểm định giả
thuyết 2 nhỏ hơn 16, với α = 0,05. Cặp giả thuyết là:
16:
16:
2
1
2
0
H
H
Trong đó giả thuyết H0 nghĩa là ý kiến sai, H1 là ý kiến đúng.
Tiêu chuẩn kiểm định
2
2
2
0
( 1)
n S ; Miền bác bỏ H0: 2 2 2( 1)1: nW
Với mẫu cụ thể trên ta tính được:
2
2
qs 2
0
(n 1)s 24 8,4267 12,6416
Tìm được g