I.KIỂM ĐỊNH PHÂN PHỐI CHUẨN
1.1.Dựa vào đồ thị tần suất: Đối chiếu đồ thị tần suất có
giống đồ thị hàm phân phối chuẩn.
1.2. Kiểm định Jarque-Bera:
H0: X có phân phối chuẩn
H1: X không có phân phối chuẩn
17 trang |
Chia sẻ: thanhtuan.68 | Lượt xem: 1383 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Bài giảng Nguyên lý thống kê - Chương 8: Kiểm định phi tham số, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Chương 8:
KIỂM ĐỊNH PHI THAM SỐ
www.nguyenngoclam.com
152
I.KIỂM ĐỊNH PHÂN PHỐI CHUẨN
1.1.Dựa vào đồ thị tần suất: Đối chiếu đồ thị tần suất có
giống đồ thị hàm phân phối chuẩn.
1.2. Kiểm định Jarque-Bera:
H0: X có phân phối chuẩn
H1: X không có phân phối chuẩn
24
)3K(
6
S
nJB
22
3
x
3
i
s
n/)xx(
S
4
x
4
i
s
n/)xx(
K
Bác bỏ H0: JB >
2
2,
153
I.KIỂM ĐỊNH PHÂN PHỐI CHUẨN
Ví dụ: Kiểm định tỷ lệ lãi trên vốn (%) trước và sau CPH có
phân phối chuẩn với mức ý nghĩa 5%:
DN Trước CPH Sau CPH DN Trước CPH Sau CPH
1 3,5 4,0 9 4,5 5,0
2 5,1 4,8 10 5,0 5,4
3 4,0 6 11 6,0 6,5
4 4,2 6,8 12 4,0 5,0
5 5,0 5,2 13 5,0 5,6
6 6,0 6,4 14 6,0 6,2
7 5,8 6,0 15 5,4 6,5
8 6,0 5,0
154
II.KIỂM ĐỊNH WILLCOXON (T)
2.1.Giả thuyết: H0: x = y Mẫu phối hợp từng cặp
2.2.Mẫu nhỏ (n≤20):
1. Tính các chênh lệch giữa các cặp: di = xi - yi
2. Xếp hạng di theo thứ tự tăng dần, các giá trị bằng
nhau sẽ nhận hạng trung bình của các hạng liên tiếp, bỏ
qua trường hợp di = 0.
3. Tìm tổng các hạng di>0 (di<0). Ký hiệu: T
+, T-
4. Giá trị kiểm định T=min(T+,T-)
5. Bác bỏ H0: T Tn’,, Tn’, có phân phối Wilcoxon
n’: Số cặp quan sát khác 0
155
II.KIỂM ĐỊNH WILLCOXON (T)
Ví dụ: Để khảo sát xem khách hàng thích sản phẩm nào
hơn, chọn ngẫu nhiên 10 khách hàng và yêu cầu họ cho
biết sở thích về 2 sản phẩm cùng loại X, Y khác nhau thông
qua thang điểm từ 1 đến 5 (điểm càng cao sở thích càng
cao). Hãy cho biết khách thích sản phẩm nào nhiều hơn với
= 5%.
Khách hàng 1 2 3 4 5 6 7 8 9 10
X 4 5 2 4 3 1 3 2 1 5
Y 3 5 5 2 5 5 3 5 5 2
156
II.KIỂM ĐỊNH WILLCOXON (T)
Khách
hàng
1 2 3 4 5 6 7 8 9 10 Tổng
X 4 5 2 4 3 1 3 2 1 5
Y 3 5 5 2 5 5 3 5 5 2
di 1 0 -3 2 -2 -4 0 -3 -4 3
T+ 1 2,5 5 8,5
T- 5 2,5 7,5 5 7,5 27,5
157
II.KIỂM ĐỊNH WILLCOXON (T)
2.3. Mẫu lớn n>20: Ta có kiểm định Z
T
TTz
4
)1'n('n
T
24
)1'n2)(1'n('n2
T
158
III.KIỂM ĐỊNH MANN-WHITNEY (U)
3.1.Giả thuyết: H0: 1 = 2 Mẫu độc lập
3.2.Mẫu nhỏ (n1,n2≤20):
1. Xếp hạng tất cả các giá trị của hai mẫu theo thứ tự tăng
dần. Những giá trị bằng nhau sẽ nhận hạng trung bình các
hạng liên tiếp.
2. Tổng hạng mẫu 1 và mẫu 2. Ký hiệu: R1, R2
3. Giá trị kiểm định: U=min(U1,U2)
1
11
211 R2
)1n(n
n.nU
1212 Un.nU
4. Bác bỏ H0: U Un1,n2,
159
III.KIỂM ĐỊNH MANN-WHITNEY (U)
Ví dụ: Tại một trang trại nuôi lợn người ta thử áp dụng một loại thuốc
tăng trọng bổ sung vào khẩu phần thức ăn của 10 con lợn, sau 3
tháng người ta thu thập số liệu về trọng lượng của heo (X). Trong khi
đó 15 con lợn khác không dùng thuốc tăng trọng có trọng lượng, sau
3 tháng người ta thu thập số liệu (Y). Hãy kiểm tra xem trọng lượng
có như nhau hay không khi thử nghiệm với =5%.
X 60 61 62 62 63 63 68 64 64 65
Y 56 56 57 57 58 58 58 59 59 60 60 60 61 61 62
R(X) 11,5 15 18 18 20,5 20,5 25 22,5 22,5 24 197,5
R(Y) 1,5 1,5 3,5 3,5 6 6 6 8,5 8,5 11,5 11,5 11,5 15 15 18 127,5
160
III.KIỂM ĐỊNH MANN-WHITNEY (U)
3.3.Mẫu lớn (n1,n2>20): Ta có kiểm định z
U
UUz
2
nn 21
U 12
)1nn(n.n 21212
U
161
IV.KIỂM ĐỊNH KRUSKAL-WALLIS
• Giả thuyết:
)ji(:H
...:H
ji1
k210
• Giá trị kiểm định:
Chọn k mẫu độc lập có n1...,nk quan sát (ni5), n=ni.
Tổng hạng của k mẫu R1,...,Rk
)1n(3
n
R
)1n(n
12
W
k
1i i
2
i
• Bác bỏ H0: W>
2
k-1,
162
IV.KIỂM ĐỊNH KRUSKAL-WALLIS
Ví dụ: Một nhà nghiên cứu muốn xem xét phải chăng ở 3 ngành công
nghiệp A,B,C tổng giá trị sản xuất trung bình của các xí nghiệp là như
nhau với mức ý nghĩa 5%. Chọn một số xí nghiệp ở các ngành đó
như sau:
Ngành Tổng
A 1,38 1,55 1,90 2,00 1,22 2,11 1,98 1,61
B 2,33 2,50 2,79 3,01 1,99 2,45
C 1,06 1,37 1,09 1,65 1,44 1,11
Hạng A 6 8 11 14 4 15 12 9 79
Hạng B 16 18 19 20 13 17 103
Hạng C 1 5 2 10 7 3 28
W=13,5416
163
V.KIỂM ĐỊNH SỰ PHÙ HỢP
Giả thuyết H0: Tổng thể được chia làm k nhóm, có phân
phối xác suất pi (pi=1) để một quan sát rơi vào nhóm i.
Chọn ngẫu nhiên n quan sát, ni là số quan sát rơi vào nhóm
i.
Giá trị kiểm định:
Bác bỏ Ho: 2 >2k-1,
Nhóm 1 2 k
Ho P1 P2 Pk 1
Quan sát n1 n2 nk n
5npE ,
E
)En(
ii
k
1i i
2
ii2
164
V.KIỂM ĐỊNH SỰ PHÙ HỢP
Ở một quán cafe, có 4 nhãn hiệu nước giải khát khác nhau.
160 khách hàng được chọn ngẫu nhiên cho thấy sự lựa
chọn về các nhãn hiệu như sau. Có thể kết luận sự ưa
chuộng của khách hàng về 4 giảI khát là như nhau được
không ở mức ý nghĩa 2,5%.
Nhãn hiệu A B C D
Số khách hàng 34 46 29 51 160
GT Ho (pi) 0,25 0,25 0,25 0,25 1
Ei=n.pi 40 40 40 40
(ni-Ei)
2/Ei 0,90 0,90 3,03 3,03 7,85
165
VI.KIỂM ĐỊNH SỰ ĐỘC LẬP
Giả sử có mẫu ngẫu nhiên gồm n quan sát, được phân nhóm kết hợp
thành 2 tiêu thức:
Phân nhóm theo tiêu
thức thứ hai
Phân nhóm theo tiêu thức thứ nhất
1 2 ... c
1 n11 n12 ... n1c R1
2 n21 n22 ... n2c R2
... ... ... ... ... ...
r nr1 nr2 ... nrc Rr
C1 C2 ... Cc n
Giả thuyết H0: Tiêu thức 1 và tiêu thức 2 độc lập
Giá trị kiểm định:
n
CR
E ,
E
)En( ji
ij
r
1i
c
1j ij
2
ijij2
Bác bỏ H0:
2
),1c)(1r(
2
166
VI.KIỂM ĐỊNH SỰ ĐỘC LẬP
Ví dụ: Một nghiên cứu được thực hiện nhằm xem xét mối liên hệ giữa
giới tính và sự ưa thích các nhãn hiệu nước giải khát, một mẫu ngẫu
nhiên 2.425 người tiêu dùng với các nhãn hiệu nước giải khát được
ưa thích như sau. Kiểm định giả thuyết không có mối liên hệ nào giữa
giới tính và sự ưa thích nhãn hiệu nước giải khát ở mức ý nghĩa
0,5%.
Giới tính Nhãn hiệu ưa thích
Coca Pepsi 7Up
Nam 308 177 114
Nữ 502 627 697
2 = 129,83
Tổng (Ri)
599
1826
Tổng(Cj) 810 804 811 2425
(200) (199) (200)
(610) (605) (611)
www.nguyenngoclam.com