Bài giảng Thống kê cho khoa học xã hội - Bài 4: Kiểm định phi tham số - Nguyễn Thị Xuân Mai

KIỂM ĐỊNH PHI THAM SỐ • Ưu điểm:  Được sử dụng trong trường hợp dữ liệu không có phân phối chuẩn, hoặc cho các mẫu nhỏ có ít quan sát.  Được sử dụng khi dữ liệu định tính có thang đo định danh hoặc thang đo thứ bậc.  Được sử dụng khi kiểm định các giả thuyết khác bên cạnh các giả thuyết liên quan đến các tham số của tổng thể.  Trong một số trường hợp, tính toán dễ dàng hơn so với kiểm định tham số.  Dễ hiểu. • Nhược điểm:  Có xu hướng sử dụng ít thông tin hơn kiểm định tham số.  Khả năng tìm ra được sự sai biệt kém, không mạnh như các phép kiểm định có tham số (T student, phân tích phương sai ), đồng thời khó mở rộng để giải quyết các mô hình kinh tế phức tạp.

pdf37 trang | Chia sẻ: thanhle95 | Lượt xem: 26 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Bài giảng Thống kê cho khoa học xã hội - Bài 4: Kiểm định phi tham số - Nguyễn Thị Xuân Mai, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
v1.0016104219 GIỚI THIỆU MÔN HỌC 1 THỐNG KÊ CHO KHOA HỌC XÃ HỘI Giảng viên: ThS. Nguyễn Thị Xuân Mai v1.0016104219 2 BÀI 4 KIỂM ĐỊNH PHI THAM SỐ Giảng viên: ThS. Nguyễn Thị Xuân Mai v1.0016104219 MỤC TIÊU BÀI HỌC • Trình bày phương pháp kiểm định Mann-Whitney khi so sánh hai mẫu độc lập với các biến thứ bậc. • Trình bày phương pháp kiểm định dấu và kiểm định tổng hạng có dấu Wilconxon khi so sánh hai mẫu phụ thuộc với các biến thứ bậc. • Trình bày phương pháp kiểm định Khi bình phương để thấy sự phù hợp. 3 • Áp dụng phương pháp Khi bình phương để kiểm định mối liên hệ giữa hai tiêu thức được trình bày qua bảng chéo. • Dựa vào phương pháp Khi bình phương để tính toán các tham số đo lường mối liên hệ giữa các biến định danh: Lambda, Hệ số Phi, Cramer’s V. v1.0016104219 CÁC KIẾN THỨC CẦN CÓ Kiến thức chung về kinh tế - xã hội. 4 v1.0016104219 HƯỚNG DẪN HỌC • Đọc tài liệu tham khảo. • Thảo luận với giáo viên và các sinh viên khác về những vấn đề chưa hiểu rõ. • Trả lời các câu hỏi của bài học. • Đọc và tìm hiểu thêm về các phương pháp kiểm định phi tham số. 5 v1.0016104219 CẤU TRÚC NỘI DUNG 6 Kiểm định dấu và kiểm định tổng hạng có dấu Wilconxon4.2 Kiểm định Mann-Whitney4.1 Kiểm định Khi bình phương4.3 v1.0016104219 KIỂM ĐỊNH PHI THAM SỐ • Ưu điểm:  Được sử dụng trong trường hợp dữ liệu không có phân phối chuẩn, hoặc cho các mẫu nhỏ có ít quan sát.  Được sử dụng khi dữ liệu định tính có thang đo định danh hoặc thang đo thứ bậc.  Được sử dụng khi kiểm định các giả thuyết khác bên cạnh các giả thuyết liên quan đến các tham số của tổng thể.  Trong một số trường hợp, tính toán dễ dàng hơn so với kiểm định tham số.  Dễ hiểu. • Nhược điểm:  Có xu hướng sử dụng ít thông tin hơn kiểm định tham số.  Khả năng tìm ra được sự sai biệt kém, không mạnh như các phép kiểm định có tham số (T student, phân tích phương sai), đồng thời khó mở rộng để giải quyết các mô hình kinh tế phức tạp. 7 v1.0016104219 4.1. KIỂM ĐỊNH MANN-WHITNEY • Kiểm định Mann-Whitney U là một trong những kiểm định dựa trên xếp hạng. Các quan sát sẽ được xếp hạng từ giá trị nhỏ nhất tới lớn nhất và sau đó thứ hạng sẽ được sử dụng thay cho các giá trị thực trong tính toán. • Kiểm định Mann-Whitney U dùng để kiểm định liệu có tồn tại sự khác biệt giữa hai tổng thể, với điều kiện:  Tổng thể không có phân phối chuẩn;  Dữ liệu ít nhất phải có thang đo thứ bậc;  Hai mẫu được chọn ngẫu nhiên độc lập với nhau. • Giả thuyết cần kiểm định:  H0: Phân phối của hai tổng thể là giống hệt nhau (μ1= μ2). Lưu ý: kiểm định Mann-Whitney U giống kiểm định tổng hạng Wilconxon. 8 v1.0016104219 4.1. KIỂM ĐỊNH MANN-WHITNEY 9 v1.0016104219 4.1. KIỂM ĐỊNH MANN-WHITNEY 10 v1.0016104219 4.1. KIỂM ĐỊNH MANN-WHITNEY (tiếp theo) • Trường hợp tạo mẫu lớn: n1, n2 > 10  Kết hợp hai mẫu ngẫu nhiên và xếp hạng tất cả các quan sát từ nhỏ nhất tới lớn nhất. Những giá trị bằng nhau sẽ nhận hạng trung bình của các hạng liên tiếp.  Tính tổng các thứ hạng riêng cho từng mẫu, giá trị nào lớn hơn, ký hiệu là R1.  Giá trị của thống kê U:  Tiêu chuẩn kiểm định là thống kê z có phân phối xấp xỉ chuẩn: Với là trung bình của U; là độ chênh lệch tiêu chuẩn của U.  Tra bảng tìm giá trị tới hạn z với mức ý nghĩa  Giả thuyết H0: μ1= μ2 H1: μ1≠ μ2 H0: μ1≥ μ2 H1: μ1< μ2 H0: μ1≤ μ2 H1: μ1> μ2 Bác bỏ H0 z > z/2 z z  1 1 1 2 1 1 2 n n U n n R    U U Uz   1 2 2U n n   1 2 1 2 1 12U n n n n   11 v1.0016104219 4.1. KIỂM ĐỊNH MANN-WHITNEY (tiếp theo) 12 PP1 39 43 50 57 59 60 62 65 69 70 72 74 80 83 88 PP2 60 62 72 73 75 85 87 88 88 89 90 92 93 96 98 Xếp hạng 1 2 3 4 5 6.5 8.5 10 11 12 13.5 15 16 17 18 19 20 21 23 25 26 27 28 29 30 Ví dụ: Để kiểm tra xem liệu hai phương pháp học ngoại ngữ mới có hiệu quả như nhau không, ta thu thập một cách ngẫu nhiên điểm số của 15 người mỗi nhóm. Với số liệu này, liệu có thể kết luận phương pháp thứ hai hiệu quả hơn không? Phương pháp 1: 65, 57, 74, 43, 39, 88, 62, 69, 70, 72, 59, 60, 80, 83, 50 Phương pháp 2: 85, 87, 92, 98, 90, 88, 75, 72, 60, 93, 88, 89, 96, 73, 62 • Kết hợp hai mẫu lại với nhau và xếp hạng theo thứ tự từ nhỏ đến lớn. • Dễ dàng thấy rằng phương pháp 2 có tổng xếp hạng cao hơn phương pháp 1, vậy R1=6.5+8.5+13.5+15+16+17+20+21+23+23+25+26+27+28+29+30=312.5 v1.0016104219 4.1. KIỂM ĐỊNH MANN-WHITNEY (tiếp theo) • Giá trị của thống kê U là: • Trung bình của U: • Độ lệch tiêu chuẩn của U: • Tiêu chuẩn kiểm định z: • Với mức ý nghĩa  = 0,05  H0: 1 = 2 bị bác bỏ vì z = 3,32 > z/2 = 1,96  H0: 1  2 bị bác bỏ vì z = -3,32 < -z = -1,645  H0: 1  2 được chấp nhận vì z = -3,32 < z = 1,645 • Như vậy, có cơ sở cho rằng phương pháp 2 có hiệu quả hơn phương pháp 1.    1 1 1 2 1 1 15 15 1 15 15 312,5 32,5 2 2 n n U n n R           1 2 15 15 112,5 2 2U n n        1 2 1 2 1 15 15 15 15 1 24,1 12 12U n n n n         32,5 112,5 3,32 24,1 U U Uz      13 v1.0016104219 4.2. KIỂM ĐỊNH DẤU VÀ KIỂM ĐỊNH TỔNG HẠNG CÓ DẤU WILCONXON 4.2.1. Kiểm định dấu 4.2.2. Kiểm định tổng hạng có dấu Wilconxon 14 v1.0016104219 4.2.1. KIỂM ĐỊNH DẤU • Kiểm định dấu dùng để kiểm định về giá trị trung vị của một tổng thể.  Bài toán: Để kiểm định xem liệu giá trị trung vị có bằng một giá trị cho trước nào đó (M), ta lấy một mẫu và so sánh các giá trị đó với giá trị trung vị phỏng đoán trên.  Giả thuyết cần kiểm định: H0: Giá trị của số trung vị = M  Nếu số liệu có giá trị lớn hơn M, nhận dấu dương. Nếu số liệu có giá trị nhỏ hơn M, nhận dấu âm. Nếu số liệu bằng M, nhận kết quả 0, loại khỏi nghiên cứu.  Số dấu âm và số dấu dương sẽ được so sánh với nhau. Nếu số dấu âm và số dấu dương bằng nhau, giả thuyết H0 là đúng.  Trường hợp mẫu nhỏ, n < 20.  Tiêu chuẩn kiểm định là số dấu âm hoặc số dấu dương mà có giá trị nhỏ hơn.  Tra bảng giá trị tới hạn của kiểm định dấu với cỡ mẫu là tổng số dấu âm và số dấu dương và mức ý nghĩa α.  Bác bỏ H0 nếu tiêu chuẩn kiểm định nhỏ hơn giá trị tới hạn tra bảng. 15 v1.0016104219 4.2.1. KIỂM ĐỊNH DẤU 16 Ví dụ: Có ý kiến cho rằng, giá trị trung vị về năng suất lao động của Doanh nghiệp A là 40 triệu đồng/tháng. Một mẫu ngẫu nhiên gồm 20 lao động được chọn ra để nghiên cứu, cho thấy, có 15 người có năng suất lao động nhỏ hơn 40 triệu đồng/tháng, 3 người có suất lao động lớn hơn 40 triệu đồng/tháng và 2 người có năng suất lao động bằng 40 triệu đồng/tháng. • Giả thuyết: H0: Me= 40 H1: Me ≠ 40 • Số dấu âm là 15, số dấu dương là 3. Tiêu chuẩn kiểm định là min (15,3)=3. • Giá trị tới hạn ở mức 0,05 cho kiểm định hai phía với n = 18 là 4 → Bác bỏ H0. v1.0016104219 4.2.1. KIỂM ĐỊNH DẤU (tiếp theo)  Trường hợp mẫu lớn, n  20. Khi mẫu lớn tiêu chuẩn kiểm định có phân phối xấp xỉ chuẩn, được tính như sau: Trong đó: X = min (số dấu dương, số dấu âm) n: qui mô mẫu Ví dụ: Theo một báo cáo, tuổi trung vị của người dân địa phương A là 36,4. Một nhà nghiên cứu đã lựa chọn 50 người dân và thấy có 21 người nhiều hơn 36,4 tuổi. Với mức ý nghĩa 0,05, liệu có thể khẳng định tuổi trung vị thấp nhất là 36,4 không?  Giả thuyết cần kiểm định: H0: Me  36,4 H1: Me < 36,4  Có 21 người nhiều hơn 36,4 tuổi. Vậy có 29 người nhỏ hơn hoặc bằng 36,4 tuổi.  Vậy giá trị X = min(21,29) = 21  Tiêu chuẩn kiểm định:  Tra bảng tìm giá trị tới hạn với n = 50 và  = 0,05 cho kiểm định phía trái, giá trị tới hạn là -1,65.  Vì z = -0,99 > -1,65, chưa đủ cơ sở bác bỏ H0.  Không có đủ bằng chứng để bác bỏ ý kiến trên (tuổi trung vị thấp nhất là 36,4).  0,5 2 / 2 nX z n        500,5 21 0,5 2 2 0,99 50 2 2 nX z n         17 v1.0016104219 4.2.1. KIỂM ĐỊNH DẤU (tiếp theo) 18 • Kiểm định dấu dùng để kiểm định giả thuyết với hai mẫu tương đồng từng cặp. • Bài toán: để kiểm tra trung bình của mẫu khi so sánh hai mẫu phụ thuộc, chẳng hạn như kiểm định trước – sau. • Ví dụ: Một nghiên cứu cho rằng, nếu những người đi bơi có đeo nút bịt tai thì số lần nhiễm trùng tai sẽ giảm xuống. Một mẫu gồm 10 người được lựa chọn để ghi lại số lần nhiễm trùng tai trong 4 tháng. Trong 2 tháng đầu, họ không dùng nút bịt tai, 2 tháng sau có dùng nút bịt tai. Vào đầu của chu kỳ 2 tháng sau, mỗi người sẽ được kiểm tra để chắc chắn là không bị nhiễm trùng tai. v1.0016104219 4.2.1. KIỂM ĐỊNH DẤU (tiếp theo) 19 Ví dụ (tiếp)  Giả thuyết:  H0: số người bị nhiễm trùng tai không giảm xuống;  H1: số người bị nhiễm trùng tai giảm xuống.  Xác định dấu của chênh lệch giữa trước và sau.  Số dấu âm là 2, số dấu dương là 7.  Tiêu chuẩn kiểm định là min(2,7) = 2.  Tra bảng với n = 2+7 = 9, α = 0,05 cho kiểm định một phía, giá trị tới hạn là 1.  Do 2 > 1, bác bỏ H0.  Nghiên cứu trên là có cơ sở, sử dụng nút bịt tai sẽ làm giảm bệnh nhiễm trùng tai. STT Trước Sau Dấu củachênh lệch 1 3 2 + 2 0 1 - 3 5 4 + 4 4 0 + 5 2 1 + 6 4 3 + 7 3 1 + 8 5 3 + 9 2 2 0 10 1 3 - v1.0016104219 4.2.1. KIỂM ĐỊNH DẤU (tiếp theo) • Trường hợp mẫu lớn, n > 20  Tính chênh lệch giữa hai mẫu để xác định số dấu âm, số dấu dương.  Tương tự như với trường hợp kiểm định số trung vị, tiêu chuẩn kiểm định có phân phối chuẩn và được tính theo công thức:  Trong đó: X = min(số dấu dương, số dấu âm); n: qui mô mẫu  So sánh với giá trị tới hạn tra ở bảng để kết luận.  0,5 2 2 nX z n    20 v1.0016104219 4.2.2. KIỂM ĐỊNH TỔNG HẠNG CÓ DẤU WILCONXON • Kiểm định tổng hạng có dấu Wilconxon được sử dụng nhằm so sánh hai tổng thể với điều kiện:  Số liệu định lượng nhưng giả thuyết về phân phối chuẩn của μ1 - μ2 bị vi phạm.  Hai mẫu tương đồng từng cặp (phụ thuộc). • Trình tự kiểm định  Tính chênh lệch giữa các cặp di = xi – yi và loại các trường hợp có chênh lệch bằng 0. Số cặp có chênh lệch khác 0 là n.  Xếp hạng giá trị tuyệt đối của các chênh lệch theo thứ tự từ nhỏ nhất đến lớn nhất. Các giá trị bằng nhau có xếp hạng như nhau là trung bình của các hạng liên tiếp.  Tính tổng hạng của các chênh lệch dương, ký hiệu là T+ và tổng hạng của các chênh lệch âm, ký hiệu là T-. 21 v1.0016104219 4.2.2. KIỂM ĐỊNH TỔNG HẠNG CÓ DẤU WILCONXON 22 • Trường hợp mẫu nhỏ, n ≤ 20  H0: μ1 ≤ μ2: tiêu chuẩn kiểm định là tổng hạng của chênh lệch âm. Bác bỏ H0 nếu T- ≤ giá trị tới hạn.  H0: μ1 ≥ μ2: tiêu chuẩn kiểm định là tổng hạng của chênh lệch dương. Bác bỏ H0 nếu T+ ≤ giá trị tới hạn  H0: μ1 = μ2: Tiêu chuẩn kiểm định là tổng hạng của chênh lệch âm hoặc tổng hạng của chênh lệch dương mà có giá trị nhỏ hơn: T = min (T+, T-). Bác bỏ H0 khi: T ≤ giá trị tới hạn.  Giá trị tới hạn được xác định từ bảng giá trị tới hạn của kiểm định tổng hạng có dấu khi biết qui mô n và mức ý nghĩa α. v1.0016104219 4.2.2. KIỂM ĐỊNH TỔNG HẠNG CÓ DẤU WILCONXON 23 Ví dụ: Nhằm đánh giá hai phương pháp sản xuất mới có hiệu quả như nhau không, một mẫu gồm 11 công nhân được lựa chọn, mỗi công nhân sẽ thực hiện một nhiệm vụ sản xuất có sử dụng từng phương pháp mới này, thời gian thực hiện được tính theo phút. Phương pháp sản xuất mà mỗi công nhân sử dụng đầu tiên cũng được lựa chọn ngẫu nhiên. Vậy 2 phương pháp này xét về mặt thời gian hoàn thành nhiệm vụ có như nhau không? • Tính chênh lệch về thời gian thực hiện nhiệm vụ bằng 2 phương pháp. Sự chênh lệch dương trong thực hiện nhiệm vụ cho thấy phương pháp 1 cần nhiều thời gian hơn, sự chênh lệch âm lại cho thấy phương pháp 2 cần nhiều thời gian hơn. • Xếp hạng giá trị tuyệt đối của chênh lệch. • Tổng hạng của các chênh lệch dương là: T+ = 49,5 • Tổng hạng của các chênh lệch âm là: T- = 5,5 • H0: μ1 = μ2: Tiêu chuẩn kiểm định là T = min(T+,T-) = 5,5 • Giá trị tới hạn tra bảng với n = 10 (có chênh lệch khác 0), α = 0,05 là: 8, bác bỏ H0. • H0: μ1 ≤ μ2, Tiêu chuẩn kiểm định là T- = 5,5, Giá trị tới hạn cho kiểm định một phía với n = 10, α = 0,05, là 11, bác bỏ H0. • H0: μ1 ≥ μ2 Tiêu chuẩn kiểm định là T+ = 49,5, giá trị tới hạn cho kiểm định một phía với n = 10, α = 0,05, là 11, chấp nhận H0. • Vậy 2 phương pháp này là khác nhau và phương pháp 1 có thời gian hoàn thành nhiệm vụ cao hơn phương pháp 2. v1.0016104219 4.2.2. KIỂM ĐỊNH TỔNG HẠNG CÓ DẤU WILCONXON (tiếp theo) 24 STT Thời gian thực hiện (phút) Chênh lệch Giá trị tuyệt đối của chênh lệch Xếp hạng Xếp hạng có dấu dương Xếp hạng có dấu âmPP1 PP2 1 10,2 9,5 0,7 0,7 8 8 2 9,6 9,8 -0,2 0,2 2 2 3 9,2 8,8 0,4 0,4 3,5 3,5 4 10,6 10,1 0,5 0,5 5,5 5,5 5 9,9 10,3 -0,4 0,4 3,5 3,5 6 10,2 9,3 0,9 0,9 10 10 7 10,6 10,5 0,1 0,1 1 1 8 10,0 10,0 0 9 11,2 10,6 0,6 0,6 7 7 10 10,7 10,2 0,5 0,5 5,5 5,5 11 10,6 9,8 0,8 0,8 9 9 Tổng 49,5 5,5 v1.0016104219 4.2.2. KIỂM ĐỊNH TỔNG HẠNG CÓ DẤU WILCONXON (tiếp theo) 25 v1.0016104219 4.3. KIỂM ĐỊNH KHI BÌNH PHƯƠNG 4.3.1. Kiểm định Khi bình phương về sự phù hợp 4.3.3. Đo lường mối liên hệ giữa các biến định danh 4.3.2. Kiểm định Khi bình phương so sánh hai mẫu độc lập với các biến định danh 26 v1.0016104219 4.3.1. KIỂM ĐỊNH KHI BÌNH PHƯƠNG VỀ SỰ PHÙ HỢP • Sử dụng với biến định danh  Bài toán:  Ví dụ 1: Để đáp ứng yêu cầu của khách hàng, nhà sản xuất giầy thể thao có thể muốn biết liệu khách hàng có thích một sản phẩm cụ thể;  Ví dụ 2: Một dịch vụ cấp cứu có thể muốn biết liệu họ có nhận được nhiều cuộc gọi hơn vào một giờ nhất định trong ngày để bố trí nhân lực cho phù hợp.  Câu hỏi: liệu có một khác biệt đáng kể nào đó, hay một sở thích nào đó? Phân phối của tổng thể và giá trị thực tế phù hợp với nhau ở mức nào?  Cách giải quyết: chọn ngẫu nhiên một mẫu và thu thập thông tin  Khi đó, giá trị thu được từ mẫu (tức các giá trị thực tế) được gọi là giá trị quan sát, ký hiệu là O.  Giá trị thu được từ tính toán (nếu như không có khác biệt hay sở thích) được gọi là giá trị mong muốn, ký hiệu là E.  Giá trị quan sát và giá trị mong muốn thường khác nhau do sai số chọn mẫu, vì thế nó sẽ thay đổi từ mẫu này sang mẫu khác. 27 v1.0016104219 4.3.1. KIỂM ĐỊNH KHI BÌNH PHƯƠNG VỀ SỰ PHÙ HỢP 28 v1.0016104219 4.3.1. KIỂM ĐỊNH KHI BÌNH PHƯƠNG VỀ SỰ PHÙ HỢP (tiếp theo) • Ví dụ: Một nhà phân tích thị trường muốn biết liệu các khách hàng có sở thích khác nhau với 5 loại nước ép hoa quả hay không. Một mẫu gồm 100 người đã cho biết lựa chọn của mình như sau: • Giả thuyết cần kiểm định là:  H0: khách hàng không có sự khác biệt về sở thích với mỗi loại nước ép  H1: khách hàng có sự khác biệt về sở thích với mỗi loại nước ép • Nếu không có sự khác biệt, mỗi loại nước ép trên sẽ có số lượng người thích như nhau. Khi đó, mỗi nhóm sẽ có 100/5 = 20 người, đây chính là giá trị mong muốn. • Tiêu chuẩn kiểm định được tính: • Với mức ý nghĩa 0,05 và bậc tự do k-1 = 4 (có 5 loại nước ép hoa quả tức k = 5), tra bảng tìm được giá trị tới hạn là 9,488. • , bác bỏ H0, vậy có sự khác biệt về sở thích với các loại nước ép. Dâu Nho Táo Ổi Cam 32 28 16 14 10 2 9, 488             2 2 2 2 2 22 32 20 28 20 16 20 14 20 10 20 18 20 20 20 20 20 O E E              29 v1.0016104219 4.3.1. KIỂM ĐỊNH KHI BÌNH PHƯƠNG VỀ SỰ PHÙ HỢP (tiếp theo) 30 v1.0016104219 4.3.2. KIỂM ĐỊNH KHI BÌNH PHƯƠNG SO SÁNH HAI MẪU ĐỘC LẬP VỚI CÁC BIẾN ĐỊNH DANH (tiếp theo) 31 v1.0016104219 4.3.2. KIỂM ĐỊNH KHI BÌNH PHƯƠNG SO SÁNH HAI MẪU ĐỘC LẬP VỚI CÁC BIẾN ĐỊNH DANH (tiếp theo) 32 v1.0016104219 4.3.3. ĐO LƯỜNG MỐI LIÊN HỆ GIỮA CÁC BIẾN ĐỊNH DANH • được thiết lập để xác định có hay không một mối liên hệ giữa hai biến, nhưng nó không chỉ ra được cường độ của mối liên hệ đó, hay nói cách khác là nó không chỉ ra được mức độ thay đổi của một biến khi giá trị của một biến khác thay đổi. • Ngoài ra, giá trị của không đưa ra một chỉ dẫn đáng tin cậy về cường độ của mối liên hệ giữa hai biến do còn phụ thuộc vào quy mô của bảng chéo (dòng, cột). • Để giải quyết vấn đề này, thống kê Khi bình phương được điều chỉnh để tính đến sự khác biệt về kích thước mẫu và kích thước của bảng. • Hệ số Phi, Hệ số Contigency và Cramer’s V được dùng để đo lường mối liên hệ giữa các biến định danh. • Các hệ số này nhận giá trị trong khoảng (0,1). Giá trị càng gần 0, mối liên hệ càng lỏng lẻo. Giá trị càng gần 1, mối quan hệ càng chặt chẽ. 33 2 2 2 v1.0016104219 4.3.3. ĐO LƯỜNG MỐI LIÊN HỆ GIỮA CÁC BIẾN ĐỊNH DANH 34 v1.0016104219 4.3.3. ĐO LƯỜNG MỐI LIÊN HỆ GIỮA CÁC BIẾN ĐỊNH DANH 35 v1.0016104219 4.3.3. ĐO LƯỜNG MỐI LIÊN HỆ GIỮA CÁC BIẾN ĐỊNH DANH (tiếp theo) • Ví dụ: Để xác định thị trường mục tiêu tốt hơn, một nhà nghiên cứu thị trường đã tiến hành khảo sát trên 669 người được chọn ngẫu nhiên. Mỗi người trong số đó được yêu cầu chọn 1 trong 4 đặc tính thể hiện rõ nhất hình ảnh riêng của bản thân mình khi lái xe. Bốn tính cách bao gồm: phòng vệ, hung hăng, hưởng thụ và uy tín. Những người tham gia khảo sát cũng được chia thành 3 nhóm tuổi: trẻ, trung niên, già. Mục tiêu của nghiên cứu nhằm đánh giá xem liệu có mối liên hệ nào đó giữa nhóm tuổi của mỗi người với hình ảnh của họ khi lái xe không. • Qua tính toán, xác định được giá trị của thống kê Khi bình phương: • Nếu số liệu trên được biểu diễn bằng một bảng chéo, có dạng 34. • Để đánh giá mối liên hệ giữa nhóm tuổi và hình ảnh của họ khi lái xe, sử dụng hệ số Cramer’s V Trong đó k = min(3,4) = 3. • Với giá trị V = 0,125, mối liên hệ giữa nhóm tuổi và hình ảnh của họ khi lái xe là không thực sự mạnh mẽ.     2 20,867 0,125 1 669 3 1 V n k     36 v1.0016104219 TÓM LƯỢC CUỐI BÀI 37 Trong bài học này, chúng ta đã nghiên cứu các nội dung chính sau: • Ưu nhược điểm của kiểm định phi tham số; • Kiểm định Mann-Whitney; • Kiểm định dấu; • Kiểm định tổng hạng có dấu Wilconxon; • Kiểm định khi bình phương; • Đo lường mối quan hệ giữa các biến định danh.
Tài liệu liên quan