Bài giảng Xác suất thống kê y học - Tuần 7: So sánh hai trung bình kiểm định T không bắt cặp - Lê Huỳnh Thị Cẩm Hồng

CÁC BƯỚC KIỂM ĐỊNH T KHÔNG BẮT CẶP • Xây dựng giả thuyết Ho • Chọn kiểm định phù hợp • Tính giá trị thống kê của số liệu thu thập được • Tính giá trị p-value • Kết luận. Nếu p đủ nhỏ chúng ta bác bỏ giả thuyết HoCÁC BƯỚC KIỂM ĐỊNH T KHÔNG BẮT CẶP • Giả thuyết Ho: Trung bình nồng độ Vitamin D ở 2 nhóm dân số nam và nữ bằng nhau Hay ð = μ1 – μ2 = 0 • Nghiên cứu so sánh 2 trung bình nồng độ Vitamin D (biến phụ thuộc, định lượng, phân phối bình thường) của nhóm nam và nữ (biến độc lập, nhị giá) => kiểm định T không bắt cặp

pdf26 trang | Chia sẻ: thanhle95 | Lượt xem: 200 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Bài giảng Xác suất thống kê y học - Tuần 7: So sánh hai trung bình kiểm định T không bắt cặp - Lê Huỳnh Thị Cẩm Hồng, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
SO SÁNH HAI TRUNG BÌNH KIỂM ĐỊNH T KHÔNG BẮT CẶP (T-TEST KHÔNG BẮT CẶP) 1 SO SÁNH HAI TRUNG BÌNH • So sánh trung bình của 2 dân số • Mẫu không bắt cặp: Hai mẫu chọn từ hai dân số khác nhau và không có liên hệ gì giữa các quan sát Quan sát thứ nhất của mẫu 1 không liên hệ gì với quan sát thứ nhất của mẫu 2 VÍ DỤ So sánh chiều cao trung bình của nam sinh viên và nữ sinh viên trường ĐH Hồng Bàng • Dân số 1/Mẫu số 1: Nam sinh viên • Dân số 2/Mẫu số 2: Nữ sinh viên  So sánh trung bình của 2 dân số  Hai dân số nam và nữ khác nhau, không có liên hệ với nhau  Dân số/Mẫu không bắt cặp 4CHỌN LỰA KIỂM ĐỊNH PHÙ HỢP Biến phụ thuộc (hậu quả) Biến độc lập (nguyên nhân) Nhị giá Danh định – Thứ tự Định lượng - Đa biến (mô hình hóa) Định lượng (phân phối bình thường) T-test ANOVA Hồi quy tuyến tính Thứ tự (biến định lượng pp không bình thường) Wilcoxon Rank sum t. Mann-Whitney Kruskal-Wallis TQ Spearman Nhị giá Chi bình phương Chi bình phương (mhodds, tab2) Hồi quy logistic Hồi quy Poisson Sống còn Wilcoxon tổng quát Logrank Wilcoxon tổng quát Logrank Hồi quy Cox KIỂM ĐỊNH T (T-TEST) • Biến độc lập (Nguyên nhân): Biến nhị giá Vd: Giới tính (nam/nữ), Kết quả xét nghiệm (Âm tính/Dương tính) • Biến phụ thuộc (Kết quả): Biến định lượng, có phân phối bình thường Vd: Chiều cao trung bình; Thu nhập trung bình KÝ HI UỆ Dân số 1 Mẫu 1 Dân số 2 Mẫu 2 Trung bình μ1 x1 μ2 x2 Độ lệch chuẩn σ1 s1 σ2 s2 μ1 , σ1 μ2 , σ2 x1 , s1 x2 , s2 x1 , s1 x2 , s2 x1 , s1 x2 , s2 Chúng ta tiến hành lấy mẫu nhiều lần từ dân số P1 và P2 sẽ thu được các trung bình và độ lệch chuẩn khác nhau Mẫu 1 Mẫu 2 Mẫu 3 μ1 -μ2 x1 - x2 x1 - x2 x1 - x2 Hiệu số trung bình Giá trị (x1 - x2) sẽ thay đổi từ mẫu này sang mẫu khác Giá trị (x1 - x2) sẽ phân phối đối xứng chung quanh giá trị (μ1 -μ2) Mẫu 1 Mẫu 2 Mẫu 3 Mẫu Nam Nữ N 222 (n1) 336 (n2) Trung bình 28.57 (x1) 23.79 (x2) Độ lệch chuẩn (SD) 8.94 (s1) 7.86 (s2) Dữ liệu từ mẫu Ví dụ: Nồng độ Vitamin D ở 2 nhóm nam và nữa Mẫu Dân số Nam Nữ Nam Nữ N 222 (n1) 336 (n2) Ko xác định Ko xác định Trung bình 28.57 (x1) 23.79 (x2) μ1 = ? μ2 = ? Độ lệch chuẩn (SD) 8.94 (s1) 7.86 (s2) σ1 = ? σ2 = ? Phân biệt giữa sample và population Nồng độ Vitamin D ở 2 nhóm nam và nữa Ta dùng số liệu mẫu để suy luận số liệu của quần thể Chúng ta sẽ không biết μ1, μ2, σ1, σ2 Mẫu Dân số Nam Nữ Nam Nữ N 222 (n1) 336 (n2) Ko xác định Ko xác định Trung bình 28.57 (x1) 23.79 (x2) μ1 = ? μ2 = ? Độ lệch chuẩn (SD) 8.94 (s1) 7.86 (s2) σ1 = ? σ2 = ? Sự khác nhau d = x1 – x2 ð = μ1 – μ2 Tình trạng thông tin Biết Không biết Nồng độ Vitamin D ở 2 nhóm nam và nữa Tính d => suy luận ð Mẫu Dân số Nam Nữ Nam Nữ N 222 (n1) 336 (n2) Ko xác định Ko xác định Trung bình 28.57 (x1) 23.79 (x2) μ1 = ? μ2 = ? Độ lệch chuẩn (SD) 8.94 (s1) 7.86 (s2) σ1 = ? σ2 = ? Sự khác nhau d = x1 – x2 ð = μ1 – μ2 Tình trạng thông tin Biết Không biết Nồng độ Vitamin D ở 2 nhóm nam và nữa Khác biệt giữa Vitamin D giữa nam và nữ là thực tế hay ngẫu nhiên? CÁC BƯỚC KIỂM ĐỊNH T KHÔNG BẮT CẶP • Xây dựng giả thuyết Ho • Chọn kiểm định phù hợp • Tính giá trị thống kê của số liệu thu thập được • Tính giá trị p-value • Kết luận. Nếu p đủ nhỏ chúng ta bác bỏ giả thuyết Ho CÁC BƯỚC KIỂM ĐỊNH T KHÔNG BẮT CẶP • Giả thuyết Ho: Trung bình nồng độ Vitamin D ở 2 nhóm dân số nam và nữ bằng nhau Hay ð = μ1 – μ2 = 0 • Nghiên cứu so sánh 2 trung bình nồng độ Vitamin D (biến phụ thuộc, định lượng, phân phối bình thường) của nhóm nam và nữ (biến độc lập, nhị giá) => kiểm định T không bắt cặp Ước tính phương sai của d • Tính d (sự khác biệt giữa trung bình nam và nữ) d = x1 – x2 • Gọi var = Phương sai của d (Variance) var (d) = var (x1) + var (x2) = Ước tính độ lệch chuẩn của d Độ lệch chuẩn của d = Căn bậc 2 của phương sai s Thực tế, chúng ta không biết được σ1 và σ2 nên chúng ta sử dụng s1 và s2 thay thế s = Ước tính khoảng tin cậy 95% •Khoảng tin cậy 95% của d là: CI 95% = d ± 1,96 s ƯỚC TÍNH T • Tính t: •    • Thực tế, chúng ta không biết được σ1 và σ2 nên chúng ta sử dụng s1 và s2 thay thế Tính độ tự do, giá trị p Khi cỡ mẫu đủ lớn, ta không cần tính độ tự do (bởi vì độ tự do khá lớn) => chỉ cần áp dụng giá trị tới hạn của z thay cho giá trị tới hạn của t 20 GIẢ ĐỊNH CỦA KIỂM ĐỊNH T KHÔNG BẮT CẶP • Dữ liệu tuân theo luật phân phối chuẩn/phân phối bình thường • Hai nhóm độc lập, không liên quan • Cỡ mẫu tương đối đủ lớn, n1 > 30 và n2 > 30 • Lấy mẫu ngẫu nhiên Mẫu Nam Nữ N 222 (n1) 336 (n2) Trung bình 28.57 (x1) 23.79 (x2) Độ lệch chuẩn (SD) 8.94 (s1) 7.86 (s2) Bài tập Nồng độ Vitamin D ở 2 nhóm nam và nữa. Biết rằng biến nồng độ VitD có phân phối bình thường và phương pháp lấy mẫu ngẫu nhiên Câu hỏi: d Phương sai Độ lệch chuẩn Khoảng tin cậy 95% Kiểm tra giả định Tính t Giá trị p Kết luận BÀI T P:Ậ Một nghiên cứu thực hiện ở 2 làng, nhằm đánh giá: Tình trạng suy dinh dưỡng ở tuối thiếu nhi >< Khả năng hoạt động thể lực ở tuổi trưởng thành - Làng 1: Tất cả phụ nữ mang thai + bà mẹ cho con bú + trẻ em dưới 7 tuổi được bổ sung thực phẩm giàu năng lượng và giàu protein Atole: 163 Kcal + 6,4 g protein/180ml - Làng 2: Tất cả phụ nữ mang thai + bà mẹ cho con bú + trẻ em dưới 7 tuổi chỉ được bổ sung thực phẩm nghèo năng lượng và không có protein Fresco: 59 Kcal + 0 g protein/180ml Sau hơn 10 năm, các nhà KH quay lại đo tốc dộ tiêu thụ Oxy cực đại (VO2max) trên thanh niên 14-18 tuổi (những người đã được bổ sung dinh dưỡng lúc mang thai và 3 năm đầu đời). Biết rằng biến VO2max có phân phối bình thường và phương pháp lấy mẫu ngẫu nhiên Kết quả:Nhóm can thiệp n VO2max (l/phút) Trung bình mẫu Độ lệch chuẩn Atole 44 2,62 0,54 Fresco 42 2,24 0,54 Câu hỏi: Đặt giả thuyết Ho d Phương sai Độ lệch chuẩn Khoảng tin cậy 95% Kiểm tra giả định Tính t Giá trị p Kết luận BÀI TẬP Xem xét kết quả sau từ một chương trình sốt rét trong đó các lam máu của trẻ từ 1 đến 4 tuổi được xét nghiệm tìm kí sinh trùng Plasmodium falciparum. • Kí sinh trùng được tìm thấy trong 70 lam máu (từ 70 trẻ), có nồng độ hemoglobin trung bình của những trẻ này là 10,6g% với độ lệch chuẩn là 1,4g%. • Ở 80 mẫu máu của trẻ khác (không nhiễm ký sinh trùng) có nồng độ hemoglobin trung bình là 11,5g% với độ lệch chuẩn là 1,3g%. Nồng độ hemoglobin bị giảm trong lúc bị nhiễm P. falciparum không? 25 GOOD STUDY!!!