CÁC BƯỚC KIỂM ĐỊNH T KHÔNG BẮT CẶP
• Xây dựng giả thuyết Ho
• Chọn kiểm định phù hợp
• Tính giá trị thống kê của số liệu thu thập được
• Tính giá trị p-value
• Kết luận. Nếu p đủ nhỏ chúng ta bác bỏ giả thuyết HoCÁC BƯỚC KIỂM ĐỊNH T KHÔNG BẮT CẶP
• Giả thuyết Ho:
Trung bình nồng độ Vitamin D ở 2 nhóm dân số nam và nữ bằng nhau
Hay
ð = μ1 – μ2 = 0
• Nghiên cứu so sánh 2 trung bình nồng độ Vitamin D (biến phụ thuộc, định
lượng, phân phối bình thường) của nhóm nam và nữ (biến độc lập, nhị giá)
=> kiểm định T không bắt cặp
26 trang |
Chia sẻ: thanhle95 | Lượt xem: 285 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Bài giảng Xác suất thống kê y học - Tuần 7: So sánh hai trung bình kiểm định T không bắt cặp - Lê Huỳnh Thị Cẩm Hồng, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
SO SÁNH HAI TRUNG BÌNH
KIỂM ĐỊNH T KHÔNG BẮT CẶP
(T-TEST KHÔNG BẮT CẶP)
1
SO SÁNH HAI TRUNG BÌNH
• So sánh trung bình của 2 dân số
• Mẫu không bắt cặp:
Hai mẫu chọn từ hai dân số khác nhau và không có liên
hệ gì giữa các quan sát
Quan sát thứ nhất của mẫu 1 không liên hệ gì với quan
sát thứ nhất của mẫu 2
VÍ DỤ
So sánh chiều cao trung bình của nam sinh viên và
nữ sinh viên trường ĐH Hồng Bàng
• Dân số 1/Mẫu số 1: Nam sinh viên
• Dân số 2/Mẫu số 2: Nữ sinh viên
So sánh trung bình của 2 dân số
Hai dân số nam và nữ khác nhau, không có liên hệ
với nhau
Dân số/Mẫu không bắt cặp
4CHỌN LỰA KIỂM ĐỊNH PHÙ HỢP
Biến phụ
thuộc
(hậu quả)
Biến độc lập (nguyên nhân)
Nhị giá Danh định –
Thứ tự
Định lượng -
Đa biến (mô
hình hóa)
Định lượng (phân phối
bình thường) T-test ANOVA Hồi quy tuyến tính
Thứ tự (biến định
lượng pp không bình
thường)
Wilcoxon Rank
sum t.
Mann-Whitney
Kruskal-Wallis TQ Spearman
Nhị giá Chi bình phương Chi bình
phương
(mhodds, tab2)
Hồi quy logistic
Hồi quy
Poisson
Sống còn Wilcoxon tổng
quát
Logrank
Wilcoxon tổng
quát
Logrank
Hồi quy Cox
KIỂM ĐỊNH T (T-TEST)
• Biến độc lập (Nguyên nhân): Biến nhị giá
Vd: Giới tính (nam/nữ), Kết quả xét nghiệm
(Âm tính/Dương tính)
• Biến phụ thuộc (Kết quả): Biến định lượng, có
phân phối bình thường
Vd: Chiều cao trung bình; Thu nhập trung bình
KÝ HI UỆ
Dân số
1
Mẫu
1
Dân số
2
Mẫu
2
Trung bình μ1 x1 μ2 x2
Độ lệch chuẩn σ1 s1 σ2 s2
μ1 , σ1
μ2 , σ2
x1 , s1
x2 , s2
x1 , s1
x2 , s2
x1 , s1
x2 , s2
Chúng ta tiến hành lấy mẫu nhiều lần từ dân số P1 và P2
sẽ thu được các trung bình và độ lệch chuẩn khác nhau
Mẫu 1 Mẫu 2 Mẫu 3
μ1 -μ2
x1 - x2 x1 - x2 x1 - x2
Hiệu số trung bình
Giá trị (x1 - x2) sẽ thay đổi từ mẫu này sang mẫu khác
Giá trị (x1 - x2) sẽ phân phối đối xứng chung quanh giá trị (μ1 -μ2)
Mẫu 1 Mẫu 2 Mẫu 3
Mẫu
Nam Nữ
N 222 (n1) 336 (n2)
Trung bình 28.57 (x1) 23.79 (x2)
Độ lệch
chuẩn (SD)
8.94 (s1) 7.86 (s2)
Dữ liệu từ mẫu
Ví dụ: Nồng độ Vitamin D ở 2 nhóm nam và nữa
Mẫu Dân số
Nam Nữ Nam Nữ
N 222 (n1) 336 (n2) Ko xác định Ko xác định
Trung bình 28.57 (x1) 23.79 (x2) μ1 = ? μ2 = ?
Độ lệch
chuẩn (SD)
8.94 (s1) 7.86 (s2) σ1 = ? σ2 = ?
Phân biệt giữa sample và population
Nồng độ Vitamin D ở 2 nhóm nam và nữa
Ta dùng số liệu mẫu để suy luận số liệu của quần thể
Chúng ta sẽ không biết μ1, μ2, σ1, σ2
Mẫu Dân số
Nam Nữ Nam Nữ
N 222 (n1) 336 (n2) Ko xác định Ko xác định
Trung bình 28.57 (x1) 23.79 (x2) μ1 = ? μ2 = ?
Độ lệch chuẩn (SD) 8.94 (s1) 7.86 (s2) σ1 = ? σ2 = ?
Sự khác nhau d = x1 – x2 ð = μ1 – μ2
Tình trạng thông tin Biết Không biết
Nồng độ Vitamin D ở 2 nhóm nam và nữa
Tính d => suy luận ð
Mẫu Dân số
Nam Nữ Nam Nữ
N 222 (n1) 336 (n2) Ko xác định Ko xác định
Trung bình 28.57 (x1) 23.79 (x2) μ1 = ? μ2 = ?
Độ lệch chuẩn (SD) 8.94 (s1) 7.86 (s2) σ1 = ? σ2 = ?
Sự khác nhau d = x1 – x2 ð = μ1 – μ2
Tình trạng thông tin Biết Không biết
Nồng độ Vitamin D ở 2 nhóm nam và nữa
Khác biệt giữa Vitamin D giữa nam và nữ
là thực tế hay ngẫu nhiên?
CÁC BƯỚC KIỂM ĐỊNH T KHÔNG BẮT CẶP
• Xây dựng giả thuyết Ho
• Chọn kiểm định phù hợp
• Tính giá trị thống kê của số liệu thu thập được
• Tính giá trị p-value
• Kết luận. Nếu p đủ nhỏ chúng ta bác bỏ giả thuyết Ho
CÁC BƯỚC KIỂM ĐỊNH T KHÔNG BẮT CẶP
• Giả thuyết Ho:
Trung bình nồng độ Vitamin D ở 2 nhóm dân số nam và nữ bằng nhau
Hay
ð = μ1 – μ2 = 0
• Nghiên cứu so sánh 2 trung bình nồng độ Vitamin D (biến phụ thuộc, định
lượng, phân phối bình thường) của nhóm nam và nữ (biến độc lập, nhị giá)
=> kiểm định T không bắt cặp
Ước tính phương sai của d
• Tính d (sự khác biệt giữa trung bình nam và nữ)
d = x1 – x2
• Gọi var = Phương sai của d (Variance)
var (d) = var (x1) + var (x2)
=
Ước tính độ lệch chuẩn của d
Độ lệch chuẩn của d = Căn bậc 2 của phương sai
s
Thực tế, chúng ta không biết được σ1 và σ2 nên chúng ta sử dụng
s1 và s2 thay thế
s =
Ước tính khoảng tin cậy 95%
•Khoảng tin cậy 95% của d là:
CI 95% = d ± 1,96 s
ƯỚC TÍNH T
• Tính t:
•
• Thực tế, chúng ta không biết
được σ1 và σ2 nên chúng ta sử
dụng s1 và s2 thay thế
Tính độ tự do, giá trị p
Khi cỡ mẫu đủ lớn, ta không cần tính độ tự do (bởi vì độ tự do khá
lớn)
=> chỉ cần áp dụng giá trị tới hạn của z thay cho giá trị tới hạn của t
20
GIẢ ĐỊNH CỦA KIỂM ĐỊNH T KHÔNG BẮT CẶP
• Dữ liệu tuân theo luật phân phối chuẩn/phân phối bình
thường
• Hai nhóm độc lập, không liên quan
• Cỡ mẫu tương đối đủ lớn, n1 > 30 và n2 > 30
• Lấy mẫu ngẫu nhiên
Mẫu
Nam Nữ
N 222 (n1) 336 (n2)
Trung bình 28.57 (x1) 23.79 (x2)
Độ lệch
chuẩn (SD)
8.94 (s1) 7.86 (s2)
Bài tập
Nồng độ Vitamin D ở 2 nhóm nam và nữa. Biết rằng biến nồng
độ VitD có phân phối bình thường và phương pháp lấy mẫu
ngẫu nhiên
Câu hỏi:
d
Phương sai
Độ lệch chuẩn
Khoảng tin cậy 95%
Kiểm tra giả định
Tính t
Giá trị p
Kết luận
BÀI T P:Ậ
Một nghiên cứu thực hiện ở 2 làng, nhằm đánh giá:
Tình trạng suy dinh dưỡng ở tuối thiếu nhi >< Khả năng hoạt động thể
lực ở tuổi trưởng thành
- Làng 1: Tất cả phụ nữ mang thai + bà mẹ cho con bú + trẻ em
dưới 7 tuổi được bổ sung thực phẩm giàu năng lượng và giàu protein
Atole: 163 Kcal + 6,4 g protein/180ml
- Làng 2: Tất cả phụ nữ mang thai + bà mẹ cho con bú + trẻ em dưới
7 tuổi chỉ được bổ sung thực phẩm nghèo năng lượng và không có
protein
Fresco: 59 Kcal + 0 g protein/180ml
Sau hơn 10 năm, các nhà KH quay lại đo tốc dộ tiêu thụ Oxy cực
đại (VO2max) trên thanh niên 14-18 tuổi (những người đã được bổ
sung dinh dưỡng lúc mang thai và 3 năm đầu đời).
Biết rằng biến VO2max có phân phối bình thường và phương pháp
lấy mẫu ngẫu nhiên
Kết quả:Nhóm
can
thiệp
n VO2max (l/phút)
Trung bình
mẫu
Độ lệch
chuẩn
Atole 44 2,62 0,54
Fresco 42 2,24 0,54
Câu hỏi:
Đặt giả thuyết Ho
d
Phương sai
Độ lệch chuẩn
Khoảng tin cậy 95%
Kiểm tra giả định
Tính t
Giá trị p
Kết luận
BÀI TẬP
Xem xét kết quả sau từ một chương trình sốt rét trong đó các lam
máu của trẻ từ 1 đến 4 tuổi được xét nghiệm tìm kí sinh trùng
Plasmodium falciparum.
• Kí sinh trùng được tìm thấy trong 70 lam máu (từ 70 trẻ), có nồng
độ hemoglobin trung bình của những trẻ này là 10,6g% với độ
lệch chuẩn là 1,4g%.
• Ở 80 mẫu máu của trẻ khác (không nhiễm ký sinh trùng) có nồng
độ hemoglobin trung bình là 11,5g% với độ lệch chuẩn là 1,3g%.
Nồng độ hemoglobin bị giảm trong lúc bị nhiễm P. falciparum
không?
25
GOOD STUDY!!!