Bài tập
Nếu muốn xác định các biến số cần và đủ cho
một nghiên cứu thì cần dựa vào cách nào dới
đây (chọn cách mà Anh/Chị cho là hợp lý nhất)?
A. Kinh nghiệm của các nghiên cứu tõng tự đã
đợc tác giả khác triển khai,
B. Cây vấn đề đợc phát triển từ đề tài nghiên
cứu
C. Kế hoạch trình bày phần kết quả nghiên cứu
và bàn luận
D. Mục tiêu nghiên cứu
Phân biệt thống kê mô tả và
thống kê suy luận%
• Thống kê mô tả:
‒ là mô tả kết quả thu đợc từ mẫu nghiên cứu
‒ biểu thị độ lớn, sự phân bố của các tham số của
mẫu nghiên cứu nh , độ lệch chuẩn, các tỷ lệ,
bảng, biểu, đồ thị sự phân bố theo các biến số
khác nhau nh tuổi, giới, địa d.
• Thống kê suy luận:
‒ là quá trình ngoại suy kết quả nghiên cứu từ mẫu
ra quần thể nghiên cứu.
‒ bao gồm 2 phơng pháp: ớc lợng và kiểm định
27 trang |
Chia sẻ: thanhle95 | Lượt xem: 307 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Bài giảng Thống kê nghiên cứu - Bài: Đại cương về mục tiêu, biến số và phân tích số liệu - Lưu Ngọc Hoạt, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
1
Đại cương về
Mục tiêu, Biến số và
Phân tích số liệu %
Lưu Ngọc Hoạt
Viện YHDP và YTCC, ĐH Y Hà Nội
MT cụ thể:
ỹ Xỏc định tỷ lệ cao HA của
người cao tuổi tại huyện A.
ỹ Xỏc định một số yếu tố liờn
quan đến tỡnh trạng cao HA.
ỹ Đỏnh giỏ hiệu quả của một số
giải phỏp can thiệp làm giảm
tỷ lệ tăng huyết ỏp.
Tờn đề tài: Huyết ỏp của người dõn tại
huyện A năm 2005 và một số
yếu tố ảnh hưởng
MT chung: Xỏc định tỷ lệ cao HA của người
cao tuổi tại huyện A năm 2005
và một số yếu tố ảnh hưởng
Mối liờn quan giữa tờn đề tài, mục tiờu chung
và mục tiờu cụ thể
M
ục
t
iờ
u
3
M
ục
t
iờ
u
2
M
ục
t
iờ
u
1
Mục tiờu chu g
%
%
Tờn đề tài
M
ục
t
iờ
u
3
M
ục
t
iờ
u
2
M
ục
t
iờ
u
1
Mục tiờu chung
Tờn đề tài
Cao HA của người cao tuổi tại
huyện A năm 2005 và một số yếu
tố ảnh hưởng
• Xỏc định tỷ lệ cao HA của người
cao tuổi tại huyện A năm 2005
và một số yếu tố ảnh hưởng
ỹ Xỏc định tỷ lệ cao HA của
người cao tuổi tại huyện A.
ỹ Xỏc định một số yếu tố liờn
quan đến tỡnh trạng cao HA.
ỹ Đề xuất (và thăm dũ) một số
giải phỏp can thiệp làm giảm
tỷ lệ tăng huyết ỏp.
M
ục
t
iờ
u
3
M
ục
t
iờ
u
2
M
ục
t
iờ
u
1
Mục tiờu chung
Biến số 1
Biến số 2
Biến số 3
Biến số 4
Mối liờn quan giữa một số thành phần của NC
Biến số 1
Biến số 2
Biến số 3
Biến số 4
Biến số 1
Biến số 2
Biến số 3
Biến số 4
Tờn đề tài
Định nghĩa Biến số%
• Đặc tính của người, vật sự việc, hiện tư
ợng biến thiên theo các điều kiện
khác nhau
• Do người nghiên cứu lựa chọn phù hợp
với từng mục tiêu nghiên cứu
• Triển khai nghiên cứu chính là thu thập
số liệu cho các biến số này
• Đối lập với biến số là các hằng số
2
Phân loại theo bản chất của biến số
Biến định lượng
Biến định tính
Biến liên tục
Biến rời rạc
Biến tỷ suất
Biến khoảng chia
Biến danh mục
Biến thứ hạng
Biến nhị phân
Bài tập 1: Phân loại các biến số
Định
tính
Định
lượng
Danh
mục
Thứ
hạng
Nhị
phân
Khoảng
chia
Tỷ
suất
Liên
tục
Rời
rạc
Tuổi
Hàm lượng đường
huyết
Độ cận, viễn của
mắt (đi ốp)
Số lượng hồng cầu
Nhiệt độ không khí
Giới
Dân tộc
Trình độ văn hoá
Số vi khuẩn/vi trư
ờng
Bài tập 1: Phân loại các biến số
Định
tính
Định
lượng
Danh
mục
Thứ
hạng
Nhị
phân
Khoảng
chia
Tỷ
suất
Liên
tục
Rời
rạc
Tuổi X X X
Hàm lượng đường
huyết
X X X
Độ cận, viễn của
mắt (đi ốp)
X X X
Số lượng hồng cầu X X X
Nhiệt độ không khí X X X
Giới X X
Dân tộc X X
Trình độ văn hoá X X
Số vi khuẩn/vi trư
ờng
X X X
Phân loại theo mối tương quan giữa các
biến số
Biến độc lập
(phơi nhiễm)
Biến phụ
thuộc (bệnh)
Yếu tố nhiễu
l Nhiễu là yếu tố làm sai lệch ảnh hưởng của phơi nhiễm
với bệnh (thay đổi độ lớn và ý nghĩa thống kê)
l Biến độc lập, phụ thuộc và nhiễu được xác định bởi ngư
ời nghiên cứu và chỉ có ý nghĩa trong nghiên cứu đó.
3
Tiêu chuẩn của 1 yếu tố nhiễu%
v Phải là 1 yếu tố nguy cơ đối với bệnh
v Phải có liên quan đối với phơi nhiễm như
ng không lệ thuộc vào phơi nhiễm
v Không phải là yếu tố trung gian giữa phơi
nhiễm và bệnh
v Phải thực sự tác động lên mối tương quan
giữa phơi nhiễm và bệnh (khẳng định khi
phân tích số liệu)
v Có thể đổi chỗ cho yếu tố phơi nhiễm tuỳ
theo mục đích người làm nghiên cứu
Trường hợp nào sau đây là nhiễu?%
E
E
E
D E E D D
D
D
D
D
E
E
E D
D E
F F F
F
F
F F
F F
Bài tập
Nếu muốn xác định các biến số cần và đủ cho
một nghiên cứu thì cần dựa vào cách nào dưới
đây (chọn cách mà Anh/Chị cho là hợp lý nhất)?
A. Kinh nghiệm của các nghiên cứu tưõng tự đã
được tác giả khác triển khai,
B. Cây vấn đề được phát triển từ đề tài nghiên
cứu
C. Kế hoạch trình bày phần kết quả nghiên cứu
và bàn luận
D. Mục tiêu nghiên cứu
Phân biệt thống kê mô tả và
thống kê suy luận%
• Thống kê mô tả:
‒ là mô tả kết quả thu được từ mẫu nghiên cứu
‒ biểu thị độ lớn, sự phân bố của các tham số của
mẫu nghiên cứu như , độ lệch chuẩn, các tỷ lệ,
bảng, biểu, đồ thị sự phân bố theo các biến số
khác nhau như tuổi, giới, địa dư...
• Thống kê suy luận:
‒ là quá trình ngoại suy kết quả nghiên cứu từ mẫu
ra quần thể nghiên cứu.
‒ bao gồm 2 phương pháp: ước lượng và kiểm định
4
Quần thể đích%
Quần thể
nghiên cứu%
Mẫu%
Tham số quần thể %
(à, σ, P...)%Mẫu xác suất%
- Ngẫu nhiên đơn !
- Ngẫu nhiên hệ thống!
- Mẫu phân tầng !
- Mẫu chùm !
- Mẫu nhiều bậc !
Mẫu không xác suất%
- Mẫu kinh nghiệm %
- Mẫu thuận tiện !
- Mẫu chỉ tiêu!
- Mẫu có mục đích.%
Chọn
mẫu %
Ước lượng %
• điểm%
• khoảng %
Kiểm định
giả thuyết%
Suy luận
thông kê
(Chỉ áp
dụng cho
mẫu xác
suất với
cỡ mẫu
đủ lớn) %
Kết luận ngoại suy !
Các test
thống kê
Giá trị p
Lựa chọn!
Mô tả các tham số mẫu%
(trình bày kết quả nghiên cưú) %
Tham số mẫu%
( , s, p...)!XBiến số !
Thống kê
mô tả %
Thống kê suy luận%
1. Thống kê mô tả %
Bài tập
Nếu một người nghiờn cứu muốn thu thập số liệu
về huyết ỏp tối đa của cỏc đối tượng NC, cỏch thu
thập nào dưới đõy Anh/Chị cho là hợp lý nhất?
A. Phõn huyết ỏp thành cỏc nhúm (vớ dụ < 90
mmHg; 90-120; 121-140...) sau đú chọn nhúm
thớch hợp
B. Ghi đầy đủ trị số huyết ỏp tối đa của từng đối
tượng.
C. Phõn đối tượng thành hai loại cú và khụng cao
huyết ỏp tối đa
D. Phõn thành cỏc nhúm: huyết ỏp thấp, bỡnh
thường, cao và rất cao
Bài tập
Nếu một người nghiờn cứu muốn thu thập số
liệu về số điếu thuốc lỏ một người hỳt trung
bỡnh/ngày, cỏch thu thập nào dưới đõy Anh/Chị
cho là hợp lý nhất?
A. Phõn thành cỏc nhúm (vớ dụ < 5 điếu; 5-10;
11-15; 16-20...) sau đú chọn nhúm thớch hợp
B. Ghi chớnh xỏc số điếu thuốc hỳt trung bỡnh mà
đối tượng đó trả lời.
C. Phõn đối tượng thành hai loại: hỳt trờn 1 bao
hoặc dưới một bao
D. Phõn thành cỏc nhúm: hỳt nhẹ, hỳt trung bỡnh,
hỳt nhiều, hỳt rất nhiều.
5
Ví dụ 1: Mô tả đặc điểm của cân nặng khi
đẻ của 500 trẻ mới sinh tại bệnh viện M: %
1. Khi cân nặng tính bằng gram (biến định lượng)!
ố Đo lường độ tập trung của số liệu:
- Giá trị trung bình: với số liệu phân bố chuẩn
- Giá trị trung vị: với bộ số liệu phân bố không chuẩn
ố Đo lường độ phân tán của bộ số liệu:
- Khoảng dao động (Max ‒ Min)
- Độ lệch chuẩn
2. Khi cân nặng tính theo mốc < hoặc ≥ 2500
gram (biến định tính) !
ố Tỷ lệ trẻ có cân nặng < 2500 gr
Ưu điểm của phân tích số liệu dưới dạng
định lượng (ví dụ cân nặng khi đẻ của trẻ)%
BA XX >>PA = PB = 10% %
2500 gr %
50 trẻ 450 trẻ
B
2500 gr %
50 trẻ 450 trẻ
A
%
Ưu điểm của phân tích số liệu dưới dạng
định lượng (tiếp) (Huyết áp tối đa) %
PA = PB = 60% %
120 mmHg %
300 người 200 người
A
120 mmHg %
300 người 200 người
B
BA XX ≈
sB >> sA %
Các nội dung chính của thống kê mô tả %
I. Tổng hợp các biến số%
‒ Với các biến định tính:!
• Tần số (frequency)!
• Tỷ số (ratio)!
• Tỷ lệ (proportion)!
• Tỷ suất (rate)!
‒ Với các biến định lượng: !
• Đo lường độ tập trung: giá trị trung bình,
trung vị, mốt!
• Đo lường độ phân tán: phương sai, độ lệch
chuẩn, %
6
Các nội dung chính của thống kê mô tả %
II. Trình bày số liệu bằng bảng: %
‒ Bảng 1 chiều %
‒ Bảng 2 chiều%
III. Trình bày số liệu bằng biểu và đồ thị %
‒ Đồ thị cột: %
• Cột rời, !
• Cột chồng, !
• Cột liên tục !
‒ Đồ thị hình tròn%
‒ Biểu đồ gấp khúc %
‒ Biểu đồ đa giác %
‒ Biểu đồ chấm (đám mây)%
‒ Bản đồ %
1/ Tổng hợp số liệu với
các biến định tính
1.1. Tần số (frequency):%
• Biểu thị số lần xuất hiện của 1 quan sát nào đó%
• VD : Phân bố nhóm dân tộc trong số 22 người
nghiên cứu.
22 %Tổng cộng%
6%Nùng %
12 %Tày%
4%Kinh %
Tần số%Đếm số lần xuất hiện%Giá trị biến%
1.2. Tỷ số (ratio):%
• Là phân số mà mẫu số
không bao hàm tử số
n Tử số và mẫu số có thể khác nhau
về đơn vị đo lường
n Hệ số k có thể là 1, 10, 100, 1000...
n Ví dụ:
a%
--- x k %
b%
số học sinh nam
----------------------
số học sinh nữ
số giường bệnh
----------------------------
dân số trong khu vực
7
1.3. Tỷ lệ (proportion):%
: Là 1 phân số mà mẫu số bao
hàm tử số, do vậy cả mẫu và
tử đều phải cùng đơn vị
a%
------- x k %
a + b%
n Hệ số k có thể là 1, 10, 100, 1000...
n Khi k = 100, ta có tỷ lệ phần trăm (percentage)!
n Ví dụ:%
số học sinh nam
Tỷ lệ học sinh nam = -----------------------
tổng số học sinh
số người mắc sốt rét
Tỷ lệ mắc sốt rét = ----------------------------------
tổng số người được khám
1.4. Tỷ suất (rate):%
• Là 1 dạng đặc biệt của tỷ lệ khi nó được đo lư
ờng trong một khoảng thời gian nhất định
• Ví dụ:
số biến cố xẩy ra trong 1 khoảng thời gian
------------------------------------------------------------ x k
dân số trung bình trong khoảng thời gian đó
n Hệ số k có thể là 1, 10, 100, 1000...
n Ví dụ:%
số người bị sốt rét tại huyện A năm 2000
------------------------------------------------------------- x 100
dân số trung bình của huyện A trong năm đó
2/ Tổng hợp số liệu với
các biến định lượng
2.1. Đo lường độ tập trung:
Bài tập
Tham số nào là thớch hợp nhất để đo
lường độ tập trung của bộ số liệu dưới
đõy: 12, 15, 17, 20, 23, 24, 26, 28, 80
A. Trung vị
B. Khoảng phần trăm
C. Giỏ trị trung bỡnh
D. Độ lệch chuẩn
8
• Được tính bằng tổng số các giá trị quan sát đư
ợc chia cho số lần quan sát.
• Giá trị trung bình chỉ tính được với các số dạng
liệu số (biến định lượng)
• Ví dụ:!
‒ Chiều cao của 7 em gái đo được như sau:
‒ 141, 141, 143, 144, 145, 146, 155 cm (tổng
cộng tất cả chiều cao là 1015 cm)
‒ Vì vậy trung bình bằng 1015/7, tức là 145 cm.
n
X
n
XXXX
n
i
i
n
∑
==
+++
= 121
...
v Trung bình số học (trung bình cộng):
• Là giá trị giữa của 1 bộ số liệu khi chúng được sắp
xếp theo thứ tự tăng dần hoặc giảm dần.
• Giá trị này chia sự phân bố của số liệu thành hai
phần bằng nhau
!
• Ví dụ:!
‒ ta có bộ số liệu: 47, 41, 44, 43, 42, 40, 72 kg.
‒ để tính trung vị, trước hết sắp xếp số liệu theo thứ tự:
40, 41, 42, 43, 44, 47, 72 kg.
‒ trung vị sẽ là giá trị của quan sát thứ (n+1)/2, tức là
(7+1)/2 =4, và giá trị thứ 4 = 43 kg là trung vị.
‒ Với bộ số liệu: 40, 41, 42, 43, 44, 47, 49 và 72 thì trung
vị là giá trị trung bình cộng của giá trị thứ 4 và thứ 5 =
(43+44)/2 = 43,5
v Trung vị (giá trị trung tâm):
• Là giá trị quan sát được nhiều lần nhất trong bộ số liệu
• Trong bộ số liệu dưới đây:141, 141, 143, 144, 145, 146,
155 thì 141 được coi là mốt vì quan sát được nhiều lần
nhất.
• Mốt ít có giá trị trong đo lường độ tập trung của bộ số liệu
khi ở dạng định lượng, nhưng có giá trị với bộ số liệu phân
nhóm, hoặc biến định tính
• Ví dụ: Trong bảng dưới, nhóm tuổi 36-45 là mốt
Nhóm
tuổi
Tần số Nhóm
tuổi
Tần số Nhóm tuổi Tần số
< 5 15 26-35 67 56-65 43
5-15 24 36-45 120 66-75 27
16-25 32 46-55 94 >75 12
v Mốt: Phân biệt về giá trị trung bình, trung vị
và mốt:
Mốt = 10
Trung vị = 11
Trung bình = 11,3
Đo lường (cm)
9
Ví dụ phân bố chuẩn%
Fr
eq
ue
nc
y
bwt
709 % 4990 %
0 %
29 %
Phân biệt về giá trị trung bình, trung vị
và mốt (tiếp):
• Giá trị trung bình được sử dụng thường xuyên
hơn và có giá trị khi bộ số liệu là 1 phân bố
chuẩn. %
• Khi bộ số liệu phân bố không chuẩn, trung vị có
ý nghĩa hơn:%
• Ví dụ: !
‒ Với bộ số liệu này: 40, 41, 42, 43, 44, 47, 72 thì giá
trị trung bình = 47, trong khi giá trị trung vị bằng 43.
‒ Nếu ta thay giá trị 72 trong bộ số liệu trên = 51, giá
trị trung vị không đổi, nhưng giá trị trung bình chỉ còn
là 44!
2/ Tổng hợp số liệu với các
biến định lượng (tiếp)
2.2. Đo lường độ phân tán:
v Khoảng số liệu (range): %
‒ Là hiệu giữa hai giá trị đo lường cao nhất và thấp nhất
trong một bộ số liệu.
‒ Khoảng số liệu (R) = Xmax ‒ Xmin
• Ví dụ: nếu cân nặng của 7 phụ nữ là 40, 41, 42, 43, 44,
47 và 72 kg, khoảng quan sát sẽ là 72 - 40 = 32 kg.%
1
)(
1
2
2
−
−
=
∑
=
n
XXi
s
n
i
v Phương sai (variance)%
‒ Là tổng bình phương các
khoảng cách giữa giá trị quan
sát so với giá trị trung bình chia
cho số các quan sát trừ đi 1.
v Độ lệch chuẩn (standard
deviation)%
2ss =
10
v Ví dụ minh hoạ:
X
v Ví dụ minh hoạ (tiếp):
6
10
0
30
Σ
1 2 1 0 4
Bình phương khoảng chênh
lệch giữa giá trị quan sát so
với giá trị trung bình
1 2 -1 0 -2
Khoảng chênh lệch so với giá
trị trung bình
7 8 5 6 4
Tỷ lệ phụ nữ làm kinh tế giỏi
(Xi)
01 00 99 98 97
)( XXi −
5,2
4
10
1
)(
1
2
2 ==
−
−
=
∑
=
n
XXi
s
n
i
X
2)( XXi −
58,15,2 ==⇒ s
v Hệ số biến thiên (coeficient of variation)%
• Là tỷ số giữa độ lệch chuẩn và trị tuyệt đối của giá trị trung
bình
• Hệ số biến thiên được biểu thị bằng tỷ lệ phần trăm (%) và
biểu thị mức độ biến thiên của độ lệch chuẩn so với giá trị
trung bình
• Giúp cho việc so sánh mức độ phân tán của nhiều bộ số liệu
với nhau:
• Ví dụ:!
• CV của cân nặng nam =12/60 = 20%
• CV của cân nặng nữ = 8/54 = 15%
• Vậy bộ số liệu của cân nặng nam phân tán hơn
X
sCV =
8 54 Cân nặng nữ thanh niên
12 60 Cân nặng nam thanh niên
s X
• Thống kê mô tả: Quan tâm đến mẫu NC
‒ Tổng hợp số liệu:
• tỷ lệ, tỷ số, tỷ suất
• Độ tập trung, độ phân tán của bộ số liệu định lượng
‒ Trình bày kết quả nghiên cứu:
• Bảng
• Biểu đồ, đồ thị
• Thống kê suy luận: quan tâm đến quần thể
‒ Ước lượng :
• Điểm,
• Khoảng
‒ Kiểm định giả thuyết
• Khác nhau
• Tương quan
11
2. Thống kê suy luận %
2.1. Ước lượng điểm, khoảng%
Phân biệt ước lượng và kiểm định%
• ước lượng:
‒ ngoại suy từ tham số mẫu ra tham số quần thể:
‒ từ trung bình của mẫu ( ) sang TB quần thể (à)
‒ từ tỷ lệ của mẫu (p) sang tỷ lệ của quần thể (P)
‒ từ OR, RR, r của mẫu ra quần thể.
• Kiểm định giả thuyết:
‒ so sánh 2 hoặc nhiều quần thể NC từ sự khác biệt
của 2 hoặc nhiều mẫu rút ra từ các quần thể đó.
‒ kiểm định mối tương quan của quần thể dựa theo
mối tương quan thu được từ mẫu
X
Ví dụ: Cân nặng khi đẻ của trẻ mới sinh
tại huyện A: tham số mẫu và quần thể %
Trẻ sơ sinh%
tại huyện A %
5000 trẻ %
Mẫu%
500 trẻ %
12802954±=± sXTham số mẫu:
??±=±σàTham số QT:
ước lượng hay kiểm định?
Ví dụ: Cân nặng khi đẻ của trẻ mới sinh
tại huyện A: tham số mẫu và quần thể %
Trẻ sơ sinh%
tại huyện A %
5000 trẻ %
Mẫu%
500 trẻ %
Tỷ lệ trẻ (p) có cân nặng
< 2500 gram = 20%
ước lượng hay kiểm định?
Tỷ lệ trẻ (P) có cân nặng
< 2500 gram = ?
12
Ví dụ: Cân nặng khi đẻ của trẻ mới sinh
tại huyện A và huyện B %
Trẻ sơ sinh%
tại huyện A %
5000 trẻ %
Trẻ sơ sinh%
tại huyện B %
6000 trẻ %
Mẫu%
500 trẻ %
Mẫu B %
500 trẻ %
?
12802954± 8862785±>
ước lượng hay kiểm định?
* Ước lượng điểm:%
X=à
P = p !
+ Với biến định lượng: ố
+ Với biến định tính: ố
n Nhược điểm của ước lượng điểm:
n Ví dụ điểm thi của 9 sinh viên
Sinh viên số 1 2 3 4 5 6 7 8 9
Điểm đạt được 9 8 7 9 6 4 5 8 3
Nếu coi 9 sinh viên
này là 1 quần thể ố
56,6
9
385469789
=
++++++++
=à
Nếu chọn ngẫu nhiên1 mẫu có 2 SV, ta
sẽ có 36 cơ hội.
N! %
---------%
n!(N-n)!%
* Ước lượng điểm (tiếp)%
Mẫu
số:
Cặp sinh viên
số:
Điểm của từng
sinh viên
Điểm trung bình của 2
sinh viên
1
1, 2
9
8
8,5
2
1, 3
9
7
8,0
3
1, 4
9
9
9,0
4
1, 5
9
6
7,5
5
1, 6
9
4
6,5
6
1, 7
9
5
7,0
7
1, 8
9
8
8,5
8
1, 9
9
3
6,0
9
2, 3
8
7
7,5
10
2, 4
8
9
8,5
11
2, 5
8
6
7,0
12
2, 6
8
4
6,0
36
8,9
8
3
5,5
* Ước lượng điểm (tiếp)%
Tần số quan sát với các trung bình mẫu khác
nhau (phân bố mẫu):
TB mẫu 3,5 4,0 4,5 5,0 5,5 6,0 6,5 7,0 7,5 8,0 8,5 9,0
Tần số 1 1 2 2 4 5 5 4 4 3 4 1
13
Ví dụ phân bố chuẩn%
Fr
eq
ue
nc
y
bwt
709 % 4990 %
0 %
29 %
* Ước lượng khoảng %
+ Với biến định lượng: ố
+ Với biến định tính: ố
+ Công thức tổng quát:
Tham số quần thể = tham số mẫu ± Zα/2.SE
SE (Sai số chuẩn) = độ lệch chuẩn của các
trung bình mẫu
Ước lượng khoảng còn dùng với nhiều tham số
mẫu khác như OR, RR, r...
n
sZX 2/αà ±=
n
ppZpP )1.(2/
−
±= α
* Nguyên lý ước lượng khoảng và
khoảng tin cậy %
à
2.2. Kiểm định giả thuyết%
* So sánh sự khác nhau giữa 2 nhóm %
14
Ví dụ 2: So sánh cân nặng khi đẻ của trẻ
mới sinh tại huyện A so với huyện B:%
Trẻ sơ sinh%
tại huyện A %
5000 trẻ %
Trẻ sơ sinh%
tại huyện B %
6000 trẻ %
Mẫu A %
500 trẻ %
Mẫu B %
500 trẻ %
1. Khi cân nặng của trẻ dưới dạng gram%
Trẻ sơ sinh%
tại huyện A %
5000 trẻ %
Trẻ sơ sinh%
tại huyện B %
5000 trẻ %
Mẫu A %
500 trẻ %
Mẫu B %
500 trẻ %
?
Test t!
12802954± 8862785±>
2. Khi cân nặng của trẻ dưới dạng
< hoặc ≥ 2500 gram%
Trẻ sơ sinh%
tại huyện A %
5000 trẻ %
Trẻ sơ sinh%
tại huyện B %
5000 trẻ %
Mẫu A %
500 trẻ %
Mẫu B %
500 trẻ %
>%
?
Test χ2 hoặc
Fisher test!
pA = 25% pB = 22%
2.2. Kiểm định giả thuyết%
* So sánh sự khác nhau giữa > 2 nhóm %
15
Trẻ sơ sinh%
tại huyện A %
5000 trẻ %
Trẻ sơ sinh%
tại huyện B %
5000 trẻ %
Mẫu A %
500 trẻ %
Mẫu B %
500 trẻ %
12802954± 10242645±>
1. Với biến định lượng%
Trẻ sơ sinh%
tại huyện C %
5000 trẻ %
Mẫu C %
500 trẻ %
8862785±<
? ?
Test ANOVA %
Trẻ sơ sinh%
tại huyện A %
5000 trẻ %
Trẻ sơ sinh%
tại huyện B %
5000 trẻ %
Mẫu A %
500 trẻ %
Mẫu B %
500 trẻ %
>
2. Với biến định tính%
Trẻ sơ sinh%
tại huyện C %
5000 trẻ %
Mẫu C %
500 trẻ %
>
? ?
Test χ2 %
pA = 25% pB = 21% pc = 16%
Không %
ghép cặp %
t test !
cho cặp%
test t-student
hoặc Z test %
Khi so sánh
trên 2 nhóm %
ANOVA %
(F test) %
Phân tích%
sự %
khác nhau
Biến định
tính%
Biến định
lượng%
Ghép cặp %
Không %
ghép cặp %Với tất cả các loại
nghiên cứu%
McNemar’s
test (χ2) %
χ2 hoặc Fisher
test %
Khi so sánh %
2 nhóm%
Ghép cặp %
Không %
ghép cặp %
Ghép cặp % t test !
cho cặp%
Tổng hợp phân tích
sự khác nhau
Phõn bổ tựy ý
Tổng số bệnh nhõn
Can thiệp mới
Can thiệp cũ
(hoặc dựng
Placebo)
Tỷ lệ khỏi
Lần điều trị thứ
nhất
Can thiệp mới
Can thiệp cũ
(hoặc dựng
Placebo)
Lần điều trị
thứ hai
Nhúm B
Nhúm B
Nhúm A
Nhúm A
Tỷ lệ khỏi
Tỷ lệ khỏi
Tỷ lệ khỏi
16
2.2. Kiểm định giả thuyết%
Kiểm định mối tương quan giữa 2
biến nhị phân %
Kiểm định mối
quan hệ nhân quả
Phân tích Sự "
Tương quan"
Đo lường độ
lớn của mối tư
ơng quan %
Biến nhị
phân%
Biến định
lượng%
NC ngang/ %
NC bệnh-chứng%
Tỷ suất
chênh (OR)%
NC thuần tập/%
NC Thử nghiệm %
Nguy cơ tư
ơng đối (RR)
và OR!
Với tất cả các loại
nghiên cứu%
Phân tích tư
ơng quan và
hồi quy%
Test ý nghĩa
TK của mối tư
ơng quan%
Biến nhị
phân%
Với tất cả các loại
nghiên cứu%
χ2 hoặc χ2
của
McNemar’s %
Phân tích tư
ơng quan và
hồi quy%
%
Với tất cả các loại
nghiên cứu%
%
Biến định
lượng%
Môí liên quan giữa tuổi và huyết áp tối đa %
sb
p
age 17 70
110
220
- Hệ số tương quan r
- Phương trình hồi quy tuyến tính
Bảng lựa chọn test thống kê %
Biến độc
lập
Biến
Phụ thuộc
1 biến định tính >2 biến
định tính
1 định lư
ợng
1 định
tính, 1
định lư
ợng
Nhiều biến
định tính
và/hoặc
định lượng
Có 2
nhóm
Trên 2
nhóm
1 biến định lư
ợng
Test t Test
ANOVA
Factorial
design
(thừa số)
Hệ số tư
ơng quan r
hoặc hồi
quy tuyến
tính
ANCOVA Phân tích
hồi quy đa
biến
1 biến nhị
phân
OR, RR,
χ2 hoặc
Fisher
test
χ2 hoặc
Fisher
test
Phân tích
tầng
Test t Factorial
design
(thừa số)
Hồi quy
logistics
1 biến định
tính
χ2 hoặc
Fisher
test
χ2 hoặc
Fisher
test
Phân tích
tầng
ANOVA Fac