Xác định được quần thể đích, quẩn
thể nghiên cứu,đơn vị mẫu
2. Lựa chọn được phương pháp chọn
mẫu thích hợp
3. Dự kiến được các loại sai số trong
quá trình chọn mẫu và các biện pháp
khắc phục.
4. Tính được cỡ mẫu cho một nghiên cứu
59 trang |
Chia sẻ: tranhoai21 | Lượt xem: 1841 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Mẫu và phương pháp chọn mẫu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
MẪU VÀ PHƯƠNG PHÁP
CHỌN MẪU
Ths Lê Minh Hữu
2Mục tiêu học tập
1. Xác định được quần thể đích, quẩn
thể nghiên cứu, đơn vị mẫu
2. Lựa chọn được phương pháp chọn
mẫu thích hợp
3. Dự kiến được các loại sai số trong
quá trình chọn mẫu và các biện pháp
khắc phục.
4. Tính được cỡ mẫu cho một nghiên
cứu
3Khái niệm
Quần thể
NC Mẫu
Chọn
? ?
Quần thể
đích
4Đơn vị lấy mẫu, khung mẫu
Đơn vị lấy mẫu: là đơn vị của quần thể
được chọn vào mẫu
Khung mẫu: Danh sách các đơn vị mẫu
hoặc bản đồ phân bố mẫu.
Đơn vị nghiên cứu: là một chủ thể mà
sự quan sát hoặc đo lường sẽ được
thực hiện trên chủ thể (người hoặc vật
thí nghiệm)
5Nghiên cứu về sử dụng hố xí tại xã X
200 hộ
Chủ hộ
Đại diện
hgđ
PVDanh sách
Các hộ
gia đình
trong xã
Chọn
Đơn vị
lấy mẫu
Khung
mẫu
Đơn vị
NC
6Không đủ kinh phí
Sai số trong điều tra toàn thể
Mẫu đủ lớn sẽ ngoại suy ra toàn quần
thể
Lý do chọn mẫu
7CÁC PHƯƠNG PHÁP CHỌN MẪU
8Các phương pháp chọn mẫu
Chọn mẫu có xác suất
Ngẫu nhiên đơn
Ngẫu nhiên hệ thống
Phân tầng
Mẫu cụm
Nhiều giai đoạn
Chọn mẫu không xác suất
Thuận tiện
Chỉ tiêu
Mục đích
9Chọn mẫu ngẫu nhiên đơn
10
Là mẫu mà tất cả các thể trong quần
thể có cùng cơ hội để chọn vào mẫu.
Cách chọn:
Lập danh sách toàn bộ những đơn vị
mẫu trong quần thể
Sử dụng phương pháp “bốc thăm” hoặc
sử dụng bảng số ngẫu nhiên để chọn
đơn vị mẫu
Chọn mẫu ngẫu nhiên đơn
11
Chọn mẫu ngẫu nhiên đơn
Ưu điểm:
Cách làm đơn giản, tính đại diện cao
Có thể lòng vào các kỷ thuật chọn mẫu
khác
Hạn chế:
Cần phải có khung mẫu
Các cá thể được chọn vào mẫu có thể
phân bố tản mạn.
12
Chọn mẫu ngẫu nghiên hệ
thống
Sampling interval’s width is determined
and individuals selected.
13
Chọn mẫu ngẫu nghiên hệ thống
Những cá thể được chọn theo một
khoảng cách đều đặn
Cách chọn
Ghi một danh sách đơn vị mẫu
Xác định khoảng cách mẫu k=N/n
Chọn một số ngẫu nhiên (i) giữa 1 và k.
Các cá thể có số thứ tự i + 1k, i + 2k,
i + 3k... sẽ được chọn vào mẫu
14
Chọn mẫu phân tầng
15
Chọn mẫu phân tầng
Là việc phân chia các cá thể của quần thể
nghiên cứu thành các nhóm riêng lẽ
Lý do phân tầng: Có sự khác biệt về đặc tính
nghiên cứu của các cá thể ở các tầng
Tầng có thể phân chia theo: Khu vực địa lý,
giới, tuổi, nghề nghiệp
Ví dụ: Để khảo sát các yếu tố nguy cơ gây
bệnh Đái tháo đường tại thành phố CT, nhà
nghiên cứu có thể phân chia tầng theo thành
thị và nông thôn
16
Cách chọn mẫu tầng
Thành phố CT
Nông thôn Thành thị
PhườngXã
17
Cluster sample
Chọn mẫu chùm (cụm)
18
Chọn mẫu chùm (cụm)
Do không có khung mẫu hoặc nghiên cứu
trên địa bàn rộng
Có được các nhóm của các đơn vị nghiên
cứu có sẵn (các làng, các trường học)
Việc chọn những nhóm các đơn vị nghiên
cứu (các cụm) thay cho việc chọn cá nhân
những đơn vị nghiên cứu.
19
Chọn mẫu chùm (cụm)
Các cụm thường là những đơn vị địa lý
(xã, ấp/khu vực) hoặc những đơn vị tổ
chức (các phòng khám, trường học).
Số lượng cụm, tuỳ vào số cụm. Nên
chọn 30
Ví dụ: Chọn mẫu cụm trong xác định tỷ
lệ bao phủ tiêm chủng trẻ dưới 5 tuổi
của tỉnh X
20
Dân số
chọn mẫu
Mẫu cụm
bậc 1 Mẫu cụm bậc 2
Chọn mẫu chùm (cụm)
21
Chọn mẫu PPS – Xác suất tỷ lệ với kích
cỡ của quần thể
Sử dụng khi nghiên cứu trên cộng đồng
lớn, kích thước các cộng đồng không đều
nhau
Các bước thực hiện
1. Liệt kê các cụm và dân số
2. Xếp các cụm theo một trình tự và cộng dồn
3. Chọn khoảng cách mẫu k = Dscd/số cụm
4. Chọn ngẫu nhiên con số i nào đó, chọn
cụm đầu tiên có dân số cộng dồn lớn hơn
hoặc bằng i
5. Các cụm kế tiếp tính bằng cách lấy i + k
22
Ví dụ
Một nghiên cứu về tình trạng sâu răng
của học sinh tiểu học tại quận Ninh kiều
TPCT.
Cỡ mẫu: 300 học
Số lượng trường tiểu học là 10
Số lượng trường tiểu học cần chọn là 4
Các bước chọn theo PPS?
23
Tên trường và số lượng học sinh
Tên
Trường Số lượng
1 400
2 700
3 800
4 1200
5 1800
6 300
7 800
8 900
9 1100
10 1000
Tổng 9000
24
Cộng dồn
Tên
Trường Số lượng Cộng dồn
1 400 400
2 700 1100
3 800 1900
4 1200 3100
5 1800 4900
6 300 5200
7 800 6000
8 900 6900
9 1100 8000
10 1000 9000
Tổng 9000
25
Tính khoảng cách k
Tên
Trường Số lượng Cộng dồn
Khoảng
cách k
1 400 400 2250
2 700 1100
3 800 1900
4 1200 3100
5 1800 4900
6 300 5200
7 800 6000
8 900 6900
9 1100 8000
10 1000 9000
Tổng 9000
26
Chọn số ngẫu nhiên i <= k
Tên
Trường Số lượng Cộng dồn
Khoảng
cách
Chọn
cụm
1 400 400 2250
2 700 1100 679
3 800 1900
4 1200 3100
5 1800 4900
6 300 5200
7 800 6000
8 900 6900
9 1100 8000
10 1000 9000
Tổng 9000
27
Chọn các cụm còn lại
Tên
Trường Số lượng Cộng dồn
Khoảng
cách
Chọn
cụm
1 400 400 2250
2 700 1100 679
3 800 1900
4 1200 3100 2929
5 1800 4900
6 300 5200 5179
7 800 6000
8 900 6900
9 1100 8000 7429
10 1000 9000
Tổng 9000
28
Tính tổng học sinh của các trường được chọn
Tên
Trường Số lượng Cộng dồn
Khoảng
cách
Chọn
cụm Mẫu
1 400 400 2250
2 700 1100 679
3 800 1900
4 1200 3100 2929
5 1800 4900
6 300 5200 5179
7 800 6000
8 900 6900
9 1100 8000 7429
10 1000 9000
Tổng 9000 3300 0
29
Tính cỡ mẫu cho các trường ni= (n x Ni)/N
Tên
Trường Số lượng Cộng dồn
Khoảng
cách
Chọn
cụm Mẫu
1 400 400 2250
2 700 1100 679 64
3 800 1900
4 1200 3100 2929 109
5 1800 4900
6 300 5200 5179 27
7 800 6000
8 900 6900
9 1100 8000 7429 100
10 1000 9000
Tổng 9000 3300 300
30
Chọn mẫu nhiều giai đoạn
Trong những quần thể rất lớn và rải
khắp mẫu có thể được tiến hành theo
hai hoặc nhiều giai đoạn
Thường là những nghiên cứu dựa trên
cộng đồng, trong đó người được phỏng
vấn thuộc những làng khác nhau, và
những làng này đã được chọn từ những
khu vực khác nhau
31
Ví dụ
Ví dụ: ĐBSCL có 13 tỉnh, mỗi tỉnh có nhiều
huyện, mỗi huyện có nhiều xã...
Giai đọan 1: Chọn ngẫu nhiên 3 tỉnh;
Giai đọan 2: Chọn ngẫu nhiên 2 huyện từ các
tỉnh đã được chọn ở giai đoạn 1
Giai đọan 3: Chọn ngẫu nhiên 2 xã từ các
huyện đã được chọn ở giai đoạn 2,...
Giai đoạn 4: Chọn ngẫu nhiên 2 ấp từ xã
Giai đoạn 5: Chọn ngẫu nhiên 30 cá thể từ
mỗi ấp
32
Chọn mẫu không xác xuất
Chn mu thun tin
Đạt được trên cơ sở các cá thể có sẵn
khi thu thập số liệu.
Ví dụ: Tất cả các bệnh nhân đến khám
tại phòng khám hằng ngày.
Đây là cách chọn mẫu hay gặp trong
nghiên cứu lâm sàng.
33
Chọn mẫu không xác xuất
Chn mu ch tiêu
Là phương pháp đảm bảo rằng một số
nhất định các đơn vị mẫu từ các loại
khác nhau của quần thể nghiên cứu với
các tính đạc trưng sẽ có mặt trong mẫu.
34
Chọn mẫu không xác xuất
Chn mu mc đích
Nhà nghiên cứu đã xác định trước các
nhóm quan trọng để tiến hành thu thập
số liệu.
Các nhóm khác nhau sẽ có tỷ lệ mẫu
khác nhau.
Đây là cách hay dùng trong các điều tra
thăm dò, phỏng vấn sâu.
35
Các sai số thường gặp trong chọn mẫu
Sự không đáp ứng
Nghiên cứu với người tình nguyện
Sai số do mùa
Sai số do đường xá
36
Sự không đáp ứng
Là hiện tượng các cá thể từ chối tham gia nghiên
cứu.
Thường hay gặp trong thử nghiệm lâm sàng
Cách khắc phục:
Chuẩn hoá phương pháp thu thập số liệu
Giải thích các đối tượng trước khi thu thập số liệu
Nếu vằng mặt thì người điều tra phải quay lại gặp
cho bằng được.
Nếu đối tượng không muốn hợp tác thì phải xem xét
lại đối tượng này để tìm ra các đặc điểm khác với
những đối tượng tham gia.
Có thể chọn thêm đối tượng vào mẫu để thay thế
những người không tham gia.
37
CỠ MẪU
38
Các yếu tố ảnh hưởng đến cỡ
mẫu
Loại thiết kế nghiên cứu
Phương pháp chọn mẫu
Độ lớn của tham số được nghiên cứu
Mức độ sai lệch tham số mẫu và tham
số quần thể
Khả năng thực thi
39
Cỡ mẫu cho việc ước tính tỷ lệ trong
quần thể
2
2
2/1
)1(
d
ppZn −×=
−α
Cỡ mẫu Tỷ lệ ước đoán
Khoảng
sai lệch
Mức ý nghĩa
thống kê
Hệ số tin cậy
0,1
0,05
0,05
0,01
40
Giá trị Z
Giá trị Z thu được từ bằng cách tra
bảng Z
Với α = 0,1 ; Z = 1,645
Với α = 0,05; Z = 1,96
Với α = 0,01; Z= 2,58
41
Ví dụ
Trưởng phòng y tế huyện muốn xác định
tỷ lệ SDD của trẻ dưới 5 tuổi trong
huyện hiện tại là bao nhiêu. Giả sử rằng
bạn sử dụng kỷ thuật chọn mẫu ngẫu
nhiên, hãy tính cỡ mẫu cần thiết cho
cuộc điều tra này. Biết rằng tỷ lệ SDD
chung của quốc gia là 30%, độ tin cậy là
95%, sai số tuyệt đối là 5%.
42
Cách tính cỡ mẫu
2
2
2/1
)1(
d
ppZn −×=
−α
Cỡ mẫu Tỷ lệ ước đoán
Khoảng
sai lệch
Mức ý nghĩa
thống kê
Hệ số tin cậy
0,050,05
1,96
0,3
323
43
Ước lượng tỷ lệ với sai số tương
đối
ε là một tỷ lệ sai số so với p (0,1 – 0,4)
2
2
2/1 ).(
)1(
εα p
ppZn −×=
−
2
2
2/1
.
1
εα p
pZn −=
−
44
Quần thể hữu hạn
P là kích thước của dân số đích và
Nhc là cỡ mẫu sau khi đã hiệu chỉnh
Với ví dụ trên, dân số trẻ dưới 5 tuổi
trong huyện là 1000 thì số trẻ cần cho
nghiên cứu?
PN
PNNhc +
×
=
45
Cỡ mẫu cho việc kiểm định 1 tỷ lệ
2
0
2
1002/1
)(
})1()1({
pp
ppZppZ
n
a
aa
−
−+−
=
−− βα
p0 là tỷ lệ cần kiểm định
pa là tỷ lệ thật trong quần thể
α: là xác suất của việc phạm phải sai lầm loại I
β: Là xác suất của việc phạm phải sai lầm loại II.
1- β gọi là lực mẫu
Lực mẫu là 80%; Z=0,86
Lực mẫu là 90%; Z=1,28
Lực mẫu là 95%; Z=1,65
46
Giả sử tỷ lệ thành công trong phẫu thuật của
một loại tim mạch đã được báo cáo trong y
văn là 70%. Một phương pháp mới điều trị
nội khoa đang được đề nghị có hiệu quả
tương đương. Một bệnh viện không có
phương tiện phẫu thuật nên muốn áp dụng
phương pháp điều trị mới. Muốn 90% khả
năng để chứng minh tác dụng tương đương
của phác đồ điều trị nội khoa so với phẫu
thuật, với độ chính xác là 10%, ở mức tin cậy
là 95%, cỡ mẫu là bao nhiêu
47
Cỡ mẫu cho việc kiểm định 1 tỷ lệ
2
0
2
1002/1
)(
})1()1({
pp
ppZppZ
n
a
aa
−
−+−
=
−− βα
p0 = 0,7
pa = 0,8 hoặc 0,6
α = 0,05; z0,975 =1,96
1- β = 90%; Z=1,28
thế các số liệu vào công thức:
n = 200 và 233. Chọn n = 233
48
Cỡ mẫu cho nghiên cứu bệnh
chứng
c l
ng t s
chênh
−
+
−−
=
−
)1(
1
)1(
1
)1ln( 22112
2
2/1
pppp
Z
n
ε
α
)1( 11
1
2 ppOR
pORp
−+×
×
=Trong đó
49
Kim đnh t s
chênh
Cỡ mẫu cho nghiên cứu bệnh
chứng
2
21
2
22111222/1
)(
})1()1()1(2{
pp
ppppZppZ
n
−
−+−+−
=
−− βα
50
Cỡ mẫu cho nghiên cứu đoàn hệ
c l
ng nguy cơ t
ơng đ
i
−
+
−
−
=
−
2
2
1
1
2
2
2/1 )1()1(
)1ln( p
p
p
pZ
n
ε
α
51
Kim đnh nguy cơ t
ơng đ
i
Cỡ mẫu cho nghiên cứu đoàn hệ
2
21
2
22111
**
2/1
)(
})1()1()1(2{
pp
ppppZppZ
n
−
−+−+−
=
−− βα
p*= (p1 + p2 )/2
52
Cỡ mẫu trong nghiên cứu đối
với giá trị trung bình
C mu cho vic
c tính giá tr
trung bình trong qun th
2
2
2
2/1 d
Zn σα−=
n: là cỡ mẫu nghiên cứu cần có
σ: Độ lệch chuẩn quần thể
53
Cỡ mẫu trong nghiên cứu đối
với giá trị trung bình
C mu cho vic kim đnh mt
trung bình dân s
2
0
2
12/1
2
)(
)(
a
ZZ
n
µµ
σ βα
−
+
=
−−
54
Hiệu lực thiết kế (Design Effect): D
Sử dụng trong nhiều trường hợp chọn
mẫu: mẫu cụm, chọn mẫu nhiều giai
đoạn.
Đễ đảm bảo tính chính xác của mẫu,
nhà nghiên cứu thường nhân cỡ mẫu
với một hệ số gọi là hiệu lực thiết kế
(ký hiệu D).
Giá trị của D: 1,5 - 2Thông thường
chọn D = 2.
55
Tiêu chí đưa vào và loại ra
Tiêu Chí Đưa Vào
Những thuộc tính cuả dân số mục tiêu
Tiêu Chí Loại Ra
Những thuộc tính không phù hợp
Không là phần phụ của tiêu chí đưa vào
THỰC TRẠNG BỆNH ĐÁI THÁO ĐƯỜNG VÀ
CÁC YẾU TỐ NGUY CƠ Ở LỨA TUỔI 25 – 64
TẠI THÀNH PHỐ CẦN THƠ NĂM 2005
Đề tài
57
MỤC TIÊU NGHIÊN CỨU
1. Xác định tỷ lệ hiện mắc bệnh ĐTĐ của
người dân trong độ tuổi từ 25 – 64 tại
thành phố Cần Thơ.
2. Xác định một số yếu tố nguy cơ gây bệnh
ĐTĐ ở người dân trong độ tuổi từ 25 – 64
và đánh giá mức độ liên quan qua lại của
các yếu tố nguy cơ này đối với bệnh ĐTĐ.
58
Tiêu chí lựa chọn: Người dân trong độ
tuổi từ 25 – 64 tuổi, có hộ khẩu thường
trú tại thành phố Cần Thơ.
Các trường hợp loại trừ: Các đối
tượng nằm bệnh viện, bỏ địa bàn, bị
giam giữ, dị tật.
Đối tượng nghiên cứu?
59
Học viên thảo luận
1. Xác định quần thể đích, quần thể
nghiên cứu, khung mẫu (nếu có) cho
nghiên cứu của nhóm.
2. Tiêu chí chọn mẫu; tiêu chí loại trừ
3. Lựa chọn phương pháp chọn mẫu
thích hợp: Mô tả cụ thể
4. Tính cỡ mẫu