Mẫu và phương pháp chọn mẫu

Xác định được quần thể đích, quẩn thể nghiên cứu,đơn vị mẫu 2. Lựa chọn được phương pháp chọn mẫu thích hợp 3. Dự kiến được các loại sai số trong quá trình chọn mẫu và các biện pháp khắc phục. 4. Tính được cỡ mẫu cho một nghiên cứu

pdf59 trang | Chia sẻ: tranhoai21 | Lượt xem: 1841 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Mẫu và phương pháp chọn mẫu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
MẪU VÀ PHƯƠNG PHÁP CHỌN MẪU Ths Lê Minh Hữu 2Mục tiêu học tập 1. Xác định được quần thể đích, quẩn thể nghiên cứu, đơn vị mẫu 2. Lựa chọn được phương pháp chọn mẫu thích hợp 3. Dự kiến được các loại sai số trong quá trình chọn mẫu và các biện pháp khắc phục. 4. Tính được cỡ mẫu cho một nghiên cứu 3Khái niệm Quần thể NC Mẫu Chọn ? ? Quần thể đích 4Đơn vị lấy mẫu, khung mẫu Đơn vị lấy mẫu: là đơn vị của quần thể được chọn vào mẫu Khung mẫu: Danh sách các đơn vị mẫu hoặc bản đồ phân bố mẫu. Đơn vị nghiên cứu: là một chủ thể mà sự quan sát hoặc đo lường sẽ được thực hiện trên chủ thể (người hoặc vật thí nghiệm) 5Nghiên cứu về sử dụng hố xí tại xã X 200 hộ Chủ hộ Đại diện hgđ PVDanh sách Các hộ gia đình trong xã Chọn Đơn vị lấy mẫu Khung mẫu Đơn vị NC 6Không đủ kinh phí Sai số trong điều tra toàn thể Mẫu đủ lớn sẽ ngoại suy ra toàn quần thể Lý do chọn mẫu 7CÁC PHƯƠNG PHÁP CHỌN MẪU 8Các phương pháp chọn mẫu Chọn mẫu có xác suất Ngẫu nhiên đơn Ngẫu nhiên hệ thống Phân tầng Mẫu cụm Nhiều giai đoạn Chọn mẫu không xác suất Thuận tiện Chỉ tiêu Mục đích 9Chọn mẫu ngẫu nhiên đơn 10 Là mẫu mà tất cả các thể trong quần thể có cùng cơ hội để chọn vào mẫu. Cách chọn: Lập danh sách toàn bộ những đơn vị mẫu trong quần thể Sử dụng phương pháp “bốc thăm” hoặc sử dụng bảng số ngẫu nhiên để chọn đơn vị mẫu Chọn mẫu ngẫu nhiên đơn 11 Chọn mẫu ngẫu nhiên đơn Ưu điểm: Cách làm đơn giản, tính đại diện cao Có thể lòng vào các kỷ thuật chọn mẫu khác Hạn chế: Cần phải có khung mẫu Các cá thể được chọn vào mẫu có thể phân bố tản mạn. 12 Chọn mẫu ngẫu nghiên hệ thống Sampling interval’s width is determined and individuals selected. 13 Chọn mẫu ngẫu nghiên hệ thống Những cá thể được chọn theo một khoảng cách đều đặn Cách chọn Ghi một danh sách đơn vị mẫu Xác định khoảng cách mẫu k=N/n Chọn một số ngẫu nhiên (i) giữa 1 và k. Các cá thể có số thứ tự i + 1k, i + 2k, i + 3k... sẽ được chọn vào mẫu 14 Chọn mẫu phân tầng 15 Chọn mẫu phân tầng Là việc phân chia các cá thể của quần thể nghiên cứu thành các nhóm riêng lẽ Lý do phân tầng: Có sự khác biệt về đặc tính nghiên cứu của các cá thể ở các tầng Tầng có thể phân chia theo: Khu vực địa lý, giới, tuổi, nghề nghiệp Ví dụ: Để khảo sát các yếu tố nguy cơ gây bệnh Đái tháo đường tại thành phố CT, nhà nghiên cứu có thể phân chia tầng theo thành thị và nông thôn 16 Cách chọn mẫu tầng Thành phố CT Nông thôn Thành thị PhườngXã 17 Cluster sample Chọn mẫu chùm (cụm) 18 Chọn mẫu chùm (cụm) Do không có khung mẫu hoặc nghiên cứu trên địa bàn rộng Có được các nhóm của các đơn vị nghiên cứu có sẵn (các làng, các trường học) Việc chọn những nhóm các đơn vị nghiên cứu (các cụm) thay cho việc chọn cá nhân những đơn vị nghiên cứu. 19 Chọn mẫu chùm (cụm) Các cụm thường là những đơn vị địa lý (xã, ấp/khu vực) hoặc những đơn vị tổ chức (các phòng khám, trường học). Số lượng cụm, tuỳ vào số cụm. Nên chọn 30 Ví dụ: Chọn mẫu cụm trong xác định tỷ lệ bao phủ tiêm chủng trẻ dưới 5 tuổi của tỉnh X 20 Dân số chọn mẫu Mẫu cụm bậc 1 Mẫu cụm bậc 2 Chọn mẫu chùm (cụm) 21 Chọn mẫu PPS – Xác suất tỷ lệ với kích cỡ của quần thể  Sử dụng khi nghiên cứu trên cộng đồng lớn, kích thước các cộng đồng không đều nhau  Các bước thực hiện 1. Liệt kê các cụm và dân số 2. Xếp các cụm theo một trình tự và cộng dồn 3. Chọn khoảng cách mẫu k = Dscd/số cụm 4. Chọn ngẫu nhiên con số i nào đó, chọn cụm đầu tiên có dân số cộng dồn lớn hơn hoặc bằng i 5. Các cụm kế tiếp tính bằng cách lấy i + k 22 Ví dụ Một nghiên cứu về tình trạng sâu răng của học sinh tiểu học tại quận Ninh kiều TPCT. Cỡ mẫu: 300 học Số lượng trường tiểu học là 10 Số lượng trường tiểu học cần chọn là 4 Các bước chọn theo PPS? 23 Tên trường và số lượng học sinh Tên Trường Số lượng 1 400 2 700 3 800 4 1200 5 1800 6 300 7 800 8 900 9 1100 10 1000 Tổng 9000 24 Cộng dồn Tên Trường Số lượng Cộng dồn 1 400 400 2 700 1100 3 800 1900 4 1200 3100 5 1800 4900 6 300 5200 7 800 6000 8 900 6900 9 1100 8000 10 1000 9000 Tổng 9000 25 Tính khoảng cách k Tên Trường Số lượng Cộng dồn Khoảng cách k 1 400 400 2250 2 700 1100 3 800 1900 4 1200 3100 5 1800 4900 6 300 5200 7 800 6000 8 900 6900 9 1100 8000 10 1000 9000 Tổng 9000 26 Chọn số ngẫu nhiên i <= k Tên Trường Số lượng Cộng dồn Khoảng cách Chọn cụm 1 400 400 2250 2 700 1100 679 3 800 1900 4 1200 3100 5 1800 4900 6 300 5200 7 800 6000 8 900 6900 9 1100 8000 10 1000 9000 Tổng 9000 27 Chọn các cụm còn lại Tên Trường Số lượng Cộng dồn Khoảng cách Chọn cụm 1 400 400 2250 2 700 1100 679 3 800 1900 4 1200 3100 2929 5 1800 4900 6 300 5200 5179 7 800 6000 8 900 6900 9 1100 8000 7429 10 1000 9000 Tổng 9000 28 Tính tổng học sinh của các trường được chọn Tên Trường Số lượng Cộng dồn Khoảng cách Chọn cụm Mẫu 1 400 400 2250 2 700 1100 679 3 800 1900 4 1200 3100 2929 5 1800 4900 6 300 5200 5179 7 800 6000 8 900 6900 9 1100 8000 7429 10 1000 9000 Tổng 9000 3300 0 29 Tính cỡ mẫu cho các trường ni= (n x Ni)/N Tên Trường Số lượng Cộng dồn Khoảng cách Chọn cụm Mẫu 1 400 400 2250 2 700 1100 679 64 3 800 1900 4 1200 3100 2929 109 5 1800 4900 6 300 5200 5179 27 7 800 6000 8 900 6900 9 1100 8000 7429 100 10 1000 9000 Tổng 9000 3300 300 30 Chọn mẫu nhiều giai đoạn Trong những quần thể rất lớn và rải khắp mẫu có thể được tiến hành theo hai hoặc nhiều giai đoạn Thường là những nghiên cứu dựa trên cộng đồng, trong đó người được phỏng vấn thuộc những làng khác nhau, và những làng này đã được chọn từ những khu vực khác nhau 31 Ví dụ Ví dụ: ĐBSCL có 13 tỉnh, mỗi tỉnh có nhiều huyện, mỗi huyện có nhiều xã... Giai đọan 1: Chọn ngẫu nhiên 3 tỉnh; Giai đọan 2: Chọn ngẫu nhiên 2 huyện từ các tỉnh đã được chọn ở giai đoạn 1 Giai đọan 3: Chọn ngẫu nhiên 2 xã từ các huyện đã được chọn ở giai đoạn 2,... Giai đoạn 4: Chọn ngẫu nhiên 2 ấp từ xã Giai đoạn 5: Chọn ngẫu nhiên 30 cá thể từ mỗi ấp 32 Chọn mẫu không xác xuất Chn mu thun tin Đạt được trên cơ sở các cá thể có sẵn khi thu thập số liệu. Ví dụ: Tất cả các bệnh nhân đến khám tại phòng khám hằng ngày. Đây là cách chọn mẫu hay gặp trong nghiên cứu lâm sàng. 33 Chọn mẫu không xác xuất Chn mu ch tiêu Là phương pháp đảm bảo rằng một số nhất định các đơn vị mẫu từ các loại khác nhau của quần thể nghiên cứu với các tính đạc trưng sẽ có mặt trong mẫu. 34 Chọn mẫu không xác xuất Chn mu mc đích Nhà nghiên cứu đã xác định trước các nhóm quan trọng để tiến hành thu thập số liệu. Các nhóm khác nhau sẽ có tỷ lệ mẫu khác nhau. Đây là cách hay dùng trong các điều tra thăm dò, phỏng vấn sâu. 35 Các sai số thường gặp trong chọn mẫu  Sự không đáp ứng  Nghiên cứu với người tình nguyện  Sai số do mùa  Sai số do đường xá 36 Sự không đáp ứng  Là hiện tượng các cá thể từ chối tham gia nghiên cứu. Thường hay gặp trong thử nghiệm lâm sàng Cách khắc phục: Chuẩn hoá phương pháp thu thập số liệu Giải thích các đối tượng trước khi thu thập số liệu Nếu vằng mặt thì người điều tra phải quay lại gặp cho bằng được. Nếu đối tượng không muốn hợp tác thì phải xem xét lại đối tượng này để tìm ra các đặc điểm khác với những đối tượng tham gia. Có thể chọn thêm đối tượng vào mẫu để thay thế những người không tham gia. 37 CỠ MẪU 38 Các yếu tố ảnh hưởng đến cỡ mẫu Loại thiết kế nghiên cứu Phương pháp chọn mẫu Độ lớn của tham số được nghiên cứu Mức độ sai lệch tham số mẫu và tham số quần thể Khả năng thực thi 39 Cỡ mẫu cho việc ước tính tỷ lệ trong quần thể 2 2 2/1 )1( d ppZn −×= −α Cỡ mẫu Tỷ lệ ước đoán Khoảng sai lệch Mức ý nghĩa thống kê Hệ số tin cậy 0,1 0,05 0,05 0,01 40 Giá trị Z Giá trị Z thu được từ bằng cách tra bảng Z Với α = 0,1 ; Z = 1,645 Với α = 0,05; Z = 1,96 Với α = 0,01; Z= 2,58 41 Ví dụ Trưởng phòng y tế huyện muốn xác định tỷ lệ SDD của trẻ dưới 5 tuổi trong huyện hiện tại là bao nhiêu. Giả sử rằng bạn sử dụng kỷ thuật chọn mẫu ngẫu nhiên, hãy tính cỡ mẫu cần thiết cho cuộc điều tra này. Biết rằng tỷ lệ SDD chung của quốc gia là 30%, độ tin cậy là 95%, sai số tuyệt đối là 5%. 42 Cách tính cỡ mẫu 2 2 2/1 )1( d ppZn −×= −α Cỡ mẫu Tỷ lệ ước đoán Khoảng sai lệch Mức ý nghĩa thống kê Hệ số tin cậy 0,050,05 1,96 0,3 323 43 Ước lượng tỷ lệ với sai số tương đối ε là một tỷ lệ sai số so với p (0,1 – 0,4) 2 2 2/1 ).( )1( εα p ppZn −×= − 2 2 2/1 . 1 εα p pZn −= − 44 Quần thể hữu hạn P là kích thước của dân số đích và Nhc là cỡ mẫu sau khi đã hiệu chỉnh Với ví dụ trên, dân số trẻ dưới 5 tuổi trong huyện là 1000 thì số trẻ cần cho nghiên cứu? PN PNNhc + × = 45 Cỡ mẫu cho việc kiểm định 1 tỷ lệ 2 0 2 1002/1 )( })1()1({ pp ppZppZ n a aa − −+− = −− βα  p0 là tỷ lệ cần kiểm định  pa là tỷ lệ thật trong quần thể α: là xác suất của việc phạm phải sai lầm loại I β: Là xác suất của việc phạm phải sai lầm loại II.  1- β gọi là lực mẫu Lực mẫu là 80%; Z=0,86 Lực mẫu là 90%; Z=1,28 Lực mẫu là 95%; Z=1,65 46 Giả sử tỷ lệ thành công trong phẫu thuật của một loại tim mạch đã được báo cáo trong y văn là 70%. Một phương pháp mới điều trị nội khoa đang được đề nghị có hiệu quả tương đương. Một bệnh viện không có phương tiện phẫu thuật nên muốn áp dụng phương pháp điều trị mới. Muốn 90% khả năng để chứng minh tác dụng tương đương của phác đồ điều trị nội khoa so với phẫu thuật, với độ chính xác là 10%, ở mức tin cậy là 95%, cỡ mẫu là bao nhiêu 47 Cỡ mẫu cho việc kiểm định 1 tỷ lệ 2 0 2 1002/1 )( })1()1({ pp ppZppZ n a aa − −+− = −− βα p0 = 0,7 pa = 0,8 hoặc 0,6 α = 0,05; z0,975 =1,96 1- β = 90%; Z=1,28 thế các số liệu vào công thức: n = 200 và 233. Chọn n = 233 48 Cỡ mẫu cho nghiên cứu bệnh chứng  c l ng t s chênh       − + −− = − )1( 1 )1( 1 )1ln( 22112 2 2/1 pppp Z n ε α )1( 11 1 2 ppOR pORp −+× × =Trong đó 49 Kim đnh t s chênh Cỡ mẫu cho nghiên cứu bệnh chứng 2 21 2 22111222/1 )( })1()1()1(2{ pp ppppZppZ n − −+−+− = −− βα 50 Cỡ mẫu cho nghiên cứu đoàn hệ  c l ng nguy cơ t ơng đ i       − + − − = − 2 2 1 1 2 2 2/1 )1()1( )1ln( p p p pZ n ε α 51 Kim đnh nguy cơ t ơng đ i Cỡ mẫu cho nghiên cứu đoàn hệ 2 21 2 22111 ** 2/1 )( })1()1()1(2{ pp ppppZppZ n − −+−+− = −− βα p*= (p1 + p2 )/2 52 Cỡ mẫu trong nghiên cứu đối với giá trị trung bình C mu cho vic c tính giá tr trung bình trong qun th 2 2 2 2/1 d Zn σα−= n: là cỡ mẫu nghiên cứu cần có σ: Độ lệch chuẩn quần thể 53 Cỡ mẫu trong nghiên cứu đối với giá trị trung bình C mu cho vic kim đnh mt trung bình dân s 2 0 2 12/1 2 )( )( a ZZ n µµ σ βα − + = −− 54 Hiệu lực thiết kế (Design Effect): D  Sử dụng trong nhiều trường hợp chọn mẫu: mẫu cụm, chọn mẫu nhiều giai đoạn.  Đễ đảm bảo tính chính xác của mẫu, nhà nghiên cứu thường nhân cỡ mẫu với một hệ số gọi là hiệu lực thiết kế (ký hiệu D).  Giá trị của D: 1,5 - 2Thông thường chọn D = 2. 55 Tiêu chí đưa vào và loại ra Tiêu Chí Đưa Vào  Những thuộc tính cuả dân số mục tiêu Tiêu Chí Loại Ra  Những thuộc tính không phù hợp  Không là phần phụ của tiêu chí đưa vào THỰC TRẠNG BỆNH ĐÁI THÁO ĐƯỜNG VÀ CÁC YẾU TỐ NGUY CƠ Ở LỨA TUỔI 25 – 64 TẠI THÀNH PHỐ CẦN THƠ NĂM 2005 Đề tài 57 MỤC TIÊU NGHIÊN CỨU 1. Xác định tỷ lệ hiện mắc bệnh ĐTĐ của người dân trong độ tuổi từ 25 – 64 tại thành phố Cần Thơ. 2. Xác định một số yếu tố nguy cơ gây bệnh ĐTĐ ở người dân trong độ tuổi từ 25 – 64 và đánh giá mức độ liên quan qua lại của các yếu tố nguy cơ này đối với bệnh ĐTĐ. 58  Tiêu chí lựa chọn: Người dân trong độ tuổi từ 25 – 64 tuổi, có hộ khẩu thường trú tại thành phố Cần Thơ.  Các trường hợp loại trừ: Các đối tượng nằm bệnh viện, bỏ địa bàn, bị giam giữ, dị tật. Đối tượng nghiên cứu? 59 Học viên thảo luận 1. Xác định quần thể đích, quần thể nghiên cứu, khung mẫu (nếu có) cho nghiên cứu của nhóm. 2. Tiêu chí chọn mẫu; tiêu chí loại trừ 3. Lựa chọn phương pháp chọn mẫu thích hợp: Mô tả cụ thể 4. Tính cỡ mẫu
Tài liệu liên quan