Chương 4: Chọn mẫu

Chọn mẫu là gì? – Chọn mẫu (sampling) là quá trình chọn lựa một bộ phận(thường nhỏ hơn tổng thể) có tính chất đại diện cho tổng thể để thực hiện nghiên cứu

pdf42 trang | Chia sẻ: lylyngoc | Lượt xem: 2238 | Lượt tải: 3download
Bạn đang xem trước 20 trang tài liệu Chương 4: Chọn mẫu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
1Chương 4: Chọn mẫu ThS. Trần Trí Dũng 2Nội dung 1. Khái niệm và quá trình chọn mẫu 2. Phân lọai phương pháp chọn mẫu 3. Chọn mẫu xác suất 4. Chọn mẫu phi xác suất 5. Xác định cở mẫu 31. Khái niệm và quá trình chọn mẫu z Chọn mẫu là gì? – Chọn mẫu (sampling) là quá trình chọn lựa một bộ phận (thường nhỏ hơn tổng thể) có tính chất đại diện cho tổng thể để thực hiện nghiên cứu. 41. Khái niệm và quá trình chọn mẫu z Vì sao phải chọn mẫu? – Tiết kiệm thời gian – Tiết kiệm chi phí – Nghiên cứu trên mẫu nhiều lúc chính xác hơn – Cần thiết trong những nghiên cứu mà kết quả khảo sát sẽ dẫn đến thay đổi thuộc tính hay phá họai đối tượng nghiên cứu 51. Khái niệm và quá trình chọn mẫu (tt) z Các lọai sai số trong nghiên cứu 61. Khái niệm và quá trình chọn mẫu (tt) z Các lọai sai số trong nghiên cứu (tt) Sai số lấy mẫu Sai số không lấy mẫu Sai số lấy mẫu Sai số không lấy mẫu Sai số lấy mẫu Sai số không lấy mẫu Sai số không lấy mẫuTổng thể điều tra Tăng kích thước mẫu 71. Khái niệm và quá trình chọn mẫu (tt) z Mục tiêu (yêu cầu) của mẫu: – Tính ổn định z Các mẫu với những kích thước giống nhau được lấy theo những cách khác nhau phải dẫn đến những kết quả giống nhau. – Tính đại diện z Mẫu phải chứa đựng những đặc điểm then chốt của tổng thể. 81. Khái niệm và quá trình chọn mẫu (tt) z Các khái niệm cơ bản: – Phần tử (element): đơn vị mà nhà NC cần quan sát và thu thập dữ liệu (cá nhân, hộ gia đình, doanh nghiệp,…) – Tổng thể (population): tập hợp tất cả các phần tử được định nghĩa là thuộc phạm vi NC 91. Khái niệm và quá trình chọn mẫu (tt) z Các khái niệm cơ bản: – Tổng thể nghiên cứu (study population): tập hợp những phần tử thuộc tổng thể mà thực tế có thể nhận dạng và lấy mẫu được – Đơn vị lấy mẫu (sampling unit): một hay một nhóm các phần tử để từ đó thực hiện việc lấy mẫu trong mỗi giai đọan lấy mẫu 10 1. Khái niệm và quá trình chọn mẫu (tt) z Các khái niệm cơ bản: – Khung mẫu (sampling frame): danh sách các đơn vị lấy mẫu có sẵn phục vụ cho việc lấy mẫu 11 1. Khái niệm và quá trình chọn mẫu (tt) z Quá trình chọn mẫu Xác định tổng thể NC và phần tử Xác định khung mẫu Xác định phương pháp chọn mẫu Xác định kích thước mẫu Chọn mẫu 12 1. Khái niệm và quá trình chọn mẫu (tt) z Bước 1: Xác định tổng thể và phần tử. – Việc xác định tổng thể phải rõ ràng và phải được mô tả theo những giới hạn có thể được xác định. 13 1. Khái niệm và quá trình chọn mẫu (tt) z Bước 2: Xác định khung mẫu – “Khung” theo một nghĩa nào đó dùng để giới hạn tổng thể. – Một “khung” có thể là một danh sách các thành viên thích hợp cho việc lấy mẫu trong tổng thể. – Một bảng liệt kê tất cả mọi phần tử trong tổng thể là một khung hòan chỉnh. 14 1. Khái niệm và quá trình chọn mẫu (tt) z Bước 3: Lựa chọn phương pháp lấy mẫu – Hai tính chất được chú ý nhất của mẫu là: tính đại diện và tính ổn định của mẫu. – Việc lựa chọn phương pháp lấy mẫu sẽ tùy thuộc vào: đối tượng nghiên cứu, chi phí cho nghiên cứu, thời gian nghiên cứu, bản chất vấn đề và khả năng (chuyên môn) của người nghiên cứu. – Có 2 phương pháp lấy mẫu tổng quát là: Phương pháp xác suất và phương pháp phi xác suất. 15 1. Khái niệm và quá trình chọn mẫu (tt) z Bước 4: Xác định kích thước mẫu – Được thảo luận chi tiết ở phần Xác định cở mẫu 16 1. Khái niệm và quá trình chọn mẫu (tt) z Bước 5: Lấy mẫu – Những chỉ dẫn rõ ràng và chính xác về kích thước mẫu, đối tượng lấy mẫu,… sẽ rất cần thiết nếu người thực hiện lấy mẫu tại hiện trường không phải là người thực hiện nghiên cứu. 17 2. Phân lọai phương pháp chọn mẫu z Phương pháp chọn mẫu theo xác suất (probability sampling): – Biết trước xác suất xuất hiện các phần tử – Quá trình chọn mẫu tuân theo một quy luật, không thể tự ý thay đổi – Các thông số của mẫu có thể được dùng để ước lượng/kiểm nghiệm các thông số của tổng thể 18 2. Phân lọai phương pháp chọn mẫu z Phương pháp chọn mẫu phi xác suất (non- probability sampling): – Chọn các phần tử vào mẫu không theo quy luật ngẫu nhiên – Không biết xác suất xuất hiện của các phần tử. Mẫu được chọn tùy thuộc vào nhà nghiên cứu – Không thể dùng các tham số của mẫu để ước lượng/kiểm nghiệm các thông số của tổng thể 19 2. Phân lọai phương pháp chọn mẫu z Các câu hỏi: – Câu 1: Phương pháp lấy mẫu nào có độ chính xác hơn? – Câu 2: Nghiên cứu ứng dụng hay nghiên cứu cơ bản đòi hỏi nghiêm ngặt tính đại diện của mẫu hơn? 20 2. Phân lọai phương pháp chọn mẫu z Các câu hỏi: – “There is no guarantee that the results obtained with a probability sample will be more accurate than those obtained with a nonprobability sample. What the former allows the researcher to do is to measure the amount of sampling error likely to occur in the sample. This provides a measure of the accuracy of the sample result. With nonprobability sampling no such error measure exists” (Kinnear & Taylor, p.207) 21 2. Phân lọai phương pháp chọn mẫu z Tóm tắt các phương pháp chọn mẫu Lấy mẫu theo mầm (snow ball)Theo nhóm (cluster) Lấy mẫu theo lớp (quota)Phân tầng (stratified random) Lấy mẫu phán đóan (judgement)Hệ thống (systematic) Lấy mẫu thuận tiện (convenience) Ngẫu nhiên đơn giản (simple random) Chọn mẫu phi xác suấtChọn mẫu xác suất 22 3. Chọn mẫu theo xác suất z Chọn mẫu ngẫu nhiên đơn giản: – Các phần tử được chọn vào mẫu có xác suất như nhau và biết trước – Ưu điểm: đơn giản – Nhược điểm: khó khả thi nếu có một tổng thể lớn 23 3. Chọn mẫu theo xác suất (tt) z Chọn mẫu hệ thống: – Chọn ngẫu nhiên một điểm xuất phát (starting point) và dựa vào bước nhảy (sampling interval) để xác định các phần tử tiếp theo từ khung mẫu – Ưu điểm: không cần khung mẫu hòan chỉnh – Nhược điểm: mẫu sẽ bị lệch khi khung mẫu xếp theo chu kỳ và tần số bẳng với bước nhảy 24 3. Chọn mẫu theo xác suất (tt) z Chọn mẫu phân tầng ngẫu nhiên: – Tổng thể được chia ra thành nhiều tầng (strata) theo quy tắc: “cùng tầng đồng nhất, khác tầng dị biệt” – Để chọn phần tử trong mỗi tầng, có thể dùng phương pháp chọn mẫu hệ thống hay ngẫu nhiên – Số phần tử trong mỗi tầng được xác định theo tỷ lệ hoặc không theo tỷ lệ với kích thước tổng thể. z Phân tầng ngẫu nhiên theo tỷ lệ: Số phần tử trong mỗi tầng tỷ lệ với quy mô của mỗi tầng trong tổng thể. z Phân tầng ngẫu nhiên không theo tỷ lệ: Sử dụng khi độ phân tán các phần tử trong mỗi tầng khác nhau đáng kể và khi không biết tỷ lệ của mỗi tầng trong tổng thể. 25 3. Chọn mẫu theo xác suất (tt) z Chọn mẫu theo nhóm (cluster sampling): – Tổng thể được chia làm nhiều nhóm (mỗi nhóm mang tính đại diện cho tổng thể) và tuân theo nguyên tắc: “cùng nhóm dị biệt, khác nhóm đồng nhất”. – Các nhóm sẽ được chọn một cách ngẫu nhiên để tạo thành mẫu. – Có thể phân nhóm nhiều bước: tiếp tục chọn nhóm con trong nhóm và các phần tử trong nhóm con, v.v. (multi– stage cluster sampling) – Chọn mẫu theo khu vực (area sampling): một dạng của chọn mẫu theo nhóm, với các nhóm được chia theo khu vực địa lý. 26 4. Chọn mẫu phi xác suất z Chọn mẫu thuận tiện (convenience sampling): – Chọn phần tử dựa trên sự thuận tiện, dễ tiếp cận, dễ lấy thông tin. – Nhược điểm: Không xác định được sai số lấy mẫu và không thể kết luận cho tổng thể từ kết quả mẫu. – Sử dụng phổ biến khi bị giới hạn về thời gian và chi phí. 27 4. Chọn mẫu phi xác suất (tt) z Chọn mẫu phán đóan (judgement): – Nhà nghiên cứu tự phán đoán sự thích hợp của các phần tử để mời họ tham gia vào mẫu. – Đặc điểm giống như chọn mẫu thuận tiện, nhưng nếu khả năng/kinh nghiệm phán đoán tốt sẽ cho mẫu tốt hơn thuận tiện. 28 4. Chọn mẫu phi xác suất (tt) z Chọn mẫu theo lớp (quota sampling): – Dựa vào một số thuộc tính kiểm soát (control characteristics), xác định một số phần tử sao cho chúng đảm bảo tỷ lệ của tổng thể và các đặc trưng kiểm soát. – Sử dụng phổ biến nhất trong thực tiễn NC. – Có thể dùng 1 hoặc nhiều thuộc tính kiểm soát như tuổi, giới tính, thu nhập, loại hình DN,… 29 4. Chọn mẫu phi xác suất (tt) z Chọn mẫu theo mầm (snow ball): – Chọn ngẫu nhiên những người phỏng vấn ban đầu, những người tiếp theo được chọn dựa trên sự giới thiệu của người trước. – Sử dụng thích hợp khi: tổng thể ít, khó nhận ra các đối tượng cần thu thập thông tin. 30 5. Xác định cở mẫu z Đặc điểm của quá trình xác định cở mẫu: – Đánh đổi giữa sai số cho phép và chi phí cho nghiên cứu. – Chọn mẫu đủ lớn để có thể ước lượng một cách tương đối chính xác giá trị của tổng thể những không lãng phí quỹ nghiên cứu vào các mẫu quá lớn và không cần thiết. – Việc xác định cở mẫu phải xét đến nhiều yếu tố, gồm cả yếu tố định lượng và yếu tố định tính. 31 5. Xác định cở mẫu (tt) z Quá trình xác định cở mẫu Xác định sai số e chấp nhận được giữa ước lượng của mẫu và tổng thể Xác định độ tin cậy α muốn có trong ước lượng mẫu nằm trong sai số e Xác định giá trị Z tương ứng với độ tin cậy muốn có đã quyết định Ước tính độ lệch chuẩn của tổng thể Tỷ lệ p và q (trong trường hợp biến tỷ lệ) Dùng công thức thống kê tương ứng Tính cỡ mẫu 32 5. Xác định cở mẫu (tt) z Bước 1: Xác định sai số e chấp nhận được giữa ước lượng của mẫu và của tổng thể – Xác định sai số e cho phép: phụ thuộc vào độ nhạy của kết quả quyết định đối với biến ước lượng đang khảo sát. – Thường từ: 10 - 20% của đơn vị đo nhỏ nhất – Ví dụ: KFC định mở một cửa hàng tại một vùng dân cư mới. Quyết định có mở hay không phụ thuộc vào thu nhập trung bình của người dân sống trong khu vực đó. Giả sử nếu thu nhập trung bình từ 10triệu/tháng trở lên thì mở. Vấn đề đặt ra là xác định thu nhập trung bình của người dân với một sai số cho cho phép cho trước (1triệu chẳng hạn.) 33 5. Xác định cở mẫu (tt) z Bước 2: Xác định độ tin cậy α mong muốn – Mức tin cậy thường được chọn là 99%, 95% và 90%. – Trong thực tế thường chọn 95% Æ z = 1.96. Mức tin cậy cho phép kết quả nghiên cứu sai số 5% so với giá trị thực của tổng thể, và mức sai số này thường được chấp nhận đối với phần lớn các quyết định marketing. 34 5. Xác định cở mẫu (tt) z Bước 3: Xác định giá trị Z tương ứng 2.5899% 1.9695% 1.64590% Hằng số ZĐộ tin cậy 35 5. Xác định cở mẫu (tt) z Bước 4a: Ước tính độ lệch chuẩn của tổng thể (Trường hợp biến liên tục – thang đo metric scale: khỏang hoặc tỷ lệ) – Tiến hành nghiên cứu thí điểm, sử dụng độ lệch chuẩn của kết quả nghiên cứu thí điểm. Thường lấy khỏang 50 – 100 trường hợp. – Dựa vào kết quả của những nghiên cứu tương tự trước đó. – Sử dụng công thức theo quy tắc 3σ: 6 -σ MinMax= 36 5. Xác định cở mẫu (tt) z Bước 4b: Ước tính tỷ lệ p và q (Trường hợp biến tỷ lệ) – Trong đó: p: ước lượng tần số xuất hiện của hiện tượng q = 1 - p – Tiến hành nghiên cứu thí điểm, sử dụng tỷ lệ của kết quả nghiên cứu thí điểm. – Dựa vào kết quả của những nghiên cứu tương tự trước đó. 37 5. Xác định cở mẫu (tt) z Bước 5a: Xác định cở mẫu (Biến liên tục) – Sử dụng công thức tính mẫu: – Nếu n > 5% tổng thể thì tính lại theo công thức: = 2 2 e )S*Z(n + = 222 22 Z*Se*N S*Z*Nn 38 5. Xác định cở mẫu (tt) z Bước 5b: Xác định cở mẫu (Biến tỷ lệ) – Sử dụng công thức tính mẫu: – Nếu n > 5% tổng thể thì tính lại theo công thức: 2 2 ** e Zqpn= 22 2 *** *** ZqpeN ZqpNn += 39 5. Xác định cở mẫu (tt) z Xác định cở mẫu trong chọn mẫu phi xác suất: – Quyết định chọn mẫu phi xác suất thường được thực hiện một cách chủ quan. – Yếu tố then chốt cho việc lựa chọn là thời gian và tài chính. 40 5. Xác định cở mẫu (tt) z Những lưu ý khi xác định cở mẫu: – Khảo sát một và nhiều yếu tố/biến. – Tỷ lệ hồi đáp 41 Vấn đề thảo luận 1. Sai số không lấy mẫu đi vào dữ liệu điều tra theo những con đường nào? 2. Trị số trung bình mẫu có liên hệ với trung bình tổng thể như thế nào? 3. Những yếu tố nào nhà nghiên cứu phải tính đến khi xác định kích thước mẫu? 4. Những biện pháp nào làm tăng tỷ lệ hồi đáp? 42 The End