Chương 4: Chọn mẫu
Chọn mẫu là gì? – Chọn mẫu (sampling) là quá trình chọn lựa một bộ phận(thường nhỏ hơn tổng thể) có tính chất đại diện cho tổng thể để thực hiện nghiên cứu
Bạn đang xem trước 20 trang tài liệu Chương 4: Chọn mẫu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
1Chương 4: Chọn mẫu
ThS. Trần Trí Dũng
2Nội dung
1. Khái niệm và quá trình chọn mẫu
2. Phân lọai phương pháp chọn mẫu
3. Chọn mẫu xác suất
4. Chọn mẫu phi xác suất
5. Xác định cở mẫu
31. Khái niệm và quá trình chọn mẫu
z Chọn mẫu là gì?
– Chọn mẫu (sampling) là quá trình chọn lựa một
bộ phận (thường nhỏ hơn tổng thể) có tính chất
đại diện cho tổng thể để thực hiện nghiên cứu.
41. Khái niệm và quá trình chọn mẫu
z Vì sao phải chọn mẫu?
– Tiết kiệm thời gian
– Tiết kiệm chi phí
– Nghiên cứu trên mẫu nhiều lúc chính xác hơn
– Cần thiết trong những nghiên cứu mà kết quả
khảo sát sẽ dẫn đến thay đổi thuộc tính hay phá
họai đối tượng nghiên cứu
51. Khái niệm và quá trình chọn mẫu (tt)
z Các lọai sai số trong nghiên cứu
61. Khái niệm và quá trình chọn mẫu (tt)
z Các lọai sai số trong nghiên cứu (tt)
Sai số lấy mẫu Sai số không lấy mẫu
Sai số lấy mẫu Sai số không lấy mẫu
Sai số lấy mẫu Sai số không lấy mẫu
Sai số không lấy mẫuTổng thể điều
tra
Tăng kích
thước mẫu
71. Khái niệm và quá trình chọn mẫu (tt)
z Mục tiêu (yêu cầu) của mẫu:
– Tính ổn định
z Các mẫu với những kích thước giống nhau được lấy
theo những cách khác nhau phải dẫn đến những kết
quả giống nhau.
– Tính đại diện
z Mẫu phải chứa đựng những đặc điểm then chốt của
tổng thể.
81. Khái niệm và quá trình chọn mẫu (tt)
z Các khái niệm cơ bản:
– Phần tử (element): đơn vị mà nhà NC cần quan
sát và thu thập dữ liệu (cá nhân, hộ gia đình,
doanh nghiệp,…)
– Tổng thể (population): tập hợp tất cả các phần tử
được định nghĩa là thuộc phạm vi NC
91. Khái niệm và quá trình chọn mẫu (tt)
z Các khái niệm cơ bản:
– Tổng thể nghiên cứu (study population): tập hợp
những phần tử thuộc tổng thể mà thực tế có thể
nhận dạng và lấy mẫu được
– Đơn vị lấy mẫu (sampling unit): một hay một
nhóm các phần tử để từ đó thực hiện việc lấy
mẫu trong mỗi giai đọan lấy mẫu
10
1. Khái niệm và quá trình chọn mẫu (tt)
z Các khái niệm cơ bản:
– Khung mẫu (sampling frame): danh sách các đơn
vị lấy mẫu có sẵn phục vụ cho việc lấy mẫu
11
1. Khái niệm và quá trình chọn mẫu (tt)
z Quá trình chọn mẫu
Xác định tổng thể NC và phần tử
Xác định khung mẫu
Xác định phương pháp chọn mẫu
Xác định kích thước mẫu
Chọn mẫu
12
1. Khái niệm và quá trình chọn mẫu (tt)
z Bước 1: Xác định tổng thể và phần tử.
– Việc xác định tổng thể phải rõ ràng và phải được
mô tả theo những giới hạn có thể được xác định.
13
1. Khái niệm và quá trình chọn mẫu (tt)
z Bước 2: Xác định khung mẫu
– “Khung” theo một nghĩa nào đó dùng để giới hạn
tổng thể.
– Một “khung” có thể là một danh sách các thành
viên thích hợp cho việc lấy mẫu trong tổng thể.
– Một bảng liệt kê tất cả mọi phần tử trong tổng thể
là một khung hòan chỉnh.
14
1. Khái niệm và quá trình chọn mẫu (tt)
z Bước 3: Lựa chọn phương pháp lấy mẫu
– Hai tính chất được chú ý nhất của mẫu là: tính đại
diện và tính ổn định của mẫu.
– Việc lựa chọn phương pháp lấy mẫu sẽ tùy thuộc
vào: đối tượng nghiên cứu, chi phí cho nghiên
cứu, thời gian nghiên cứu, bản chất vấn đề và
khả năng (chuyên môn) của người nghiên cứu.
– Có 2 phương pháp lấy mẫu tổng quát là: Phương
pháp xác suất và phương pháp phi xác suất.
15
1. Khái niệm và quá trình chọn mẫu (tt)
z Bước 4: Xác định kích thước mẫu
– Được thảo luận chi tiết ở phần Xác định cở mẫu
16
1. Khái niệm và quá trình chọn mẫu (tt)
z Bước 5: Lấy mẫu
– Những chỉ dẫn rõ ràng và chính xác về kích
thước mẫu, đối tượng lấy mẫu,… sẽ rất cần thiết
nếu người thực hiện lấy mẫu tại hiện trường
không phải là người thực hiện nghiên cứu.
17
2. Phân lọai phương pháp chọn mẫu
z Phương pháp chọn mẫu theo xác suất
(probability sampling):
– Biết trước xác suất xuất hiện các phần tử
– Quá trình chọn mẫu tuân theo một quy luật,
không thể tự ý thay đổi
– Các thông số của mẫu có thể được dùng để ước
lượng/kiểm nghiệm các thông số của tổng thể
18
2. Phân lọai phương pháp chọn mẫu
z Phương pháp chọn mẫu phi xác suất (non-
probability sampling):
– Chọn các phần tử vào mẫu không theo quy luật
ngẫu nhiên
– Không biết xác suất xuất hiện của các phần tử.
Mẫu được chọn tùy thuộc vào nhà nghiên cứu
– Không thể dùng các tham số của mẫu để ước
lượng/kiểm nghiệm các thông số của tổng thể
19
2. Phân lọai phương pháp chọn mẫu
z Các câu hỏi:
– Câu 1: Phương pháp lấy mẫu nào có độ chính
xác hơn?
– Câu 2: Nghiên cứu ứng dụng hay nghiên cứu cơ
bản đòi hỏi nghiêm ngặt tính đại diện của mẫu
hơn?
20
2. Phân lọai phương pháp chọn mẫu
z Các câu hỏi:
– “There is no guarantee that the results obtained
with a probability sample will be more accurate
than those obtained with a nonprobability sample.
What the former allows the researcher to do is to
measure the amount of sampling error likely to
occur in the sample. This provides a measure of
the accuracy of the sample result. With
nonprobability sampling no such error measure
exists” (Kinnear & Taylor, p.207)
21
2. Phân lọai phương pháp chọn mẫu
z Tóm tắt các phương pháp chọn mẫu
Lấy mẫu theo mầm (snow ball)Theo nhóm (cluster)
Lấy mẫu theo lớp (quota)Phân tầng (stratified random)
Lấy mẫu phán đóan (judgement)Hệ thống (systematic)
Lấy mẫu thuận tiện
(convenience)
Ngẫu nhiên đơn giản (simple
random)
Chọn mẫu phi xác suấtChọn mẫu xác suất
22
3. Chọn mẫu theo xác suất
z Chọn mẫu ngẫu nhiên đơn giản:
– Các phần tử được chọn vào mẫu có xác suất như
nhau và biết trước
– Ưu điểm: đơn giản
– Nhược điểm: khó khả thi nếu có một tổng thể lớn
23
3. Chọn mẫu theo xác suất (tt)
z Chọn mẫu hệ thống:
– Chọn ngẫu nhiên một điểm xuất phát (starting
point) và dựa vào bước nhảy (sampling interval)
để xác định các phần tử tiếp theo từ khung mẫu
– Ưu điểm: không cần khung mẫu hòan chỉnh
– Nhược điểm: mẫu sẽ bị lệch khi khung mẫu xếp
theo chu kỳ và tần số bẳng với bước nhảy
24
3. Chọn mẫu theo xác suất (tt)
z Chọn mẫu phân tầng ngẫu nhiên:
– Tổng thể được chia ra thành nhiều tầng (strata) theo quy
tắc: “cùng tầng đồng nhất, khác tầng dị biệt”
– Để chọn phần tử trong mỗi tầng, có thể dùng phương pháp
chọn mẫu hệ thống hay ngẫu nhiên
– Số phần tử trong mỗi tầng được xác định theo tỷ lệ hoặc
không theo tỷ lệ với kích thước tổng thể.
z Phân tầng ngẫu nhiên theo tỷ lệ: Số phần tử trong mỗi tầng tỷ
lệ với quy mô của mỗi tầng trong tổng thể.
z Phân tầng ngẫu nhiên không theo tỷ lệ: Sử dụng khi độ phân
tán các phần tử trong mỗi tầng khác nhau đáng kể và khi
không biết tỷ lệ của mỗi tầng trong tổng thể.
25
3. Chọn mẫu theo xác suất (tt)
z Chọn mẫu theo nhóm (cluster sampling):
– Tổng thể được chia làm nhiều nhóm (mỗi nhóm mang tính
đại diện cho tổng thể) và tuân theo nguyên tắc: “cùng nhóm
dị biệt, khác nhóm đồng nhất”.
– Các nhóm sẽ được chọn một cách ngẫu nhiên để tạo thành
mẫu.
– Có thể phân nhóm nhiều bước: tiếp tục chọn nhóm con
trong nhóm và các phần tử trong nhóm con, v.v. (multi–
stage cluster sampling)
– Chọn mẫu theo khu vực (area sampling): một dạng của
chọn mẫu theo nhóm, với các nhóm được chia theo khu
vực địa lý.
26
4. Chọn mẫu phi xác suất
z Chọn mẫu thuận tiện (convenience
sampling):
– Chọn phần tử dựa trên sự thuận tiện, dễ tiếp cận,
dễ lấy thông tin.
– Nhược điểm: Không xác định được sai số lấy
mẫu và không thể kết luận cho tổng thể từ kết
quả mẫu.
– Sử dụng phổ biến khi bị giới hạn về thời gian và
chi phí.
27
4. Chọn mẫu phi xác suất (tt)
z Chọn mẫu phán đóan (judgement):
– Nhà nghiên cứu tự phán đoán sự thích hợp của
các phần tử để mời họ tham gia vào mẫu.
– Đặc điểm giống như chọn mẫu thuận tiện, nhưng
nếu khả năng/kinh nghiệm phán đoán tốt sẽ cho
mẫu tốt hơn thuận tiện.
28
4. Chọn mẫu phi xác suất (tt)
z Chọn mẫu theo lớp (quota sampling):
– Dựa vào một số thuộc tính kiểm soát (control
characteristics), xác định một số phần tử sao cho
chúng đảm bảo tỷ lệ của tổng thể và các đặc
trưng kiểm soát.
– Sử dụng phổ biến nhất trong thực tiễn NC.
– Có thể dùng 1 hoặc nhiều thuộc tính kiểm soát
như tuổi, giới tính, thu nhập, loại hình DN,…
29
4. Chọn mẫu phi xác suất (tt)
z Chọn mẫu theo mầm (snow ball):
– Chọn ngẫu nhiên những người phỏng vấn ban
đầu, những người tiếp theo được chọn dựa trên
sự giới thiệu của người trước.
– Sử dụng thích hợp khi: tổng thể ít, khó nhận ra
các đối tượng cần thu thập thông tin.
30
5. Xác định cở mẫu
z Đặc điểm của quá trình xác định cở mẫu:
– Đánh đổi giữa sai số cho phép và chi phí cho
nghiên cứu.
– Chọn mẫu đủ lớn để có thể ước lượng một cách
tương đối chính xác giá trị của tổng thể những
không lãng phí quỹ nghiên cứu vào các mẫu quá
lớn và không cần thiết.
– Việc xác định cở mẫu phải xét đến nhiều yếu tố,
gồm cả yếu tố định lượng và yếu tố định tính.
31
5. Xác định cở mẫu (tt)
z Quá trình xác định
cở mẫu
Xác định sai số e chấp nhận được giữa ước lượng của
mẫu và tổng thể
Xác định độ tin cậy α muốn có trong ước lượng mẫu
nằm trong sai số e
Xác định giá trị Z tương ứng với độ tin cậy muốn có đã
quyết định
Ước tính độ lệch chuẩn của tổng thể
Tỷ lệ p và q (trong trường hợp biến tỷ lệ)
Dùng công thức thống kê tương ứng
Tính cỡ mẫu
32
5. Xác định cở mẫu (tt)
z Bước 1: Xác định sai số e chấp nhận được giữa ước
lượng của mẫu và của tổng thể
– Xác định sai số e cho phép: phụ thuộc vào độ nhạy của kết
quả quyết định đối với biến ước lượng đang khảo sát.
– Thường từ: 10 - 20% của đơn vị đo nhỏ nhất
– Ví dụ: KFC định mở một cửa hàng tại một vùng dân cư mới.
Quyết định có mở hay không phụ thuộc vào thu nhập trung
bình của người dân sống trong khu vực đó. Giả sử nếu thu
nhập trung bình từ 10triệu/tháng trở lên thì mở. Vấn đề đặt
ra là xác định thu nhập trung bình của người dân với một
sai số cho cho phép cho trước (1triệu chẳng hạn.)
33
5. Xác định cở mẫu (tt)
z Bước 2: Xác định độ tin cậy α mong muốn
– Mức tin cậy thường được chọn là 99%, 95% và
90%.
– Trong thực tế thường chọn 95% Æ z = 1.96. Mức
tin cậy cho phép kết quả nghiên cứu sai số 5% so
với giá trị thực của tổng thể, và mức sai số này
thường được chấp nhận đối với phần lớn các
quyết định marketing.
34
5. Xác định cở mẫu (tt)
z Bước 3: Xác định giá trị Z tương ứng
2.5899%
1.9695%
1.64590%
Hằng số ZĐộ tin cậy
35
5. Xác định cở mẫu (tt)
z Bước 4a: Ước tính độ lệch chuẩn của tổng
thể (Trường hợp biến liên tục – thang đo
metric scale: khỏang hoặc tỷ lệ)
– Tiến hành nghiên cứu thí điểm, sử dụng độ lệch
chuẩn của kết quả nghiên cứu thí điểm. Thường
lấy khỏang 50 – 100 trường hợp.
– Dựa vào kết quả của những nghiên cứu tương tự
trước đó.
– Sử dụng công thức theo quy tắc 3σ:
6
-σ MinMax=
36
5. Xác định cở mẫu (tt)
z Bước 4b: Ước tính tỷ lệ p và q (Trường hợp
biến tỷ lệ)
– Trong đó:
p: ước lượng tần số xuất hiện của hiện tượng
q = 1 - p
– Tiến hành nghiên cứu thí điểm, sử dụng tỷ lệ của
kết quả nghiên cứu thí điểm.
– Dựa vào kết quả của những nghiên cứu tương tự
trước đó.
37
5. Xác định cở mẫu (tt)
z Bước 5a: Xác định cở mẫu (Biến liên tục)
– Sử dụng công thức tính mẫu:
– Nếu n > 5% tổng thể thì tính lại theo công thức:
=
2
2
e
)S*Z(n
+
=
222
22
Z*Se*N
S*Z*Nn
38
5. Xác định cở mẫu (tt)
z Bước 5b: Xác định cở mẫu (Biến tỷ lệ)
– Sử dụng công thức tính mẫu:
– Nếu n > 5% tổng thể thì tính lại theo công thức:
2
2
**
e
Zqpn=
22
2
***
***
ZqpeN
ZqpNn +=
39
5. Xác định cở mẫu (tt)
z Xác định cở mẫu trong chọn mẫu phi xác
suất:
– Quyết định chọn mẫu phi xác suất thường được
thực hiện một cách chủ quan.
– Yếu tố then chốt cho việc lựa chọn là thời gian và
tài chính.
40
5. Xác định cở mẫu (tt)
z Những lưu ý khi xác định cở mẫu:
– Khảo sát một và nhiều yếu tố/biến.
– Tỷ lệ hồi đáp
41
Vấn đề thảo luận
1. Sai số không lấy mẫu đi vào dữ liệu điều tra
theo những con đường nào?
2. Trị số trung bình mẫu có liên hệ với trung
bình tổng thể như thế nào?
3. Những yếu tố nào nhà nghiên cứu phải tính
đến khi xác định kích thước mẫu?
4. Những biện pháp nào làm tăng tỷ lệ hồi
đáp?
42
The End