Độ chính xác (Sample accuracy): mức độ thống kê
trên mẫu gần với giá trị của tổng thể mà nó đại diện
như thế nào.
Những điểm quan trọng:
Qui mô mẫu không liên quan đến tính đại
diện của mẫu.
Qui mô mẫu liên quan đến mức độ chính
xác.
47 trang |
Chia sẻ: lylyngoc | Lượt xem: 2950 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Xác định qui mô mẫu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Xác định qui mô mẫu
Độ chính xác
Ch 13
2
Độ chính xác (Sample accuracy): mức độ thống kê
trên mẫu gần với giá trị của tổng thể mà nó đại diện
như thế nào.
Những điểm quan trọng:
Qui mô mẫu không liên quan đến tính đại
diện của mẫu.
Qui mô mẫu liên quan đến mức độ chính
xác.
Qui mô mẫu và độ chính xác
Ch 13
3
Mẫu xác suất lớn và mẫu xác suất nhỏ: mẫu nào chính
xác hơn?
Mẫu xác suất càng lớn thì mức độ chính xác càng cao
(ít sai số mẫu).
"Một bức tranh có thể nói thay cho 1,000 từ”
Ch 13
4
Sample Size and Accuracy
0%
2%
4%
6%
8%
10%
12%
14%
16%
5
0
2
0
0
3
5
0
5
0
0
6
5
0
8
0
0
9
5
0
1
1
0
0
1
2
5
0
1
4
0
0
1
5
5
0
1
7
0
0
1
8
5
0
2
0
0
0
Sample Size
A
c
c
u
ra
c
y
±
Độ chính xác của mẫu xác suất có thể được tính với công thức
đơn giản, và biểu diễn dưới dạng ± %.
n 550 - 2000 = 1,450
4% - 2% = ±2%
Làm thế nào để diễn giải độ chính xác của mẫu
Ch 13
5
Từ một báo cáo…
Mẫu chính xác với ± 7% ở độ tin cậy
95%…
Từ một bài báo tin tức
Độ chính xác của cuộc điều tra này
là ± 7%…
Làm thế nào để diễn giải độ chính xác của mẫu
Ch 13
6
Diễn giải
Kết quả: 60% nhận biết được thương
hiệu của công ty
Vì thế tỉ lệ phần trăm tổng thể nhận
biết được thương hiệu của công ty là từ
53% (60%-7%) đến 67% (60%+7%).
Những điều cần biết về qui mô mẫu
Ch 13
7
Để xác định được qui mô mẫu phù hợp, cần hiểu những điều
sau:
Chỉ có duy nhất một mẫu chính xác đó là tổng thể mục tiêu.
Mẫu xác suất luôn có sai số (sai số lấy mẫu).
Mẫu xác suất càng lớn, thì mức độ chính xác càng cao (ít sai số
lấy mẫu hơn).
Độ chính xác của mẫu xác suất có thể được tính toán với một
công thức đơn giản và được biểu diễn dưới dạng +- %.
Bạn có thể dùng bất kỳ kết quả nào của cuộc điều tra, lặp lại
cuộc điều tra với cùng qui mô mẫu, và bạn sẽ có được kết quả
nằm trong khoảng +- của kết quả ban đầu.
Những điều cần biết về qui mô mẫu
Ch 13
8
Trong hầu hết các trường hợp, độ chính xác (sai số mẫu) của
một mẫu xác suất độc lập với qui mô mẫu.
Bạn có thể dùng bất kỳ kết quả nào của cuộc điều tra, lặp lại
cuộc điều tra với cùng qui mô mẫu, và bạn sẽ có được kết quả
nằm trong khoảng +- của kết quả ban đầu.
Trong hầu hết các trường hợp, độ chính xác (sai số mẫu) của
một mẫu xác suất độc lập với qui mô mẫu.
Tuy nhiên, mẫu xác suất có thể chiếm một tỉ lệ phần trăm của
tổng thể rất nhỏ nhưng lại rất chính xác (ít sai số mẫu).
Qui mô mẫu và qui mô tổng thể
Ch 13
9
N?
Qui mô
tổng thể
e=±3% Qui mô
mẫu
e=±4% Qui mô
mẫu
10,000 ____ ____
100,000 ____ ____
1,000,000 ____ ____
100,000,00
0
____ ____
1,067 600
1,067 600
1,067 600
1,067 600
Trong hầu hết các trường hợp, độ chính xác (sai số mẫu)
của một mẫu xác suất độc lập với qui mô mẫu.
Qui mô mẫu và qui mô tổng thể
Ch 13
10
Qui mô tổng thể có tác động đến qui mô mẫu
hay sai số mẫu không?
Tuy nhiên, mẫu xác suất có thể chiếm một tỉ lệ phần
trăm của tổng thể rất nhỏ nhưng lại rất chính xác (ít sai
số mẫu).
Qui mô tổng
thể
e=±3% Qui mô
mẫu
Qui mô mẫu chiếm
% của tổng thể
10,000 ____ ___%
100,000 ____ ___%
1,000,000 ____ ___%
100,000,000 ____ ___%
1,067 1%
1,067 .1%
1,067 .01
1,067 .0001%
Những điều cần biết về qui mô mẫu
Ch 13
11
Qui mô mẫu xác suất phụ thuộc vào mức độ chính xác mong
muốn của khách hàng cùng với chi phí thu thập dữ liệu đối với
qui mô mẫu như vậy.
Có một cách duy nhất để xác định qui mô mẫu là nhà nghiên
cứu phải xác định trước mức độ chính xác của kết quả thu
được trên mẫu.
Ch 13
12
Phương pháp khoảng
tin cậy của việc xác
định qui mô mẫu.
Phương pháp khoảng tin cậy của việc
xác định qui mô mẫu.
Ch 13
13
Phương pháp này dựa trên khoảng tin cậy và định lí
giới hạn trung tâm…
Khoảng tin cậy: khoảng mà hai điểm cuối của nó xác
định tỉ lệ phần trăm câu trả lời đối với một câu hỏi.
Phương pháp khoảng tin cậy của việc
xác định qui mô mẫu.
Ch 13
14
Cách tiếp cận khoảng tin cậy: ứng dụng khái niệm
mức chính xác, độ biến thiên, và độ tin cậy để
có được qui mô mẫu phù hợp.
Hai loại sai số:
Sai số không lấy mẫu: liên quan đến nguồn
sai số khác ngoài phương pháp chọn mẫu
và qui mô mẫu.
Sai số lấy mẫu: liên quan đến việc chọn mẫu
và qui mô mẫu.
Phương pháp khoảng tin cậy của việc
xác định qui mô mẫu.
Ch 13
15
Công thức tính sai số mẫu:
Phương pháp khoảng tin cậy của việc
xác định qui mô mẫu.
Ch 13
16
Mối quan hệ giữa qui mô mẫu và sai số mẫu
Tính toán
Ch 13
17
n
pq
ze
Thử nghiệm với 3 n khác nhau
1000
500
100
1.96
50 nhân với
50
Trả lời…
Câu trả lời là
Ch 13
18
n
pq
ze
Với 3 n khác nhau
1000 ±3.1%
500 ±4.4%
100 ±9.8%
1.96
50 nhân 50
Độ tin cậy của mẫu có nghĩa là gì?
Ch 13
19
Độ tin cậy 95%
Tính toán kết quả từ mẫu: p%
Tính toán độ chính xác của mẫu: ± e%
95% bạn tin tưởng rằng phần trăm của
tổng thể nằm trong khoảng: p% ± e%
Độ chính xác của mẫu có nghĩa là gì?
Ch 13
20
Ví dụ
Qui mô mẫu là 1,000
Kết quả: 40% đáp viên thích thương
hiệu của công ty
Độ chính xác là ± 3% (theo công
thức)
Vì vậy có từ 37% - 43% thích thương
hiệu của công ty
Phương pháp khoảng tin cậy để xác định qui
mô mẫu
Ch 13
21
Độ biến thiên: nói đến mức độ tương tự hoặc khác
biệt trong các câu trả lời cho một câu hỏi cụ thể.
P: phần trăm
Q: 100%-P
Cần nhớ: sự biến thiên trong tổng thể càng nhiều, thì
qui mô mẫu phải càng lớn để đạt được độ chính xác
cần thiết.
Ch 13
22
Với dữ liệu định danh (ví dụ: Có, Không),
chúng ta có thể khái quát hóa mức biến thiên
với biểu đồ hình cột…độ biến thiên lớn
nhất là 50/50.
Cách tiếp cận khoảng tin cậy
Ch 13
23
Cách tiếp cận khoảng tin cậy dựa trên phân
phối chuẩn.
Chúng ta có thể sử dụng phân phối chuẩn bởi
vì định lí giới hạn trung tâm…không quan
tâm đến hình dạng của phân phối tổng thể,
phân phối mẫu (đối với n>=30) được rút ra từ
tổng thể hình thành nên phân phối chuẩn.
Định lí giới hạn trung tâm
(Central Limits Theorem)
Ch 13
24
Định lí giới hạn trung tâm cho phép chúng ta sử dụng
logic của phân phối chuẩn.
Vì 95% mẫu rút ra từ tổng thể rơi vào + hoặc – 1.96
x sai số mẫu (logic này dựa vào kiến thức về phân
phối chuẩn) chúng ta có thể có nhưng phát biểu sau:
Ch 13
25
Nếu chúng ta thực hiện nghiên cứu lặp lại
1000 lần, chúng ta kỳ vọng rằng kết quả sẽ rơi
vào một khoảng biết trước. Dựa vào đó,
chúng ta tin chắc khoảng 95% rằng giá trị
tổng thể rơi vào khoảng này.
Phương pháp khoảng tin cậy để xác định qui mô mẫu
Ch 13
26
1.96 x s.d. xác định hai điểm biên của phân
phối.
Ch 13
27
Chúng ta cũng biết rằng, với một mức biến
thiên biết trước trong tổng thể, qui mô mẫu
sẽ tác động đến độ rộng của khoảng tin cậy.
Đến đây chúng ta đã học được gì?
Ch 13
28
Có mối quan hệ giữa:
Độ tin cậy mà chúng ta mong muốn đối với
kết quả nghiên cứu sẽ rơi vào trong một
khoảng nếu chúng ta lặp lại nghiên cứu…
Độ biến thiên trong tổng thể
Mức độ chính xác mong muốn/sai số mẫu
chấp nhận được
Qui mô mẫu
Công thức tính qui mô mẫu
Ch 13
29
Những nhà thống kê đã đưa ra công thức
giữa trên mối quan hệ này.
Công thức yêu cầu chúng ta phải
Cụ thể hóa mức tin cậy mà chúng ta muốn
Ước lượng phương sai của tổng thể
Cụ thể hóa mức chính xác mà chúng ta muốn.
Khi cụ thể hóa được những điều trên, công
thức cho ta biết qui mô mẫu n cần có.
Công thức tính qui mô mẫu
Ch 13
30
Công thức tính qui mô mẫu chuẩn khi ước
tính tỉ lệ phần trăm:
Những điều thực tế cần xem xét khi xác định qui mô mẫu
Ch 13
31
Làm thế nào để ước lượng độ biến thiên trong tổng
thể (pxq)
Lường trước trường hợp xấu nhất (p=50;
q=50)
Ước tính độ biến thiên: nghiên cứu có
trước? Thực hiện nghiên cứu thử nghiệm
(pilot study)?
Những điều thực tế cần xem xét khi xác định qui mô mẫu
Ch 13
32
Làm thế nào để xác định sai số mẫu
mong muốn
Người nghiên cứu nên làm việc với nhà quản trị
để đưa ra quyết định này. Nhà quản trị sẽ chấp
nhận mức sai số là bao nhiêu?
Thông thường là + hoặc – 5%
Quyết định càng quan trọng thì sai số mẫu càng
nhỏ.
Những điều thực tế cần xem xét khi xác định qui mô mẫu
Ch 13
33
Làm thế nào để xác định độ tin cậy
mong muốn
Nhà nghiên cứu nên làm việc với nhà quản trị để
đưa ra quyết định này. Độ tin cậy càng cao thì qui
mô mẫu phải càng lớn.
Thông thường là 95% (z=1.96)
Quyết định càng quan trọng thì nhà quản trị
muốn độ tin cậy càng cao độ tin cậy 99% ,
z=2.58.
Ví dụ
Ước lượng tỉ lệ phần trăm trong tổng thể
Ch 13
34
Qui mô mẫu cần là bao nhiêu?
Năm năm trước một cuộc điều tra cho thấy 42% người
tiêu dùng nhận biết được thương hiệu của công ty
(người tiêu dùng trả lời câu hỏi “có nhận biết”, “không
nhận biết”)
Sau một chiến dịch quảng cáo tập trung, ban quản trị
muốn thực hiện một cuộc điều tra khác và muốn chắc
chắc 95% rằng ước lượng của cuộc điều tra sẽ ở trong
khoảng ±5% tỉ lệ phần trăm thực về người tiêu dùng
nhận biết được thương hiệu trong tổng thể.
Qui mô mẫu n sẽ là bao nhiêu?
Ví dụ
Ước lượng tỉ lệ phần trăm trong tổng thể
Ch 13
35
Z=1.96 (độ tin cậy 95%)
p=42
q=100-p=58
e=5
n là bao nhiêu?
Ví dụ
Ước lượng tỉ lệ phần trăm trong tổng thể
Ch 13
36
Điều này có ý nghĩa gì?
Nó có nghĩa là nếu chúng ta sử dụng qui mô mẫu là
374, sau điều tra, chúng ta có thể phát biểu kết quả
sau: (giả định rằng kết quả cho thấy có 55% nhận biết
thương hiệu)
“Ước lượng tỉ lệ phần trăm người tiêu dùng nhận biết
được thươn ghiệu công ty chiếm 55%. Bên cạnh đó,
chúng ta tin tưởng đến 95% rằng tỉ lệ phần trăm người
tiêu dùng nhận biết được thương hiệu của công ty trong
tổng thể là ở trong khoảng 50% đến 60%.
n=374
Ước lượng giá trị trung bình
Ch 13
37
Ước lượng giá trị trung bình sử dụng công thức
khác.
• Z được xác định như ở công thức trên (1.96 or
2.58)
• e được biểu diễn dưới dạng đơn vị mà chúng ta
đang ước tính (ví dụ, nếu chúng ta đo lường thái
độ sử dụng thang đo 1-7, chúng ta có thể muốn sai
số không quá ± 0.5 đơn vị trên thang đo
• s thì khó ước lượng hơn một chút
Ước lượng s
Ch 13
38
Vì chúng ta đang ước lượng giá trị trung bình, chúng
ta có thể giả định rằng dữ liệu của chúng ta là
khoảng hoặc tỉ lệ. Khi chúng ta sử dụng dữ liệu
khoảng hoặc tỉ lệ, độ lệch chuẩn, s (σ), có thể được sử
dụng như là đo lường phương sai.
Ước lượng s
Ch 13
39
Làm thế nào để ước lượng s?
Sử dụng độ lệch chuẩn từ nghiên cứu trước.
Thực hiện nghiên cứu thử nghiệm với một số
thành viên của tổng thể mục tiêu và tính ra s.
Ước lượng khoảng mà giá trị bạn đang ước tính rơi
vào (giá trị lớn nhất và nhỏ nhất, sau đó chia
khoảng đó cho 6).
Ước lượng s
Ch 13
40
Tại sao chia cho 6?
Khoảng giá trị bao gồm toàn bộ phân phối và ± 3 (hoặc 6) độ lệch
chuẩn phủ 99.9% khu vực đường cong độ lệch chuẩn. Bởi vì chúng
ta ước lược độ lệch chuẩn, chúng ta chia khoảng giá trị cho 6.
Ví dụ
Ước lượng giá trị trung bình của tổng thể
Ch 13
41
Qui mô mẫu cần là bao nhiêu?
Nhà quản trị muốn biết mức hài lòng của khách hàng
với dịch vụ của họ. Họ đề xuất thực hiện một nghiên cứu
và hỏi về sự hài lòng trên thang đo từ 1 đến 10 (vì có thể
có 10 câu trả lời, nên khoảng = 10).
Nhà quản trị muốn chắc tới 99% trong kết quả thu được
và họ không muốn sai số cho phép lớn hơn ±.5 đơn vị
thang đo.
n bằng bao nhiêu?
Ước lượng giá trị trung bình
n?
Ch 13
42
S=10/6 or 1.7
Z=2.58 (độ tin cậy 99%)
e=.5 điểm trên thang đo
n bằng bao nhiêu?
Ước lượng giá trị trung bình
Ch 13
43
Điều này có nghĩa là gì?
Sau nghiên cứu, nhà quản trị có thể phát biểu như sau:
(giả định rằng mức hài lòng trung bình là 7.3)
“Ước lượng về mức hài lòng của người tiêu dùng là 7.3
trên thang điểm 10. Chúng ta tin chắc 99% rằng mức hài
lòng thực sự của tổng thể người tiêu dùng rơi vào khoảng
6.8 và 7.8.”
n=77
Những phương pháp xác định qui mô mẫu khác
Ch 13
44
Chọn theo trực giác
Qui mô mẫu bị ảnh hưởng bởi kỹ thuật phân
tích dữ liệu được sử dụng.
Qui mô mẫu khi sử dụng phương pháp chọn
mẫu phi xác suất: không liên quan đến mức
chính xác, xem xét chi phí-lợi ích liên quan
khi chọn mẫu.
Ví dụ
Ch 13
45
1. Sử dụng công thức được giới thiệu trên đây, xác
định qui mô mẫu cho mỗi trường hợp sau, với độ
chính xác (sai số chấp nhận được) là ±5%:
Độ biến thiên là 30%,
Độ tin cậy là 95%
(323) 322.6 =
25
8064
=
25
2100 x 3.84
=
5
70) x (30961.
=
e
(pq)z
= n
2
2
2
2
Ví dụ
Ch 13
46
Sử dụng công thức được giới thiệu trên đây, xác định
qui mô mẫu cho mỗi trường hợp sau, với độ chính xác
(sai số chấp nhận được) là ±5%:
Độ biến thiên là 60%,
Độ tin cậy là 99%
(639) 639.4 =
25
15,984
=
25
2400 x 6.66
=
5
40) x (60582.
=
e
(pq)z
= n
2
2
2
2
Ví dụ
Ch 13
47
Sử dụng công thức được giới thiệu trên đây, xác định
qui mô mẫu cho mỗi trường hợp sau, với độ chính xác
(sai số chấp nhận được) là ±5%:
Độ biến thiên không được biết trước,
Độ tin cậy là 95%
384 =
25
9600
=
25
2500 x 3.84
=
5
50) x (50961.
=
e
(pq)z
= n
2
2
2
2