Xác định qui mô mẫu

 Độ chính xác (Sample accuracy): mức độ thống kê trên mẫu gần với giá trị của tổng thể mà nó đại diện như thế nào.  Những điểm quan trọng: Qui mô mẫu không liên quan đến tính đại diện của mẫu. Qui mô mẫu liên quan đến mức độ chính xác.

pdf47 trang | Chia sẻ: lylyngoc | Lượt xem: 2920 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Xác định qui mô mẫu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Xác định qui mô mẫu Độ chính xác Ch 13 2  Độ chính xác (Sample accuracy): mức độ thống kê trên mẫu gần với giá trị của tổng thể mà nó đại diện như thế nào.  Những điểm quan trọng: Qui mô mẫu không liên quan đến tính đại diện của mẫu. Qui mô mẫu liên quan đến mức độ chính xác. Qui mô mẫu và độ chính xác Ch 13 3  Mẫu xác suất lớn và mẫu xác suất nhỏ: mẫu nào chính xác hơn?  Mẫu xác suất càng lớn thì mức độ chính xác càng cao (ít sai số mẫu). "Một bức tranh có thể nói thay cho 1,000 từ” Ch 13 4 Sample Size and Accuracy 0% 2% 4% 6% 8% 10% 12% 14% 16% 5 0 2 0 0 3 5 0 5 0 0 6 5 0 8 0 0 9 5 0 1 1 0 0 1 2 5 0 1 4 0 0 1 5 5 0 1 7 0 0 1 8 5 0 2 0 0 0 Sample Size A c c u ra c y ± Độ chính xác của mẫu xác suất có thể được tính với công thức đơn giản, và biểu diễn dưới dạng ± %. n 550 - 2000 = 1,450 4% - 2% = ±2% Làm thế nào để diễn giải độ chính xác của mẫu Ch 13 5  Từ một báo cáo… Mẫu chính xác với ± 7% ở độ tin cậy 95%…  Từ một bài báo tin tức Độ chính xác của cuộc điều tra này là ± 7%… Làm thế nào để diễn giải độ chính xác của mẫu Ch 13 6  Diễn giải Kết quả: 60% nhận biết được thương hiệu của công ty Vì thế tỉ lệ phần trăm tổng thể nhận biết được thương hiệu của công ty là từ 53% (60%-7%) đến 67% (60%+7%). Những điều cần biết về qui mô mẫu Ch 13 7  Để xác định được qui mô mẫu phù hợp, cần hiểu những điều sau:  Chỉ có duy nhất một mẫu chính xác đó là tổng thể mục tiêu.  Mẫu xác suất luôn có sai số (sai số lấy mẫu).  Mẫu xác suất càng lớn, thì mức độ chính xác càng cao (ít sai số lấy mẫu hơn).  Độ chính xác của mẫu xác suất có thể được tính toán với một công thức đơn giản và được biểu diễn dưới dạng +- %.  Bạn có thể dùng bất kỳ kết quả nào của cuộc điều tra, lặp lại cuộc điều tra với cùng qui mô mẫu, và bạn sẽ có được kết quả nằm trong khoảng +- của kết quả ban đầu. Những điều cần biết về qui mô mẫu Ch 13 8  Trong hầu hết các trường hợp, độ chính xác (sai số mẫu) của một mẫu xác suất độc lập với qui mô mẫu.  Bạn có thể dùng bất kỳ kết quả nào của cuộc điều tra, lặp lại cuộc điều tra với cùng qui mô mẫu, và bạn sẽ có được kết quả nằm trong khoảng +- của kết quả ban đầu.  Trong hầu hết các trường hợp, độ chính xác (sai số mẫu) của một mẫu xác suất độc lập với qui mô mẫu.  Tuy nhiên, mẫu xác suất có thể chiếm một tỉ lệ phần trăm của tổng thể rất nhỏ nhưng lại rất chính xác (ít sai số mẫu). Qui mô mẫu và qui mô tổng thể Ch 13 9  N? Qui mô tổng thể e=±3% Qui mô mẫu e=±4% Qui mô mẫu 10,000 ____ ____ 100,000 ____ ____ 1,000,000 ____ ____ 100,000,00 0 ____ ____ 1,067 600 1,067 600 1,067 600 1,067 600 Trong hầu hết các trường hợp, độ chính xác (sai số mẫu) của một mẫu xác suất độc lập với qui mô mẫu. Qui mô mẫu và qui mô tổng thể Ch 13 10  Qui mô tổng thể có tác động đến qui mô mẫu hay sai số mẫu không? Tuy nhiên, mẫu xác suất có thể chiếm một tỉ lệ phần trăm của tổng thể rất nhỏ nhưng lại rất chính xác (ít sai số mẫu). Qui mô tổng thể e=±3% Qui mô mẫu Qui mô mẫu chiếm % của tổng thể 10,000 ____ ___% 100,000 ____ ___% 1,000,000 ____ ___% 100,000,000 ____ ___% 1,067 1% 1,067 .1% 1,067 .01 1,067 .0001% Những điều cần biết về qui mô mẫu Ch 13 11  Qui mô mẫu xác suất phụ thuộc vào mức độ chính xác mong muốn của khách hàng cùng với chi phí thu thập dữ liệu đối với qui mô mẫu như vậy.  Có một cách duy nhất để xác định qui mô mẫu là nhà nghiên cứu phải xác định trước mức độ chính xác của kết quả thu được trên mẫu. Ch 13 12 Phương pháp khoảng tin cậy của việc xác định qui mô mẫu. Phương pháp khoảng tin cậy của việc xác định qui mô mẫu. Ch 13 13  Phương pháp này dựa trên khoảng tin cậy và định lí giới hạn trung tâm…  Khoảng tin cậy: khoảng mà hai điểm cuối của nó xác định tỉ lệ phần trăm câu trả lời đối với một câu hỏi. Phương pháp khoảng tin cậy của việc xác định qui mô mẫu. Ch 13 14  Cách tiếp cận khoảng tin cậy: ứng dụng khái niệm mức chính xác, độ biến thiên, và độ tin cậy để có được qui mô mẫu phù hợp.  Hai loại sai số: Sai số không lấy mẫu: liên quan đến nguồn sai số khác ngoài phương pháp chọn mẫu và qui mô mẫu. Sai số lấy mẫu: liên quan đến việc chọn mẫu và qui mô mẫu. Phương pháp khoảng tin cậy của việc xác định qui mô mẫu. Ch 13 15  Công thức tính sai số mẫu: Phương pháp khoảng tin cậy của việc xác định qui mô mẫu. Ch 13 16  Mối quan hệ giữa qui mô mẫu và sai số mẫu Tính toán Ch 13 17 n pq ze  Thử nghiệm với 3 n khác nhau 1000 500 100 1.96 50 nhân với 50 Trả lời… Câu trả lời là Ch 13 18 n pq ze  Với 3 n khác nhau 1000 ±3.1% 500 ±4.4% 100 ±9.8% 1.96 50 nhân 50 Độ tin cậy của mẫu có nghĩa là gì? Ch 13 19  Độ tin cậy 95% Tính toán kết quả từ mẫu: p% Tính toán độ chính xác của mẫu: ± e% 95% bạn tin tưởng rằng phần trăm của tổng thể nằm trong khoảng: p% ± e% Độ chính xác của mẫu có nghĩa là gì? Ch 13 20  Ví dụ Qui mô mẫu là 1,000 Kết quả: 40% đáp viên thích thương hiệu của công ty Độ chính xác là ± 3% (theo công thức) Vì vậy có từ 37% - 43% thích thương hiệu của công ty Phương pháp khoảng tin cậy để xác định qui mô mẫu Ch 13 21  Độ biến thiên: nói đến mức độ tương tự hoặc khác biệt trong các câu trả lời cho một câu hỏi cụ thể.  P: phần trăm  Q: 100%-P  Cần nhớ: sự biến thiên trong tổng thể càng nhiều, thì qui mô mẫu phải càng lớn để đạt được độ chính xác cần thiết. Ch 13 22  Với dữ liệu định danh (ví dụ: Có, Không), chúng ta có thể khái quát hóa mức biến thiên với biểu đồ hình cột…độ biến thiên lớn nhất là 50/50. Cách tiếp cận khoảng tin cậy Ch 13 23  Cách tiếp cận khoảng tin cậy dựa trên phân phối chuẩn.  Chúng ta có thể sử dụng phân phối chuẩn bởi vì định lí giới hạn trung tâm…không quan tâm đến hình dạng của phân phối tổng thể, phân phối mẫu (đối với n>=30) được rút ra từ tổng thể hình thành nên phân phối chuẩn. Định lí giới hạn trung tâm (Central Limits Theorem) Ch 13 24  Định lí giới hạn trung tâm cho phép chúng ta sử dụng logic của phân phối chuẩn.  Vì 95% mẫu rút ra từ tổng thể rơi vào + hoặc – 1.96 x sai số mẫu (logic này dựa vào kiến thức về phân phối chuẩn) chúng ta có thể có nhưng phát biểu sau: Ch 13 25  Nếu chúng ta thực hiện nghiên cứu lặp lại 1000 lần, chúng ta kỳ vọng rằng kết quả sẽ rơi vào một khoảng biết trước. Dựa vào đó, chúng ta tin chắc khoảng 95% rằng giá trị tổng thể rơi vào khoảng này. Phương pháp khoảng tin cậy để xác định qui mô mẫu Ch 13 26  1.96 x s.d. xác định hai điểm biên của phân phối. Ch 13 27  Chúng ta cũng biết rằng, với một mức biến thiên biết trước trong tổng thể, qui mô mẫu sẽ tác động đến độ rộng của khoảng tin cậy. Đến đây chúng ta đã học được gì? Ch 13 28  Có mối quan hệ giữa: Độ tin cậy mà chúng ta mong muốn đối với kết quả nghiên cứu sẽ rơi vào trong một khoảng nếu chúng ta lặp lại nghiên cứu… Độ biến thiên trong tổng thể Mức độ chính xác mong muốn/sai số mẫu chấp nhận được Qui mô mẫu Công thức tính qui mô mẫu Ch 13 29  Những nhà thống kê đã đưa ra công thức giữa trên mối quan hệ này. Công thức yêu cầu chúng ta phải Cụ thể hóa mức tin cậy mà chúng ta muốn Ước lượng phương sai của tổng thể Cụ thể hóa mức chính xác mà chúng ta muốn. Khi cụ thể hóa được những điều trên, công thức cho ta biết qui mô mẫu n cần có. Công thức tính qui mô mẫu Ch 13 30  Công thức tính qui mô mẫu chuẩn khi ước tính tỉ lệ phần trăm: Những điều thực tế cần xem xét khi xác định qui mô mẫu Ch 13 31  Làm thế nào để ước lượng độ biến thiên trong tổng thể (pxq)  Lường trước trường hợp xấu nhất (p=50; q=50) Ước tính độ biến thiên: nghiên cứu có trước? Thực hiện nghiên cứu thử nghiệm (pilot study)? Những điều thực tế cần xem xét khi xác định qui mô mẫu Ch 13 32  Làm thế nào để xác định sai số mẫu mong muốn  Người nghiên cứu nên làm việc với nhà quản trị để đưa ra quyết định này. Nhà quản trị sẽ chấp nhận mức sai số là bao nhiêu?  Thông thường là + hoặc – 5%  Quyết định càng quan trọng thì sai số mẫu càng nhỏ. Những điều thực tế cần xem xét khi xác định qui mô mẫu Ch 13 33  Làm thế nào để xác định độ tin cậy mong muốn  Nhà nghiên cứu nên làm việc với nhà quản trị để đưa ra quyết định này. Độ tin cậy càng cao thì qui mô mẫu phải càng lớn.  Thông thường là 95% (z=1.96)  Quyết định càng quan trọng thì nhà quản trị muốn độ tin cậy càng cao độ tin cậy 99% , z=2.58. Ví dụ Ước lượng tỉ lệ phần trăm trong tổng thể Ch 13 34  Qui mô mẫu cần là bao nhiêu?  Năm năm trước một cuộc điều tra cho thấy 42% người tiêu dùng nhận biết được thương hiệu của công ty (người tiêu dùng trả lời câu hỏi “có nhận biết”, “không nhận biết”)  Sau một chiến dịch quảng cáo tập trung, ban quản trị muốn thực hiện một cuộc điều tra khác và muốn chắc chắc 95% rằng ước lượng của cuộc điều tra sẽ ở trong khoảng ±5% tỉ lệ phần trăm thực về người tiêu dùng nhận biết được thương hiệu trong tổng thể.  Qui mô mẫu n sẽ là bao nhiêu? Ví dụ Ước lượng tỉ lệ phần trăm trong tổng thể Ch 13 35  Z=1.96 (độ tin cậy 95%)  p=42  q=100-p=58  e=5  n là bao nhiêu? Ví dụ Ước lượng tỉ lệ phần trăm trong tổng thể Ch 13 36  Điều này có ý nghĩa gì?  Nó có nghĩa là nếu chúng ta sử dụng qui mô mẫu là 374, sau điều tra, chúng ta có thể phát biểu kết quả sau: (giả định rằng kết quả cho thấy có 55% nhận biết thương hiệu)  “Ước lượng tỉ lệ phần trăm người tiêu dùng nhận biết được thươn ghiệu công ty chiếm 55%. Bên cạnh đó, chúng ta tin tưởng đến 95% rằng tỉ lệ phần trăm người tiêu dùng nhận biết được thương hiệu của công ty trong tổng thể là ở trong khoảng 50% đến 60%. n=374 Ước lượng giá trị trung bình Ch 13 37  Ước lượng giá trị trung bình sử dụng công thức khác. • Z được xác định như ở công thức trên (1.96 or 2.58) • e được biểu diễn dưới dạng đơn vị mà chúng ta đang ước tính (ví dụ, nếu chúng ta đo lường thái độ sử dụng thang đo 1-7, chúng ta có thể muốn sai số không quá ± 0.5 đơn vị trên thang đo • s thì khó ước lượng hơn một chút Ước lượng s Ch 13 38  Vì chúng ta đang ước lượng giá trị trung bình, chúng ta có thể giả định rằng dữ liệu của chúng ta là khoảng hoặc tỉ lệ. Khi chúng ta sử dụng dữ liệu khoảng hoặc tỉ lệ, độ lệch chuẩn, s (σ), có thể được sử dụng như là đo lường phương sai. Ước lượng s Ch 13 39  Làm thế nào để ước lượng s?  Sử dụng độ lệch chuẩn từ nghiên cứu trước.  Thực hiện nghiên cứu thử nghiệm với một số thành viên của tổng thể mục tiêu và tính ra s.  Ước lượng khoảng mà giá trị bạn đang ước tính rơi vào (giá trị lớn nhất và nhỏ nhất, sau đó chia khoảng đó cho 6). Ước lượng s Ch 13 40 Tại sao chia cho 6?  Khoảng giá trị bao gồm toàn bộ phân phối và ± 3 (hoặc 6) độ lệch chuẩn phủ 99.9% khu vực đường cong độ lệch chuẩn. Bởi vì chúng ta ước lược độ lệch chuẩn, chúng ta chia khoảng giá trị cho 6. Ví dụ Ước lượng giá trị trung bình của tổng thể Ch 13 41 Qui mô mẫu cần là bao nhiêu?  Nhà quản trị muốn biết mức hài lòng của khách hàng với dịch vụ của họ. Họ đề xuất thực hiện một nghiên cứu và hỏi về sự hài lòng trên thang đo từ 1 đến 10 (vì có thể có 10 câu trả lời, nên khoảng = 10).  Nhà quản trị muốn chắc tới 99% trong kết quả thu được và họ không muốn sai số cho phép lớn hơn ±.5 đơn vị thang đo.  n bằng bao nhiêu? Ước lượng giá trị trung bình n? Ch 13 42  S=10/6 or 1.7  Z=2.58 (độ tin cậy 99%)  e=.5 điểm trên thang đo  n bằng bao nhiêu? Ước lượng giá trị trung bình Ch 13 43  Điều này có nghĩa là gì?  Sau nghiên cứu, nhà quản trị có thể phát biểu như sau: (giả định rằng mức hài lòng trung bình là 7.3)  “Ước lượng về mức hài lòng của người tiêu dùng là 7.3 trên thang điểm 10. Chúng ta tin chắc 99% rằng mức hài lòng thực sự của tổng thể người tiêu dùng rơi vào khoảng 6.8 và 7.8.” n=77 Những phương pháp xác định qui mô mẫu khác Ch 13 44  Chọn theo trực giác  Qui mô mẫu bị ảnh hưởng bởi kỹ thuật phân tích dữ liệu được sử dụng.  Qui mô mẫu khi sử dụng phương pháp chọn mẫu phi xác suất: không liên quan đến mức chính xác, xem xét chi phí-lợi ích liên quan khi chọn mẫu. Ví dụ Ch 13 45  1. Sử dụng công thức được giới thiệu trên đây, xác định qui mô mẫu cho mỗi trường hợp sau, với độ chính xác (sai số chấp nhận được) là ±5%:  Độ biến thiên là 30%,  Độ tin cậy là 95% (323) 322.6 = 25 8064 = 25 2100 x 3.84 = 5 70) x (30961. = e (pq)z = n 2 2 2 2 Ví dụ Ch 13 46  Sử dụng công thức được giới thiệu trên đây, xác định qui mô mẫu cho mỗi trường hợp sau, với độ chính xác (sai số chấp nhận được) là ±5%: Độ biến thiên là 60%,  Độ tin cậy là 99% (639) 639.4 = 25 15,984 = 25 2400 x 6.66 = 5 40) x (60582. = e (pq)z = n 2 2 2 2 Ví dụ Ch 13 47  Sử dụng công thức được giới thiệu trên đây, xác định qui mô mẫu cho mỗi trường hợp sau, với độ chính xác (sai số chấp nhận được) là ±5%:  Độ biến thiên không được biết trước,  Độ tin cậy là 95% 384 = 25 9600 = 25 2500 x 3.84 = 5 50) x (50961. = e (pq)z = n 2 2 2 2