Bài giảng Thống kê cho khoa học xã hội - Bài 3: Ước lượng và kiểm định giả thuyết thống kê - Nguyễn Thị Xuân Mai

3.1.2. ƯU NHƯỢC ĐIỂM CỦA ĐIỀU TRA CHỌN MẪU • Ưu điểm:  Tiết kiệm hơn về mặt thời gian và chi phí so với điều tra toàn bộ.  Do điều tra ít đơn vị nên có thể mở rộng nội dung điều tra đi sâu nghiên cứu chi tiết nhiều mặt của hiện tượng.  Tài liệu thu được trong điều tra chọn mẫu có độ chính xác cao hơn do giảm được sai số phi chọn mẫu.  Tiến hành nhanh gọn, bảo đảm tính kịp thời của số liệu thống kê. Mặt khác, điều tra chọn mẫu không đòi hỏi phải có tổ chức lớn, chỉ cần một cơ quan hoặc một nhóm người cũng có thể tiến hành điều tra được. • Nhược điểm:  Không cho biết thông tin đầy đủ, chi tiết về từng đơn vị tổng thể, không cho biết qui mô tổng thể.  Do chỉ tiến hành điều tra một số đơn vị rồi dùng kết quả để suy rộng cho toàn bộ tổng thể nên chắc chắn không tránh khỏi sai số khi suy rộng.  Kết quả điều tra chọn mẫu không thể tiến hành phân nhỏ theo mọi phạm vi và tiêu thức nghiên cứu như điều tra toàn bộ mà chỉ có thể thực hiện ở một mức độ nhất định tuỳ thuộc vào quy mô mẫu và cách rải mẫu.

pdf31 trang | Chia sẻ: thanhle95 | Lượt xem: 26 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Bài giảng Thống kê cho khoa học xã hội - Bài 3: Ước lượng và kiểm định giả thuyết thống kê - Nguyễn Thị Xuân Mai, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
GIỚI THIỆU MÔN HỌC THỐNG KÊ CHO KHOA HỌC XÃ HỘI Giảng viên: ThS. Nguyễn Thị Xuân Mai 2BÀI 3 ƯỚC LƯỢNG VÀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Giảng viên: ThS. Nguyễn Thị Xuân Mai MỤC TIÊU BÀI HỌC • Trình bày một số vấn đề cơ bản về điều tra chọn mẫu. • Trình bày các yếu tố của ước lượng. • Trình bày phương pháp ước lượng số trung bình của tổng thể chung. • Trình bày phương pháp ước lượng tỷ lệ của tổng thể chung. 3 • Trình bày công thức xác định cỡ mẫu cần điều tra. • Giới thiệu một số vấn đề về kiểm định giả thuyết thống kê và các khái niệm có liên quan. • Trình bày phương pháp kiểm định giả thuyết thống kê về giá trị trung bình của một tổng thể chung. • Trình bày phương pháp kiểm định giả thuyết thống kê về tỷ lệ của một tổng thể chung. CÁC KIẾN THỨC CẦN CÓ Kiến thức chung về kinh tế - xã hội. 4 5• Đọc tài liệu tham khảo. • Thảo luận với giáo viên và các sinh viên khác về những vấn đề chưa hiểu rõ. • Trả lời các câu hỏi của bài học. • Đọc và tìm hiểu thêm về điều tra thống kê, điều tra chọn mẫu và phương pháp thống kê suy luận. HƯỚNG DẪN HỌC 6CẤU TRÚC NỘI DUNG Ước lượng số trung bình và tỷ lệ từ kết quả điều tra chọn mẫu 3.2 Điều tra chọn mẫu3.1 Kiểm định giả thuyết thống kê3.3 3.1. ĐIỀU TRA CHỌN MẪU 3.1.1. Khái niệm điều tra chọn mẫu 3.1.2. Ưu nhược điểm của điều tra chọn mẫu 3.1.3. Sai số trong điều tra chọn mẫu 7 3.1.1. KHÁI NIỆM ĐIỀU TRA CHỌN MẪU • Điều tra chọn mẫu là một loại điều tra không toàn bộ trong đó người ta chỉ chọn ra một số đơn vị thuộc đối tượng nghiên cứu để tiến hành điều tra thực tế. Các đơn vị này được chọn theo những quy tắc nhất định để đảm bảo tính đại biểu. Kết quả của điều tra chọn mẫu được dùng để suy rộng cho tổng thể chung. • Các khái niệm liên quan:  Chọn mẫu ngẫu nhiên: Là phương pháp tổ chức chọn mẫu một cách hoàn toàn ngẫu nhiên không qua một sự sắp xếp nào. Ví dụ: bốc thăm, quay số hoặc chọn theo bảng số ngẫu nhiên hay chọn bất kỳ. Có nhiều phương pháp chọn mẫu ngẫu nhiên: chọn ngẫu nhiên giản đơn, chọn mẫu hệ thống, chọn mẫu chùm, chọn mẫu phân tầng, chọn mẫu phân tổ.  Chọn mẫu phi ngẫu nhiên: là phương pháp chọn đơn vị điều tra phụ thuộc vào ý muốn chủ quan của người chọn, dựa trên những thông tin đã biết về tổng thể. Ví dụ: chọn đơn vị trung bình, chọn chuyên gia. 8 iX N    ixx n   *Np N  *nf n   22 iX N     22 1 ix xS n    3.1.1. KHÁI NIỆM ĐIỀU TRA CHỌN MẪU 9 • Tổng thể chung là một tập hợp bao gồm toàn bộ các đối tượng nghiên cứu. → Xác định đúng tổng thể nghiên cứu rất quan trọng. Việc xác định sai sẽ dẫn đến kết quả tính toán trên mẫu bị chệch và dẫn đến sai số phi chọn mẫu. • Tổng thể mẫu (còn gọi là mẫu) là một tập hợp con được rút ra từ tổng thể nghiên cứu. → Điều tra chọn mẫu là thu thập thông tin từ các đơn vị trong mẫu. • Suy rộng (ước lượng) từ các tham số (mức độ) tính toán được trên các đơn vị điều tra (TTM) suy ra các tham số tương ứng của toàn bộ hiện tượng (TTC). Tổng thể chung Tổng thể mẫu Qui mô N n Số trung bình Tỷ lệ theo một tiêu thức Phương sai hoặc 2 = p(1- p) hoặc S2 = f(1 – f) 3.1.2. ƯU NHƯỢC ĐIỂM CỦA ĐIỀU TRA CHỌN MẪU • Ưu điểm:  Tiết kiệm hơn về mặt thời gian và chi phí so với điều tra toàn bộ.  Do điều tra ít đơn vị nên có thể mở rộng nội dung điều tra đi sâu nghiên cứu chi tiết nhiều mặt của hiện tượng.  Tài liệu thu được trong điều tra chọn mẫu có độ chính xác cao hơn do giảm được sai số phi chọn mẫu.  Tiến hành nhanh gọn, bảo đảm tính kịp thời của số liệu thống kê. Mặt khác, điều tra chọn mẫu không đòi hỏi phải có tổ chức lớn, chỉ cần một cơ quan hoặc một nhóm người cũng có thể tiến hành điều tra được. • Nhược điểm:  Không cho biết thông tin đầy đủ, chi tiết về từng đơn vị tổng thể, không cho biết qui mô tổng thể.  Do chỉ tiến hành điều tra một số đơn vị rồi dùng kết quả để suy rộng cho toàn bộ tổng thể nên chắc chắn không tránh khỏi sai số khi suy rộng.  Kết quả điều tra chọn mẫu không thể tiến hành phân nhỏ theo mọi phạm vi và tiêu thức nghiên cứu như điều tra toàn bộ mà chỉ có thể thực hiện ở một mức độ nhất định tuỳ thuộc vào quy mô mẫu và cách rải mẫu. 10 3.1.2. ƯU NHƯỢC ĐIỂM CỦA ĐIỀU TRA CHỌN MẪU 11 • Trường hợp vận dụng điều tra chọn mẫu:  Sử dụng để thay thế cho điều tra toàn bộ trong trường hợp đối tượng nghiên cứu cho phép vừa có thể điều tra toàn bộ vừa có thể điều tra chọn mẫu hoặc với những trường hợp không cho phép điều tra toàn bộ, hoặc do quy mô điều tra toàn bộ quá lớn, cần thu thập nhiều chỉ tiêu nhưng không đủ kinh phí và nhân lực để tiến hành điều tra toàn bộ.  Kết hợp với điều tra toàn bộ để mở rộng nội dung điều tra và đánh giá kết quả của điều tra toàn bộ.  Sử dụng để tổng hợp nhanh tài liệu của điều tra toàn bộ phục vụ kịp thời yêu cầu thông tin cho các đối tượng sử dụng.  Sử dụng trong trường hợp muốn so sánh các hiện tượng với nhau hoặc muốn đưa ra một nhận định nào đó mà chưa có tài liệu cụ thể (để kiểm tra giả thuyết thống kê). 3.1.3. SAI SỐ TRONG ĐIỀU TRA CHỌN MẪU • Sai số trong điều tra thống kê là chênh lệch giữa giá trị thu được qua điều tra và giá trị thực tế của nó. → là vấn đề không thể tránh khỏi trong các cuộc điều tra. → gây ảnh hưởng đến độ tin cậy của kết quả điều tra. • Có hai loại sai số trong điều tra thống kê:  Sai số phi chọn mẫu, xảy ra ở tất cả các cuộc điều tra. Nguyên nhân: xác định sai mục đích, xác định đối tượng điều tra không phù hợp, đơn vị điều tra không trả lời hoặc trả lời sai, lỗi trong bảng hỏi, điều tra viên → Nếu sai số là ngẫu nhiên thì khi điều tra một số lớn đơn vị, các sai số sẽ bù trừ cho nhau. Nếu sai số có hệ thống thì càng điều tra nhiều đơn vị, sai số càng lớn.  Sai số chọn mẫu, chỉ xảy ra trong điều tra chọn mẫu. Đó là sự khác biệt giữa giá trị ước lượng của mẫu và giá trị của tổng thể chung. Sai số chọn mẫu còn gọi là sai số do tính đại biểu, xảy ra do mẫu điều tra không đại diện cho tổng thể chung. → Do sai số phi chọn mẫu không tính được nên phần dưới đây chỉ đề cập tới sai số chọn mẫu. 12 3.1.3. SAI SỐ TRONG ĐIỀU TRA CHỌN MẪU 13 • Các nhân tố tác động đến sai số chọn mẫu, gồm có:  Số đơn vị tổng thể mẫu n: Khi số đơn vị điều tra tăng lên, tổng thể mẫu sẽ gần với tổng thể chung, sai số chọn mẫu sẽ giảm.  Phương pháp tổ chức chọn mẫu: Các phương pháp chọn mẫu khác nhau, tính đại diện của mẫu chọn ra khác nhau sẽ dẫn đến những sai số chọn mẫu khác nhau.  Độ đồng đều của tổng thể chung: nếu tổng thể có độ đồng đều cao tức phương sai tổng thể 2 tương đối nhỏ thì sai số chọn mẫu sẽ nhỏ. • Sai số chọn mẫu không phải là một trị số cố định. Với cùng một hiện tượng nhưng nếu tiến hành điều tra nhiều lần với các cách chọn mẫu khác nhau, kết cấu của tổng thể mẫu khác nhau thì sẽ có các sai số chọn mẫu khác nhau. • Giá trị của sai số chọn mẫu ảnh hưởng rất nhiều đến ước lượng khoảng tin cậy của các tham số. 3.2. ƯỚC LƯỢNG SỐ TRUNG BÌNH VÀ TỶ LỆ TỪ KẾT QUẢ ĐIỀU TRA CHỌN MẪU 3.2.1. Các yếu tố của ước lượng 3.2.2. Ước lượng số trung bình của tổng thể chung 3.2.3. Ước lượng tỷ lệ của tổng thể chung 3.2.4. Xác định cỡ mẫu điều tra 14 3.2.1. CÁC YẾU TỐ CỦA ƯỚC LƯỢNG Ước lượng khoảng tin cậy là xác định một khoảng giá trị mà tham số của tổng thể chung rơi vào đó với xác suất nhất định. • Khoảng giá trị này gọi là khoảng tin cậy, được xác định bởi hai giới hạn: giới hạn tin cậy dưới và giới hạn tin cậy trên. • Độ tin cậy là xác suất để tham số của tổng thể chung rơi vào trong khoảng tin cậy đó, được ký hiệu là (1-α) %, chẳng hạn 90%, 95%, 99%... → α chính là xác suất để tham số của tổng thể chung không rơi vào trong khoảng tin cậy. Khoảng tin cậy Thống kê mẫu Giới hạn tin cậy dưới Giới hạn tin cậy trên 15 • Trường hợp đã biết phương sai của tổng thể chung (2)  Điều kiện: tổng thể chung phân phối chuẩn. Trong trường hợp không phân phối chuẩn, phải sử dụng mẫu lớn.  Khoảng tin cậy ước lượng cho số trung bình của tổng thể chung là: Trong đó: là sai số chọn mẫu (sampling error) khi ước lượng số trung bình của tổng thể chung. 3.2.2. ƯỚC LƯỢNG SỐ TRUNG BÌNH CỦA TỔNG THỂ CHUNG xx xx   n z.z 2/x2/x   x • Trường hợp chưa biết phương sai của tổng thể chung (2).  Điều kiện: áp dụng khi tổng thể chung phân bố chuẩn và sử dụng phân vị Student.  Khoảng tin cậy ước lượng cho số trung bình của tổng thể chung là: Trong đó: là sai số chọn mẫu khi ước lượng số trung bình của tổng thể chung. xx xx   n s t.t )1n(,2/x)1n(,2/x   x 16 3.2.2. ƯỚC LƯỢNG SỐ TRUNG BÌNH CỦA TỔNG THỂ CHUNG 17 Ví dụ: Một mẫu gồm 20 nhân viên được tiến hành điều tra nhằm thu thập thông tin liên quan đến một chương trình đào tạo. Người ta tính được thời gian trung bình để hoàn tất chương trình của 20 nhân viên này là 51,5 ngày với độ lệch tiêu chuẩn là 6,84 ngày. Hãy ước lượng thời gian trung bình để hoàn tất chương trình với độ tin cậy 95%. • Do chưa biết phương sai của tổng thể chung nên sẽ dùng phương sai của tổng thể mẫu để ước lượng. • Tra bảng t-Student với mức ý nghĩa 0,05 và 19 bậc tự do, t0,025;19 = 2,093. • Công thức ước lượng: • Kết luận: Với mẫu đã cho, khoảng tin cậy 95% cho thời gian trung bình để hoàn tất chương trình là: 6,84 51,5 2,093. 51,5 3,2 20 hay     48,3 54,7  (ngày) 3.2.3. ƯỚC LƯỢNG TỶ LỆ CỦA TỔNG THỂ CHUNG • Theo tiêu thức nghiên cứu, tổng thể chỉ có 2 loại biểu hiện. Khi đó tổng thể chung có phân phối nhị thức. Phân phối xấp xỉ chuẩn được sử dụng. • Với mẫu đủ lớn (n.p  5 và n(1-p)  5), công thức ước lượng khoảng tin cậy cho tỷ lệ của tổng thể chung như sau: Trong đó:  f là sai số chọn mẫu khi ước lượng tỷ lệ của tổng thể chung.  z/2 là giá trị tới hạn của phân phối chuẩn. ff fpf  n )f1(f .z 2/f   18 3.2.4. XÁC ĐỊNH CỠ MẪU ĐIỀU TRA Cơ sở xác định cỡ mẫu: • Sai số chọn mẫu là nhỏ nhất. • Chi phí điều tra là thấp nhất. → Đây là hai yêu cầu đối lập nhau → Khi xác định cỡ mẫu thường dựa vào độ chính xác trong ước lượng. • Cỡ mẫu được xác định khi ước lượng số trung bình là: Ví dụ: Cỡ mẫu là bao nhiêu để khoảng tin cậy 90% khi ước lượng số trung bình nằm trong phạm vi  5. Một nghiên cứu đã cho rằng độ lệch chuẩn là 45. Cỡ mẫu được xác định khi ước lượng tỷ lệ là: Lưu ý: Cỡ mẫu luôn làm tròn lên. 2 2 /2 2 x Zn    2 2 2 2 /2 2 2 1,645 .45 219,2 220 5x Zn       2/2 2 1 f Z p p n    19 3.2.4. XÁC ĐỊNH CỠ MẪU ĐIỀU TRA 20 Để xác định cỡ mẫu, cần phải biết 3 yếu tố: • Độ tin cậy mong muốn, được xác định bằng giá trị z/2. • Sai số chọn mẫu có thể chấp nhận được, . • Độ lệch tiêu chuẩn của tổng thể, , là yếu tố thường không biết trong đa phần các trường hợp. Có một số cách để xác định giá trị  này như sau:  Lấy phương sai lớn nhất trong các lần điều tra trước (nếu có).  Lấy phương sai của các hiện tượng khác tương tự (nếu có).  Điều tra thí điểm để tính phương sai.  Có thể ước lượng độ lệch tiêu chuẩn qua khoảng biến thiên tùy theo phân phối của tổng thể. Cụ thể, nếu tổng thể có phân phối chuẩn thì: max min 6 6 x xR    3.3. KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ 3.3.1. Một số vấn đề chung về kiểm định giả thuyết thống kê 3.3.2. Kiểm định giả thuyết về giá trị trung bình của tổng thể chung 3.3.3. Kiểm định giả thuyết về tỷ lệ của tổng thể chung 21 3.3.1. MỘT SỐ VẤN ĐỀ CHUNG VỀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ • Giả thuyết thống kê là giả thuyết về một vấn đề nào đó của tổng thể chung. Cặp giả thuyết thống kê gồm:  Giả thuyết không (H0) là giả thuyết mà ta muốn kiểm định.  Giả thuyết đối (H1) là giả thuyết đối lập với H0. • Kiểm định thống kê là tìm ra kết luận về việc thừa nhận hay bác bỏ giả thuyết đó dựa vào thông tin thực nghiệm của mẫu. Các loại kiểm định:  Kiểm định hai phía;  Kiểm định phía trái;  Kiểm định phía phải. 22 3.3.1. MỘT SỐ VẤN ĐỀ CHUNG VỀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ 23 Kiểm định 2 phía là bác bỏ giả thuyết H0 khi tham số đặc trưng của mẫu cao hơn hoặc thấp hơn so với giá trị của giả thuyết về tổng thể chung. Kiểm định 2 phía có 2 miền bác bỏ. Kiểm định phía trái là bác bỏ giả thuyết H0 khi tham số đặc trưng của mẫu nhỏ hơn một cách đáng kể so với giá trị của giả thuyết H0. Miền bác bỏ nằm ở phía trái của đường phân phối. Kiểm định phía phải là bác bỏ giả thuyết H0 khi tham số đặc trưng của mẫu lớn hơn một cách đáng kể so với giá trị của giả thuyết H0. Miền bác bỏ nằm ở phía phải của đường phân phối. 3.3.1. MỘT SỐ VẤN ĐỀ CHUNG VỀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ (tiếp theo) • Sai lầm và mức ý nghĩa trong kiểm định Khi phải lựa chọn giữa hai giả thuyết H0 và H1, có thể mắc phải:  Sai lầm loại 1 là bác bỏ giả thuyết H0 khi nó đúng.  Sai lầm loại 2 là thừa nhận H0 khi nó sai.  Xác suất mắc sai lầm loại 1 gọi là mức ý nghĩa, được ký hiệu là .  Xác suất mắc sai lầm loại 2 gọi là β; 1- β được gọi là lực của kiểm định. • Tiêu chuẩn kiểm định Tiêu chuẩn kiểm định là một thống kê nào đó tuân theo quy luật phân phối xác suất xác định (quy luật phân phối chuẩn, phân phối T-Student, phân phối 2, phân phối Fisher...) khi giả thuyết không đúng.  Trong tập hợp các kiểm định thống kê có cùng mức ý nghĩa , kiểm định nào có xác suất mắc sai lầm loại 2 nhỏ nhất sẽ được xem là “tốt nhất”. Kết luận Thực tế Chấp nhận H0 Bác bỏ H0 nhận H1 H0 đúng Kết luận đúng Sai lầm loại 1 H0 sai Sai lầm loại 2 Kết luận đúng 24 3.3.1. MỘT SỐ VẤN ĐỀ CHUNG VỀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ (tiếp theo) 25 • Các bước tiến hành một kiểm định giả thiết thống kế  Phát biểu giả thuyết H0 và giả thuyết đối H1.  Định rõ mức ý nghĩa .  Chọn tiêu chuẩn kiểm định.  Tính giá trị của tiêu chuẩn kiểm định từ mẫu quan sát.  Kết luận:  Nếu giá trị của tiêu chuẩn kiểm định thuộc miền bác bỏ: H0 sai, bác bỏ giả thuyết H0.  Nếu giá trị của tiêu chuẩn kiểm định thuộc miền chấp nhận: với mẫu cụ thể này chưa đủ cơ sở để bác bỏ H0. 0 1344,27 1123 3,71 231 15 xt S n     • Giả sử lượng biến của tiêu thức X trong tổng thể chung phân phối theo quy luật chuẩn với trung bình là  và phương sai là 2. Ký hiệu: N(, 2). Ta chưa biết , nhưng nếu có cơ sở để cho rằng nó bằng 0. Vậy giả thuyết thống kê H0:  = 0 • Để kiểm định giả thuyết này, từ tổng thể ta tiến hành điều tra chọn mẫu ngẫu nhiên n đơn vị và tính được trung bình mẫu là • Phương sai của tổng thể chung σ2 đã biết  Tiêu chuẩn kiểm định là thống kê z:  H0 đúng, z phân phối theo quy luật chuẩn hóa N(0,1). 3.3.2. KIỂM ĐỊNH GIẢ THUYẾT VỀ GIÁ TRỊ TRUNG BÌNH CỦA TỔNG THỂ CHUNG Kiểm định phía phải: H0:  = 0 H1:  > 0 Nếu z > Z, bác bỏ giả thuyết H0. Kiểm định phía trái: H0:  = 0 H1:  < 0 Nếu z < -Z, bác bỏ giả thuyết H0. Kiểm định hai phía: H0:  = 0 H1:  ≠ 0 Nếu |z| > Z/2, bác bỏ giả thuyết H0. n xz / 0   x nS xt / 0 26 3.3.2. KIỂM ĐỊNH GIẢ THUYẾT VỀ GIÁ TRỊ TRUNG BÌNH CỦA TỔNG THỂ CHUNG 27 • Phương sai của tổng thể σ2 chưa biết  Tiêu chuẩn kiểm định là thống kê t:  H0 đúng, t sẽ phân phối theo quy luật Student với (n - 1) bậc tự do. Kiểm định phía phải: H0:  = 0 H1:  > 0 Nếu t > t,(n-1), bác bỏ giả thuyết H0. Kiểm định phía trái: H0:  = 0 H1:  < 0 Nếu t < -t,(n-1), bác bỏ giả thuyết H0. Kiểm định hai phía: H0:  = 0 H1:  ≠ 0 Nếu |t| > t/2,(n-1), bác bỏ giả thuyết H0. Lưu ý: trong thực tế, với quy mô mẫu lớn (n ≥30), thống kê t phân phối xấp xỉ chuẩn, nên cũng có thể so sánh tiêu chuẩn kiểm định với giá trị Z. 3.3.2. KIỂM ĐỊNH GIẢ THUYẾT VỀ GIÁ TRỊ TRUNG BÌNH CỦA TỔNG THỂ CHUNG 28 Ví dụ: Theo công bố của một nghiên cứu về chi tiêu hộ gia đình ở thành thị, năm 2012, trung bình mỗi hộ đã phải trả 1123 nghìn đồng một tháng cho tiêu dùng năng lượng. Để kiểm tra thông tin này, người ta chọn 15 hộ gia đình và tính được chi tiêu dùng năng lượng trung bình mỗi hộ là 1344,27 nghìn đồng một tháng với độ lệch tiêu chuẩn là 231 nghìn đồng. Ở mức ý nghĩa 5%, liệu kết luận của nghiên cứu có thấp hơn thực tế hay không? • Gọi  là mức chi cho tiêu dùng năng lượng trung bình của mỗi hộ một tháng. • Ta cần kiểm định giả thuyết: H0:  = 1123 H1:  > 1123 • Do chưa biết phương sai của tổng thể chung nên tiêu chuẩn kiểm định là thống kê t. • Tra bảng phân phối Student với 14 bậc tự do ta tìm được t0,05;14 = 1,761 • Kết luận: vì t > t,(n-1) do đó với mẫu đã nghiên cứu, bác bỏ H0. Các hộ gia đình chi tiêu dùng năng lượng nhiều hơn mức công bố của nghiên cứu. 3.3.3. KIỂM ĐỊNH GIẢ THUYẾT VỀ TỶ LỆ CỦA TỔNG THỂ CHUNG • Giả sử ở tổng thể chung, tỷ lệ theo một tiêu thức A nào đó là p. Nếu p chưa biết, song có cơ sở cho rằng giá trị của nó bằng p0, ta đưa ra giả thuyết: H0: p = p0. • Để kiểm định giả thuyết đó, lấy mẫu ngẫu nhiên kích thước n và thấy có nA đơn vị có biểu hiện nghiên cứu của tiêu thức A. Như vậy ta có tỷ lệ mẫu: f = nA/n. • Với n đủ lớn (n.p0 ≥ 5 và n(1 – p0) ≥ 5), tiêu chuẩn kiểm định là thống kê Z: • H0 đúng, thì z phân phối theo quy luật chuẩn hóa N(0,1). Kiểm định phía phải: H0: p = p0 H1: p > p0 Nếu z > Z, bác bỏ giả thuyết H0. Kiểm định phía trái: H0: p = p0 H1: p < p0 Nếu z < -Z, bác bỏ giả thuyết H0. Kiểm định hai phía: H0: p = p0 H1: p ≠ p0 Nếu |z| > Z/2, bác bỏ giả thuyết H0. n pp pf z )1( 00 0   29 3.3.3. KIỂM ĐỊNH GIẢ THUYẾT VỀ TỶ LỆ CỦA TỔNG THỂ CHUNG 30 Ví dụ: Trong một nghiên cứu của công ty AZ, người ta thực hiện phỏng vấn 758 khách du lịch đến HL có sử dụng tour du lịch biển xem liệu họ có hài lòng hay không. 394 người trong số được hỏi đã trả lời là có. Với mức ý nghĩa 5%, hãy kiểm định xem liệu có đúng là đa số (>50%) những người đến HL có sử dụng tour du lịch biển là hài lòng với tour này hay không? • Gọi p là tỷ lệ khách du lịch đến HL có sử dụng tour du lịch biển và hài lòng với tour này. • Giả thuyết cần kiểm định là: H0: p = 0,5 H1: p > 0,5 • Ta có np0 = 758.0,5 = 379  5 và n(1-p0) = 758.0,5 = 379  5 do đó điều kiện kiểm định được thỏa mãn. • Tỷ lệ mẫu f = 394/758 = 0,52 và tiêu chuẩn kiểm định là thống kê z. TÓM LƯỢC CUỐI BÀI Trong bài học này, chúng ta đã nghiên cứu các nội dung chính sau: • Điều tra chọn mẫu và một số khái niệm liên quan, ưu nhược điểm của điều tra chọn mẫu và trường hợp vận dụng. • Ước lượng số trung bình và tỷ lệ của tổng thể chung từ kết quả điều tra chọn mẫu. • Kiểm định giả thuyết về số trung bình và tỷ lệ của tổng thể chung. 31