Bài giảng Thống kê kinh doanh - Bài 4: Kiểm định giả thuyết thống kê - Nguyễn Thị Xuân Mai

1.1. GIẢ THIẾT THỐNG KÊ • Giả thuyết thống kê là giả thuyết về một vấn đề nào đó của tổng thể chung. Cặp giả thuyết thống kê gồm:  Giả thuyết không (H0) là giả thuyết mà ta muốn kiểm định.  Giả thuyết đối (H1) là giả thuyết đối lập với H0. • Kiểm định thống kê là tìm ra kết luận về việc thừa nhận hay bác bỏ giả thuyết đó dựa vào thông tin thực nghiệm của mẫu. Các loại kiểm định:  Kiểm định hai phía;  Kiểm định phía trái;  Kiểm định phía phải

pdf34 trang | Chia sẻ: thanhle95 | Lượt xem: 281 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Bài giảng Thống kê kinh doanh - Bài 4: Kiểm định giả thuyết thống kê - Nguyễn Thị Xuân Mai, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
v1.0013112205 BÀI 4 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ ThS. Nguyễn Thị Xuân Mai Trường Đại học Kinh tế Quốc dân 1 v1.0013112205 2 TÌNH HUỐNG KHỞI ĐỘNG: Liệu sản phẩm có mang lại hiệu quả như quảng cáo? 1. Làm thế nào để chứng minh được chất lượng cũng như tính trung thực trong quảng cáo sản phẩm mới của nhãn hàng Pond’s? 2. Có thể kiểm tra được những gì từ cuộc khảo sát này? Cũng trong chiến dịch quảng bá sản phẩm kem dưỡng làm trắng da mới của nhãn hàng Pond’s, bộ phận truyền thông của hãng đã chọn ra hai nhóm nữ thanh niên tuổi từ 15-25 để tiến hành khảo sát. Một nhóm gồm những bạn có sử dụng sản phẩm kem dưỡng làm trắng da mới của Pond’s, nhóm còn lại chỉ sử dụng sản phẩm kem dưỡng da thông thường. Thông qua cuộc khảo sát này, nhãn hàng muốn khẳng định chất lượng cũng như tính trung thực trong quảng cáo sản phẩm mới của hãng. v1.0013112205 MỤC TIÊU 3 Sau khi học xong bài này, sinh viên có khả năng: • Trình bày được khái niệm về giả thuyết thống kê. • Phân biệt được các dạng giả thuyết thống kê khác nhau. • Phân biệt được các sai lầm trong kiểm định. • Mô tả được các bước tiến hành một kiểm định giả thuyết thống kê. • Vận dụng để kiểm định giả thuyết về giá trị trung bình của một tổng thể chung và của hai tổng thể chung trong thực tế. • Vận dụng để kiểm định giả thuyết về tỷ lệ của một tổng thể chung và của hai tổng thể chung trong thực tế. v1.0013112205 NỘI DUNG 4 Một số vấn đề chung về kiểm định giả thiết Kiểm định giả thiết về giá trị trung bình Kiểm định giả thiết về tỷ lệ v1.0013112205 1. MỘT SỐ VẤN ĐỀ CHUNG VỀ KIỂM ĐỊNH GIẢ THIẾT 5 1.2. Sai lầm và mức ý nghĩa trong kiểm định 1.1. Giả thiết thống kê 1.3. Tiêu chuẩn kiểm định 1.4. Các bước tiến hành một kiểm định giả thiết thống kê v1.0013112205 6 1.1. GIẢ THIẾT THỐNG KÊ • Giả thuyết thống kê là giả thuyết về một vấn đề nào đó của tổng thể chung. Cặp giả thuyết thống kê gồm:  Giả thuyết không (H0) là giả thuyết mà ta muốn kiểm định.  Giả thuyết đối (H1) là giả thuyết đối lập với H0. • Kiểm định thống kê là tìm ra kết luận về việc thừa nhận hay bác bỏ giả thuyết đó dựa vào thông tin thực nghiệm của mẫu. Các loại kiểm định:  Kiểm định hai phía;  Kiểm định phía trái;  Kiểm định phía phải. v1.0013112205 7 KIỂM ĐỊNH HAI PHÍA Kiểm định 2 phía là bác bỏ giả thuyết H0 khi tham số đặc trưng của mẫu cao hơn hoặc thấp hơn so với giá trị của giả thuyết về tổng thể chung. Kiểm định 2 phía có 2 miền bác bỏ. v1.0013112205 8 KIỂM ĐỊNH PHÍA TRÁI Kiểm định phía trái là bác bỏ giả thuyết H0 khi tham số đặc trưng của mẫu nhỏ hơn một cách đáng kể so với giá trị của giả thuyết H0. Miền bác bỏ nằm ở phía trái của đường phân phối. v1.0013112205 9 KIỂM ĐỊNH PHÍA PHẢI Kiểm định phía phải là bác bỏ giả thuyết H0 khi tham số đặc trưng của mẫu lớn hơn một cách đáng kể so với giá trị của giả thuyết H0. Miền bác bỏ nằm ở phía phải của đường phân phối. v1.0013112205 10 1.2. SAI LẦM VÀ MỨC Ý NGHĨA TRONG KIỂM ĐỊNH Khi phải lựa chọn giữa hai giả thuyết H0 và H1, có thể mắc phải: • Sai lầm loại 1 là bác bỏ giả thuyết H0 khi nó đúng. • Sai lầm loại 2 là thừa nhận H0 khi nó sai. Xác suất mắc sai lầm loại 1 gọi là mức ý nghĩa, được ký hiệu là . Xác suất mắc sai lầm loại 2 gọi là β; 1- β được gọi là lực của kiểm định. Kết luận Thực tế Chấp nhận H0 Bác bỏ H0 nhận H1 H0 đúng Kết luận đúng Sai lầm loại 1 H0 sai Sai lầm loại 2 Kết luận đúng v1.0013112205 11 1.3. TIÊU CHUẨN KIỂM ĐỊNH • Tiêu chuẩn kiểm định là một thống kê nào đó tuân theo quy luật phân phối xác suất xác định (quy luật phân phối chuẩn, phân phối T-Student, phân phối 2, phân phối Fisher...) khi giả thuyết không đúng. • Trong tập hợp các kiểm định thống kê có cùng mức ý nghĩa , kiểm định nào có xác suất mắc sai lầm loại 2 nhỏ nhất sẽ được xem là “tốt nhất”. v1.0013112205 12 1.4. CÁC BƯỚC TIẾN HÀNH MỘT KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ • Phát biểu giả thuyết H0 và giả thuyết đối H1. • Định rõ mức ý nghĩa . • Chọn tiêu chuẩn kiểm định. • Tính giá trị của tiêu chuẩn kiểm định từ mẫu quan sát. • Kết luận:  Nếu giá trị của tiêu chuẩn kiểm định thuộc miền bác bỏ: H0 sai, bác bỏ giả thuyết H0.  Nếu giá trị của tiêu chuẩn kiểm định thuộc miền chấp nhận: với mẫu cụ thể này chưa đủ cơ sở để bác bỏ H0. v1.0013112205 2. KIỂM ĐỊNH GIẢ THIẾT VỀ GIÁ TRỊ TRUNG BÌNH 13 2.2. Kiểm định hai giá trị trung bình của hai tổng thể chung 2.1. Kiểm định giả thiết về giá trị trung bình của một tổng thể chung v1.0013112205 2.1. KIỂM ĐỊNH GIẢ THIẾT VỀ GIÁ TRỊ TRUNG BÌNH CỦA MỘT TỔNG THỂ CHUNG • Giả sử lượng biến của tiêu thức X trong tổng thể chung phân phối theo quy luật chuẩn với trung bình là  là phương sai là σ2. Ký hiệu: N(,σ2). Ta chưa biết , nhưng nếu có cơ sở để cho rằng nó bằng 0. Vậy giả thuyết thống kê H0:  = 0. • Để kiểm định giả thuyết này, từ tổng thể chung ta tiến hành điều tra chọn mẫu ngẫu nhiên n đơn vị và tính được trung bình mẫu là 14 x v1.0013112205 2.1.1. PHƯƠNG SAI CỦA TỔNG THỂ CHUNG σ2 ĐÃ BIẾT • Tiêu chuẩn kiểm định là thống kê z: • H0 đúng, z phân phối theo quy luật chuẩn hóa N(0,1). 15 Kiểm định phía phải: H0:  = 0 H1:  > 0 Nếu z > Z, bác bỏ giả thuyết H0. Kiểm định phía trái: H0:  = 0 H1:  < 0 Nếu z < -Z, bác bỏ giả thuyết H0. Kiểm định hai phía: H0:  = 0 H1:  ≠ 0 Nếu |z| > Z/2, bác bỏ giả thuyết H0. 0 xz / n   v1.0013112205 2.1.2. PHƯƠNG SAI CỦA TỔNG THỂ CHUNG σ2 CHƯA BIẾT • Tiêu chuẩn kiểm định là thống kê t: • H0 đúng, t sẽ phân phối theo quy luật Student với (n - 1) bậc tự do. 16 0 xt S/ n  Kiểm định phía phải: H0:  = 0 H1:  > 0 Nếu t > t,(n-1), bác bỏ giả thuyết H0. Kiểm định phía trái: H0:  = 0 H1:  < 0 Nếu t < -t,(n-1), bác bỏ giả thuyết H0. Kiểm định hai phía: H0:  = 0 H1:  ≠ 0 Nếu |t| > t/2,(n-1), bác bỏ giả thuyết H0. v1.0013112205 2.1.2. PHƯƠNG SAI CỦA TỔNG THỂ CHUNG σ2 CHƯA BIẾT 17 Ví dụ: Theo thông tin từ chủ đầu tư, giá thuê một căn hộ có 2 phòng ngủ ở tà nhà A là 587$/tháng. Để kiểm tra, một khách hàng đã thu thập giá thuê của 50 căn hộ có phòng ngủ thuộc tòa nhà và xác định được mức giá thuê một căn hộ trung bình là 599,5$/tháng với độ lệch tiêu chuẩn là 84,84$. Với mức ý nghĩa 0,02 hãy kiểm định xem thông tin của chủ đầu tư trên có đúng không? • Gọi   là giá thuê trung bình một căn hộ có 2 phòng thuộc tòa nhà A. • Ta cần kiểm định giả thuyết: H0:  = 0 H1:  > 0 • Tiêu chuẩn kiểm định: • Tra bảng tìm giá trị tới hạn: ta/2,(n-1) nên = Z0,01 (49) =2,403 • Vì |t|< ta/2,(n-1) nên với mẫu đã nghiên cứu có thể kết luận rằng chưa đủ cơ sở để bác bỏ H0, tạm thời chấp nhận thông tin từ đầu tư là đúng. 0x 599,5 587t 1,042 S/ n 84,84 / 50     v1.0013112205 2.2. KIỂM ĐỊNH HAI GIÁ TRỊ TRUNG BÌNH CỦA HAI TỔNG THỂ CHUNG • Tổng thể chung thứ nhất có các lượng biến của tiêu thức X1 phân phối theo quy luật chuẩn N(1,σ12). Tổng thể chung thứ hai có các lượng biến của tiêu thức X2 phân phối theo quy luật chuẩn N(2,σ22). • Nếu 1, và 2 chưa biết, song có cơ sở để giả thuyết rằng giá trị của chúng bằng nhau hoặc chênh lệch nhau một giá trị nào đó, ta có giả thuyết không như sau: H0: 1 = 2 hoặc H0: 1 - 2 = 0 • Để kiểm định giả thuyết trên, từ hai tổng thể chung người ta rút ra hai mẫu ngẫu nhiên độc lập với kích thước mẫu tương ứng là n1 và n2, từ đó tính được các trung bình mẫu là và . 18 1x 2x v1.0013112205 2.2.1. PHƯƠNG SAI CỦA HAI TỔNG THỂ CHUNG σ12 VÀ σ22 ĐÃ BIẾT • Tiêu chuẩn kiểm định là thống kê z: • H0 đúng, z phân phối theo quy luật chuẩn hóa N(0,1). 19    1 2 1 2 2 2 1 2 1 2 x x z n n       Kiểm định phía phải: H0: 1 - 2 = 0 H1: 1 - 2 > 0 Nếu z > Z, bác bỏ giả thuyết H0. Kiểm định phía trái: H0: 1 - 2 = 0 H1: 1 - 2 < 0 Nếu z < -Z, bác bỏ giả thuyết H0. Kiểm định hai phía: H0: 1 - 2 = 0 H1: 1 - 2 ≠ 0 Nếu |z| > Z/2, bác bỏ giả thuyết H0. v1.0013112205 2.2.2. PHƯƠNG SAI CỦA HAI TỔNG THỂ CHUNG σ12 VÀ σ22 CHƯA BIẾT Trường hợp phương sai của hai tổng thể bằng nhau • Tiêu chuẩn kiểm định là thống kê t: • S2 là giá trị chung của hai phương sai mẫu S12 và S22. • H0 đúng, cả hai tổng thể chung có phân phối chuẩn thì t sẽ có phân phối Student với (n1 + n2 – 2) bậc tự do. 20    1 2 1 2 2 2 1 2 x x t S S n n         2 22 1 1 2 2 1 2 n 1 S n 1 S S n n 2      v1.0013112205 2.2.2. PHƯƠNG SAI CỦA HAI TỔNG THỂ CHUNG σ12 VÀ σ22 CHƯA BIẾT 21 v1.0013112205 2.2.2. PHƯƠNG SAI CỦA HAI TỔNG THỂ CHUNG σ12 VÀ σ22 CHƯA BIẾT (tiếp theo) 22 v1.0013112205 3. KIỂM ĐỊNH GIẢ THIẾT VỀ TỶ LỆ 23 3.2. Kiểm định hai tỷ lệ của hai tổng thể chung 3.1. Kiểm định giả thiết về tỷ lệ của một tổng thể chung v1.0013112205 24 3.1. KIỂM ĐỊNH GIẢ THIẾT VỀ TỶ LỆ CỦA MỘT TỔNG THỂ CHUNG • Giả sử ở tổng thể chung, tỷ lệ theo một tiêu thức A nào đó là p. Nếu p chưa biết song có cơ sở để giả thuyết rằng giá trị của nó bằng p0, ta đưa ra giả thuyết: H0: p = p0. • Để kiểm định giả thuyết đó ta lấy mẫu ngẫu nhiên kích thước n và thấy có nA đơn vị có biểu hiện nghiên cứu của tiêu thức A. Như vậy ta có tỷ lệ mẫu: f = nA/ n. v1.0013112205 25 3.1. KIỂM ĐỊNH GIẢ THIẾT VỀ TỶ LỆ CỦA MỘT TỔNG THỂ CHUNG (tiếp theo) • Với n đủ lớn (n.p0 ≥ 5 và n(1 – p0) ≥ 5), tiêu chuẩn kiểm định là thống kê Z: • H0 đúng, thì z phân phối theo quy luật chuẩn hóa N(0,1). Kiểm định phía phải: H0: p = p0 H1: p > p0 Nếu z > Z, bác bỏ giả thuyết H0. Kiểm định phía trái: H0: p = p0 H1: p < p0 Nếu z < -Z, bác bỏ giả thuyết H0. Kiểm định hai phía: H0: p = p0 H1: p ≠ p0 Nếu |z| > Z/2, bác bỏ giả thuyết H0. 0 0 0 f pz p (1 p ) n   v1.0013112205 26 3.2. KIỂM ĐỊNH HAI TỶ LỆ CỦA HAI TỔNG THỂ CHUNG • Tỷ lệ theo một tiêu thức A nào đó của tổng thể chung thứ nhất là p1 và của tổng thể chung thứ hai là p2. • Nếu p1 và p2 chưa biết, song có cơ sở để giả thuyết rằng chúng bằng nhau, giả thuyết cần kiểm định là: H0: p1 = p2. • Để kiểm định giả thuyết này, từ hai tổng thể chung ta rút ra hai mẫu ngẫu nhiên với kích thước tương ứng là n1 và n2; thấy có n1A và n2A đơn vị có biểu hiện của tiêu thức A. Ta tính các tỷ lệ mẫu f1 = n1A/ n1 và f2 = n2A/ n2. v1.0013112205 27 3.2. KIỂM ĐỊNH HAI TỶ LỆ CỦA HAI TỔNG THỂ CHUNG • Khi n1 và n2 tương đối lớn (n1f1; n1(1 – f1); n2f2; n2(1 – f2) ≥ 5), tiêu chuẩn kiểm định là thống kê z: • Với f là tỷ lệ chung của cả hai mẫu và được tính: • H0 đúng, z có phân phối xấp xỉ chuẩn N(0,1). 1 2 1 2 f fz 1 1f (1 f ) n n       1 1 2 2 1A 2A 1 2 1 2 n f n f n nf n n n n     v1.0013112205 28 3.2. KIỂM ĐỊNH HAI TỶ LỆ CỦA HAI TỔNG THỂ CHUNG Kiểm định phía phải: H0: p1 = p2 H1: p1 > p2 Nếu z > Z, bác bỏ giả thuyết H0. Kiểm định phía trái: H0: p1 = p2 H1: p1 < p2 Nếu z < -Z, bác bỏ giả thuyết H0. Kiểm định hai phía: H0: p1 = p2 H1: p1 ≠ p2 Nếu |z| > Z/2, bác bỏ giả thuyết H0. v1.0013112205 29 GIẢI QUYẾT TÌNH HUỐNG Câu hỏi: 1. Làm thế nào để chứng minh được chất lượng cũng như tính trung thực trong quảng cáo sản phẩm mới của nhãn hàng Pond’s? 2. Có thể kiểm tra được những gì từ cuộc khảo sát này? Trả lời: 1. Dựa trên kết quả thu được qua điều tra trên 2 mẫu, thực hiện kiểm định giả thuyết thống kê về hiệu quả sử dụng kem dưỡng trắng da của Pond’s. 2. Có thể kiểm tra xem liệu thời gian da trắng lên có như quảng cáo không; tỷ lệ người sử dụng kem dưỡng trắng da của Pond’s nhận được kết quả tốt sau khi sử dụng. v1.0013112205 30 CÂU HỎI MỞ Sau khi học xong bài này, anh/chị hãy rút ra mối quan hệ giữa α và β. Trả lời: • Xác suất mắc sai lầm loại 1 (bác bỏ H0 khi nó đúng) là mức ý nghĩa α và 1- α được gọi là độ tin cậy. • Xác suất mắc sai lầm loại 2 (thừa nhận H0 khi nó sai) là β và 1- β được gọi là lực của kiểm định. • Khi kiểm định bao giờ cũng muốn tối thiểu hóa α và β nhưng α và β có quan hệ nghịch với nhau. α nhỏ thì β lớn và ngược lại, tức là càng ít bác bỏ H0 thì càng dễ chấp nhận H0 khi nó sai. • Vấn đề là cần chọn tiêu chuẩn kiểm định như thế nào khi muốn tối thiểu hóa được cả α và β. v1.0013112205 31 CÂU HỎI TRẮC NGHIỆM 1 Trong kiểm định giả thuyết thống kê, ký hiệu α gắn với: A. lực của kiểm định. B. xác suất mắc sai lầm loại 1. C. xác suất mắc sai lầm loại 2. D. xác suất không bác bỏ giả thuyết H0 khi nó đúng. Trả lời: • Đáp án đúng là: B. Xác suất mắc sai lầm loại 1. • Giải thích: Xác suất của việc mắc sai lầm loại 1 (bác bỏ giả thuyết H0 khi nó đúng) gọi là mức ý nghĩa, được ký hiệu là . v1.0013112205 32 CÂU HỎI TRẮC NGHIỆM 2 Giả sử bạn muốn kiểm định cặp giả thuyết: H0: p=0,55 và H1: p≠0,55. Giá trị tới hạn cần so sánh với tiêu chuẩn kiểm định là: A. Zα. B. Zα/2. C. tα/2,(n-1). D. tα,(n-1). Trả lời: • Đáp án đúng là: B. Zα/2. • Giải thích: Vì đây là kiểm định hai phía của giả thuyết về tỷ lệ của một tổng thể chung, tiêu chuẩn kiểm định z phân phối theo quy luật chuẩn hoá N(0,1) nên phải so sánh tiêu chuẩn kiểm định với giá trị tới hạn Zα/2. v1.0013112205 33 CÂU HỎI TỰ LUẬN Khi nào thực hiện việc kiểm định một phía hay hai phía? Trả lời: Giả thuyết thống kê có thể được trình bày dưới nhiều dạng khác nhau. Đối với giả thuyết không luôn tồn tại dấu bằng (=) trong biểu thức, có thể là bằng (=), lớn hơn hoặc bằng (≥) hay nhỏ hơn hoặc bằng (≤). Tuỳ theo dạng của các giả thuyết này mà lựa chọn và áp dụng kiểm định hai phía hay kiểm định một phía. v1.0013112205 TÓM LƯỢC CUỐI BÀI 34 • Để kết luận một thông tin nào đó là đúng hay sai, người ta có thể thực hiện kiểm định giả thuyết thống kê dựa trên thông tin của mẫu điều tra. • Giả thuyết thống kê gồm có giả thuyết không và giả thuyết đối. Tùy theo dạng của các giả thuyết mà có thể lựa chọn và áp dụng kiểm định hai phía hay kiểm định một phía. • Khi lựa chọn giữa hai giả thuyết không và giả thuyết đối, ta có thể mắc phải hai sai lầm: sai lầm loại 1 và sai lầm loại 2. Xác suất của việc mắc sai lầm loại 1 gọi là mức ý nghĩa. Để bác bỏ hay chấp nhận giả thuyết không, ta phải sử dụng tiêu chuẩn kiểm định. • Kiểm định giả thuyết thống kê phải được thực hiện theo một trình tự nhất định. Các trường hợp phổ biến là kiểm định giá trị trung bình hoặc tỷ lệ của một tổng thể chung so với một giá trị xác định nào đó. Hoặc có thể so sánh hai giá trị trung bình hoặc hai tỷ lệ của hai tổng thể chung với nhau.