Bài giảng Xác suất thống kê - Bài 7: Kiểm định giả thuyết thống kê

7.1.1. Giả thuyết thống kê Chúng ta nghiên cứu vấn đề của một tổng thể thông qua một dấu hiệu nào đó. Trong quá trình nghiên cứu cần kiểm tra xem dấu hiệu đó có hay không có một hoặc một số tính chất nào đó. Do không có đầy đủ thông tin trên tổng thể nên không thể đánh giá chính xác vấn đề đó được. Thông tin trên mẫu sẽ được sử dụng để kiểm tra đánh giá tính chất đó theo một phương pháp toán học. Những bài toán đó gọi là bài toán kiểm định giả thuyết thống kê. Dấu hiệu nghiên cứu được đặc trưng bởi (các) biến ngẫu nhiên – gọi là biến ngẫu nhiên gốc. Việc kiểm tra một mệnh đề liên quan đến biến ngẫu nhiên gốc là kiểm định một giả thuyết thống kê, bao gồm 3 loại:  Kiểm định về dạng phân phối xác suất (chẳng hạn, liệu một biến ngẫu nhiên nào đó có phân phối Chuẩn hay không?).  Kiểm định về tham số đặc trưng (trung bình, phương sai, tỷ lệ).  Kiểm định về tính độc lập của các biến ngẫu nhiên (chẳng hạn, việc sắp xếp các quầy hàng theo thứ tự khác nhau và sự hài lòng của khách hàng có liên quan với nhau hay không?). Trong giới hạn chương trình, ở bài này ta chỉ xét các giả thuyết thống kê về các tham số đặc trưng của tổng thể (chính là các tham số đặc trưng của biến ngẫu nhiên gốc). Để thuận tiện và chuẩn xác về mặt toán học, các mệnh đề cần được kiểm định sẽ được đặt dưới dạng các cặp giả thuyết. Tùy mục đích nghiên cứu của từng trường hợp, cặp giả thuyết sẽ tương ứng với các mệnh đề. Cặp giả thuyết gồm một giả thuyết gọi là giả thuyết gốc, kí hiệu H0, và một giả thuyết đối, kí hiệu là H1. Khi bác bỏ giả thuyết H0 thì sẽ chấp nhận giả thuyết H1 đi kèm theo nó. Các cặp giả thuyết thống kê về tham số đặc trưng  nào đó của biến ngẫu nhiên gốc có thể quy về ba dạng sau:

pdf15 trang | Chia sẻ: thanhle95 | Lượt xem: 265 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Bài giảng Xác suất thống kê - Bài 7: Kiểm định giả thuyết thống kê, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Bài 7: Kiểm định giả thuyết thống kê 128 TXTOKT02_Bai7_v1.0014109205 BÀI 7 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Hướng dẫn học Cùng với bài toán ước lượng, bài toán kiểm định giả thuyết là kết hợp của tính toán số liệu thống kê và quy luật phân phối xác suất để suy diễn các kết luận hợp lý. Do đó người học cần nắm được ý nghĩa các tham số đặc trưng chủ yếu của biến ngẫu nhiên: kỳ vọng, phương sai, độ lệch chuẩn (học ở bài 3), nắm được các nội dung cơ bản về một số quy luật phân phối xác suất phổ biến trong thực tế: quy luật Không – Một, quy luật Nhị thức, quy luật Chuẩn (học ở bài 3 và bài 4), nhớ được quy luật phân phối xác suất của một số thống kê quan trọng (học ở bài số 5) và nhớ nội dung của nguyên lý xác suất nhỏ (học trong bài số 1). Để học tốt bài này, sinh viên cần tham khảo các phương pháp học sau:  Học đúng lịch trình của môn học theo tuần, làm các bài luyện tập đầy đủ và tham gia thảo luận trên diễn đàn.  Đọc tài liệu: Giáo trình Lý thuyết xác suất và thống kê toán của NXB Đại học KTQD.  Sinh viên làm việc theo nhóm và trao đổi với giảng viên trực tiếp tại lớp học hoặc qua email.  Tham khảo các thông tin từ trang Web môn học. Nội dung  Lý thuyết cơ bản về kiểm định;  Thủ tục thực hiện bài toán kiểm định;  Kiểm định giá trị trung bình của tổng thể phân phối Chuẩn;  Kiểm định phương sai của tổng thể phân phối Chuẩn;  Kiểm định tỷ lệ tổng thể (kỳ vọng của biến ngẫu nhiên phân phối Không – Một). Mục tiêu Sau khi học xong bài này, sinh viên cần đảm bảo được các yêu cầu sau:  Nhận biết về giả thuyết thống kê;  Chuyển đổi giả thuyết thành cặp giả thuyết tương ứng, hiểu khái niệm sai lầm khi kiểm định;  Biết cách sử dụng miền bác bỏ, kết luận đúng về việc bác bỏ hay chưa bác bỏ giả thuyết thống kê;  Trả lời cho câu hỏi đặt ra một cách đúng đắn. Bài 7: Kiểm định giả thuyết thống kê TXTOKT02_Bai7_v1.0014109205 129 Tình huống dẫn nhập Kiểm định đánh giá kế hoạch và chính sách Sở Nông nghiệp của 1 tỉnh muốn biết liệu năng suất lúa năm nay có đạt mức trung bình là 5 tấn/ha hay không, để đánh giá được tổng sản lượng lúa toàn vùng, từ đó có kế hoạch phù hợp cho việc tiêu thụ nông sản (dự trữ, xuất khẩu, tiêu thụ nội địa), xác định mức giá hợp lý. Đơn vị nghiên cứu thị trường muốn biết giá cả trên thị trường năm nay có biến động nhiều hơn so với năm ngoái hay không. Một tổ chức quốc tế muốn đánh giá hiệu quả của Chương trình xóa đói giảm nghèo triển khai ở 1 quốc gia, và cần xem xét liệu tỷ lệ hộ nghèo có giảm xuống hay không, so với mức trước khi triển khai chương trình (giả sử là 12%). Trong thực tiễn kinh tế xã hội, có những bài toán đặt ra yêu cầu kiểm tra tính đúng sai của một mệnh đề/một tình huống giả định, khi chưa có đầy đủ thông tin chính xác. Vì các mệnh đề này có thể đúng hoặc không đúng nên cần kiểm định, để kết luận về tính thừa nhận hay không thừa nhận được của mệnh đề đó. Khi đó phải thực hiện kiểm tra, kiểm định dựa trên thông tin có từ một mẫu, bằng những phương pháp thống kê cụ thể. Bài toán kiểm định được áp dụng rất nhiều trong các công việc nghiên cứu liên quan đến số liệu, kết quả của nó có mặt rộng rãi trong mọi lĩnh vực, mọi cấp độ, của đời sống kinh tế xã hội. Tất cả các câu hỏi trên sẽ hoàn toàn được giải đáp nếu như ta đã thu hoạch toàn bộ các điểm trồng lúa ở tỉnh đó, đã đi điều tra về tình trạng đói nghèo của tất cả các hộ gia đình ở quốc gia kia. Nhưng sẽ làm thế nào nếu như chúng ta không làm được việc đó, vì những hạn chế về nguồn lực con người, tài chính, về thời gian, về kỹ thuật? Bài 7: Kiểm định giả thuyết thống kê 130 TXTOKT02_Bai7_v1.0014109205 7.1. Lý thuyết kiểm định giả thuyết 7.1.1. Giả thuyết thống kê Chúng ta nghiên cứu vấn đề của một tổng thể thông qua một dấu hiệu nào đó. Trong quá trình nghiên cứu cần kiểm tra xem dấu hiệu đó có hay không có một hoặc một số tính chất nào đó. Do không có đầy đủ thông tin trên tổng thể nên không thể đánh giá chính xác vấn đề đó được. Thông tin trên mẫu sẽ được sử dụng để kiểm tra đánh giá tính chất đó theo một phương pháp toán học. Những bài toán đó gọi là bài toán kiểm định giả thuyết thống kê. Dấu hiệu nghiên cứu được đặc trưng bởi (các) biến ngẫu nhiên – gọi là biến ngẫu nhiên gốc. Việc kiểm tra một mệnh đề liên quan đến biến ngẫu nhiên gốc là kiểm định một giả thuyết thống kê, bao gồm 3 loại:  Kiểm định về dạng phân phối xác suất (chẳng hạn, liệu một biến ngẫu nhiên nào đó có phân phối Chuẩn hay không?).  Kiểm định về tham số đặc trưng (trung bình, phương sai, tỷ lệ).  Kiểm định về tính độc lập của các biến ngẫu nhiên (chẳng hạn, việc sắp xếp các quầy hàng theo thứ tự khác nhau và sự hài lòng của khách hàng có liên quan với nhau hay không?). Trong giới hạn chương trình, ở bài này ta chỉ xét các giả thuyết thống kê về các tham số đặc trưng của tổng thể (chính là các tham số đặc trưng của biến ngẫu nhiên gốc). Để thuận tiện và chuẩn xác về mặt toán học, các mệnh đề cần được kiểm định sẽ được đặt dưới dạng các cặp giả thuyết. Tùy mục đích nghiên cứu của từng trường hợp, cặp giả thuyết sẽ tương ứng với các mệnh đề. Cặp giả thuyết gồm một giả thuyết gọi là giả thuyết gốc, kí hiệu H0, và một giả thuyết đối, kí hiệu là H1. Khi bác bỏ giả thuyết H0 thì sẽ chấp nhận giả thuyết H1 đi kèm theo nó. Các cặp giả thuyết thống kê về tham số đặc trưng  nào đó của biến ngẫu nhiên gốc có thể quy về ba dạng sau:     01 00 : :   H H     01 00 : :   H H     01 00 : :   H H (7.1) Ví dụ 7.1. Một nhà máy sản xuất khẳng định trọng lượng trung bình của sản phẩm do họ sản xuất ra là 350g. Khách hàng của nhà máy muốn kiểm tra điều khẳng định đó, khi đó cặp giả thuyết có dạng:     01 00 : 350: mmH mmH Với m là trung bình tổng thể, là kì vọng biến ngẫu nhiên X – “Trọng lượng sản phẩm”. Giả thuyết H0 thể hiện điều khẳng định của nhà sản xuất là đúng, giả thuyết H1 thể hiện điều khẳng định đó sai. Ví dụ 7.2. Một quan chức ngành ngân hàng cho rằng độ dao động của giá 1 ounce vàng – đo bởi phương sai – là vượt quá 20 USD2, ta sẽ kiểm định mệnh đề đó thông qua cặp giả thuyết:     2 0 2 1 2 0 2 0 : 20:   H H Bài 7: Kiểm định giả thuyết thống kê TXTOKT02_Bai7_v1.0014109205 131 Ở đây 2 là phương sai tổng thể, phương sai của biến ngẫu nhiên X – “Giá 1 ounce vàng”. Giả thuyết H0 thể hiện điều khẳng định của quan chức là sai, độ dao động của giá vàng chỉ ở mức 20 USD2, H1 thể hiện điều khẳng định là đúng, độ dao động của giá vàng đã vượt quá mức 20 USD2. Ví dụ 7.3. Báo cáo của phòng chăm sóc khách hàng nói rằng tỷ lệ khách không hài lòng là chưa đến 10%, cặp giả thuyết có dạng:     01 00 : 1,0: ppH ppH Trong đó p là tỷ lệ khách không hài lòng trong tổng thể. Giả thuyết H0 thể hiện báo cáo của phòng chăm sóc khách hàng là sai, tỷ lệ khách không hài lòng đến 10%, giả thuyết H1 thể hiện báo cáo là đúng, tỷ lệ khách không hài lòng chưa đến 2%. Để kiểm tra một giả thuyết là đúng hay không, cần phải kiểm định, chúng ta sử dụng phương pháp thống kê, dựa trên một mẫu thực nghiệm để kết luận, với phương pháp suy luận như sau:  Giả sử H0 đúng;  Khi H0 đúng, với một mẫu, biến cố A sẽ xảy ra với xác suất rất nhỏ;  Theo nguyên lý xác suất nhỏ, có thể nói với một phép thử, A sẽ không xảy ra;  Với mẫu cụ thể nếu A xảy ra thì có thể bác bỏ H0, nếu A không xảy ra thì chưa có cơ sở bác bỏ H0. 7.1.2. Phương pháp kiểm định Xét mẫu ngẫu nhiên (X1, X2,, Xn) được lập từ tổng thể, tùy thuộc cặp giả thuyết, ta chọn lập một thống kê tương ứng với giả thuyết gốc, kí hiệu là 1 2( , ,..., ) nG f X X X . Thống kê G được chọn sao cho nếu H0 đúng thì quy luật phân phối xác suất của G hoàn toàn xác định. Cùng với thống kê G, xác định một miền W sao cho với một giá trị là  (0;1) đủ nhỏ (thường lấy  bằng 0,05 hoặc 0,1) thì xác suất để thống kê G thuộc miền W bằng giá trị  đủ nhỏ đó. Tức là: P(G  Wα | H0) = α (7.2) Khi đó, theo nguyên lý xác suất lớn và nhỏ, khi H0 đúng, xác suất để biến cố (G  Wα) xảy ra là nhỏ, nên nếu với một mẫu, tính được giá trị cụ thể của G là Gqs = f(x1, x2,, xn), và nếu biến cố (G  Wα) xảy ra thì có thể cho rằng H0 là không đúng theo cách kiểm định này.  Thống kê G được gọi là Tiêu chuẩn kiểm định;  Giá trị  được gọi là Mức ý nghĩa của kiểm định;  Miền W được gọi là Miền bác bỏ giả thuyết H0 với mức ý nghĩa . Với một mẫu cụ thể, tính được giá trị quan sát Gqs của tiêu chuẩn kiểm định:  Nếu giá trị quan sát thuộc miền bác bỏ  bác bỏ H0.  Nếu giá trị quan sát không thuộc miền bác bỏ  chưa bác bỏ H0. Bài 7: Kiểm định giả thuyết thống kê 132 TXTOKT02_Bai7_v1.0014109205 7.1.3. Các loại sai lầm Khi sử dụng phương pháp kiểm định thống kê trên, có thể mắc phải các sai lầm. Các sai lầm gồm hai loại:  Sai lầm loại một: bác bỏ một điều đúng. Xác suất mắc sai lầm loại một bằng mức ý nghĩa .  Sai lầm loại hai: thừa nhận một điều sai. Xác suất mắc sai lầm loại hai bằng , 1 gọi là lực kiểm định. 7.1.4. Các bước thực hiện Bài toán kiểm định ở đây được thực hiện với giá trị cho trước của mức ý nghĩa . Các bước tiến hành tổng quát như sau:  Xây dựng giả thuyết gốc H0 cần kiểm định, từ đó viết cặp giả thuyết;  Lập mẫu ngẫu nhiên kích thước n;  Chọn tiêu chuẩn kiểm định G và xác định được quy luật phân phối xác suất của G khi giả thuyết H0 là đúng;  Xác định miền bác bỏ tốt nhất tùy thuộc vào giả thuyết đối H1;  Lập mẫu cụ thể và tìm được giá trị quan sát của tiêu chuẩn kiểm định;  So sánh giá trị quan sát với miền bác bỏ và kết luận. Trên thực tế, ta thường xét một số bài toán kiểm định các tham số cơ bản là trung bình (μ), phương sai (2) của tổng thể phân phối Chuẩn, và tỷ lệ tổng thể (p) trên các mẫu đã được cho thông tin. Do đó các tiêu chuẩn kiểm định, miền bác bỏ đã được xác định trước. Công việc phải thực hiện là:  Xác định chính xác cặp giả thuyết;  Tìm đúng tiêu chuẩn kiểm định và miền bác bỏ;  Tính đúng các thống kê dựa trên mẫu, tính giá trị quan sát;  Tra bảng số để kết luận bác bỏ hoặc chưa bác bỏ H0;  Kết luận đúng về câu hỏi. 7.2. Kiểm định về trung bình tổng thể Cũng tương tự bài toán ước lượng khoảng, ta chỉ xét bài toán kiểm định với tổng thể phân phối Chuẩn. Xét biến ngẫu nhiên gốc trong tổng thể phân phối chuẩn X ~ N(μ ; 2) với các tham số tổng thể là chưa biết, hay  chưa biết, trong đó  chính là trung bình của tổng thể theo dấu hiệu nghiên cứu. Ta kiểm định giả thiết về tham số , với việc so sánh với một số thực 0 cho trước. Các chứng minh đã được trình bày trong giáo trình, tại đây ta áp dụng các công thức để thực hiện kiểm định và đưa ra kết luận phù hợp với từng trường hợp. Xét cặp giả thuyết đầu tiên:     01 00 : :   H H Bài 7: Kiểm định giả thuyết thống kê TXTOKT02_Bai7_v1.0014109205 133 Trong đó μ0 là một con số được đưa ra trong giả thuyết cần kiểm định. Khi đó sử dụng thống kê chứa tham số cần kiểm định và có quy luật phân phối xác suất xác định (tiêu chuẩn kiểm định) như sau: 0( ) X nT S Nếu H0 đúng, chứng minh được rằng khi đó xác suất để ( 1)/2 nT t là bằng α đủ nhỏ, như vậy theo nguyên lý xác suất nhỏ, có thể nói biến cố đó không xảy ra khi thực hiện một phép thử. Khi thực hiện một phép thử, nghĩa là với số liệu mẫu cụ thể, tính được: 0( )qs x nT s Nếu ( 1)/2 nqsT t thì tức là biến cố “không xảy ra” đã xảy ra, từ đó cho rằng H0 là sai. Trình tự thực hiện bài kiểm định như sau:  Với cặp giả thuyết:     01 00 : :   H H  Tiêu chuẩn kiểm định: 0( ) X nT S  Với mức ý nghĩa α cho trước, miền bác bỏ H0 là:  Giá trị quan sát là: 0( )qs x nT s  Nếu Tqs  Wα hay ( 1)/2 nqsT t thì bác bỏ H0  Nếu Tqs  Wα hay ( 1)/2 nqsT t thì chưa bác bỏ H0 Với hai loại cặp giả thuyết có dấu lớn hơn và nhỏ hơn, tiêu chuẩn kiểm định và giá trị quan sát không thay đổi so với cặp giả thuyết trên, chỉ có miền bác bỏ là thay đổi. Loại cặp giả thuyết 0 0 1 0 H : H :        Miền bác bỏ H0 : { }( 1): nW T T t  -= >  Nếu TqsWα hay ( 1)nqsT t -> thì bác bỏ H0  Nếu TqsWα hay ( 1)nqsT t -< thì chưa bác bỏ H0 Sự khác biệt so với cặp giả thuyết trên là thay vì trị tuyệt đối |T| thì ở đây không có trị tuyệt đối, và giá trị tới hạn không phải là mức α/2 mà là α: ( 1)nt - thay cho ( 1)/ 2nt - Loại cặp giả thuyết 0 0 1 0 H : H :        Miền bác bỏ H0 : { }( 1): nW T T t  -= <- Bài 7: Kiểm định giả thuyết thống kê 134 TXTOKT02_Bai7_v1.0014109205  Nếu TqsWα hay ( 1)nqsT t -<- thì bác bỏ H0  Nếu TqsWα hay ( 1)nqsT t ->- thì chưa bác bỏ H0 Như vậy ở đây sử dụng T không có trị tuyệt đối, và giá trị tới hạn ở mức α và có dấu âm: ( 1)nt -- , quy cách bác bỏ cũng khác các cặp giả thuyết trên. Có thể tóm tắt ba cặp giả thuyết trong bảng sau: Tiêu chuẩn Cặp giả thuyết Miền bác bỏ H0 Bác bỏ H0 khi     01 00 : :   H H  ( 1)/2:    nW T T t ( 1) /2   nqsT t     01 00 : :   H H  ( 1):    nW T T t ( 1)  nqsT t 0( ) X nT S Giá trị quan sát 0( )qs x nT s     01 00 : :   H H  ( 1):     nW T T t ( 1)   nqsT t Để đơn giản, từ phần này về sau, các cặp giả thuyết, tiêu chuẩn kiểm định và miền bác bỏ sẽ được tóm tắt trong các bảng. Ví dụ 7.4. Xem xét về trọng lượng một loại quả (tính bằng gam), người ta tiến hành cân thử một số quả lấy ngẫu nhiên, đựợc số liệu cho trong bảng dưới đây. Trọng lượng (gam) 25 – 27 27 – 29 29 – 31 31 – 33 33 – 35 35 – 37 Số quả tương ứng 3 5 7 5 3 2 Biết rằng trọng lượng quả là đại lượng có phân phối chuẩn. (a) Tiêu chuẩn đặt ra cho trọng lượng trung bình của quả là 30g. Với mức ý nghĩa 5%, có thể nói loại quả trên đạt tiêu chuẩn hay không? (b) Mùa vụ trước trọng lượng trung bình của loại quả này là 29g. Với mức ý nghĩa 5% có thể nói trọng lượng trung bình đã tăng lên không? Giải: Đặt X là trọng lượng của loại quả này, theo giả thiết, X ~ N(μ ; 2), trong đó µ là trọng lượng trung bình,2 là phương sai của trọng lượng, cả hai đại lượng này đều chưa biết. Ta có thông tin của một mẫu cụ thể kích thước n = 25. Với bộ số liệu này, tính các thống kê đặc trưng mẫu được kết quả: 2 230,48(g) ; 8,4267(g ) ; 2,903(g)  x s s (a) Câu hỏi yêu cầu kiểm định xem trọng lượng trung bình có bằng 30 hay không, hay µ có bằng 30 hay không, với α = 0,05. Cặp giả thuyết là:     30: 30: 1 0   H H Trong đó giả thuyết H0 nghĩa là loại quả này đạt tiêu chuẩn, H1 là loại quả không đạt tiêu chuẩn. Bài 7: Kiểm định giả thuyết thống kê TXTOKT02_Bai7_v1.0014109205 135 Lưu ý rằng ta không được sử dụng ngay giá trị trung bình mẫu là 30,48 để kết luận trung bình tổng thể khác 30, vì con số 30,48 chỉ là của một mẫu. Phải thực hiện kiểm định chi tiết. Tiêu chuẩn kiểm định 0( ) X nT S ; miền bác bỏ H0:  ( 1)/2:    nW T T t Với mẫu cụ thể trên, 0( ) (30,48 30) 25 0,82672,903    qs x nT s ( 1) (24)/2 0,025 2,064 : 2,064     nt t W T T Do đó |Tqs| < 2,064, chưa có cơ sở bác bỏ H0, hay có thể hiểu H0 được coi là đúng, có thể nói loại quả này đạt tiêu chuẩn. Như vậy dù trung bình mẫu không bằng 30 nhưng vẫn có thể coi trung bình tổng thể là bằng 30, vẫn coi quả là đạt tiêu chuẩn. Chính xác hơn là chưa thấy bằng chứng cho thấy quả không đạt tiêu chuẩn. (b) Câu hỏi yêu cầu kiểm định xem trọng lượng trung bình có lớn hơn 29 hay không, với α = 0,05. Cặp giả thuyết là:     29: 29: 1 0   H H Trong đó giả thuyết H0 nghĩa là trọng lượng trung bình không tăng, H1 là trọng lượng trung bình có tăng lên Tiêu chuẩn kiểm định S nXT )( 0 ; miền bác bỏ H0:  ( 1): nW T T t    Với mẫu cụ thể trên, 0( ) (30,48 29) 25 2,54912,903qs x nT s      ( 1) (24)0,05 1,711 : 1,711nt t W T T       Do đó Tqs > 1,711 bác bỏ H0, có thể nói trọng lượng trung bình đã tăng lên so với mùa vụ trước. 7.3. Kiểm định giả thuyết về phương sai tổng thể Giả sử trong tổng thể có biến ngẫu nhiên gốc phân phối chuẩn, X ~ N( , 2), trong đó tham số 2 đặc trưng cho độ phân tán/độ biến động/độ ổn định/độ đồng đều của tổng thể theo dấu hiệu nghiên cứu, là chưa biết. Ta kiểm định giả thuyết về mối quan hệ giữa phương sai tổng thể 2 với một số 20 cho trước. Sử dụng một mẫu kích thước n với phương sai mẫu là S2, độ lệch chuẩn là S. Bài 7: Kiểm định giả thuyết thống kê 136 TXTOKT02_Bai7_v1.0014109205 Ta thiết lập thủ tục kiểm định dựa trên quy luật phân phối xác suất của thống kê sau: 2 2 2 2 ( 1) ~ ( 1)    n S n Từ đó xây dựng được tiêu chuẩn kiểm định, công thức tính giá trị quan sát ứng với một mẫu cụ thể kích thước n (phương sai mẫu s2, độ lệch chuẩn mẫu s) và miền bác bỏ ứng với các cặp giả thuyết như sau: Tiêu chuẩn Cặp giả thuyết Miền bác bỏ H0 Bác bỏ H0 khi     2 0 2 1 2 0 2 0 : :   H H  )1(2 2/12  nW   hoặc )1(2 2/2  n 2 2( 1) 1 /2     nqs hoặc 2 2( 1)/2   nqs     2 0 2 1 2 0 2 0 : :   H H  2 2( 1)     nW 2 2( 1)   nqs 2 0 2 2 )1(  Sn  Giá trị quan sát 2 0 2 2 )1(  sn qs      2 0 2 1 2 0 2 0 : :   H H  2 2( 1)1      nW 2 2( 1)1    nqs Ví dụ 7.5. Với số liệu của ví dụ 7.4 trong phần trên, cân thử 25 quả thấy trọng lượng trung bình mẫu là 30,48 gam, phương sai mẫu 8,4267 gam2, độ lệch chuẩn mẫu 2,903 gam. Biết trọng lượng quả là đại lượng phân phối chuẩn. (a) Với mức ý nghĩa 5%, kiểm định ý kiến cho rằng phương sai trọng lượng quả là bằng 5 gam2. Nếu mức ý nghĩa là 2% thì kết luận có thay đổi không? (b) Mùa vụ trước trọng lượng quả có độ phân tán bằng 4 gam, với mức ý nghĩa 5% thì có thể nói mùa vụ này trọng lượng quả đã đồng đều hơn không? Giải: Đặt X là trọng lượng của loại quả này, theo giả thiết, X ~ N( , 2), trong 2 là phương sai, đo độ đồng đều của trọng lượng, là chưa biết. Thông tin có được chỉ là một mẫu cụ thể kích thước n = 25, ta tính được các thống kê đặc trưng mẫu: 30,48( )x g ; 2 28, 4267( )s g ; 2,903( )s g (a) Câu hỏi kiểm định giả thuyết 2 bằng 5, với α = 0,05. Cặp giả thuyết là     5: 5: 2 1 2 0   H H Trong đó giả thuyết H0 nghĩa là ý kiến đúng, H1 là ý kiến sai. Tiêu chuẩn kiểm định 2 2 2 0 ( 1)   n S ; Miền bác bỏ H0:  2 2( 1)1 /2     nW hoặc 2 2( 1)/2   n Với mẫu cụ thể trên ta tính được: 2 2 2 0 ( 1) 24 8,4267 40,4485     qs n s Ta xác định được các giá trị tới hạn: 2( 1) 2(24) 1 /2 0,975 12, 4   n ; 2( 1) 2(24)/2 0,025 39,36   n Bài 7: Kiểm định giả thuyết thống kê TXTOKT02_Bai7_v1.0014109205 137 Như vậy bác bỏ H0 khi 2qs 39,36. Như vậy 2qs > 39,36: bác bỏ giả thuyết H0, ý kiến cho rằng phương sai trọng lượng bằng 5 gam2 là sai. Nếu mức ý nghĩa α = 0,02 thì: 2( 1) 2(24) 1 /2 0,99 10,86   n ; 2( 1) 2(24)/2 0,01 42,98   n Khi đó 10,86 < 2qs < 42,98: chưa có cơ sở bác bỏ H0, ý kiến cho rằng phương sai trọng lượng bằng 5 gam2 là đúng. (b) Độ đồng đều mùa vụ trước bằng 4 gam, tức là độ lệch chuẩn trọng lượng vụ trước bằng 4, và phương sai mùa vụ trước là 42 = 16 gam2. Độ đồng đều tăng lên tức là phương sai của trọng lượng nhỏ hơn so với ở mùa vụ trước. Câu hỏi kiểm định giả thuyết 2 nhỏ hơn 16, với α = 0,05. Cặp giả thuyết là:     16: 16: 2 1 2 0   H H Trong đó giả thuyết H0 nghĩa là ý kiến sai, H1 là ý kiến đúng. Tiêu chuẩn kiểm định 2 2 2 0 ( 1)   n S ; Miền bác bỏ H0:  2 2 2( 1)1:       nW Với mẫu cụ thể trên ta tính được: 2 2 qs 2 0 (n 1)s 24 8,4267 12,6416      Tìm được g