Bài giảng chương 8: Kiểm định giả thuyết thống kê

Giảthuyết không: là sựgiảsửmà ta muốn kiếm định thường được ký hiệu là Ho. Giảthuyết ngược lại: Việc bác bỏgiảthuyết không sẽdẫn đến việc chấp nhận giả thuyết ngược lại. Giảthuyết ngược lại thường được ký hiệu là H1. Ví dụ Kiếm định giảthuyết Ho: θ ≥ θo có thể θ= θo Với H1: θ< θo Kiếm định giảthuyết Ho: θ ≤ θo có thể θ= θo Với H1: θ> θo Kiếm định giảthuyết Ho: θ= θo Với H1: θ ≠ θo

pdf16 trang | Chia sẻ: haohao89 | Lượt xem: 7761 | Lượt tải: 2download
Bạn đang xem nội dung tài liệu Bài giảng chương 8: Kiểm định giả thuyết thống kê, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Cao Hào Thi 89 Chương 8 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ (Tests of Hypotheses) Thông thường đối với tham số θ chưa biết của tập hợp chính ta có thể đưa ra nhiều giả thuyết về θ. Vấn đề đặt ra là làm thế nào kiểm định được giả thuyết nào thích hợp với các số liệu của mẫu quan sát được (x1, x2, …, xn ). 8.1 NHỮNG KHÁI NIỆM VỀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ 8.1.1 Giả thuyết thống kê ( Statistical Hypothesis) Là một giả sử hay một phát biểu có thể đúng, có thể sai liên quan đến tham số của một hay nhiều tập hợp chính. 8.1.2 Giả thuyết không (giả thuyết đơn) và giả thuyết ngược lại (đối thuyết) (Null Hypothesis & Alternative Hypothesis) Giả thuyết không: là sự giả sử mà ta muốn kiếm định thường được ký hiệu là Ho. Giả thuyết ngược lại: Việc bác bỏ giả thuyết không sẽ dẫn đến việc chấp nhận giả thuyết ngược lại. Giả thuyết ngược lại thường được ký hiệu là H1. Ví dụ Kiếm định giả thuyết Ho: θ ≥ θo có thể θ = θo Với H1: θ < θo Kiếm định giả thuyết Ho: θ ≤ θo có thể θ = θo Với H1: θ > θo Kiếm định giả thuyết Ho: θ = θo Với H1: θ ≠ θo 8.1.3 Các loại sai lầm trong việc kiểm định giả thuyết thống kê Việc kiểm định giả thuyết thống kê có thể phạm phải 2 loại sai lầm a) Sai lầm loại I (type I error) Là loại sai lầm mà chúng ta phạm phải trong việc bác bỏ giả thuyết Ho khi Ho đúng. Xác suất của việc bác bỏ Ho khi Ho đúng là xác suất của sai lầm loại I và được ký hiệu là α α = P ( bác bỏ Ho / Ho đúng) = P(type I error) α : còn được gọi là mức ý nghĩa ( level of significance) α = 0,05; 0,01 ; 0,001 … Cao Hào Thi 90 b) Sai lầm II (type II error) Là loai sai lầm mà chúng ta phạm phải khi không bác bỏ giả thuyết Ho khi Ho sai. Xác suất của việc không bác bỏ Ho khi Ho sai là xác suất của sai lầm loại II và được ký hiệu là β. β = P (không bác bỏ Ho /Ho sai) = P(type II error) Bản chất của Ho Quyết định về giả thuyết không Ho Ho đúng Ho sai Không bác bỏ (chấp nhận ) Quyết định đúng Prob = 1- α P (không bác bỏ Ho / Ho) = 1-α Sai lầm loại II Prob = β Bác bỏ Sai lầm loại I Prob = α (α = mức ý nghĩa kiểm định) Quyết định đúng Prob = 1 - β (1 - β: năng lực kiểm định) 8.1.4 Miền bác bỏ và miền chấp nhận ( Rejection Region & Acceptance Region ) Tất cả các giá trị có thể có của các đại lượng thống kê trong kiểm định có thể chia làm 2 miền: miền bác bỏ và miền chấp nhận. ™ Miền bác bỏ là miền chứa các giá trị làm cho giả thuyết Ho bị bác bỏ. ™ Miền chấp nhận là miền chứa các giá trị giúp cho giả thuyết Ho không bị bác bỏ. Trong thực tế khi Ho không bị bác bỏ cùng nghĩa là nó được chấp nhận. Giá trị chia đôi hai miền được gọi là giá trị giới hạn (Critical value) 8.1.5 Kiểm định một đầu và kiểm định 2 đầu (one – tailed test & two – tailed test) a) Kiểm định một đầu Khi giả thuyết ngược lại H1 có tính chất 1 phía (one – sided) thì việc kiểm định được gọi là kiểm định 1 đầu. Ho: θ ≤ θo hay Ho: θ ≥ θo H1: θ > θo H1: θ < θo b) Kiểm định hai đầu: Khi giả thuyết ngược lại H1 có tính chất 2 phía (two – sided) thì việc kiểm định được gọi là kiểm định 2 đầu. Ho: θ = θo H1: θ ≠ θo Cao Hào Thi 91 8.2 CÁC BƯỚC CỦA VIỆC KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ: Gồm 6 bước: Bước 1: Thành lập giả thuyết Ho Ví dụ: Ho: θ = θo Ho: θ ≤ θo Ho: θ ≥ θo Bước 2: Thành lập giả thuyết H1 Ví dụ: H1: θ < θo H1: θ > θo H1: θ ≠ θo Bước 3: Xác định mức ý nghĩa α Bước 4: Chọn các tham số thống kê thích hợp cho việc kiếm định và xác định các miền bác bỏ, miền chấp nhận và giá trị giới hạn. Bước 5: Tính toán các giá trị của các tham số thống kê trong việc kiểm định dựa trên số hiệu của mẫu ngẫu nhiên. Bước 6: Ra quyết định: Nếu các giá trị tính toán rơi vào miền bác bỏ Ho thì ra quyết định bác bỏ Ho. Ngược lại sẽ chấp nhận Ho. 8.3 KIỂM ĐỊNH GIÁ TRỊ TRUNG BÌNH µ CỦA PHÂN PHỐI CHUẨN N(µ,σ2) KHI Đà BIẾT σ2 Cho ( x1, x2 , …, xn) là mẫu ngẫu nhiên cỡ n được lấy từ tập họp chính tuân theo phân phối chuẩn N (µ,σ2 ) trong đó σ2 đã biết. 8.3.1 Trường hợp 1 Ho : µ = µo hay µ ≥ µo H1 : µ < µo Zα Không bác bỏ H0 0 Bác bỏ H0 Cao Hào Thi 92 Miền bác bỏ R: Bác bỏ Ho nếu Ztt = n X / 0 σ µ− < - αZ 8.3.2 Trường hợp 2: Ho : µ = µo hay µ ≤ µo H1 : µ > µo Zα Không bác bỏ H0 0 Bác bỏ H0 α Miền bác bỏ R: Bác bỏ Ho nếu Ztt = n X / 0 σ µ− > αZ 8.3.3 Trường hợp 3: Ho : 0µ=µ H1 : 0µ≠µ -Zα/2 Không bác bỏ H0 0 Bác bỏ H0 α/2 α/2 Zα/2 Bác bỏ H0 Miền bác bỏ R: Bác bỏ Ho nếu Ztt 2/αZ Với : Ztt = n X / 0 σ µ− Thí dụ Trong một nhà máy bánh kẹo, một máy tự động sản xuất ra các thanh sô cô la với trọng lượng qui định 250g. Biết rằng trọng lượng các thanh sô cô la được sản xuất ra có phân bố chuẩn N(µ,52). Trong một ngày bộ phân kiểm tra kỹ thuật chọn một mẫu ngẫu nhiên gồm 16 thanh sô cô la và tính trọng lượng trung bình của chúng được 244g. Có thể khẳng Cao Hào Thi 93 định máy tự động sản xuất ra các thanh sô cô la có trọng lượng nhỏ hơn qui định không? Với mức ý nghĩa α=0,05 kiểm định giả thuyết thống kê tương ứng. Giải 1/ Ho : µ = 250g 2/ H1 : µ < 250g 3/ α = 0,05 4/ == 05,0ZZα 16,45 ⇒ - =αZ -1,645 5/ 8,4 16/5 250246 / 0 −=−=−= n XZtt σ µ =2σ 52 ⇒ σ = 5 n = 16 X = 244g , 0µ = 250g 6/ Ztt = -4,8 < - 05,0Z = -1,645 Ra quyết định: Bác bỏ giả thuyết Ho ở mức ý nghĩa 5%. Nghĩa là: máy tự động sản xuất sô cô la có trọng lượng nhỏ hơn qui định ⇒ Phải điều chỉnh lại máy Thí dụ Một máy khoan trong dây chuyền sản xuất dùng để khoan lỗ trên các bản thép. Khi máy khoan hoạt động đúng chức năng thiết kế đường kính các lỗ khoan sẽ tuân theo phân phối chuẩn với số trung bình là 2 inches và độ lệch chuẩn là 0,06 inches. Trong quá trình kiểm tra định kỳ xem máy khoan có hoạt động đúng hay không, người ta lấy đo ngẫu nhiên các lỗ đã khoan. Giả sử độ lệch chuẩn không thay đổi. Mẫu ngẫu nhiên gồm 9 lỗ khoan cho ta đường kính trung bình của mẫu là 1,95 inches. Kiểm định giả thuyết Ho : số trung bình của tập hợp chính là 2 inches. Với H1 : số trung bình của tập hợp chính khác 2 inches. Trong quá trình kiểm định dùn α = 5% Giải: 1/ Ho : µ = µ0 = 2 2/ H1 : µ ≠ 2 3/ α = 0,05 4/ 96,1025,02/ == ZZα ⇒ - 96,12/ −=αZ 5/ X = 1,95; µ0 =2; σ = 0,06; n = 9 50,2 9/06,0 295,1 / 0 −=−=−= n XZtt σ µ 6/ Ta có : Ztt < - 96,12/ −=αZ Ra quyết định : Bác bỏ giả thuyết Ho ở mức ý nghĩa 5%. ⇒ Máy hoạt động không đúng chức năng thiết kế. Cao Hào Thi 94 8.4 KIỂM ĐỊNH GIÁ TRỊ TRUNG BÌNH µ CỦA PHÂN PHỐI CHUẨN N(µ,σ2) KHI CHƯA BIẾT σ2 Giả sử ta có mẫu ngẫu nhiên cỡ mẫu là n được lấy từ tập hợp chính tuân theo phân phối chuẩn có số trung bình là µ. Gọi X và Sx là số trung bình và độ lệch chuẩn của mẫu, ta sẽ có 3 trường hợp kiểm định µ với mức ý nghĩa α. 8.4.1 Trường hợp 1: Ho : µ = µo hay µ ≥ µo H1 : µ < µo Miền bác bỏ R : Bác bỏ Ho nếu tn-1 < tn-1,α Với tn-1= n X x / 0 σ µ− , tn-1 tuân theo phân phối Student t với độ tự do n-1 8.4.2 Trường hợp 2: Ho : µ = µo hay µ ≤ µo H1 : µ > µo Miền bác bỏ R: Bác bỏ Ho nếu tn-1 > tn-1,α 8.4.3 Trường hợp 3: Ho : 0µ=µ H1 : 0µ≠µ Miền bác bỏ R: Bác bỏ Ho nếu tn-1 > tn-1,α/2 Hay tn-1 < - tn-1,α/2 t*n-1,α Không bác bỏ H0 Bác bỏ H0 α t*n-1,α Không bác bỏ H0Bác bỏ H0 α t*n-1,α/2 Không bác bỏ H0Bác bỏ H0 Bác bỏ H0 -t*n-1,α/2 α/2 α/2 Cao Hào Thi 95 Thí dụ Nhà quản lý các cửa hàng bán lẻ nhận thấy rằng số lượng hàng bán ra trung bình trong tháng 12 cao hơn 20% so với tháng 11. Theo dõi sổ sách của sáu cửa hàng (được chọn một cách ngẫu nhiên) nhà quản lý nhận thấy phần trăm độ tăng trung bình của lượng hàng bán ra tại 6 cửa hàng trong tháng 12 như sau: 19,2%; 18,4%; 19,8%; 20,2%; 20,4% và 19,0% Giả sử phần trăm độ tăng trung bình của lượng hàng bán ra tại tất cả các cửa hàng trong hệ thống bán lẻ tuân theo phân phối chuẩn Kiểm định giả thuyết rằng phần trăm độ tăng trung bình của lượng hàng bán ra trong tháng 12 là 20% so với tháng 11 với α = 10% Giải: Giả thuyết: Ho : µ = µ0 = 20 H1 : µ ≠ 20 Ta có: α = 10% tn-1, α/2 = t5, 0.05 = 2,015 -tn-1, α/2 = -t5 , 0.05 = -2,015 Xác định X và Sx 5,19 6 117 n X ix ==∑= Sx2 = 0,588 ⇒ Sx = 588,0 = 0,767 tn-1 = nS x x / 0µ− = 597,1 6/767,0 205,19 −=− Ra quyết định: tn-1, α/2 < tn-1 < tn-1, α/2 -2,015 < -1,597 < 2,015 ⇒ Chấp nhận giả thuyết Ho (Những dữ kiện từ mẫu không đủ mạnh để bác bỏ Ho) 8.5 KIỂM ĐỊNH PHƯƠNG SAI CỦA PHÂN PHỐI CHUẨN N(µ,σ2) Giả sử ta có mẫu ngẫu nhiên cỡ mẫu là n được lấy ra từ tập hợp chính tuân theo phân phối chuẩn có phương sai là σ2 . Gọi S2x là phương sai của mẫu, ta sẽ có 3 trường hợp kiểm định σ2 với mức ý nhĩa là α 8.5.1 Trường hợp 1: Ho : σ2 = σ02 hay Ho : σ2 ≥ σ02 H1 : σ2 < σ02 R : Bác bỏ Ho nếu χ2n-1 < χ2n-1,1-α Với 2 0 2 2 1 )1( σχ x n Sn −=− χ2n-1 tuân theo phân phối X2 với độ tự do n-1. Cao Hào Thi 96 8.5.2 Trường hợp 2: Ho : σ2 = σ02 hay Ho : σ2 ≤ σ02 H1 : σ2 > σ02 R : Bác bỏ Ho nếu χ2n-1 > χ2n-1,α 8.5.3 Trường hợp 3: Ho : σ2 = σ02 H1 : σ2 ≠ σ02 R : Bác bỏ Ho nếu χ2n-1 > χ2n-1,α/2 hay χ2n-1 < χ2n-1,1-α/2 Thí dụ Để thỏa mãn tiêu chuẩn đã được ấn định trong hợp đồng là phương sai của hàm lượng chất bẩn trong các lò hàng hoá chất không được vượt quá 4%. Lấy ngẫu nhiên 20 lô hàng ta có phương sai của hàm lượng chất bẩn trong các lô hàng mẫu là 5,62%. Kiểm định giả thuyết phương sai của hàm lượng chất bẩn trong tất cả các lô hàng không quá 4% với α =10%. Giả sử rằng tập hợp chính tuân theo phân phối chuẩn. Giải: Giả thuyết: Ho : σ2 ≤ σ02 = 4 H1 : σ2 > 4 R : Bác bỏ Ho nếu χ2n-1 > Ta có: α = 0,1, n = 20 → χ2n-1,α = χ219,0,1 = 27,20 S2x = 5,62, n = 20, σ20 =4 χ2n-1 = 695,264 62,5*19)1( 2 0 2 ==−σ σ xn Ra quyết định: Vì χ2n-1 =26,695 < χ2n-1,α =27,20 ⇒ Không bác bỏ Ho tại mức α =10% 8.6 KIỂM ĐỊNH GIÁ TRỊ TỶ SỐ P CỦA TẬP HỢP CHÍNH TRONG ĐIỀU KIỆN CỠ MẪU LỚN: Gọi P là tỉ số của số lần thành công trong tập hợp chính f là tỉ số của số lần thành công trong n phép thử Khi cỡ mẫu n lớn, thì biến ngẫu nhiên chuẩn hóa n/)p1(p pf − −=∑ sẽ gần đúng có phân phối chuẩn hóa. Ta có 3 trường hợp p với mức ý nghĩa α. Cao Hào Thi 97 8.6.1 Trường hợp 1: Ho : P = P0 hay Ho : P ≥ P0 H1 : P < P0 R : Bác bỏ Ho nếu Ztt < - Zα Với npp pfZ /)1( − −= , Z ∼ N (0,1) 8.6.2 Trường hợp 2: Ho : P = P0 hay Ho : P ≤ P0 H1 : P > P0 R : Bác bỏ Ho nếu Z > Zα 8.6.3 Trường hợp 3: Ho : P = P0 H1 : P ≠ P0 R : Bác bỏ Ho nếu Z > Zα/2 Hay Z < -Zα/2 Thí dụ Lấy ý kiến 199 giảng viên về việc day học theo lối tín chỉ thì có 104 giảng viên đồng ý. Kiếm định với mức về giả thuyết cho rằng có một nửa số giảng viên trong trường Bách khoa đồng ý dạy theo lối tín chỉ. Giải Gọi P là tỉ lệ số giảng viên trường Đại học Bách Khoa đồng ý dạy theo lối tín chỉ Giả thuyết: Ho : P = Po =0,5 H1 : P ≠ 0,5 Zα/2 = Z0,05 = 1,645 vì α = 10% -Zα/2 = -Z0,05 = -1,645 n =199, Po = 0,5 ⇒ f = 523,0199 104 = 65,0 199/50,0*50,0 50,0523,0 /)1( 00 0 =−=− −= npp pfZ Ra quyết định: -Zα/2 < Z < Zα/2 -1,645 < 0,65 < 1,645 ⇒ Không bác bỏ Ho Cao Hào Thi 98 Thí dụ Cũng ví dụ trên, kiếm định giả thuyết số giảng viên đồng ý hơn hoặc bằng một nửa số giảng viên trong trường. Giải: Giả thuyết: Ho : P ≥ Po = 0,5 H1 : P < 0,5 Zα = Z0,1 = 1,28 ⇒ -Zα = -1,28 Ra quyết định: Z = 0,65 > -Zα = 1,28 ⇒ Không bác bỏ Ho. 8.7 KIỂM ĐỊNH GIẢ THUYẾT VỀ QUY LUẬT PHÂN PHỐI LÝ THUYẾT 8.7.1 Kiểm định tính phù hợp (A Goddness-of-Fit Test) Giả sử ta có mẫu ngẫu nhiên với cỡ mẫu là n. Mỗi giá trị quan sát của mẫu ngẫu nhiên có thể xếp vào 1 trong K lớp. Gọi số phần tư của lớp thứ i là Oi với i = 1,2, …,K. Trong việc kiểm định tính phù hợp ta có: Ho : Xác suất để cho các giá trị quan sát rơi vào lớp thứ i = Pi (i =1,2, … k) H1 : Xác suất để cho các giá trị quan sát rơi vào lớp thứ i ≠ Pi R : Bác bỏ Ho nếu χ2k-1 > χ2k-1,α Với : i ii k i k E EO 2 1 2 1 )( −= ∑ = −χ Ei : Kỳ vọng của số phần tử trong lớp thứ i. Với giả thuyết Ho ta có: Ei = n*Pi χ2k-1 tuân theo phân phối χ2 với độ tự do là k-1. Ví dụ Một công ty chất đốt dựa vào kinh nghiệm trong quá khứ cho rằng đến cuối mùa đông sẽ có 80% lượng khách hàng trả đầy đủ tiền ngay 10% trả chậm 1 tháng, 6% trả chậm 2 tháng và 4% trả châm hơn 2 tháng. Đến cuối mùa đông để kiểm định lại điều này, Cty lấy ngẫu nhiên mẫu gồm 400 khách hàng và nhận thấy có 287 khách hàng trả ngay, 49 trả chậm 1 tháng, 30 trả chậm 2 tháng và 34 trả chậm hơn 2 tháng. Hỏi những kinh nhiệm trong quá khứ có thể áp dựng cho mùa đông năm nay không? Kiểm định với mức ý nghĩa 5%. Giải Ho : Xác suất lượng khách hàng trả tiền ở mùa đông hiện tại phù hợp với các số liệu trong quá khứ. Nghĩa là xác suất tương ứng với 4 loại khách hàng là: P1 = 0,8, P2 = 0,1, P3 = 0,06, P4 = 0,04 H1 : P1 ≠ 0,8, P2 ≠ 0,1, P3 ≠ 0,06, P4 ≠ 0,04 α = 0,05 , k = 4 ⇒ χ2k-1,α = χ23,0,05 = 7,81 Cao Hào Thi 99 Dưới giả thuyết Ho, kỳ vọng số khách hàng trong mỗi loại từ tổng số 400 khách hàng: E1 = 400 * 0,8 = 320 E2 = 400 * 0,1 = 40 E3 = 400 * 0,06 = 24 E4 = 400 * 0,04 = 16 Ta có: Số tháng trả chậm 0 1 2 > 2 Tổng Số khách hàng dựa vào mẫu quan sát Oi 287 49 30 34 400 Xác suất Pi 0,8 0,1 0,06 0,04 1 Kỳ vọng của số khách hàng trong mỗi loại Ei 320 40 24 16 400 χ2k-1 = i 2 ii 4 1i E )EO( −∑ = = 16 )1634( 24 )2430( 40 )4049( 320 )320287( 2222 −+−+−+− χ2k-1 =227,187 Ra quyết định: Vì χ2k-1 > χ2k-1,α ⇒ Bác bỏ Ho. Nghĩa là không thể áp dụng kinh nghiệm trong quá khứ vào năm nay. Số lượng khách hàng trả chậm trong năm nay nhiều hơn các năm trước. 8.7.2 Kiểm định giả thuyết về qui luật phân phối lý thuyết Trong việc kiểm định giả thuyết tính phù hợp của số liệu quan sát với qui luật phân phối lý thuyết ta có: Ho : Số liệu quan sát tuân theo qui luật phân phối lý thuyết H1 : Số liệu quan sát không tuân theo qui luật phân phối lý thuyết Cách tìm miền bác bỏ R bằng kiểm định χ2 9 Chia n số liệu quan sát ra làm K khoảng 9 Gọi Oi là số phần tử của mẫu quan sát nằm trong khoảng i (i=1,2, …, K) 9 Gọi Ei là kỳ vọng của số phần tư nằm trong khoảng i (Ei được tính dựa vào qui luật phân phối lý thuyết) Ei = n . Pi Pi = xác suất để cho các phần tử nằm trong khoảng i 9 Tính χ2 χ2k-1 = i 2 ii 4 1i E )EO( −∑ = χ2 gần đúng tuân theo phân phối Chi Squared với độ tự do là ν, ν = k -r -1 r : số tham số cần phải ước lượng . Cao Hào Thi 100 Với phân phối chuẩn r = 2 Với phân phối Poisson r = 1 9 Tìm miền bác bỏ R Nếu χ2 > χ2ν,α ta bác bỏ giả thuyết Ho. Nghĩa là số liệu quan sát không tuân theo qui luật phân phối lý thuyết đã định → Đi tìm qui luật phân phối lý thuyết khác. Ví dụ : Kiểm định phân phối chuẩn Để đo lường chất lượng của 1 lô sản phẩm, người ta lấy ra đo 200 chi tiết và cho kết quả như sau: Các lớp Số chi tiết quan sát được Oi 54,795 54,80 54,805 54,805 54,81 54,815 54,815 54,82 54,825 54,825 54,83 54,835 54,835 54,84 54,845 54,845 54,85 54,855 54,855 54,86 54,865 54,865 54,87 54,875 6 14 33 47 45 33 15 7 n = 200 Vấn đề đặt ra là các số liệu quan sát được có tuân theo phân phối chuẩn không? Giải: Giả thuyết: Ho : Các số liệu quan sát tuân theo phân phối chuẩn H1 : Các số liệu quan sát không tuân theo phân phối chuẩn Tính Ei Ei = n * pI Với Pi = P(xi < x < xi+1) = ⎟⎠ ⎞⎜⎝ ⎛ −<<− +σ µ σ µ 1ii xZxP Ở đây lấy 835,54== Xµ (số trung bình của mẫu) σ = Sx = 0,016 (độ lệch của mẫu) Ví dụ: Tính P1 , E1 P1 = P (54,795 < X < 54,805) = P ( 016,0 835,54805,54 016,0 835,54795,54 −<<− Z ) = P (-2,5 < Z <-1,88) = 0,4938 – 0,4699 P1= 0,0239 ⇒ E1 = n P1 = 200 * 0,0239 =4,78 Tính tương tự cho các lớp khác ta có Cao Hào Thi 101 Các lớp Kỳ vọng của số phần tử nằm trong lớp i Ei (-∞ 54,795 54,805 54,815 54,825 54,835 54,845 54,855 54,865 (54,865 - - - - - - - - - - 54,805) 54,805 54,815 54,825 54,835 54,845 54,855 54,865 54,875 +∞ ) 4,78 6,02 14,74 31,46 46,18 46,74 32,52 15,76 6,58 5,20 Tổng n ≈ 200 n = 200 (n = 197,38) Tính X2: Oi Ei (Oi – Ei) (Oi –Ei)2 i 2 iii E )EO( − 6 14 33 47 45 33 15 7 6,02 14,74 31,46 46,18 46,74 32,52 15,76 6,58 -0,02 -0,74 1,54 0,82 -1,74 0,48 -0,76 0,42 0,0004 0,5476 2,3716 0,6724 3,0276 0,2304 0,5776 0,1764 ≈0 0,037 0,075 0,014 0,069 0,007 0,036 0,027 n = 20 n = 200 X2 = 0,265 Tính χ2γ,α : γ = K – r –1 = 8 –2 – 1 Số lớp K = 8; r = 2 (phân phối chuẩn) α = 0,05 Tra bảng χ25,0,05 = 11,0706 6/ Ra quyết định : Vì χ2 = 0,265 < χ25,0,05 = 11,0706 ⇒ Không bác bỏ Ho ⇒ Số liệu quan sát tuân theo phân phối chuẩn . Cao Hào Thi 102 8.8 BẢNG DỮ KIỆN NGẪU NHIÊN (Contingency Tables) 8.8.1 Bảng dữ kiện ngẫu nhiên 2 chiều (Two Way Contingency Tables) Nếu các dữ kiện của biến ngẫu nhiên được xếp loại theo 2 tiêu chuẩn thì các dữ kiên sẽ được trình bày trong bảng gồm hàng và cột gọi là bảng dữ kiện ngẫu nhiên 2 chiều. Tổng quát, bảng ngẫu nhiên 2 chiều gồm r hàng và c cột được trình bày như sau: 1 2 3 … c 1 O11 O11 O11 … O1c R1 2 O21 O21 O21 … O2c R2 3 O31 O31 O31 … O3c R3 … … … … … … … r Or1 Or2 Or3 … Orc RC CộtHàng Tổng theo hàng Tổng theo cột C1 C2 C3 … C5 Ký hiệu: Oij : Số dữ kiện quan sát ở hàng i, cột j R : Tổng các dữ kiện quan sát ở hàng i Cj : Tổng các dữ kiện quan sát ở cột j n : Cỡ mẫu n = ∑ Ri = ∑ Cj 8.8.2 Kiểm định giả thuyết về tính độc lập giữa 2 thuộc tính của tập hợp chính Trong việc kiểm định giả thuyết về tính độc lập giữa 2 thuộc tính của tập họp chính ta có: Ho : Các tiêu chuẩn được phân loại theo hàng và theo cột độc lập với nhau. H1 : Các tiêu chuẩn đựợc phân loại theo hàng và theo cột phụ thuộc nhau R : Bác bỏ giả thuyết Ho nếu X2 ≥ X2α,γ ij ijji ji E EO 2, , 2 )( −= ∑χ Eij : là kỳ vọng của phần tử ở hàng i, cột j n CR E jiij = Eij = Pij * n = PI * Pj * n = n* n C * n R ji = n CR ji χ2 : tuân theo phân phối Chi – squared với độ tự do là ν Cao Hào Thi 103 ν = (r -1)(C –1) Ví dụ Để đánh giá hiệu quả làm tăng chất lượng của một biện pháp công nghệ mới trên một dây chuyền sản xuất người ta thu thập được các số liệu sau: Chất lượng Công nghệ Phế phẩm (cái) Chính phẩm (cái) Tổng số (cái) Sau khi thay đổi công nghệ 8 192 200 Trước khi thay đổi công nghệ 92 708 800 Tổng số 100 900 1000 Vấn đề đặt ra là việc áp dụng công nghệ mới và chất lượng có liên quan hay không ? (Với α =0,05) Giải: 1/ Ho : Công nghệ mới độc lập với chất lượng 2/ H1 : Chất lượng phụ thuộc công nghệ mới 3/ Tính Eij: • Tỉ lệ phế phẩm 10 1000 100 = % • Tỉ lệ chính phẩm 90 100 900 = % Chất lượng Công nghệ Phế phẩm (cái) Chính phẩm (cái) Tổng số (cái) Sau khi thay đổi công nghệ 200 * 100 10 = 20 200 * 100 90 = 180 200 Trước khi thay đổi công nghệ 800 * 100 10 = 80 800 * 100 90 = 720 800 Tổng số 100 900 1000 Tính X2: X2 = ij 2 ijj,i j,i E )EO( −∑ = ( ) ( ) ( ) ( )72072070818018019280809220208 2222 −+−+−+− 2χ = 10 Tính 2,αυχ α = 0,05 ν = (r-1)(c-1) = 1 Tra bảng χ21;0,05 = 3,84 Cao Hào Thi 104 Ra quyết định: χ2 > χ21;0,05 ⇒ Bác bỏ giả thuyết H0. Nghĩa là việc áp dụng công nghệ mới đã làm tăng chất lượng sản phẩm.