Bài giảng Xác suất thống kê - Chương 4: Lý thuyết mẫu & ước lượng tham số - Phan Trung Hiếu

Ví dụ 1: Một khách hàng nhận được lô hàng từ một nhà máy sản xuất bút bi rẻ tiền. Để ước lượng tỉ lệ bút hỏng, khách hàng lấy ngẫu nhiên 300 bút từ lô hàng kiểm tra và thấy có 30 bút hỏng. a) Nếu sử dụng mẫu điều tra, để ước lượng tỉ lệ bút bi hỏng đạt độ chính xác là 2,5% thì đảm bảo độ tin cậy là bao nhiêu? b) Nếu muốn ước lượng tỉ lệ bút bi hỏng đạt độ tin cậy 96% và độ chính xác 3% thì cần kiểm tra thêm bao nhiêu bút bi nữa?

pdf29 trang | Chia sẻ: thanhle95 | Lượt xem: 1458 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Bài giảng Xác suất thống kê - Chương 4: Lý thuyết mẫu & ước lượng tham số - Phan Trung Hiếu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
11/24/2019 1 LOG O Chương 4: LÝ THUYẾT MẪU & ƯỚC LƯỢNG THAM SỐ Giảng viên: Phan Trung Hiếu 2 I. Tổng thể và mẫu: Tổng thể - Là tập hợp tất cả các phần tử cần khảo sát một tính chất A nào đó. - Gọi N: số phần tử của tổng thể. Mẫu - Là tập hợp gồm các phần tử được chọn từ tổng thể. - Gọi n: số phần tử của mẫu (cỡ mẫu). 3 Ví dụ 1: Tính chiều cao trung bình của người Việt Nam ở độ tuổi 18. Đo chiều cao của tất cả người Việt Nam ở độ tuổi 18! Tốn thời gian, tiền bạc, công sức. Không xác định được chính xác tổng thể. Ví dụ 3: Tính tỉ lệ hộp sữa kém chất lượng trong kho gồm 1 triệu hộp. Kiểm tra từng hộp! Phá vỡ tổng thể. Ví dụ 2: Tính tỉ lệ người nhiễm HIV bằng con đường tiêm chích ma tuý trong số những người nhiễm HIV ở Việt Nam. Xác định tất cả những người nhiễm HIV! 4 Tổng thể (N) Mẫu (n) Nghiên cứuKết quả Hoàn lại Không hoàn lại 5 II. Các đặc trưng của tổng thể:  Tỉ lệ (xác suất) phần tử có tính chất A:  Trung bình của tổng thể: E(X)   Phương sai của tổng thể: 2 Var(X)  , :mp m N  Số phần tử có tính chất A. 6 III. Các đặc trưng của mẫu: 3.1. Bảng số liệu: Gọi là những kết quả quan sát.1 2, ,..., kx x x Dạng liệt kê: x1,x2,, xk trong đó mỗi xi có thể lặp lại. Dạng bảng tần số: (Bảng pp thực nghiệm) Dạng khoảng: xi x1 x2 ... xk Tần số (ni) n1 n2 ... nk xi a1-b1 ai-bi ak-bk ni n1 ni nk Sắp xếp lại số liệu 2 a bx  i ii 11/24/2019 2 7 3.2. Các đặc trưng mẫu: Cho bảng tần số xi x1 x2 ... xk Tần số (ni) n1 n2 ... nk n1+n2++ nk = n Trung bình mẫu ( ):x 1 1 k i i i x n x n    8 Phương sai mẫu (s2): 22 2 2 2 1 1 . . ( ( ) ) 1 1 k i i i ns n x n x x x n n           Độ lệch mẫu (s): 2s s Tỉ lệ mẫu ( f ): mf n  m: số phần tử có tính chất A nào đó. trong đó: 2 2 1 1 k i i i x n x n    9 fx-570 ES  Xóa bộ nhớ: SHIFT→ 9 → 2 → = Vào chế độ thống kê (STAT): MODE→3: STAT→1:1-VAR  Nhập số liệu: dùng nút tròn và nút =  Khai báo cột tần số: SHIFT→MODE→▼→4: STAT→1: ON Nhập xong nhấn AC 10  Đọc kết quả: Đại lượng cần tìm Thao tác n SHIFT→ 1 → 5:Var→1: n→ = SHIFT→ 1 → 5:Var→ → = s SHIFT→ 1 → 5:Var→ → = x : x2 : 1x n 4 11 fx-570 ES PLUS  Xóa bộ nhớ: SHIFT→ 9 → 2 → = Vào chế độ thống kê (STAT): MODE→3: STAT→1:1-VAR  Nhập số liệu: dùng nút tròn và nút =  Khai báo cột tần số: SHIFT→MODE→▼→4: STAT→1: ON Nhập xong nhấn AC 12  Đọc kết quả: Đại lượng cần tìm Thao tác n SHIFT→ 1 → 4:Var→1: n→ = SHIFT→ 1 → 4:Var→ → = s SHIFT→ 1 → 4:Var→ → = x : x2 :sx4 11/24/2019 3 13 fx-580 VNX  Xóa bộ nhớ: SHIFT→ 9 → 2 → = Vào chế độ thống kê (STAT): MENU→6: STAT→1:1-VAR  Nhập số liệu: dùng nút tròn và nút =  Khai báo cột tần số: SHIFT→MENU→▼→3: STAT→1: ON Nhập xong nhấn AC 14  Đọc kết quả: Đại lượng cần tìm Thao tác n Nhấn ▼ Nhìn màn hình thấy n Nhìn màn hình thấy s Nhấn ▼ Nhìn màn hình thấy sx x OPTN→2:1-VAR x IV. Lý thuyết ước lượng: 15 Tổng thể (N) Mẫu (n)  2 p x 2s f Ước lượng (dự đoán) V. Ước lượng điểm: 16 -Kết quả được cho bởi một con số cụ thể.   2  p  Ví dụ: Ta lấy mẫu và ước lượng chiều cao trung bình của người Việt Nam. Nếu kết luận chiều cao trung bình của người Việt Nam là 170cm thì 170cm là một ước lượng điểm. -Khi đó: x 2s f VI. Ước lượng khoảng: 17 -Kết quả cần ước lượng được cho bởi một khoảng (a,b). Ví dụ: Ta lấy mẫu và ước lượng chiều cao trung bình của người Việt Nam. Nếu kết luận chiều cao trung bình của người Việt Nam trong khoảng (158cm,172cm) thì (158cm,172cm) là một ước lượng khoảng. 18 Giả sử là tham số cần ước lượng 2( , , )p   ( a b )  ( , ) γP a b   (a,b): Khoảng tin cậy (khoảng ước lượng) với độ tin cậy .γ 1 γ, :   Mức ý nghĩa. 11/24/2019 4 VII. Ước lượng trung bình của tổng thể: 19 : trung bình của tổng thể -Giả thiết: Cho cỡ mẫu n. Biết Cho độ tin cậy ,x s γ -Mục tiêu: Cần tìm (sai số ước lượng, độ chính xác) sao cho  ( ; )x x     -Phương pháp: Tùy vào n và  : Khoảng tin cậy đối xứng. ( ; )x    : Khoảng tin cậy tối đa. ( ; )x   : Khoảng tin cậy tối thiểu. 20 KHOẢNG TIN CẬY ĐỐI XỨNG (2 PHÍA) (Xem Phương pháp dạng sơ đồ trang 18) 21 KHOẢNG TIN CẬY TỐI ĐA, TỐI THIỂU (1 PHÍA) (Xem Phương pháp dạng sơ đồ trang 18) 22 Ví dụ 1: Mẫu điều tra về chỉ tiêu X của một loại sản phẩm được kết quả cho trong bảng: xi (%) 2,5 7,5 12,5 17,5 22,5 27,5 32,5 37,5 ni(số sp) 7 12 20 25 18 12 5 1 a) Hãy ước lượng khoảng cho trung bình chỉ tiêu X với độ tin cậy 95%. b) Hãy ước lượng khoảng cho trung bình tối đa của chỉ tiêu X với độ tin cậy 95%. c) Hãy ước lượng trung bình tối thiểu của chỉ tiêu X với độ tin cậy 95%. d) Những sản phẩm có chỉ tiêu X không quá 10% là sản phẩm loại 2. Hãy ước lượng khoảng cho trung bình chỉ tiêu X các sản phẩm loại 2 với độ tin cậy 95%, biết rằng chỉ tiêu X các sản phẩm loại 2 có phân phối chuẩn. 23 Giải a) n   chưa biết và x s  γ  ( ) 2 C C     100. 17,3. 8,0691. 0,95. 0,95 0, 475 2  1,96. Gọi (%) là trung bình chỉ tiêu X. 30.n  24 sC n       (15,7185 ; 18,8815) (%) 8,06911,96 1,5815. 100   ( ; )x x   b) ( ) 0,5C C      1,65. γ 0,95 1 0,95 0, 05.     0, 45 sC n     8, 06911,65 1,3314. 100   11/24/2019 5 25   Vậy trung bình tối đa của chỉ tiêu X với độ tin cậy 95% là 18,6314%. ( ; ) ( ; 18,6314).x     c)  ( ; ) (15,9686 ; ).x     Vậy trung bình tối thiểu của chỉ tiêu X với độ tin cậy 95% là 15,9686%. d) Bảng phân phối thực nghiệm các sản phẩm loại 2: xi (%) 2,5 7,5 ni(số sp) 7 12 26 Gọi (%) là trung bình chỉ tiêu X các sản phẩm loại 2 .   n   chưa biết và x s  γ    7 12 19  5,6579 2,4779. 0,95 1 0,95 0,05.   21,C t n     0,05219 1,t   18; 0,025 2,101.t  sC n     2, 47792,101 1,1944. 19   30.n  VII. Ước lượng trung bình của tổng thể: 27   ; (4,4635 ; 6,8523) (%).x x    Ví dụ 2: Chủ một kho cung cấp sơn muốn ước lượng lượng sơn chứa trong một thùng được sản xuất từ một dây chuyền công nghệ quốc gia. Biết rằng theo tiêu chuẩn của dây chuyền công nghệ đó, độ lệch tiêu chuẩn của lượng sơn là 0,08 thùng. Điều tra một mẫu 50 thùng được lượng sơn trung bình là 0,97 thùng. Với độ tin cậy 99%, hãy ước lượng khoảng cho lượng sơn trung bình chứa trong một thùng. 28 Giải Gọi (thùng) là n   x  γ  ( )C C     29     (thùng). VIII. Ước lượng tỉ lệ của tổng thể: 30 :p tỉ lệ của tổng thể -Giả thiết: Cho cỡ mẫu n. Biết tỉ lệ mẫu , m: số phần tử có tính chất A nào đó. Cho độ tin cậy γ -Mục tiêu: Cần tìm (sai số ước lượng, độ chính xác) sao cho với độ tin cậy   ;p f f    γ mf n  : Khoảng tin cậy đối xứng.  ;p f    : Khoảng tin cậy tối đa.  ;p f    : Khoảng tin cậy tối thiểu. 11/24/2019 6 31 -Sai số ước lượng khoảng tin cậy đối xứng: (Xem Phương pháp dạng sơ đồ trang 22) 32 -Sai số ước lượng khoảng tin cậy tối đa, tối thiểu: (Xem Phương pháp dạng sơ đồ trang 22) 33 Ví dụ 1: Kiểm tra 100 sản phẩm trong một lô hàng lớn gồm 50000 sản phẩm thấy có 20 phế phẩm. Hãy ước lượng khoảng cho tỉ lệ phế phẩm với độ tin cậy 99%? Số phế phẩm của lô hàng đó nằm trong khoảng nào? Giải Gọi p : tỉ lệ phế phẩm của lô hàng. f : tỉ lệ phế phẩm trong 100 sản phẩm được kiểm tra γ  ( )C C    f  20 0, 2. 100  0,99. 2,58γ 0,99 0,495 2 2   34   p  Số phế phẩm của lô hàng đó nằm trong khoảng:    0,0968 50000; 0,3032 50000 4840; 15160   (sản phẩm). (1 ) 0,2(1 0, 2)2,58 100 f fC n       0,1032  ; (0,0968 ; 0,3032).f f    35 Ví dụ 2: Cân ngẫu nhiên 45 con heo 3 tháng tuổi trong một trại chăn nuôi, ta được kết quả sau xi 35 37 39 41 43 45 47 ni 2 6 10 11 8 5 3 Heo có khối lượng trên 38kg là heo đạt tiêu chuẩn. Giả sử khối lượng tuân theo quy luật phân phối chuẩn. a) Hãy tìm khoảng ước lượng cho tỉ lệ heo đạt tiêu chuẩn trong trại trên với độ tin cậy 90%. b) Hãy ước lượng tối đa cho tỉ lệ heo đạt tiêu chuẩn trong trại trên với độ tin cậy 90%. 36 Gọi p : f : γ  γ 0,9 0,45 1,64. 2 2 ( )C C     f  a) tỉ lệ heo đạt tiêu chuẩn. tỉ lệ heo đạt tiêu chuẩn trong 45 con heo được cân Giải 11/24/2019 7 37   p  với độ tin cậy 90%. 38 b) γ    ( )C C      p   Vậy, tỉ lệ tối đa cho heo đạt tiêu chuẩn trong trại trên với độ tin cậy 90% là IX. Ước lượng phương sai của tổng thể: 39 Sinh viên tự nghiên cứu.    X. Các bài toán liên quan đến ước lượng trung bình: 40 Xem trang 19 XI. Các bài toán liên quan đến ước lượng tỉ lệ: 41 Xem trang 23 42 Ví dụ 1: Một khách hàng nhận được lô hàng từ một nhà máy sản xuất bút bi rẻ tiền. Để ước lượng tỉ lệ bút hỏng, khách hàng lấy ngẫu nhiên 300 bút từ lô hàng kiểm tra và thấy có 30 bút hỏng. a) Nếu sử dụng mẫu điều tra, để ước lượng tỉ lệ bút bi hỏng đạt độ chính xác là 2,5% thì đảm bảo độ tin cậy là bao nhiêu? b) Nếu muốn ước lượng tỉ lệ bút bi hỏng đạt độ tin cậy 96% và độ chính xác 3% thì cần kiểm tra thêm bao nhiêu bút bi nữa? 11/24/2019 8 43 Giải a) 200n  . (1 ) nC f f    γ 2 ( )C   3 . 30 0,1. 300 f   0,025. 3000,025. 1,44. 0,1.(1 0,1)   2. (1,44) 2. 0, 4251 0,8502 85,02%.     Gọi f : tỉ lệ bút hỏng trong 300 bút được kiểm tra.   44 b) γ 0,95 0, 475 1,96. 2 ) 2 (C C     Gọi n là số bút bi cần kiểm tra. Vậy cần kiểm tra thêm 300 125m n   (bút).    , 6 , 8 2,06.  424,36 1n   425. 0,96 0, 03 2 2 2 2 . .(1 ) (2,06) .0,1.(1 0,1) 424,36 (0,03) C f fn       45 Ví dụ 2: Đo đường kính của 100 chi tiết do một máy sản xuất được số liệu xi(cm) 9,75 9,80 9,85 9,90 ni(số sản phẩm) 5 37 42 16 a) Nếu sử dụng mẫu này và muốn ước lượng đường kính trung bình với độ chính xác 0,006 cm thì đảm bảo độ tin cậy bao nhiêu? b) Nếu muốn ước lượng đường kính trung bình với độ chính xác là 0,003 cm và độ tin cậy là 95% thì cần kiểm tra thêm bao nhiêu chi tiết? 46 Giải a) 100 30. 0,04.n s  γ  C    47 b) 0,003. 0 9γ , 5.   γ 0,95 0, 475 1,96. 2 ) 2 (C C     Vậy cần kiểm tra thêm: Gọi n là số chi tiết cần kiểm tra. n  (chi tiết). LOG O Chương 5: KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Giảng viên: Phan Trung Hiếu Việc kiểm tra lại thông tin mà ta nhận được xem có đáng tin cậy không chính là bài toán kiểm định. 11/24/2019 9 49 I. Các khái niệm: Giả thuyết thống kê: là các giả thuyết nói về - Các tham số của tổng thể; -Quy luật phân phối xác suất hoặc tính độc lập của các biến ngẫu nhiên. Kiểm định giả thuyết thống kê: là công việc tìm ra kết luận để bác bỏ hay chấp nhận một giả thuyết thống kê từ các thông tin thu được trên mẫu điều tra. Ký hiệu: H: giả thuyết không. : giả thuyết đối (đối thuyết) của H.H 50 -Dựa vào mẫu lấy ra để đưa ra kết luận: "chấp nhận H (bác bỏ ) hay chấp nhận (bác bỏ H)". H H Ví dụ 1: Một tổ chức cho rằng chiều cao trung bình hiện nay của thanh niên Việt Nam là 1,65m. Hãy lập giả thuyết để kiểm chứng kết quả này? 51 Giải Gọi : chiều cao trung bình của thanh niên hiện nay (theo thực tế).  Giả thuyết : 1, 65 . : 1,65 H H      lấy một mẫu để điều tra kiểm định chấp nhận H bác bỏ    52 Ví dụ 2: Một ý kiến cho rằng tỉ lệ sinh viên thi đạt môn XSTK là thấp hơn 50%. Hãy lập giả thuyết để kiểm chứng điều này? Giải Gọi p: tỉ lệ sinh viên thi đạt môn XSTK (theo thực tế). Giả thuyết : 0,5 . H p    : 0,5H p  53 Tiêu chuẩn kiểm định giả thuyết: là một thống kê T=T(X1, X2,,Xn) có thể phụ thuộc vào tham số đã biết trong giả thuyết H. Thống kê T được chọn sao cho thỏa điều kiện: Khi H đúng thì luật phân phối xác suất của T hoàn toàn được xác định. Miền bác bỏ: Với số bé cho trước, ta có thể tìm được tập hợp thỏa 0  W P{T W H đúng} . :W Miền bác bỏ giả thuyết H. :W  Miền chấp nhận giả thuyết H. : Mức ý nghĩa. ( 0,1; 0,05; 0,01...)  54 Tiến hành quan trắc dựa trên mẫu ngẫu nhiên (X1, X2,, Xn) ta thu được mẫu cụ thể (x1, x2,, xn), ta tính được giá trị t=T(x1, x2,, xn). Từ đó: ■ Nếu thì ta bác bỏ H. ■ Nếu thì ta chấp nhận H (chưa đủ cơ sở để bác bỏ H). t W t W  11/24/2019 10 55 II. Các loại sai lầm trong kiểm định:  : mức ý nghĩa. Thực tế Kết luận Sai lầm nào nghiêm trọng hơn? Cách làm giảm khả năng mắc sai lầm? 56 Ví dụ: Tôi đi khám bệnh Ebola, có 2 giả thiết H: Tôi thực sự bị bệnh Ebola. H: Tôi thực sự không bệnh Ebola. Kết luận của bác sĩ: Có bệnh Không bệnh Sai lầm loại I: Bác sĩ cho tôi về trong khi tôi thực sự có bệnh. Sai lầm loại II: Bác sĩ cách ly tôi trong khi tôi thực sự không có bệnh.  Nghiêm trọng     cách ly (tạm giam)  cho về 57 -Ta không thể làm giảm P(sai lầm I) và P(sai lầm II) xuống cùng một lúc được vì khi P(sai lầm I) giảm thì P(sai lầm II) sẽ tăng và ngược lại. -Ta sẽ ấn định trước P(Sai lầm I) = , và trong điều kiện đó P(Sai lầm II) được hạn chế ở mức thấp nhất.  III. Kiểm định tham số: 58 Giả sử là tham số cần kiểm định theo thực tế. 2( , , )p   là giá trị đã biết theo 1 ý kiến nào đó.0 2 0 0 0 0( , , )p   Kiểm định 2 phía Kiểm định 1 phía Kiểm định phía trái Kiểm định phía phải 0 0 : : H H          0 0 : : H H         0 0 : : H H          59 Các bước kiểm định tổng quát: -Bước 1: Đặt cặp giả thuyết thống kê. -Bước 2: Kiểm định giả thuyết thống kê. -Bước 3: Kết luận (chấp nhận hay bác bỏ H). IV. So sánh trung bình với một số: 60  : trung bình của tổng thể (thực tế, chua biết) 0 : cho trước. Cho trước mức ý nghĩa  Nhắc lại: 1 .   11/24/2019 11 61 Các bước làm: xem trang 20 62 Ví dụ 1: Mẫu điều tra về năng suất của một giống lúa ở một vùng, kết quả cho trong bảng: xi (tạ/ha) 25 26 27 28 29 30 31 ni (Số ha) 3 5 8 10 7 6 2 Với mức ý nghĩa 2%, có thể cho rằng năng suất trung bình của giống lúa này là 29tạ/ha được không? 63 Giải Gọi (tạ) là năng suất lúa trung bình của giống lúa.  41.n   chưa biết và 27,9512.x  Giả thuyết: : 29, : 29. H H      1, 6117.s  30.n  IV. So sánh trung bình với một số: 64 ( 29 4, 66) 1 8x nt   s 0,02  ( ) 0,49 2 C    2,33.C  Vì nên ta chấp nhận . Vậy, với mức ý nghĩa 2%, không thể cho rằng năng suất trung bình của giống lúa này là 29tạ/ha. t C 1 0,98.     4,1668.t | | H 65 Ví dụ 2: Trọng lượng của một gói chè do một máy tự động đóng theo thiết kế là 500 gam/gói. Người ta lấy ngẫu nhiên 30 gói cân thử được trọng lượng trung bình là 495 gam và độ lệch tiêu chuẩn là 10 gam. Một ý kiến cho rằng máy đóng gói chè làm việc không bình thường làm cho trọng lượng trung bình của gói chè giảm sút. Với mức ý nghĩa 5%, ý kiến này có đáng tin hay không. 66 Giải Gọi (gam) là trọng lượng trung bình của gói chè được máy đóng gói.  n  Giả thuyết: : : H H     x  s  n  11/24/2019 12 IV. So sánh trung bình với một số: 67 t    ( )C  C  Vì nên ta Vậy, với mức ý nghĩa 5%, ý kiến t  H 68 Ví dụ 3: Trong năm trước trọng lượng trung bình khi xuất chuồng của một trại heo là 100 kg/con. Năm nay, người ta cho heo ăn một loại thức ăn mới với hy vọng sẽ làm tăng trọng nhiều hơn. Sau thời gian thử nghiệm, người ta cân ngẫu nhiên 50 con và tính được trọng lượng trung bình là 110 kg/con. Giả thiết trọng lượng của heo trong trại là biến ngẫu nhiên có độ lệch chuẩn là 50kg. a) Với mức ý nghĩa 5%, hãy xét xem loại thức ăn mới có làm tăng trọng lượng trung bình của heo lên hay không? b) Giải lại câu a) với mức ý nghĩa 10%. 69 Giải Gọi là trọng lượng trung bình của heo sau khi cho dùng loại thức ăn mới. ( )kg n  Giả thuyết: : : H H     x   IV. So sánh trung bình với một số: 70 t    ( )C  C  Vì nên ta H. Vậy, với mức ý nghĩa 5%, loại thức ăn mới a) IV. So sánh trung bình với một số: 71   ( )C  C  Vì nên ta Vậy, với mức ý nghĩa 10%, loại thức ăn mới H b) t  V. So sánh tỉ lệ với một số: 72 p : tỉ lệ của tổng thể (thực tế, chua biết) 0p : cho trước. Cho trước mức ý nghĩa  mf n  : tỉ lệ mẫu. 11/24/2019 13 73 Các bước làm: xem trang 24 74 Ví dụ 1: Điều tra doanh số bán hàng của các hộ kinh doanh một loại hàng năm nay cho số liệu: xi (triệu đồng/tháng) 11 11,5 12 12,5 13 13,5 ni (Số hộ) 10 15 20 30 15 10 Những hộ có doanh số trên 12,5 triệu đồng/tháng là những hộ có doanh số cao. Theo một báo cáo, tỉ lệ hộ có doanh số cao là 35%. Với mức ý nghĩa 5%, số liệu trong báo cáo có đáng tin hay không. 75 Giải Gọi p: tỉ lệ hộ có doanh số cao. f : tỉ lệ hộ có doanh số cao trong 100 hộ. : 0,35 : 0,35. H p H p    Giả thuyết: n = 100. 15 10 0, 25. 100 f   76 ( 0,35). 0,35(1 0,35 2 0966. ) ,nt     f 0,05 1 0,95.       ( ) 0,475 2 C    1,96.C  Vì chấp nhận . Vậy, với mức ý nghĩa 5%, số liệu trong báo cáo không đáng tin. t C 2, 0966.t | | H 77 Ví dụ 2: Một công ty tuyên bố rằng 60% khách hàng ưa thích sản phẩm của công ty. Điều tra 400 khách hàng có 230 người ưa thích sản phẩm của công ty này. Với mức ý nghĩa 5%, số liệu trong tuyên bố trên có cao hơn so với thực tế hay không? 78 Giải Gọi p: tỉ lệ khách hàng ưa thích sản phẩm của công ty theo thực tế. f : tỉ lệ khách hàng ưa thích sản phẩm trong 400 khách hàng. : : H H    Giả thuyết: n = f  11/24/2019 14 79 t    ( )C  C  Vì nên ta H . Vậy, với mức ý nghĩa 5%, số liệu trong tuyên bố trên t   VI. So sánh hai trung bình: 80 i : trung bình của tổng thể thứ i (i=1,2) m : cỡ mẫu lấy ra từ tổng thể thứ 1. ix : trung bình mẫu thứ i. is : độ lệch chuẩn của mẫu thứ i. i : độ lệch chuẩn của tổng thể thứ i. n : cỡ mẫu lấy ra từ tổng thể thứ 2. 81 Các bước làm: xem trang 21 82 Ví dụ: Người ta muốn so sánh chất lượng đào tạo tại hai cơ sở A, B căn cứ trên điểm trung bình ở kì thi quốc gia. Một mẫu 100 thí sinh được đào tạo tại cơ sở A có điểm trung bình 9,25, độ lệch chuẩn 0,8, và một mẫu 80 thí sinh được đào tạo tại cơ sở B có điểm trung bình 9, độ lệch chuẩn 1. a) Với mức ý nghĩa 5%, hãy cho biết chất lượng đào tạo của cơ sở A và B có khác nhau hay không? b) Nếu biết cơ sở A có đội ngũ giáo viên tốt hơn cơ sở B. Với mức ý nghĩa 5%, hãy cho biết chất lượng đào tạo của cơ sở A có tốt hơn cơ sở B không? IV. So sánh trung bình với một số: 83 Giải Gọi là điểm trung bình của các thí sinh được đào tạo tại cơ sở A, B. ,A B  100.m  1 2,  chưa biết và 1 9,25.x  Giả thuyết: : . : A B A B H H        1 0,8.s  80.n  2 9.x  2 1.s  a) , 30.m n  IV. So sánh trung bình với một số: 84 1 2 1,8185x xt m n     2 1 2 2s s 0,05  ( ) 0,475 2 C    1,96.C  Vì nên ta chấp nhận H. Vậy, với mức ý nghĩa 5%, chất lượng đào tạo của hai cơ sở là như nhau. t C 1 0,95.     1,8185.t | | 11/24/2019 15 IV. So sánh trung bình với một số: 85 Giả thuyết: : : H H    b) ( )C  C  Vì nên ta Vậy, với mức ý nghĩa 5%, H   VII. So sánh hai tỉ lệ: 86 ip : tỉ lệ của tổng thể thứ i (i=1,2) m : cỡ mẫu lấy ra từ tổng thể thứ 1. if : tỉ lệ của mẫu thứ i. n : cỡ mẫu lấy ra từ tổng thể thứ 2. 1 2. .m f n ff m n    87 Các bước làm: xem trang 25 88 Ví dụ 1: Có 2 lô hạt giống. Từ lô thứ nhất gieo thử ngẫu nhiên 850 hạt thấy có 680 hạt nảy mầm. Từ lô thứ hai gieo thử 1200 hạt thấy có 1020 hạt nảy mầm. Với mức ý nghĩa 5%, có thể coi tỉ lệ hạt giống nảy mầm của 2 lô là khác biệt nhau hay không? IV. So sánh trung bình với một số: 89 Giải Gọi là tỉ lệ hạt nảy mầm của lô thứ nhất, lô thứ hai. 1 2,p p 1f là tỉ lệ hạt nảy mầm trong 850 hạt 1 680 0,8. 850 f   2f là tỉ lệ hạt nảy mầm trong 1200 hạt 2 1020 0,85. 1200 f   850.m  1200.n  90 1 2. . 0,8293.m f n ff m n     Giả thuyết