Bài giảng Thống kê học ứng dụng trong quản lý xây dựng - Phần 9: Suy luận và so sánh về các trị trung bình

Ta làm việc với trị trung bình (means): khoảng tin chắc và kiểm nghiệm giả thiết dựa trên mô hình phân phối mẫu.  Định Lý Giới Hạn Trung Tâm (CLT) cho ta biết rằng mô hình phân phối mẫu cho trị trung bình là mô hình chuẩn với trị trung bình μ và độ lệch chuẩn là:

pdf15 trang | Chia sẻ: nguyenlinh90 | Lượt xem: 806 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Bài giảng Thống kê học ứng dụng trong quản lý xây dựng - Phần 9: Suy luận và so sánh về các trị trung bình, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
9/8/2010 1 Phần 09 Nguyễn Duy Long, Tiến Sỹ Bộ môn Thi Công và QLXD ©2010, Nguyễn Duy Long, Tiến Sỹ 1  Các suy luận về các trị trung bình  So sánh các trị trung bình  Mẫu đôi ©2010, Nguyễn Duy Long, Tiến Sỹ 2 9/8/2010 2 Inferences about means ©2010, Nguyễn Duy Long, Tiến Sỹ 3  Ta làm việc với trị trung bình (means): khoảng tin chắc và kiểm nghiệm giả thiết dựa trên mô hình ố ẫphân ph i m u.  Định Lý Giới Hạn Trung Tâm (CLT) cho ta biết rằng mô hình phân phối mẫu cho trị trung bình là mô hình chuẩn với trị trung bình μ và độ lệch chuẩn là:  SD y  n 4©2010, Nguyễn Duy Long, Tiến Sỹ 9/8/2010 3  Với các phần, có sự liên hệ giữa giá trị của phần (proportion value) và độ lệch chuẩn của phần của ẫ ( l i )m u samp e proport on .  Với trị trung bình thì không! Biết trị trung bình của mẫu không cho ta biết điều gì về  Ta làm tất cả những gì có thể: ước lượng thông số quần thể σ với trị thống kê của mẫu s. ( )SD y  Sai số chuẩn của trị trung bình của mẫu:   sSE y n  5©2010, Nguyễn Duy Long, Tiến Sỹ  Ta có thêm sự biến đổi trong sai số chuẩn từ s, độ lệch chuẩn của mẫu. ◦ Ta cần xét sự biến đổi thêm này để không lẫn (mess up) với các tính toán về biên sai.  Và hình dạng (shape) của mô hình mẫu thay đổi – mô hình không còn là mô hình chuẩn nữa. ◦ Vậy mô hình mẫu ra sao? 6©2010, Nguyễn Duy Long, Tiến Sỹ 9/8/2010 4  William S. Gosset, nhân viên công ty bia Guinness ở Ireland, tìm ra mô hình mẫu.  Mô hình mẫu do Gosset tìm ra được gọi là t của Student (Student’s t). ◦ Các mô hình t của Student hình thành một tập các phân phối liên quan phụ thuộc vào thông số bậc tự do (degrees of freedom), gọi tắc là df. ◦ Viết tắc mô hình này dưới dạng tdf. 7©2010, Nguyễn Duy Long, Tiến Sỹ Mô hình phân phối mẫu thực tiễn cho các trị trung bình Khi các điều kiện thỏa, trị trung bình mẫu được chuẩn hóa: Theo mô hình phân phối t của Student với n – 1 bậc tự do. Ta ước lượng sai số chuẩn theo:   yt SE y    sSE y  với n là kích thước của mẫu n 8©2010, Nguyễn Duy Long, Tiến Sỹ 9/8/2010 5  Khi Gosset sửa mô hình cho sự không chắc chắn thêm (extra uncertainty), biên sai ME lớn hơn. ◦ Khoảng tin chắc sẽ rộng hơn một chút  Các mô hình t (t-models) là một mốt, đối xứng, và có hình chuông tựa như mô hình chuẩn. ◦ Các mô hình t với vài bậc tự do có đuôi dày hơn mô hình chuẩn. ◦ Khi df tăng, các mô hình t càng giống mô hình chuẩn. ◦ Mô hình t với df vô tận thì chính là mô hình chuẩn. Mô hình chuẩn Mô hình t với 2 bậc tự do 9©2010, Nguyễn Duy Long, Tiến Sỹ  Mô hình t khác nhau bởi bậc tự do (n-1)  Bảng tra cho giá trị tới hạn của mô hình t (t-model critical values)  Với n = 16 và C = 95%, t*= +/- 2.131 ◦ Nếu n = 8 và kiểm nghiệm một phương đuôi trên với =5%, t*=1.895 ©2010, Nguyễn Duy Long, Tiến Sỹ Một phần của Bảng T (tr.A-58) 10 9/8/2010 6 1) Giả định tính độc lập: ◦ Điều kiện ngẫu nhiên hóa: Dữ liệu từ mẫu ngẫu nhiên hay thí nghiệm được ngẫu nhiên hóa thích hợp. ◦ Điều kiện 10% ©2010, Nguyễn Duy Long, Tiến Sỹ 11 2) Giả định quần thể chuẩn: ◦ Điều kiện gần chuẩn “Nearly Normal”: Dữ liệu từ phân phối một mốt và đối xứng.  Kiểm tra điều kiện này bằng cách vẽ biểu đồ tần suất.  Kích thước mẫu càng nhỏ (n < 15), dữ liệu càng nên theo mô hình chuẩn.  Với các kích thước mẫu trung bình (n giữa15 và 40), t sẽ hữu hiệu khi dữ liệu là một mốt và gần đối xứng.  Với kích thước mẫu lớn hơn, t sẽ an toàn để dùng thậm chí dữ liệu là bị lệch. ©2010, Nguyễn Duy Long, Tiến Sỹ 12 9/8/2010 7  Khi các điều kiện thỏa, có thể tìm khoảng tin chắc cho trị trung bình của mẫu, μ.  Khoảng tin chắc:  Với sai số chuẩn của trị trung bình của mẫu: Giá ị ới h h h ộ à ứ i hắ C à  1nCI y t SE y   *t   sSE y n   tr t ạn p ụ t u c v o m c t n c c, , v số bậc tự do, n – 1. 1n ©2010, Nguyễn Duy Long, Tiến Sỹ 13  Các điều kiện cho kiểm nghiệm một mẫu (one-sample t-test) cho trị trung bình giống với khoảng t cho một mẫu (one-sample t-interval).  Kiểm nghiệm giả thiết H0:  = 0 dùng trị thống kê kiểm nghiệm: với sai số chuẩn của trị trung bình của mẫu:  01n yt SE y      sSE y n   Khi các điều kiện thỏa và giả thiết rỗng đúng, trị thống kê theo mô hình t của Student với n – 1 bậc tự do. ©2010, Nguyễn Duy Long, Tiến Sỹ 14 9/8/2010 8  Nhà sản xuất rượu kiểm tra dây chuyền đóng chai 750ml để đảm bảo việc rót đủ rược, nếu khống phải dùng dây chuyền và kiểm tra mọi thứ, một qui trình mất thời gian và tốn kém. Trong khi một số biến đổi là tự nhiên và chấp nhận được, mẫu 15 chai có dung tích trung bình 740ml và độ lệch chuẩn 20ml ◦ Tìm 95% CI cho dung tích trung bình của các chai rượu ◦ Nếu ta quan tâm việc đóng chai lớn hơn hay nhỏ hơn dung tích trên nhãn và sẽ chấp nhận mức  = 5%, dùng loại kiểm nghiệm nào?  Ta có dừng dây chuyền không? ế ể◦ N u ta chỉ quan tâm đóng chai ít rượu hơn, loại ki m nghiệm gì cần thực hiện? Nếu  = 5%, ta vẫn dùng cùng mức tin chắc ở trên? ©2010, Nguyễn Duy Long, Tiến Sỹ 15 Comparing Means ©2010, Nguyễn Duy Long, Tiến Sỹ 16 9/8/2010 9  Các thí nghiệm để so sánh hai nhóm thường xảy ra cả trong khoa học và công nghiệp.  So sánh hai trị trung bình không khác mấy so với so sánh hai phần ©2010, Nguyễn Duy Long, Tiến Sỹ 17  Khi các điều kiện thỏa, sự khác nhau được chuẩn hóa của mẫu giữa các trị trung bình của hai nhóm độc lập,  có thể mô hình bởi mô hình t của Student với bậc tự do theo công thức đặc biệt. Sai số ẩ )( )()( 21 2121 yySE yyt    chu n được ước tính: ©2010, Nguyễn Duy Long, Tiến Sỹ 18 2 2 2 1 2 1)( 21 n s n syySE  9/8/2010 10  Xác định bậc tự do theo: 2 22 ss  Qui tắc dễ hơn: ◦ df = min(n1, n2) nhưng không lớn hơn (n1 + n2 – 2) 2 2 2 2 12 12 1 2 1 11 1 2 2 1 1 )()( )( n s nn s n nndf    ©2010, Nguyễn Duy Long, Tiến Sỹ 19  Giả định tính độc lập  Giả định quần thể chuẩn  Giả định các nhóm độc lập ©2010, Nguyễn Duy Long, Tiến Sỹ 20 9/8/2010 11  Khi các điều kiện thỏa, khoảng tin chắc cho sự khác nhau giữa các trị trung bình của hai nhóm độc lập, µ1 - µ2, là: )()( 21 * 21 yySEtyy df  ©2010, Nguyễn Duy Long, Tiến Sỹ 21  Kiểm nghiệm t cho hai mẫu (two-sample t- test)  H0: µ1 - µ2 = Δ0  Trị thống kê kiểm nghiệm: )( )( 21 021 yySE yyt   ©2010, Nguyễn Duy Long, Tiến Sỹ 22 9/8/2010 12 Paired Samples ©2010, Nguyễn Duy Long, Tiến Sỹ 23  Dữ liệu đôi (paired data) xuất hiện dưới nhiều cách. ◦ Ví dụ: So sánh các đối tượng với chính nó trước và sau một liệu pháp.  Không thể dùng các phương pháp hai mẫu ở phần trên cho dữ liệu đôi. ©2010, Nguyễn Duy Long, Tiến Sỹ 24 9/8/2010 13 Tên Dặm lái xe với tuần làm việc 5 ngày Dặm lái xe với tuần làm việc 4 ngày Khác nhau Jeff 2798 2914 -116 Betty 7724 6112 1612 Roger 7505 6177 1328 Tom 838 1102 -264 Aimee 4592 3281 1311 Greg 8107 4997 3110 Larry G. 1228 1695 -467 ©2010, Nguyễn Duy Long, Tiến Sỹ 25 Tad 8718 6606 2112 Larry M. 1097 1063 34 Leslie 8089 6392 1697 Lee 3807 3362 445 Nguồn: De Veaux, 2006, tr.574  Vì ta quan tâm đến các sự khác nhau, ta coi tất cả chúng (cột ngoài cùng bên phải) như hể hú là d l bỏ h đầt c ng ữ iệu, qua ai cột u.  Ta chỉ có một cột các giá trị để xem xét, ta có thể dùng kiểm nghiệm t một mẫu (one- sample t-test).  Về tính toán, kiểm nghiệm t đôi (paired t- test) chỉ là kiểm nghiệm t một mẫu cho các trị trung bình của sự khác nhau từng đôi (pairwise differences), kích thước mẫu là số cặp ©2010, Nguyễn Duy Long, Tiến Sỹ 26 9/8/2010 14  Giả định dữ liệu đôi  Giả định tính độc lập  Giả định quần thể chuẩn ©2010, Nguyễn Duy Long, Tiến Sỹ 27  Khi các điều kiện thỏa, ta có thể kiểm nghiệm trị trung bình của sự khác nhau từng đôi có khác nhau đáng kể so với không.  Giả thiết rỗng H0: µ0 = Δ0  Trị số thống kê: )(1 0dSE d nt     Sai số chuẩn: ©2010, Nguyễn Duy Long, Tiến Sỹ 28 n sddSE )( 9/8/2010 15  Khi các điều kiện thỏa, ta có thể tìm khoảng tin chắc cho trị trung bình của sự khác nhau từng đôi:  Với )(* 1 dSEtd n   n sddSE )( ©2010, Nguyễn Duy Long, Tiến Sỹ 29 ©2010, Nguyễn Duy Long, Tiến Sỹ 30