Ta làm việc với trị trung bình (means): khoảng tin
chắc và kiểm nghiệm giả thiết dựa trên mô hình phân phối mẫu.
Định Lý Giới Hạn Trung Tâm (CLT) cho ta biết rằng
mô hình phân phối mẫu cho trị trung bình là mô
hình chuẩn với trị trung bình μ và độ lệch chuẩn là:
15 trang |
Chia sẻ: nguyenlinh90 | Lượt xem: 806 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Bài giảng Thống kê học ứng dụng trong quản lý xây dựng - Phần 9: Suy luận và so sánh về các trị trung bình, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
9/8/2010
1
Phần 09
Nguyễn Duy Long, Tiến Sỹ
Bộ môn Thi Công và QLXD
©2010, Nguyễn Duy Long, Tiến Sỹ 1
Các suy luận về các trị trung bình
So sánh các trị trung bình
Mẫu đôi
©2010, Nguyễn Duy Long, Tiến Sỹ 2
9/8/2010
2
Inferences about means
©2010, Nguyễn Duy Long, Tiến Sỹ 3
Ta làm việc với trị trung bình (means): khoảng tin
chắc và kiểm nghiệm giả thiết dựa trên mô hình
ố ẫphân ph i m u.
Định Lý Giới Hạn Trung Tâm (CLT) cho ta biết rằng
mô hình phân phối mẫu cho trị trung bình là mô
hình chuẩn với trị trung bình μ và độ lệch chuẩn là:
SD y
n
4©2010, Nguyễn Duy Long, Tiến Sỹ
9/8/2010
3
Với các phần, có sự liên hệ giữa giá trị của phần
(proportion value) và độ lệch chuẩn của phần của
ẫ ( l i )m u samp e proport on .
Với trị trung bình thì không! Biết trị trung bình của
mẫu không cho ta biết điều gì về
Ta làm tất cả những gì có thể: ước lượng thông số
quần thể σ với trị thống kê của mẫu s.
( )SD y
Sai số chuẩn của trị trung bình của mẫu:
sSE y
n
5©2010, Nguyễn Duy Long, Tiến Sỹ
Ta có thêm sự biến đổi trong sai số chuẩn từ s, độ
lệch chuẩn của mẫu.
◦ Ta cần xét sự biến đổi thêm này để không lẫn (mess up)
với các tính toán về biên sai.
Và hình dạng (shape) của mô hình mẫu thay đổi –
mô hình không còn là mô hình chuẩn nữa.
◦ Vậy mô hình mẫu ra sao?
6©2010, Nguyễn Duy Long, Tiến Sỹ
9/8/2010
4
William S. Gosset, nhân viên công ty bia Guinness
ở Ireland, tìm ra mô hình mẫu.
Mô hình mẫu do Gosset tìm ra được gọi là t của
Student (Student’s t).
◦ Các mô hình t của Student hình thành một tập các phân
phối liên quan phụ thuộc vào thông số bậc tự do (degrees
of freedom), gọi tắc là df.
◦ Viết tắc mô hình này dưới dạng tdf.
7©2010, Nguyễn Duy Long, Tiến Sỹ
Mô hình phân phối mẫu thực tiễn cho các trị trung bình
Khi các điều kiện thỏa, trị trung bình mẫu được chuẩn hóa:
Theo mô hình phân phối t của Student với n – 1 bậc tự do.
Ta ước lượng sai số chuẩn theo:
yt
SE y
sSE y
với n là kích thước của mẫu
n
8©2010, Nguyễn Duy Long, Tiến Sỹ
9/8/2010
5
Khi Gosset sửa mô hình cho sự không chắc chắn thêm (extra
uncertainty), biên sai ME lớn hơn.
◦ Khoảng tin chắc sẽ rộng hơn một chút
Các mô hình t (t-models) là một mốt, đối xứng, và có hình
chuông tựa như mô hình chuẩn.
◦ Các mô hình t với vài bậc tự do có đuôi dày hơn mô hình chuẩn.
◦ Khi df tăng, các mô hình t càng giống mô hình chuẩn.
◦ Mô hình t với df vô tận thì chính là mô hình chuẩn.
Mô hình chuẩn Mô hình t với 2 bậc tự do
9©2010, Nguyễn Duy Long, Tiến Sỹ
Mô hình t khác nhau bởi
bậc tự do (n-1)
Bảng tra cho giá trị tới hạn
của mô hình t (t-model
critical values)
Với n = 16 và C = 95%, t*= +/-
2.131
◦ Nếu n = 8 và kiểm nghiệm
một phương đuôi trên với
=5%, t*=1.895
©2010, Nguyễn Duy Long, Tiến Sỹ
Một phần của Bảng T (tr.A-58)
10
9/8/2010
6
1) Giả định tính độc lập:
◦ Điều kiện ngẫu nhiên hóa: Dữ liệu từ mẫu ngẫu
nhiên hay thí nghiệm được ngẫu nhiên hóa thích
hợp.
◦ Điều kiện 10%
©2010, Nguyễn Duy Long, Tiến Sỹ 11
2) Giả định quần thể chuẩn:
◦ Điều kiện gần chuẩn “Nearly Normal”: Dữ liệu từ
phân phối một mốt và đối xứng.
Kiểm tra điều kiện này bằng cách vẽ biểu đồ tần suất.
Kích thước mẫu càng nhỏ (n < 15), dữ liệu càng nên theo
mô hình chuẩn.
Với các kích thước mẫu trung bình (n giữa15 và 40), t sẽ
hữu hiệu khi dữ liệu là một mốt và gần đối xứng.
Với kích thước mẫu lớn hơn, t sẽ an toàn để dùng thậm chí
dữ liệu là bị lệch.
©2010, Nguyễn Duy Long, Tiến Sỹ 12
9/8/2010
7
Khi các điều kiện thỏa, có thể tìm khoảng tin chắc
cho trị trung bình của mẫu, μ.
Khoảng tin chắc:
Với sai số chuẩn của
trị trung bình của mẫu:
Giá ị ới h h h ộ à ứ i hắ C à
1nCI y t SE y
*t
sSE y
n
tr t ạn p ụ t u c v o m c t n c c, , v
số bậc tự do, n – 1. 1n
©2010, Nguyễn Duy Long, Tiến Sỹ 13
Các điều kiện cho kiểm nghiệm một mẫu (one-sample t-test)
cho trị trung bình giống với khoảng t cho một mẫu (one-sample
t-interval).
Kiểm nghiệm giả thiết H0: = 0 dùng trị thống kê kiểm nghiệm:
với sai số chuẩn của trị trung bình của mẫu:
01n
yt
SE y
sSE y
n
Khi các điều kiện thỏa và giả thiết rỗng đúng, trị thống kê theo
mô hình t của Student với n – 1 bậc tự do.
©2010, Nguyễn Duy Long, Tiến Sỹ 14
9/8/2010
8
Nhà sản xuất rượu kiểm tra dây chuyền đóng chai
750ml để đảm bảo việc rót đủ rược, nếu khống phải
dùng dây chuyền và kiểm tra mọi thứ, một qui trình
mất thời gian và tốn kém. Trong khi một số biến đổi
là tự nhiên và chấp nhận được, mẫu 15 chai có
dung tích trung bình 740ml và độ lệch chuẩn 20ml
◦ Tìm 95% CI cho dung tích trung bình của các chai rượu
◦ Nếu ta quan tâm việc đóng chai lớn hơn hay nhỏ hơn dung
tích trên nhãn và sẽ chấp nhận mức = 5%, dùng loại kiểm
nghiệm nào?
Ta có dừng dây chuyền không?
ế ể◦ N u ta chỉ quan tâm đóng chai ít rượu hơn, loại ki m
nghiệm gì cần thực hiện? Nếu = 5%, ta vẫn dùng cùng
mức tin chắc ở trên?
©2010, Nguyễn Duy Long, Tiến Sỹ 15
Comparing Means
©2010, Nguyễn Duy Long, Tiến Sỹ 16
9/8/2010
9
Các thí nghiệm để so sánh hai nhóm thường
xảy ra cả trong khoa học và công nghiệp.
So sánh hai trị trung bình không khác mấy so
với so sánh hai phần
©2010, Nguyễn Duy Long, Tiến Sỹ 17
Khi các điều kiện thỏa, sự khác nhau được
chuẩn hóa của mẫu giữa các trị trung bình
của hai nhóm độc lập,
có thể mô hình bởi mô hình t của Student với
bậc tự do theo công thức đặc biệt. Sai số
ẩ
)(
)()(
21
2121
yySE
yyt
chu n được ước tính:
©2010, Nguyễn Duy Long, Tiến Sỹ 18
2
2
2
1
2
1)( 21 n
s
n
syySE
9/8/2010
10
Xác định bậc tự do theo:
2
22 ss
Qui tắc dễ hơn:
◦ df = min(n1, n2) nhưng không lớn hơn (n1 + n2 – 2)
2
2
2
2
12
12
1
2
1
11
1
2
2
1
1
)()(
)(
n
s
nn
s
n
nndf
©2010, Nguyễn Duy Long, Tiến Sỹ 19
Giả định tính độc lập
Giả định quần thể chuẩn
Giả định các nhóm độc lập
©2010, Nguyễn Duy Long, Tiến Sỹ 20
9/8/2010
11
Khi các điều kiện thỏa, khoảng tin chắc cho
sự khác nhau giữa các trị trung bình của hai
nhóm độc lập, µ1 - µ2, là:
)()( 21
*
21 yySEtyy df
©2010, Nguyễn Duy Long, Tiến Sỹ 21
Kiểm nghiệm t cho hai mẫu (two-sample t-
test)
H0: µ1 - µ2 = Δ0
Trị thống kê kiểm nghiệm: )(
)(
21
021
yySE
yyt
©2010, Nguyễn Duy Long, Tiến Sỹ 22
9/8/2010
12
Paired Samples
©2010, Nguyễn Duy Long, Tiến Sỹ 23
Dữ liệu đôi (paired data) xuất hiện dưới nhiều
cách.
◦ Ví dụ: So sánh các đối tượng với chính nó trước và
sau một liệu pháp.
Không thể dùng các phương pháp hai mẫu ở
phần trên cho dữ liệu đôi.
©2010, Nguyễn Duy Long, Tiến Sỹ 24
9/8/2010
13
Tên Dặm lái xe với tuần
làm việc 5 ngày
Dặm lái xe với tuần
làm việc 4 ngày
Khác nhau
Jeff 2798 2914 -116
Betty 7724 6112 1612
Roger 7505 6177 1328
Tom 838 1102 -264
Aimee 4592 3281 1311
Greg 8107 4997 3110
Larry G. 1228 1695 -467
©2010, Nguyễn Duy Long, Tiến Sỹ 25
Tad 8718 6606 2112
Larry M. 1097 1063 34
Leslie 8089 6392 1697
Lee 3807 3362 445
Nguồn: De Veaux, 2006, tr.574
Vì ta quan tâm đến các sự khác nhau, ta coi
tất cả chúng (cột ngoài cùng bên phải) như
hể hú là d l bỏ h đầt c ng ữ iệu, qua ai cột u.
Ta chỉ có một cột các giá trị để xem xét, ta có
thể dùng kiểm nghiệm t một mẫu (one-
sample t-test).
Về tính toán, kiểm nghiệm t đôi (paired t-
test) chỉ là kiểm nghiệm t một mẫu cho các trị
trung bình của sự khác nhau từng đôi
(pairwise differences), kích thước mẫu là số
cặp
©2010, Nguyễn Duy Long, Tiến Sỹ 26
9/8/2010
14
Giả định dữ liệu đôi
Giả định tính độc lập
Giả định quần thể chuẩn
©2010, Nguyễn Duy Long, Tiến Sỹ 27
Khi các điều kiện thỏa, ta có thể kiểm nghiệm
trị trung bình của sự khác nhau từng đôi có
khác nhau đáng kể so với không.
Giả thiết rỗng H0: µ0 = Δ0
Trị số thống kê: )(1 0dSE
d
nt
Sai số chuẩn:
©2010, Nguyễn Duy Long, Tiến Sỹ 28
n
sddSE )(
9/8/2010
15
Khi các điều kiện thỏa, ta có thể tìm khoảng
tin chắc cho trị trung bình của sự khác nhau
từng đôi:
Với
)(* 1 dSEtd n
n
sddSE )(
©2010, Nguyễn Duy Long, Tiến Sỹ 29
©2010, Nguyễn Duy Long, Tiến Sỹ 30