Biết chiều dài một sản phẩm do một xưởng sản xuất ra là
bnn X . Hãy ước lượng giá trị của .
là một tham số cần ước lượng. Muốn ước lượng nó, ta
phải dựa vào mẫu gồm một số sản phẩm do xưởng này
sản xuất. Ta có thể ước đoán bởi một giá trị hoặc
ước đoán thuộc khoảng (a; b) nào đấy.
50 trang |
Chia sẻ: haohao89 | Lượt xem: 25971 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Bài giảng Xác suất và thống kê chương 5: Ước lượng tham số, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
TRẦN AN HẢI
TUẦN 6
HÀ NỘI - 2009
Chương 5
ƯỚC LƯỢNG THAM SỐ
_________________________________________________
§1 ĐẶT VẤN ĐỀ
Biết chiều dài một sản phẩm do một xưởng sản xuất ra là
bnn X . Hãy ước lượng giá trị của .
là một tham số cần ước lượng. Muốn ước lượng nó, ta
phải dựa vào mẫu gồm một số sản phẩm do xưởng này
sản xuất. Ta có thể ước đoán bởi một giá trị hoặc
ước đoán thuộc khoảng (a; b) nào đấy.
Trong thống kê, gọi là ước lượng điểm của , còn
(a; b) là ước lượng khoảng của .
§2 ƯỚC LƯỢNG ĐIỂM
Giả sử bnn X đã biết được dạng của quy luật ppxs nhưng
chưa biết tham số nào đó. Ta ước đoán bởi một con
số * như sau: Ta xây dựng hàm của mẫu ngẫu nhiên
tổng quát là
.
Với mỗi mẫu ngẫu nhiên cụ thể (x1, x2, …, xn), ta lấy
làm ước lượng cho .
Gọi
hay
là ước lượng điểm của .
Để đánh giá chất lượng * xem “tốt” hay không ta không
thể mong muốn nó thật gần bởi vì ta chưa biết . Vì
vậy, dưới đây người ta đưa ra các tiêu chuẩn để dựa vào
đó kết luận về chất lượng của *.
Ước lượng không chệch (ưlkc)
Gọi là ước lượng không chệch
của , nếu
= .
Ngược lại, nếu
thì gọi là ước lượng chệch của .
Ước lượng hiệu quả (ưlhq)
Gọi là ước lượng hiệu quả của ,
nếu nó là ưlkc của và nhỏ
nhất so với phương sai của mọi ưlkc khác của .
Ước lượng vững (ưlv)
Gọi là ước lượng vững của , nếu
Ý nghĩa của công thức này
Hầu như chắc chắn sai khác
không nhiều miễn là n đủ lớn.
Các kết quả về ước lượng điểm
là ưlkc, ưlhq, ưlv của E(X).
, là ưlkc, ưlv của D(X).
là ưlkc, ưlhq, ưlv của P(A).
, là ước lượng chệch của
D(X).
§3 ƯỚC LƯỢNG KHOẢNG
Phương pháp ước lượng điểm có nhược điểm là khi kích
thước mẫu nhỏ thì ước lượng điểm tìm được có thể sai
lệch rất nhiều so với tham số cần ước lượng. Ngoài ra
không thể đánh giá được khả năng mắc sai lầm khi ước
lượng. Để khắc phục các nhược điểm này, ta thường
dùng phương pháp ước lượng bằng khoảng tin cậy.
Giả sử bnn X đã biết được dạng của quy luật ppxs nhưng
chưa biết tham số nào đó. Ta đi tìm một khoảng
để nó chứa với xác suất bằng như sau: Ta
xây dựng như là các hàm của mẫu ngẫu nhiên tổng
quát
và .
sao cho
.
Khi ấy ta gọi
.
là ước lượng khoảng (hay khoảng tin cậy của ), còn
là độ tin cậy của ước lượng này. Số đo khả năng để
rơi vào khoảng này, nên người ta thường chọn nó gần 1.
Chú ý
Với một mẫu ngẫu nhiên cụ thể (x1, x2, …, xn), ta cũng
gọi
là ước lượng khoảng (hay khoảng tin cậy) của .
I – Tìm khoảng tin cậy cho kỳ vọng
a) Trường hợp X
Nếu đã biết, ta dùng công thức
trong đó n = kích thước mẫu, còn không âm
thỏa ,
, .
Như vậy, khoảng tin cậy của E(X) với độ tin cậy là
Đặc biệt:
Nếu chọn , thì ta có khoảng tin
cậy đối xứng là
.
Nếu chọn , thì ta có khoảng tin cậy bên
phải là
.
Nếu chọn , thì ta có khoảng tin cậy bên
trái là
.
Ví dụ
Khối lượng của một loại sản phẩm là bnn tuân theo luật
phân phối chuẩn với độ lệch tiêu chuẩn là 1g. Cân 25 sản
phẩm loại này ta thu được kết quả sau
Khối lượng (g) 18 19 20 21
Số sản phẩm 3 5 15 2
Hãy tìm khoảng tin cậy đối xứng của khối lượng trung
bình với độ tin cậy 0,95.
Giải
Với 0,95, ta có .
,
.
Vì vậy, khoảng tin cậy đối xứng của khối lượng trung
bình là
Nếu chưa biết, ta dùng công thức
trong đó n = kích thước mẫu, và không âm thỏa
, còn tra từ Bảng giá trị
hàm Student.
Đặc biệt:
Nếu chọn , thì ta có khoảng tin
cậy đối xứng là
.
Nếu chọn , thì ta có khoảng tin cậy bên
phải là
.
Nếu chọn , thì ta có khoảng tin cậy bên
trái là
.
Ví dụ
Chiều cao của thanh niên một vùng là bnn tuân theo luật
phân phối chuẩn. Đo chiều cao của 16 thanh niên được
chọn ngẫu nhiên của vùng đó ta thu được kết quả sau
172 173 173 174 174 175 175 176
166 167 165 173 171 170 171 170
Hãy tìm khoảng tin cậy đối xứng của chiều cao trung
bình với độ tin cậy 0,95.
Giải
Ta tính được .
Với 0,95, ta có .
.
Vì vậy, khoảng tin cậy đối xứng của chiều cao trung bình
là
b) Trường hợp X có phân bố bất kỳ, và kích thước
mẫu lớn
Khi kích thước mẫu là , ta dùng công thức
và không âm thỏa ,
, .
Ví dụ
Do khu rừng trồng bạch đàn rộng, không có điều kiện đo
chiều cao toàn bộ cây, nên người ta đo ngẫu nhiên 35 cây
và thu được kết quả sau
chiều
cao (m)
6,5-7,0 7,0-7,5 7,5-8 8-8,5 8,5-9 9-9,5
số cây 2 4 10 11 5 3
Với xác suất 0,95 ta có thể nói chiều cao trung bình của
cây bạch đàn thuộc khu rừng trên nằm trong khoảng nào.
Giải
Ta tính được .
Với 0,95, ta có .
,
.
Vì vậy, khoảng tin cậy đối xứng của khối lượng trung
bình là
II – Tìm khoảng tin cậy cho phương sai
Giả sử X , nhưng chưa biết .
Nếu đã biết, ta dùng công thức
trong đó n = kích thước mẫu, ,
và không âm thỏa ,
tra từ Bảng giá trị hàm Khi bình phương.
Đặc biệt:
Nếu chọn , thì ta có khoảng tin
cậy đối xứng là
.
Nếu chọn , thì ta có khoảng tin cậy bên
phải là
.
Nếu chọn , thì ta có khoảng tin cậy bên
trái là
.
Ví dụ
Mức hao phí nguyên liệu ở một cơ sở sản xuất là bnn có
phân phối chuẩn với trung bình là 20g. Để ước lượng sự
phân tán của mức hao phí này, người ta cân ngẫu nhiên
25 sản phẩm và thu được kết quả sau
Hao phí nguyên liệu (g) 19,5 20,0 20,5
Số sản phẩm tương ứng 5 18 2
Với độ tin cậy 0,90, hãy ước lượng mức độ phân tán này.
Giải
Ta tính được .
Với 0,90, ta có .
, .
Vì vậy, ước lượng của mức độ phân tán là
Nếu chưa biết, ta dùng công thức
trong đó n = kích thước mẫu, và không âm thỏa
.
Đặc biệt:
Nếu chọn , thì ta có khoảng tin
cậy đối xứng là
.
Nếu chọn , thì ta có khoảng tin cậy bên
phải là
.
Nếu chọn , thì ta có khoảng tin cậy bên
trái là
.
Ví dụ
Mức hao phí nguyên liệu ở một cơ sở sản xuất là bnn có
phân phối chuẩn. Để ước lượng sự phân tán của mức hao
phí này, người ta cân ngẫu nhiên 25 sản phẩm và thu
được kết quả sau
Hao phí nguyên liệu (g) 19,5 20,0 20,5
Số sản phẩm tương ứng 5 18 2
Với độ tin cậy 0,90, hãy ước lượng mức độ phân tán này.
Giải
Ta tính được .
Với 0,90, ta có .
, .
Vì vậy, ước lượng của mức độ phân tán là
III – Tìm khoảng tin cậy cho xác suất
Cho mẫu định tính kích thước n, trong đó biến cố A xuất
hiện m lần. là tỉ lệ mẫu, p = P(A), q = 1 - p.
không âm thỏa .
, .
Với điều kiện ta có
Đặc biệt:
Nếu chọn , thì ta có khoảng tin
cậy đối xứng là
.
Nếu chọn , thì ta có khoảng tin cậy bên
phải là
.
Nếu chọn , thì ta có khoảng tin cậy bên
trái là
.
Ví dụ
Để ước lượng số cá trong hồ, người ta vớt lên 2000 con để
đánh dấu rồi lại thả xuống hồ. Sau một thời gian, người ta bắt
lên 400 con và thấy trong số đó có 80 con đã đánh dấu. Hãy
ước lượng số cá có trong hồ, với độ tin cậy 95%.
Giải
Gọi p là xác suất bắt được một con cá đã đánh dấu.
Kích thước mẫu n = 400. Tần suất bắt được con cá có dấu là
. Ta có .
Với 0,95, ta có .
,
.
Vì vậy, khoảng tin cậy đối xứng của p là
Mặt khác, với N = số cá trong hồ, nên
với độ tin cậy 95%.
Ví dụ
Kiểm tra ngẫu nhiên 400 sản phẩm do một máy sản xuất, thấy
có 20 phế phẩm. Với độ tin cậy 0,95, hãy ước lượng tỉ lệ phế
phẩm tối đa của máy đó.
Giải
Gọi p là tỉ lệ phế phẩm.
Kích thước mẫu n = 400. Tỉ lệ mẫu là . Ta có
.
Với 0,95, ta có .
,
.
Vì vậy, khoảng tin cậy bên trái của p là , hay tỉ lệ
phế phẩm tối đa của máy là gần 6,79%.
IV – Xác định độ tin cậy và kích thước mẫu
Nếu * là ưlkc của tham số và ước lượng khoảng của có
dạng , thì gọi là độ chính xác của ước
lượng.
Ba con số: độ tin cậy , kích thước mẫu n, độ chính xác có
quan hệ chặt chẽ với nhau. Chẳng hạn: Với cho trước, nếu
n càng lớn thì càng nhỏ (tức là độ chính xác càng cao hay
sai số càng nhỏ).
Sau đây là 2 bài toán ngược của bài toán ước lượng khoảng.
Bài toán 1: Cho độ tin cậy và độ chính xác . Hãy xác định
kích thước mẫu n định lấy.
Bài toán 2: Cho kích thước mẫu n định lấy và độ chính xác .
Hãy xác định độ tin cậy .
Ví dụ
Đo đường kính của 100 chi tiết do một máy sản xuất, được
Đường kính (cm) 9,75 9,80 9,85 9,90
Số chi tiết 5 37 42 16
a) Với độ chính xác = 0,006, hãy xác định độ tin cậy của
ưlkc cho đường kính trung bình.
b) Muốn độ chính xác của ưlkc cho đường kính trung bình
là 0,003 và độ tin cậy là 95%, thì cần đo thêm bao nhiêu
chi tiết?
Giải Từ mẫu có s = 0,04. Theo công thức
với , có độ chính xác của ước lượng là .
.
a)
b) Từ
.
Vì vậy phải kiểm tra thêm 683 - 100 = 583 chi tiết nữa.
Ví dụ
Lấy ngẫu nhiên 200 sản phẩm trong một kho hàng thấy có 25
phế phẩm.
a) Nếu muốn độ chính xác của ưlkc cho tỉ lệ phế phẩm là
= 0,035, thì độ tin cậy của ước lượng là bao nhiêu?
b) Muốn độ chính xác của ưlkc cho tỉ lệ phế phẩm là 0,001
và độ tin cậy là 95%, thì cần kiểm tra thêm bao nhiêu
sản phẩm?
Giải Ta có f = 0,125. Theo công thức
với , có độ chính xác của ước lượng là .
.
a)
b) Từ
.
Vì vậy phải kiểm tra thêm 420175 - 200 = 419975 sản phẩm nữa.