3.1. CÁC PHƯƠNG PHÁP LẤY MẪU
Mục đích
• Ta không thể nghiên cứu cặn kẽ từng phần tử của tổng thể, do đó phải
nghiên cứu hạn chế trên một nhóm nhỏ rút ra từ tổng thể gọi là mẫu, từ
đó rút ra kết luận cho tổng thể.
• Một mẫu được gọi là đại diện tốt nhất cho tổng thể nếu nó là mẫu ngẫu
nhiên (random sample).
Các phương pháp lấy mẫu
• Cách chọn mẫu ngẫu nhiên đơn giản:
Chọn mẫu ngẫu nhiên có hoàn lại;
Chọn mẫu ngẫu nhiên không hoàn lại.
• Chọn mẫu phân cấp: Chia tổng thể ra thành k tổng thể bộ phận và ta thực
hiện cách lấy mẫu ngẫu nhiên đơn giản trên mỗi tổng thể thành phần
29 trang |
Chia sẻ: thanhle95 | Lượt xem: 327 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Bài giảng Lý thuyết xác suất và thống kê - Bài 5: Khái niệm phương pháp mẫu - Nguyễn Mạnh Thế, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
BÀI 5
KHÁI NIỆM PHƯƠNG PHÁP MẪU
TS N ễ M h Thế. guy n ạn
v1.0012107210
1
TÌNH HUỐNG KHỞI ĐỘNG
ì ốT nh hu ng
Điều tra mức thu nhập cá nhân trong một tháng (triệu đồng)
ở huyện Đông Anh ta có bảng số liệu mẫu sau:,
10 8 5 7 3 2Số người
1-2 2-3 3-4 4-5 5-6 6-7Thu nhập
Cần phải tính thu nhập bình quân đầu người và độ chênh
lệch thu nhập để xác định mức sống của người dân và mức
độ đồng đều về thu nhập trong vùng.
Câu hỏi gợi mở
Câu 1: Thu nhập bình quân đầu người là bao nhiêu?
Câu 2: Độ chênh lệch thu nhập là bao nhiêu?
v1.0012107210
2Câu 3: Độ chênh lệch bình quân hiệu chỉnh?
TÌNH HUỐNG KHỞI ĐỘNG
Kết luận
1. Thống kê:
n
1 2 n i
i 1
1
X G(X ,X ,..., X ) X
n
được gọi là trung bình mẫu.
2. Thống kê:
n1
được gọi là độ lệch chuẩn mẫu
2 2
i
i 1
S S (X X)
n
.
3. Thống kê:
n
2 21S ' S ' (X X)
được gọi là độ lệch chuẩn mẫu hiệu chỉnh.
i
i 1n 1
v1.0012107210
3
MỤC TIÊU
• Cơ sở lý thuyết mẫu;
• Tổng thể nghiên cứu;
• Mẫu ngẫu nhiên;
Thố kê• ng ;
• Mẫu ngẫu nhiên hai chiều;
• Quy luật phân phối xác suất
của một số thống kê.
v1.0012107210
4
1. CỞ SỞ LÝ THUYẾT MẪU
Khái niệm phương pháp mẫu:
Bài toán: Cần nghiên cứu tính chất định tính hoặc định lượng của các phần tử
ộ ậ h à đótrong m t t p ợp n o .
Ta có hai phương pháp thực hiện nghiên cứu:
Nghiên cứu toàn bộ
Chi phí lớn về kinh tế có
Nghiên cứu bộ phận
• Ta lấy ra một tập con và• ,
thể phá hủy toàn bộ tập
hợp cần nghiên cứu.
nghiên cứu toàn bộ các phần
tử trong tập con đó.
• Không thể nghiên cứu được
toàn bộ.
Vậy ta thấy nghiên cứu toàn bộ
• Đưa ra kết luận cho các phần
tử trong tập hợp nghiên cứu.
Đây là phương pháp nghiên cứu
tập hợp là không khả thi. mẫu (Sampling).
v1.0012107210
5
2. TỔNG THỂ NGHIÊN CỨU
Định nghĩa:
Tổng thể là tập hợp các phần tử cần nghiên cứu tính chất định tính hoặc định
lượng số phần tử trong tổng thể gọi là cỡ của tổng thể ký hiệu là N, , .
b) Biến định tínha) Biến định lượng
Mã hoá: Gán tính chất định tính
của biến ứng với các số nguyên.
Mã hóa: Lấy giá trị của biến định
lượng làm mã của biến.
Vậy khi nghiên cứu tổng thể ta luôn có thể giả sử là các các phần tử có dấu
hiệu định lượng.
v1.0012107210
6
Mô tả tổng thể
2. TỔNG THỂ NGHIÊN CỨU (tiếp theo)
Cho tổng thể với các phần tử { }. Với là số lần giá trị xi
xuất hiện trong tổng thể, ta có:
iN
1 2 kN N ... N N
1 2 nx , x ,..., x
Đặt được gọi là tần suất của xi trong tổng thể:ii i
N
f (i 1...k), f
N
xi x1 x2 xk
fi f1 f2 fk
Dễ thấy:
1 2 kf f ... f 1
Trung bình tổng thể: Phương sai tổng thể:
k k1 N k1
i i i i
i 1 i 1
m Nx f x
N
2 2 2i i i
i 1 i 1
s (x m) f x (m)
N
v1.0012107210
7
3. MẪU NGẪU NHIÊN
• Các phương pháp lấy mẫu;
• Định nghĩa mẫu ngẫu nhiên;
• Mô tả mẫu ngẫu nhiên:
Theo biều đồ tần suất;
Theo tổ chức đồ.
v1.0012107210
8
M đí h
3.1. CÁC PHƯƠNG PHÁP LẤY MẪU
ục c
• Ta không thể nghiên cứu cặn kẽ từng phần tử của tổng thể, do đó phải
nghiên cứu hạn chế trên một nhóm nhỏ rút ra từ tổng thể gọi là mẫu từ,
đó rút ra kết luận cho tổng thể.
• Một mẫu được gọi là đại diện tốt nhất cho tổng thể nếu nó là mẫu ngẫu
nhiên (random sample).
Các phương pháp lấy mẫu
• Cách chọn mẫu ngẫu nhiên đơn giản:
Chọn mẫu ngẫu nhiên có hoàn lại;
Chọn mẫu ngẫu nhiên không hoàn lại.
Chọn mẫu phân cấp: Chia tổng thể ra thành k tổng thể bộ phận và ta thực•
hiện cách lấy mẫu ngẫu nhiên đơn giản trên mỗi tổng thể thành phần.
v1.0012107210
9
ộ ẫ ẫ h ê ỡ ủ b ế ẫ h ê là ộ ậ á b ế
3.2. ĐỊNH NGHĨA MẪU NGẪU NHIÊN
M t m u ng u n i n c n c a i n ng u n i n X m t t p c c i n
ngẫu nhiên X1, X2, Xn độc lập và có cùng phân phốí với biến ngẫu
nhiên X.
Trong đó mỗi Xk là một quan sát về biến ngẫu nhiên X.
Quan sát Xk nhận giá trị xk
Khi đó bộ giá trị gọi là giá trị cụ thể của mẫu ngẫu nhiên
;
Ví dụ:
1 2 nx , x ,..., x
1 2 nX , X ,..., X
Khi gieo con xúc xắc 5 lần ta được một mẫu
ngẫu nhiên (X1, X2, X3, X4, X5) với các giá trị
ỗcủa m i lần gieo là (3, 5, 2, 3, 1).
v1.0012107210
10
iể đồ ầ ấ
3.3. MÔ TẢ MẪU NGẪU NHIÊN
B u t n su t:
xi x1 x2 xk
Với n là số lần giá trị x xuất hiện trong mẫu
ni n1 n2 nk
i i .
Ta có
ẫ
ni
1 2 kn n ... n n
Đặt gọi là tần suất của xi trong m u.
Ta có bảng biểu diễn tần suất mẫu:
f , fi in
xi x1 x2 xk
fi f1 f2 fk
trong đó: 1 2 k
1 2 k
n n ... n
f f ... f 1
n
v1.0012107210
11
ổ hứ đồ
3.3. MÔ TẢ MẪU NGẪU NHIÊN (tiếp theo)
T c c :
khoảng a0- a1 a1- a2 ak-1- ak
ni là số giá trị mẫu rơi vào khoảng (ai-1, ai]
ni n1 n2 nk
1 2 kn n ... n n
Mỗi khối chữ nhật có:
• Chiều cao:
• Độ dài:
i
i
i
n
y
n.h
i i i 1h a a
v1.0012107210
12
PROPERTIES
Allow user to leave interaction: Anytime
Show ‘Next Slide’ Button: Don't show
Completion Button Label: Next Slide
á h í h á iá ị hố kê đặ ẫ h ẫ h
4. THỐNG KÊ
C c t n c c g tr t ng c trưng m u c o m u t u gọn
Nếu mẫu cho dưới dạng khoảng ta chọn mỗi khoảng điểm đại diện
lúc đó ta có mẫu thu gọn.i 1 ii
a a
x , i 1,2,...,k
2
Lập một bảng tính như sau:
Khoảng x n 2 A
x
n
giá trị
mẫu
i i i in .x
a a x n n x n x 2
i in .x
2 2Bs (x)
n
0 – 1
a1 – a2
1
x2
1
n2
1 1
n2x2
1 1
n2x22
'2 2ns s
n 1
.
ai-1 – ai
.
a a
.
xi
.
x
.
ni
.
n
.
nixi
.
n x
.
nixi2
.
n x 2
v1.0012107210
15
k-1 – k k k k k k k
n A B
4. THỐNG KÊ (tiếp theo)
Ví dụ:
Điều tra mức thu nhập cá nhân trong một tháng (triệu đồng), ta có bảng số
l ệ ẫi u m u sau:
Thu nhập 1-2 2-3 3-4 4-5 5-6 6-7
Số người 10 8 5 7 3 2
Tính các giá trị đặc trưng mẫu.
2 2x s s ' s s ', , , ,
v1.0012107210
16
4. THỐNG KÊ (tiếp theo)
Bài giải:
lậ bả í hTa p ng t n sau
Khoảng
thu
ix in 2i in .x i in .x
nhập
1-2
2-3
1,5
2 5
10
8
15
20
22,5
50
3-4
4-5
5-6
,
3,5
4,5
5,5
5
7
3
17,5
31,5
16,5
61,25
141,75
90,75
6-7 6,5 2 13 84,5
n =35 113,5 450,75
x 113.5 /35 3,243
2 20 /3 (3 2 3) 2 363s 45 ,75 5 , 4 ,
s 2,363 1,573
35
s ' 2,43 1,559
v1.0012107210
17
2 2ns ' s 2,363 2,43
n 1 34
Khái niệm:
5. MẪU NGẪU NHIÊN HAI CHIỀU
Một mẫu ngẫu nhiên cỡ n của véc tơ ngẫu nhiên (X, Y) là
một tập các véc tơ ngẫu nhiên (X1, Y1), (X2, Y2) (Xn, Yn)
độc lập và có cùng phân phốí với biến ngẫu nhiên (X, Y).
Trong đó mỗi véc tơ (Xi, Yi) là một quan sát thứ i về véc tơ
ngẫu nhiên (X Y), .
Ký hiệu (xi, yi) là giá trị của mẫu (Xi, Yi) ( i = 1, 2,.., n)
Bộ giá trị {(x1, y1), (x2, y2) (xn, yn)} gọi là giá trị cụ thể của
(X1, Y1), (X2, Y2) (Xn, Yn).
Ví dụ:
Lấy mẫu điều tra thu nhập và tiêu
dùng (triệu đồng/tháng) của 10 hộ
i đì h t th đượ iá t ị ẫg a n a u c g r m u:
(2; 1.4), (2, 1.5), (3; 1.8), (4; 1.8),
(2; 1.5), (4; 3.5), (7; 5.5), (3; 1.4),
v1.0012107210
18
(4; 3.5), (5; 3.7).
Dạng 1: Lập một bảng hai dòng như sau:
5.1. PHƯƠNG PHÁP MÔ TẢ MẪU
xi x1 x2 xn
y y y y
Dạng 2: Ta thu gọn mẫu và biểu diễn dưới dạng bảng chữ nhật như sau:
i 1 2 n
yi
xi
y1 y2 yj yh ai
x1 n11 n12 ... n1j ... n1h a1
x2 n21 n22 ... n2j ... n2h a2
n
n
...
n
...
n
axi
i1
i2
ij
...
ih
...
i
....
xk nk1 nk2 ... nkj ... nkh ak
Ta có:
à
k hh k
bj b1 b2 bj bh n
v1.0012107210
19
v
ij
i 1 j 1
n n
i ij
j 1
a n
j ij
i 1
b n
5.2. THỐNG KÊ ĐẶC TRƯNG MẪU HAI CHIỀU
Trung bình mẫu:
• Véc tơ ngẫu nhiên hai chiều gọi(X Y)
là trung bình mẫu của véc tơ ngẫu
nhiên (X Y) trong đó và là các
,
X Y, ,
trung bình mẫu của biến ngẫu nhiên
thà h hầ X à Yn p n v .
• Giá trị thống kê mẫu của mẫu ngẫu
nhiên hai chiều là .(x, y)
v1.0012107210
20
ệ ố ẫ
5.2. THỐNG KÊ ĐẶC TRƯNG MẪU HAI CHIỀU (tiếp theo)
H s tương quan m u
Định nghĩa. Hệ số tương quan mẫu của mẫu ngẫu nhiên
hai chiều ký hiệu là R được xác định bởi:
trong đó thống kêXY (X)(Y)R
S S
n
k k
1
XY X Y
Giá trị của hệ số tương quan mẫu đối với mẫu cụ thể:
X Y k 1n
là r
xy (x)(y)
1 1 2 2 n n{(x , y ),(x , y ),...,(x , y )}
n k h1 1
xy x y n x y
X Y
r
s s
n1 n 2 21 ( )
l l ij i j
l 1 i 1 j 1n n
l
l 1
x x
n
n1
X l
l 1
s x x
n
n1
v1.0012107210
21
l
l 1
y y
n
2 2Y l
l 1
s y (y)
n
6. QUY LUẬT PHÂN PHỐI XÁC SUẤT CỦA MỘT SỐ THỐNG KÊ
Định nghĩa
Phân phối xác suất của một thống kê được
à â ố ẫgọi l ph n ph i m u.
Ví dụ:
Phân phối xác suất của được gọi là phân
phối mẫu của thống kê trung bình mẫu.
X
v1.0012107210
23
6.1. BIẾN NGẪU NHIÊN GỐC CÓ PHÂN PHỐI 0-1
Cho X~A(p)
Xét mẫu ngẫu nhiên rút ra từ X.1 2 n(X ,X ,..., X )
Định lý 1: Thống kê có quy luật phân phối N(0,1)
khi đủ lớ
X p
U n
p(p 1)
n n.
Chú ý: Thống kê U cũng có thể viết lại dưới dạng f pU n
p(p 1)
trong đó , với k là số lần mẫu nhận giá trị 1.kf
n
v1.0012107210
24
6.2. HAI BIẾN NGẪU NHIÊN GỐC CÓ PHÂN PHỐI 0-1
Cho X~A(p1) và Y~A(p2)
Xét hai mẫu ngẫu nhiên và1 2 n(X ,X ,..., X ) 1 2 m(Y , Y ,..., Y )
rút ra từ X và Y.
Định lý 2: Thống kê có quy luật phân phối N(0 1)1 2X Y (p p )U
,
1 1 2 2p (1 p ) p (1 p )
n m
Chú ý: và có thể được thay bằng và
trong đó 1 2k kf ; f
X Y 1f 2f
với k1 là số lần mẫu ngẫu nhiên của X nhận giá trị 1,
1 2 , n m
k2 là số lần mẫu ngẫu nhiên của Y nhận giá trị 1.
v1.0012107210
25
6.3. BIẾN NGẪU NHIÊN GỐC CÓ PHÂN PHỐI CHUẨN
Cho mẫu ngẫu nhiên (X1, X2, Xn) được rút ra từ biến ngẫu nhiên
X có quy luật phân phối chuẩn . 2N ,
Định lý 3: Thống kê trung bình mẫu có phân phối chuẩnX 2X XN ,
X
2 2 2 22
...
n
...
X
U n ~ N(0,1)
Định lý 4:
2X nn
• Thống kê có quy luật phân bố student với n-1 bậc tự do.
'
X
T n
S
'2(n 1)S• Thống kê có quy luật phân phối khi bình phương với n-1 bậc
tự do.
2
2X
v1.0012107210
26
Ch h i biế ẫ hiê độ lậ X à Y
6.4. HAI BIẾN NGẪU NHIÊN GỐC CÓ PHÂN PHỐI CHUẨN
o a n ng u n n c p v
Xét mẫu ngẫu nhiên rút ra từ X
2
1 1X ~ N( , ), 22 2Y ~ N( , )
(X X X )
và mẫu ngẫu nhiên rút ra từ Y.
1 2 n, ,...,
1 2 m(Y , Y ,..., Y )
Định lý 5: Thống kê 1 2
2 2
1 2
X Y ( )
U
n m
có quy lụât phân phối chuẩn N(0,1).
Định lý 6: Thống kê 1 2
2 2
X Y
X Y ( ) nm(n m 2)
T
n mnS mS
có quy luật phân phối student với n + m – 2 bậc tự do.
Các thống kê U và T sẽ được sử dụng trong phần ước
lượ à kiể đị h tiế th
v1.0012107210
27
ng v m n p eo.
TÓM TẮT CUỐI BÀI
Nội dung chính
1. Khái niệm mẫu ngẫu nhiên và tổng thể nghiên cứu.
ẫ2. Các phương pháp lấy m u.
3 Thống kê và các thống kê đặc trưng của mẫu. .
4 Quy luật phân phối xác suất của một số thống kê. .
v1.0012107210
28
PROPERTIES
Allow user to leave interaction: Anytime
Show ‘Next Slide’ Button: Don't show
Completion Button Label: Next Slide