2. Mẫu
2.1 Khái niệm mẫu
2.1.1 Mẫu ngẫu nhiên
Vì nhiều lý do, không thể có số liệu tổng thể,
vậy các số đặc trưng của tổng thể là không biết được.
Lấy n phần tử tổng thể (có hoàn lại) ta được n
ĐLNN X1, X2,. Xn độc lập có cùng phân phối với
ĐLNN của tổng thể. Ta gọi đây là một mẫu ngẫu
nhiên kích thước n, ký hiệu WX(X1, X2, ., Xn).
Từ n ĐLNN X1, X2, ., Xn ta thành lập các
ĐLNN đặc trưng mẫu:
15 trang |
Chia sẻ: thanhle95 | Lượt xem: 434 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Bài giảng Lý thuyết xác suất và thống kê - Chương 6: Tổng thể và mẫu, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
THỐNG KÊ TOÁN
CHƯƠNG 6
Tổng thể và mẫu
1. Tổng thể và các số đặc trưng
Một đợt thi tuyển sinh có 50.000 thí sinh tham
dự. Ta quan tâm đến điểm thi môn Toán của mỗi thí
sinh.
Trên đây là một ví dụ về tổng thể. Lượng thí
sinh gọi là kích thước tổng thể, ký hiệu N. Điểm
thi môn Toán là dấu hiệu quan tâm, ký hiệu X*.
Gọi X là giá trị của dấu hiệu X* (được đo hoặc
được lượng hoá) tại một phần tử của tổng thể được
chọn ngẫu nhiên thì X là ĐLNN. Kỳ vọng, phương
sai, độ lệch chuẩn của ĐLNN này gọi là trung bình
tổng thể (µ), phương sai tổng thể (σ2), độ lệch
chuẩn tổng thể (σ).
Nếu quy định thêm một chỉ tiêu, chẳng hạn
trong ví dụ trên chỉ tiêu đạt môn Toán là từ 5 điểm
trở lên, gọi M là số phần tử của tổng thể đạt chỉ tiêu
này thì p = M/N gọi là tỷ lệ tổng thể.
µ, σ2, σ, p là các số đặc trưng của tổng thể.
2. Mẫu
2.1 Khái niệm mẫu
2.1.1 Mẫu ngẫu nhiên
Vì nhiều lý do, không thể có số liệu tổng thể,
vậy các số đặc trưng của tổng thể là không biết được.
Lấy n phần tử tổng thể (có hoàn lại) ta được n
ĐLNN X1, X2,... Xn độc lập có cùng phân phối với
ĐLNN của tổng thể. Ta gọi đây là một mẫu ngẫu
nhiên kích thước n, ký hiệu WX(X1, X2, ..., Xn).
Từ n ĐLNN X1, X2, ..., Xn ta thành lập các
ĐLNN đặc trưng mẫu:
Trung bình mẫu ngẫu nhiên: X =
n
i
i 1
1
X
n =
∑
Phương sai mẫu ngẫu nhiên (hiệu chỉnh):
S2 = ( )
n 2
i
i 1
1
X X
n 1 =
−
− ∑
Độ lệch chuẩn mẫu ngẫu nhiên: S = 2S
Tỷ lệ mẫu ngẫu nhiên: F =
n
i
i 1
1
Y
n =
∑
Yi là ĐLNN bằng 1 nếu phần tử thứ i được chọn
vào mẫu đạt chỉ tiêu và bằng 0 nếu không đạt.
2.1.2 Mẫu cụ thể
Từ WX(X1, X2, ..., Xn), lấy số đo cụ thể của X1, X2,
..., Xn là x1, x2, ..., xn, ta được một mẫu cụ thể kích
thước n, ký hiệu WX(x1, x2, ..., xn).
Các số đặc trưng của mẫu cụ thể:
Trung bình mẫu: x =
n
i
i 1
1
x
n =
∑
Phương sai mẫu (hiệu chỉnh):
s2 = ( )
n
2
i
i 1
1
x x
n 1 =
−
− ∑
Độ lệch chuẩn mẫu: s = 2s
Tỷ lệ mẫu: f = T
n
n
nT: số ph.tử (mẫu) đạt chỉ tiêu.
2.2 Các dạng số liệu của mẫu cụ thể
Trong thực tế, số liệu của mẫu cụ thể được trình
bày dưới nhiều dạng khác nhau và ta sẽ dùng các
công thức thích hợp để tính các số đặc trưng mẫu.
2.2.1 Số liệu dạng điểm không có tần số
Số liệu là dãy gồm các giá trị xi. Công thức:
x =
n
i
i 1
1 x
n =
∑ s2 =
2n n
2
i i
i 1 i 1
1 1x x
n 1 n= =
− −
∑ ∑
Excel
n ≤ 30, x1, x2,... ,xn ghi trong miền M thì:
x =AVERAGE(M) s2 =VAR(M) s =STDEV(M)
Ghi chú
Có thể xem “điểm không tần số” là “điểm có tần
số bằng 1”.
Ví dụ
Chi phí hoạt động hàng tháng (triệu đồng) của
một doanh nghiệp trong năm 2012:
100, 106, 60, 160, 70, 170, 140, 120, 116, 120, 140, 150
Tính trung bình mẫu và phương sai mẫu.
2.2.2 Số liệu dạng điểm có tần số
Số liệu là dãy x1, x2, ...xk ứng với các tần số n1,
n2, ...nk. Ta dùng công thức:
n =
k
i
i 1
n
=
∑ x =
k
i i
i 1
1 n x
n =
∑
s2 =
2k k
2
i i i i
i 1 i 1
1 1n x n x
n 1 n= =
− −
∑ ∑
Ví dụ
Điều tra về số xe bán được trong ngày của một số đại
lý chọn ngẫu nhiên ta có bảng số liệu sau:
Số xe bán được 1 2 3 4 5 6
Số đại lý 15 12 9 5 3 1
Tính trung bình mẫu, phương sai mẫu.
n = 45 x = 107/45 ≈ 2,38 s2 ≈ 1,83
2.2.3 Số liệu dạng khoảng có tần số
Số liệu gồm k khoảng dạng [ai, bi) hoặc (ai, bi] và
tần số tương ứng n1, n2, , nk.
Thay mỗi khoảng bởi giá trị trung tâm của
khoảng là xi = i i
a b
2
+
thì có được số liệu dạng điểm
có tần số. Lúc này có thể tính các số đặc trưng mẫu
theo cách đã biết.
Ví dụ
Điều tra về thu nhập năm 2005 (triệu đồng) của
một số nhân viên ngân hàng AĐ ta có bảng:
Thu
nhập
Số
NV
Thu nhập
Số
NV
Thu
nhập
Số
NV
80–85 9 95–100 36 110–115 16
85–90 12 100–105 25 115–120 10
90–95 24 105–110 20 120–130 8
n = 60 x = 101,3125 s2 = 111,7885
1.3.4 Số liệu dạng bảng hai chiều
Khi quan tâm và đo cùng lúc hai thuộc tính của
các phần tử thuộc mẫu ta có ĐLNN hai chiều (X, Y).
Lúc này tại mỗi phần tử của một mẫu cụ thể sẽ có
hai giá trị xi và yj.
Bảng số liệu hai chiều có tần số liệt kê các giá
trị của xi, của yj và tần số nij cho biết số lần xuất
hiện của cặp (xi, yj) trong mẫu cụ thể:
X Y y1 y2 ... yh
x1 n11 n12 ... n1h
x2 n21 n22 ... n2h
... ... ... ... ...
xk nk1 nk2 ... nkh
Từ bảng này, cộng tần số theo dòng (cột) ta có
bảng phân phối thực nghiệm theo X (Y). Lấy tần số
theo cột j (dòng i) ta có bảng tần số thực nghiệm
theo X (Y) với điều kiện Y = yj (X = xi).
Từ các bảng phân phối theo thực nghiệm, ta
tính trung bình mẫu, phương sai mẫu theo công thức
số liệu dạng điểm có tần số. Các ký hiệu sau:
* Trung bình mẫu, phương sai mẫu của X: x , 2Xs .
* Trung bình mẫu, phương sai mẫu của Y: y , 2Ys .
* Trung bình mẫu, phương sai mẫu của X với
điều kiện Y=yj: j/ yx ,
j
2
X / y
s .
* Trung bình mẫu, phương sai mẫu của Y với
điều kiện X=xi: i/ xy ,
i
2
Y / x
s .
Ví dụ
Khảo sát về tỷ lệ thu nhập chi cho giáo dục (%) và
thu nhập bình quân đầu người (triệu đồng/tháng) của
400 hộ gia đình ta có bảng:
Chi Giáo dục
Thu nhập
10 20 30 40 50
1–3 10 40 20
3–7 40 60 20
7–11 20 80 40
11–17 30 30 10
Ta muốn tính: trung bình tỷ lệ thu nhập chi cho giáo
dục, thu nhập bình quân đầu người, trung bình và độ
lệch chuẩn thu nhập bình quân đầu người của những
hộ chi 30% thu nhập cho giáo dục.
Gọi X là tỷ lệ thu nhập chi cho giáo dục, Y là
thu nhập bình quân đầu người.
⇒ x = 7,45
⇒ y = 29,75
⇒ /30x = 7,79
2
X / 30s =12,76 X / 30s =3,57
Trung bình tỷ lệ thu
nhập chi cho GD là 7,45%, TN bình quân 1 người là
29,75 triệu/tháng, TN bình quân 1 người (30%) là
7,79 triệu/tháng, độ lệch chuẩn là 3,57.
ai − bi 1–3 3–7 7–11 11–17 Σ
xi 2 5 9 14
ni 70 120 140 70 400
yj 10 20 30 40 50 Σ
nj 10 100 190 90 10 400
ai − bi 1–3 3–7 7–11 11–17 Σ
xi /30 2 5 9 14
ni /30 20 60 80 30 190