Bài giảng Lý thuyết xác suất và thống kê - Chương 6: Tổng thể và mẫu

2. Mẫu 2.1 Khái niệm mẫu 2.1.1 Mẫu ngẫu nhiên Vì nhiều lý do, không thể có số liệu tổng thể, vậy các số đặc trưng của tổng thể là không biết được. Lấy n phần tử tổng thể (có hoàn lại) ta được n ĐLNN X1, X2,. Xn độc lập có cùng phân phối với ĐLNN của tổng thể. Ta gọi đây là một mẫu ngẫu nhiên kích thước n, ký hiệu WX(X1, X2, ., Xn). Từ n ĐLNN X1, X2, ., Xn ta thành lập các ĐLNN đặc trưng mẫu:

pdf15 trang | Chia sẻ: thanhle95 | Lượt xem: 434 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Bài giảng Lý thuyết xác suất và thống kê - Chương 6: Tổng thể và mẫu, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
THỐNG KÊ TOÁN CHƯƠNG 6 Tổng thể và mẫu 1. Tổng thể và các số đặc trưng Một đợt thi tuyển sinh có 50.000 thí sinh tham dự. Ta quan tâm đến điểm thi môn Toán của mỗi thí sinh. Trên đây là một ví dụ về tổng thể. Lượng thí sinh gọi là kích thước tổng thể, ký hiệu N. Điểm thi môn Toán là dấu hiệu quan tâm, ký hiệu X*. Gọi X là giá trị của dấu hiệu X* (được đo hoặc được lượng hoá) tại một phần tử của tổng thể được chọn ngẫu nhiên thì X là ĐLNN. Kỳ vọng, phương sai, độ lệch chuẩn của ĐLNN này gọi là trung bình tổng thể (µ), phương sai tổng thể (σ2), độ lệch chuẩn tổng thể (σ). Nếu quy định thêm một chỉ tiêu, chẳng hạn trong ví dụ trên chỉ tiêu đạt môn Toán là từ 5 điểm trở lên, gọi M là số phần tử của tổng thể đạt chỉ tiêu này thì p = M/N gọi là tỷ lệ tổng thể. µ, σ2, σ, p là các số đặc trưng của tổng thể. 2. Mẫu 2.1 Khái niệm mẫu 2.1.1 Mẫu ngẫu nhiên Vì nhiều lý do, không thể có số liệu tổng thể, vậy các số đặc trưng của tổng thể là không biết được. Lấy n phần tử tổng thể (có hoàn lại) ta được n ĐLNN X1, X2,... Xn độc lập có cùng phân phối với ĐLNN của tổng thể. Ta gọi đây là một mẫu ngẫu nhiên kích thước n, ký hiệu WX(X1, X2, ..., Xn). Từ n ĐLNN X1, X2, ..., Xn ta thành lập các ĐLNN đặc trưng mẫu: Trung bình mẫu ngẫu nhiên: X = n i i 1 1 X n = ∑ Phương sai mẫu ngẫu nhiên (hiệu chỉnh): S2 = ( ) n 2 i i 1 1 X X n 1 = − − ∑ Độ lệch chuẩn mẫu ngẫu nhiên: S = 2S Tỷ lệ mẫu ngẫu nhiên: F = n i i 1 1 Y n = ∑ Yi là ĐLNN bằng 1 nếu phần tử thứ i được chọn vào mẫu đạt chỉ tiêu và bằng 0 nếu không đạt. 2.1.2 Mẫu cụ thể Từ WX(X1, X2, ..., Xn), lấy số đo cụ thể của X1, X2, ..., Xn là x1, x2, ..., xn, ta được một mẫu cụ thể kích thước n, ký hiệu WX(x1, x2, ..., xn). Các số đặc trưng của mẫu cụ thể: Trung bình mẫu: x = n i i 1 1 x n = ∑ Phương sai mẫu (hiệu chỉnh): s2 = ( ) n 2 i i 1 1 x x n 1 = − − ∑ Độ lệch chuẩn mẫu: s = 2s Tỷ lệ mẫu: f = T n n nT: số ph.tử (mẫu) đạt chỉ tiêu. 2.2 Các dạng số liệu của mẫu cụ thể Trong thực tế, số liệu của mẫu cụ thể được trình bày dưới nhiều dạng khác nhau và ta sẽ dùng các công thức thích hợp để tính các số đặc trưng mẫu. 2.2.1 Số liệu dạng điểm không có tần số Số liệu là dãy gồm các giá trị xi. Công thức: x = n i i 1 1 x n = ∑ s2 = 2n n 2 i i i 1 i 1 1 1x x n 1 n= =    −    −    ∑ ∑ Excel n ≤ 30, x1, x2,... ,xn ghi trong miền M thì: x =AVERAGE(M) s2 =VAR(M) s =STDEV(M) Ghi chú Có thể xem “điểm không tần số” là “điểm có tần số bằng 1”. Ví dụ Chi phí hoạt động hàng tháng (triệu đồng) của một doanh nghiệp trong năm 2012: 100, 106, 60, 160, 70, 170, 140, 120, 116, 120, 140, 150 Tính trung bình mẫu và phương sai mẫu. 2.2.2 Số liệu dạng điểm có tần số Số liệu là dãy x1, x2, ...xk ứng với các tần số n1, n2, ...nk. Ta dùng công thức: n = k i i 1 n = ∑ x = k i i i 1 1 n x n = ∑ s2 = 2k k 2 i i i i i 1 i 1 1 1n x n x n 1 n= =    −    −    ∑ ∑ Ví dụ Điều tra về số xe bán được trong ngày của một số đại lý chọn ngẫu nhiên ta có bảng số liệu sau: Số xe bán được 1 2 3 4 5 6 Số đại lý 15 12 9 5 3 1 Tính trung bình mẫu, phương sai mẫu. n = 45 x = 107/45 ≈ 2,38 s2 ≈ 1,83 2.2.3 Số liệu dạng khoảng có tần số Số liệu gồm k khoảng dạng [ai, bi) hoặc (ai, bi] và tần số tương ứng n1, n2, , nk. Thay mỗi khoảng bởi giá trị trung tâm của khoảng là xi = i i a b 2 + thì có được số liệu dạng điểm có tần số. Lúc này có thể tính các số đặc trưng mẫu theo cách đã biết. Ví dụ Điều tra về thu nhập năm 2005 (triệu đồng) của một số nhân viên ngân hàng AĐ ta có bảng: Thu nhập Số NV Thu nhập Số NV Thu nhập Số NV 80–85 9 95–100 36 110–115 16 85–90 12 100–105 25 115–120 10 90–95 24 105–110 20 120–130 8 n = 60 x = 101,3125 s2 = 111,7885 1.3.4 Số liệu dạng bảng hai chiều Khi quan tâm và đo cùng lúc hai thuộc tính của các phần tử thuộc mẫu ta có ĐLNN hai chiều (X, Y). Lúc này tại mỗi phần tử của một mẫu cụ thể sẽ có hai giá trị xi và yj. Bảng số liệu hai chiều có tần số liệt kê các giá trị của xi, của yj và tần số nij cho biết số lần xuất hiện của cặp (xi, yj) trong mẫu cụ thể: X Y y1 y2 ... yh x1 n11 n12 ... n1h x2 n21 n22 ... n2h ... ... ... ... ... xk nk1 nk2 ... nkh Từ bảng này, cộng tần số theo dòng (cột) ta có bảng phân phối thực nghiệm theo X (Y). Lấy tần số theo cột j (dòng i) ta có bảng tần số thực nghiệm theo X (Y) với điều kiện Y = yj (X = xi). Từ các bảng phân phối theo thực nghiệm, ta tính trung bình mẫu, phương sai mẫu theo công thức số liệu dạng điểm có tần số. Các ký hiệu sau: * Trung bình mẫu, phương sai mẫu của X: x , 2Xs . * Trung bình mẫu, phương sai mẫu của Y: y , 2Ys . * Trung bình mẫu, phương sai mẫu của X với điều kiện Y=yj: j/ yx , j 2 X / y s . * Trung bình mẫu, phương sai mẫu của Y với điều kiện X=xi: i/ xy , i 2 Y / x s . Ví dụ Khảo sát về tỷ lệ thu nhập chi cho giáo dục (%) và thu nhập bình quân đầu người (triệu đồng/tháng) của 400 hộ gia đình ta có bảng: Chi Giáo dục Thu nhập 10 20 30 40 50 1–3 10 40 20 3–7 40 60 20 7–11 20 80 40 11–17 30 30 10 Ta muốn tính: trung bình tỷ lệ thu nhập chi cho giáo dục, thu nhập bình quân đầu người, trung bình và độ lệch chuẩn thu nhập bình quân đầu người của những hộ chi 30% thu nhập cho giáo dục. Gọi X là tỷ lệ thu nhập chi cho giáo dục, Y là thu nhập bình quân đầu người. ⇒ x = 7,45 ⇒ y = 29,75 ⇒ /30x = 7,79 2 X / 30s =12,76 X / 30s =3,57 Trung bình tỷ lệ thu nhập chi cho GD là 7,45%, TN bình quân 1 người là 29,75 triệu/tháng, TN bình quân 1 người (30%) là 7,79 triệu/tháng, độ lệch chuẩn là 3,57. ai − bi 1–3 3–7 7–11 11–17 Σ xi 2 5 9 14 ni 70 120 140 70 400 yj 10 20 30 40 50 Σ nj 10 100 190 90 10 400 ai − bi 1–3 3–7 7–11 11–17 Σ xi /30 2 5 9 14 ni /30 20 60 80 30 190