Bài giảng Lý thuyết xác suất và thống kê - Bài 5: Khái niệm phương pháp mẫu - Nguyễn Mạnh Thế

3.1. CÁC PHƯƠNG PHÁP LẤY MẪU Mục đích • Ta không thể nghiên cứu cặn kẽ từng phần tử của tổng thể, do đó phải nghiên cứu hạn chế trên một nhóm nhỏ rút ra từ tổng thể gọi là mẫu, từ đó rút ra kết luận cho tổng thể. • Một mẫu được gọi là đại diện tốt nhất cho tổng thể nếu nó là mẫu ngẫu nhiên (random sample). Các phương pháp lấy mẫu • Cách chọn mẫu ngẫu nhiên đơn giản:  Chọn mẫu ngẫu nhiên có hoàn lại;  Chọn mẫu ngẫu nhiên không hoàn lại. • Chọn mẫu phân cấp: Chia tổng thể ra thành k tổng thể bộ phận và ta thực hiện cách lấy mẫu ngẫu nhiên đơn giản trên mỗi tổng thể thành phần

pdf29 trang | Chia sẻ: thanhle95 | Lượt xem: 225 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Bài giảng Lý thuyết xác suất và thống kê - Bài 5: Khái niệm phương pháp mẫu - Nguyễn Mạnh Thế, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
BÀI 5 KHÁI NIỆM PHƯƠNG PHÁP MẪU TS N ễ M h Thế. guy n ạn v1.0012107210 1 TÌNH HUỐNG KHỞI ĐỘNG ì ốT nh hu ng Điều tra mức thu nhập cá nhân trong một tháng (triệu đồng) ở huyện Đông Anh ta có bảng số liệu mẫu sau:, 10 8 5 7 3 2Số người 1-2 2-3 3-4 4-5 5-6 6-7Thu nhập Cần phải tính thu nhập bình quân đầu người và độ chênh lệch thu nhập để xác định mức sống của người dân và mức độ đồng đều về thu nhập trong vùng. Câu hỏi gợi mở Câu 1: Thu nhập bình quân đầu người là bao nhiêu? Câu 2: Độ chênh lệch thu nhập là bao nhiêu? v1.0012107210 2Câu 3: Độ chênh lệch bình quân hiệu chỉnh? TÌNH HUỐNG KHỞI ĐỘNG Kết luận 1. Thống kê: n 1 2 n i i 1 1 X G(X ,X ,..., X ) X n     được gọi là trung bình mẫu. 2. Thống kê: n1 được gọi là độ lệch chuẩn mẫu 2 2 i i 1 S S (X X) n     . 3. Thống kê: n 2 21S ' S ' (X X)   được gọi là độ lệch chuẩn mẫu hiệu chỉnh. i i 1n 1  v1.0012107210 3 MỤC TIÊU • Cơ sở lý thuyết mẫu; • Tổng thể nghiên cứu; • Mẫu ngẫu nhiên; Thố kê• ng ; • Mẫu ngẫu nhiên hai chiều; • Quy luật phân phối xác suất của một số thống kê. v1.0012107210 4 1. CỞ SỞ LÝ THUYẾT MẪU Khái niệm phương pháp mẫu: Bài toán: Cần nghiên cứu tính chất định tính hoặc định lượng của các phần tử ộ ậ h à đótrong m t t p ợp n o . Ta có hai phương pháp thực hiện nghiên cứu: Nghiên cứu toàn bộ Chi phí lớn về kinh tế có Nghiên cứu bộ phận • Ta lấy ra một tập con và• , thể phá hủy toàn bộ tập hợp cần nghiên cứu. nghiên cứu toàn bộ các phần tử trong tập con đó. • Không thể nghiên cứu được toàn bộ. Vậy ta thấy nghiên cứu toàn bộ • Đưa ra kết luận cho các phần tử trong tập hợp nghiên cứu. Đây là phương pháp nghiên cứu tập hợp là không khả thi. mẫu (Sampling). v1.0012107210 5 2. TỔNG THỂ NGHIÊN CỨU Định nghĩa: Tổng thể là tập hợp các phần tử cần nghiên cứu tính chất định tính hoặc định lượng số phần tử trong tổng thể gọi là cỡ của tổng thể ký hiệu là N, , . b) Biến định tínha) Biến định lượng Mã hoá: Gán tính chất định tính của biến ứng với các số nguyên. Mã hóa: Lấy giá trị của biến định lượng làm mã của biến. Vậy khi nghiên cứu tổng thể ta luôn có thể giả sử là các các phần tử có dấu hiệu định lượng. v1.0012107210 6 Mô tả tổng thể 2. TỔNG THỂ NGHIÊN CỨU (tiếp theo) Cho tổng thể với các phần tử { }. Với là số lần giá trị xi xuất hiện trong tổng thể, ta có: iN 1 2 kN N ... N N    1 2 nx , x ,..., x Đặt được gọi là tần suất của xi trong tổng thể:ii i N f (i 1...k), f N   xi x1 x2 xk fi f1 f2 fk Dễ thấy: 1 2 kf f ... f 1    Trung bình tổng thể: Phương sai tổng thể: k k1 N k1 i i i i i 1 i 1 m Nx f x N      2 2 2i i i i 1 i 1 s (x m) f x (m) N        v1.0012107210 7 3. MẪU NGẪU NHIÊN • Các phương pháp lấy mẫu; • Định nghĩa mẫu ngẫu nhiên; • Mô tả mẫu ngẫu nhiên:  Theo biều đồ tần suất;  Theo tổ chức đồ. v1.0012107210 8 M đí h 3.1. CÁC PHƯƠNG PHÁP LẤY MẪU ục c • Ta không thể nghiên cứu cặn kẽ từng phần tử của tổng thể, do đó phải nghiên cứu hạn chế trên một nhóm nhỏ rút ra từ tổng thể gọi là mẫu từ, đó rút ra kết luận cho tổng thể. • Một mẫu được gọi là đại diện tốt nhất cho tổng thể nếu nó là mẫu ngẫu nhiên (random sample). Các phương pháp lấy mẫu • Cách chọn mẫu ngẫu nhiên đơn giản:  Chọn mẫu ngẫu nhiên có hoàn lại;  Chọn mẫu ngẫu nhiên không hoàn lại. Chọn mẫu phân cấp: Chia tổng thể ra thành k tổng thể bộ phận và ta thực• hiện cách lấy mẫu ngẫu nhiên đơn giản trên mỗi tổng thể thành phần. v1.0012107210 9 ộ ẫ ẫ h ê ỡ ủ b ế ẫ h ê là ộ ậ á b ế 3.2. ĐỊNH NGHĨA MẪU NGẪU NHIÊN M t m u ng u n i n c n c a i n ng u n i n X m t t p c c i n ngẫu nhiên X1, X2, Xn độc lập và có cùng phân phốí với biến ngẫu nhiên X. Trong đó mỗi Xk là một quan sát về biến ngẫu nhiên X. Quan sát Xk nhận giá trị xk Khi đó bộ giá trị gọi là giá trị cụ thể của mẫu ngẫu nhiên ; Ví dụ: 1 2 nx , x ,..., x 1 2 nX , X ,..., X Khi gieo con xúc xắc 5 lần ta được một mẫu ngẫu nhiên (X1, X2, X3, X4, X5) với các giá trị ỗcủa m i lần gieo là (3, 5, 2, 3, 1). v1.0012107210 10 iể đồ ầ ấ 3.3. MÔ TẢ MẪU NGẪU NHIÊN B u t n su t: xi x1 x2 xk Với n là số lần giá trị x xuất hiện trong mẫu ni n1 n2 nk i i . Ta có ẫ ni 1 2 kn n ... n n    Đặt gọi là tần suất của xi trong m u. Ta có bảng biểu diễn tần suất mẫu: f , fi in  xi x1 x2 xk fi f1 f2 fk trong đó: 1 2 k 1 2 k n n ... n f f ... f 1 n        v1.0012107210 11 ổ hứ đồ 3.3. MÔ TẢ MẪU NGẪU NHIÊN (tiếp theo) T c c : khoảng a0- a1 a1- a2 ak-1- ak ni là số giá trị mẫu rơi vào khoảng (ai-1, ai] ni n1 n2 nk 1 2 kn n ... n n    Mỗi khối chữ nhật có: • Chiều cao: • Độ dài: i i i n y n.h  i i i 1h a a   v1.0012107210 12 PROPERTIES Allow user to leave interaction: Anytime Show ‘Next Slide’ Button: Don't show Completion Button Label: Next Slide á h í h á iá ị hố kê đặ ẫ h ẫ h 4. THỐNG KÊ C c t n c c g tr t ng c trưng m u c o m u t u gọn Nếu mẫu cho dưới dạng khoảng ta chọn mỗi khoảng điểm đại diện lúc đó ta có mẫu thu gọn.i 1 ii a a x , i 1,2,...,k 2    Lập một bảng tính như sau: Khoảng x n 2 A x n  giá trị mẫu i i i in .x a a x n n x n x 2 i in .x 2 2Bs (x) n   0 – 1 a1 – a2 1 x2 1 n2 1 1 n2x2 1 1 n2x22 '2 2ns s n 1   . ai-1 – ai . a a . xi . x . ni . n . nixi . n x . nixi2 . n x 2 v1.0012107210 15 k-1 – k k k k k k k  n A B 4. THỐNG KÊ (tiếp theo) Ví dụ: Điều tra mức thu nhập cá nhân trong một tháng (triệu đồng), ta có bảng số l ệ ẫi u m u sau: Thu nhập 1-2 2-3 3-4 4-5 5-6 6-7 Số người 10 8 5 7 3 2 Tính các giá trị đặc trưng mẫu. 2 2x s s ' s s ', , , , v1.0012107210 16 4. THỐNG KÊ (tiếp theo) Bài giải: lậ bả í hTa p ng t n sau Khoảng thu ix in 2i in .x i in .x nhập 1-2 2-3 1,5 2 5 10 8 15 20 22,5 50 3-4 4-5 5-6 , 3,5 4,5 5,5 5 7 3 17,5 31,5 16,5 61,25 141,75 90,75 6-7 6,5 2 13 84,5  n =35 113,5 450,75 x 113.5 /35 3,243  2 20 /3 (3 2 3) 2 363s 45 ,75 5 , 4 ,   s 2,363 1,573  35 s ' 2,43 1,559  v1.0012107210 17 2 2ns ' s 2,363 2,43 n 1 34    Khái niệm: 5. MẪU NGẪU NHIÊN HAI CHIỀU Một mẫu ngẫu nhiên cỡ n của véc tơ ngẫu nhiên (X, Y) là một tập các véc tơ ngẫu nhiên (X1, Y1), (X2, Y2) (Xn, Yn) độc lập và có cùng phân phốí với biến ngẫu nhiên (X, Y). Trong đó mỗi véc tơ (Xi, Yi) là một quan sát thứ i về véc tơ ngẫu nhiên (X Y), . Ký hiệu (xi, yi) là giá trị của mẫu (Xi, Yi) ( i = 1, 2,.., n) Bộ giá trị {(x1, y1), (x2, y2) (xn, yn)} gọi là giá trị cụ thể của (X1, Y1), (X2, Y2) (Xn, Yn). Ví dụ: Lấy mẫu điều tra thu nhập và tiêu dùng (triệu đồng/tháng) của 10 hộ i đì h t th đượ iá t ị ẫg a n a u c g r m u: (2; 1.4), (2, 1.5), (3; 1.8), (4; 1.8), (2; 1.5), (4; 3.5), (7; 5.5), (3; 1.4), v1.0012107210 18 (4; 3.5), (5; 3.7). Dạng 1: Lập một bảng hai dòng như sau: 5.1. PHƯƠNG PHÁP MÔ TẢ MẪU xi x1 x2 xn y y y y Dạng 2: Ta thu gọn mẫu và biểu diễn dưới dạng bảng chữ nhật như sau: i 1 2 n yi xi y1 y2 yj yh ai x1 n11 n12 ... n1j ... n1h a1 x2 n21 n22 ... n2j ... n2h a2 n n ... n ... n axi i1 i2 ij ... ih ... i .... xk nk1 nk2 ... nkj ... nkh ak Ta có: à k hh k bj b1 b2 bj bh n v1.0012107210 19 v ij i 1 j 1 n n   i ij j 1 a n   j ij i 1 b n   5.2. THỐNG KÊ ĐẶC TRƯNG MẪU HAI CHIỀU Trung bình mẫu: • Véc tơ ngẫu nhiên hai chiều gọi(X Y) là trung bình mẫu của véc tơ ngẫu nhiên (X Y) trong đó và là các , X Y, , trung bình mẫu của biến ngẫu nhiên thà h hầ X à Yn p n v . • Giá trị thống kê mẫu của mẫu ngẫu nhiên hai chiều là .(x, y) v1.0012107210 20 ệ ố ẫ 5.2. THỐNG KÊ ĐẶC TRƯNG MẪU HAI CHIỀU (tiếp theo) H s tương quan m u Định nghĩa. Hệ số tương quan mẫu của mẫu ngẫu nhiên hai chiều ký hiệu là R được xác định bởi: trong đó thống kêXY (X)(Y)R S S  n k k 1 XY X Y  Giá trị của hệ số tương quan mẫu đối với mẫu cụ thể: X Y k 1n  là r xy (x)(y) 1 1 2 2 n n{(x , y ),(x , y ),...,(x , y )} n k h1 1 xy x y n x y  X Y r s s  n1 n 2 21 ( ) l l ij i j l 1 i 1 j 1n n     l l 1 x x n   n1 X l l 1 s x x n    n1 v1.0012107210 21 l l 1 y y n    2 2Y l l 1 s y (y) n    6. QUY LUẬT PHÂN PHỐI XÁC SUẤT CỦA MỘT SỐ THỐNG KÊ Định nghĩa Phân phối xác suất của một thống kê được à â ố ẫgọi l ph n ph i m u. Ví dụ: Phân phối xác suất của được gọi là phân phối mẫu của thống kê trung bình mẫu. X v1.0012107210 23 6.1. BIẾN NGẪU NHIÊN GỐC CÓ PHÂN PHỐI 0-1 Cho X~A(p) Xét mẫu ngẫu nhiên rút ra từ X.1 2 n(X ,X ,..., X ) Định lý 1: Thống kê có quy luật phân phối N(0,1) khi đủ lớ X p U n p(p 1)  n n. Chú ý: Thống kê U cũng có thể viết lại dưới dạng f pU n p(p 1)   trong đó , với k là số lần mẫu nhận giá trị 1.kf n  v1.0012107210 24 6.2. HAI BIẾN NGẪU NHIÊN GỐC CÓ PHÂN PHỐI 0-1 Cho X~A(p1) và Y~A(p2) Xét hai mẫu ngẫu nhiên và1 2 n(X ,X ,..., X ) 1 2 m(Y , Y ,..., Y ) rút ra từ X và Y. Định lý 2: Thống kê có quy luật phân phối N(0 1)1 2X Y (p p )U    , 1 1 2 2p (1 p ) p (1 p ) n m    Chú ý: và có thể được thay bằng và trong đó 1 2k kf ; f X Y 1f 2f với k1 là số lần mẫu ngẫu nhiên của X nhận giá trị 1, 1 2 , n m   k2 là số lần mẫu ngẫu nhiên của Y nhận giá trị 1. v1.0012107210 25 6.3. BIẾN NGẪU NHIÊN GỐC CÓ PHÂN PHỐI CHUẨN Cho mẫu ngẫu nhiên (X1, X2, Xn) được rút ra từ biến ngẫu nhiên X có quy luật phân phối chuẩn . 2N ,  Định lý 3: Thống kê trung bình mẫu có phân phối chuẩnX  2X XN ,     X 2 2 2 22 ... n ...              X U n ~ N(0,1)     Định lý 4: 2X nn    • Thống kê có quy luật phân bố student với n-1 bậc tự do. ' X T n S   '2(n 1)S• Thống kê có quy luật phân phối khi bình phương với n-1 bậc tự do. 2 2X   v1.0012107210 26 Ch h i biế ẫ hiê độ lậ X à Y 6.4. HAI BIẾN NGẪU NHIÊN GỐC CÓ PHÂN PHỐI CHUẨN o a n ng u n n c p v Xét mẫu ngẫu nhiên rút ra từ X 2 1 1X ~ N( , ),  22 2Y ~ N( , )  (X X X ) và mẫu ngẫu nhiên rút ra từ Y. 1 2 n, ,..., 1 2 m(Y , Y ,..., Y ) Định lý 5: Thống kê 1 2 2 2 1 2 X Y ( ) U n m        có quy lụât phân phối chuẩn N(0,1). Định lý 6: Thống kê 1 2 2 2 X Y X Y ( ) nm(n m 2) T n mnS mS         có quy luật phân phối student với n + m – 2 bậc tự do. Các thống kê U và T sẽ được sử dụng trong phần ước lượ à kiể đị h tiế th v1.0012107210 27 ng v m n p eo. TÓM TẮT CUỐI BÀI Nội dung chính 1. Khái niệm mẫu ngẫu nhiên và tổng thể nghiên cứu. ẫ2. Các phương pháp lấy m u. 3 Thống kê và các thống kê đặc trưng của mẫu. . 4 Quy luật phân phối xác suất của một số thống kê. . v1.0012107210 28 PROPERTIES Allow user to leave interaction: Anytime Show ‘Next Slide’ Button: Don't show Completion Button Label: Next Slide