Bài giảng Xác suất thống kê - Chương 4: Lý thuyết mẫu

- Tổng thể là tập hợp tất cả các phần tử về một đốitượng nào đó mà chúng tađang khảo sát hoặc nghiên cứu. Số phần tử củaTTthường ký hiệu là: N. -Tập hợp gồm n phần tử lấy ra từ tổng thể gọi là mẫu. Sốn: cỡ mẫu.

pdf5 trang | Chia sẻ: lylyngoc | Lượt xem: 1775 | Lượt tải: 1download
Bạn đang xem nội dung tài liệu Bài giảng Xác suất thống kê - Chương 4: Lý thuyết mẫu, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
1PHẦN II. THỐNG KÊ TOÁN Chương 4. Lý thuyết mẫu Chương 5. Lý thuyết ước lượng Chương 6. Kiểm định giả thuyết 1 LÝ THUYẾT MẪU Chương 4 2 NỘI DUNG CHƯƠNG 4.1 Tổng thể và mẫu ngẫu nhiên 4.2 Các đặc trưng mẫu 4.3 Một vài định lý sử dụng trong thống kê 3 ThS Lê Văn Minh 4.1 Tổng thể và mẫu ngẫu nhiên 4.1.1 Tổng thể - Tổng thể là tập hợp tất cả các phần tử về một đối tượng nào đó mà chúng ta đang khảo sát hoặc nghiên cứu. Số phần tử của TT thường ký hiệu là: N. - Tập hợp gồm n phần tử lấy ra từ tổng thể gọi là mẫu. Số n: cỡ mẫu. 4 24.1 Tổng thể và mẫu ngẫu nhiên Để mẫu đại diện tốt cho tổng thể thì: - Mẫu phải được chọn một cách ngẫu nhiên. - Các phần tử của mẫu cũng được chọn một cách độc lập. Có hai cách chọn mẫu: - Chọn có hoàn lại - Chọn không hoàn lại ( n << N). 5 4.1 Tổng thể và mẫu ngẫu nhiên 4.1.2 Mẫu ngẫu nhiên Cho tnnn  và một bnn X liên quan đến . Lặp lại tn , n lần độc lập ta được X1,..,Xn trong đó các Xi,(i=1,..,n) độc lập và có cùng ppxs với X. Người ta gọi vector nn WX=(X1,..,Xn) là mẫu nn lấy từ X. - Mẫu nn còn gọi là mẫu tổng quát hay mẫu lý thuyết. - Khi có số liệu cụ thể thì Wx=(x1,..,xn) gọi là mẫu cụ thể hay mẫu thực nghiệm. 6 4.1 Tổng thể và mẫu ngẫu nhiên 4.1.3 Quyết định thống kê Cho bnn X có hàm ppxs F(x) chưa biết và một mẫu nn từ X là WX=(X1,..,Xn). Bài toán dựa vào mẫu ngẫu nhiên để kết luận về luật pp F(x) gọi là quyết định thống kê. Có 3 quyết định TK thường gặp: - Ước lượng điểm - Ước lượng khoảng - Kiểm định giả thuyết. 7 ThS Lê Văn Minh 4.1 Tổng thể và mẫu ngẫu nhiên 4.1.4 Dãy thống kê đơn giản trong đó: n là cỡ mẫu. 8 34.2 Các đặc trưng mẫu 4.2.1 Trung bình mẫu. Phương sai mẫu Định nghĩa: Cho bnn X và mẫu ngẫu nhiên từ X là WX=(X1,..,Xn). Người ta gọi trung bình mẫu là bnn có dạng: Người ta gọi phương sai mẫu là bnn có dạng: Phương sai mẫu cải biên (hiệu chỉnh): 1 1 (4.2.1) n i i X X n    2 2 2 2 1 1 1 1( ) ( ) (4.2.2) n n i i i i s X X X X n n       2 2 2 1 1ˆ ( ) (4.2.3) 1 1 n i i ns X X s n n     9 4.2 Các đặc trưng mẫu 4.2.2 Trường hợp mẫu có tần số (mẫu lặp) Cho mẫu ngẫu nhiên và giả sử mẫu có tần số dạng: trong đó: ni là tần số giá trị xi trong mẫu và (cỡ mẫu) Khi đó: + Trung bình mẫu: 1( ,..., )x kW x x 1 2 kn n n n    1 1 (4.2.1) k i i i X n x n    10 4.2 Các đặc trưng mẫu 4.2.2 Trường hợp mẫu có tần số (mẫu lặp) + Phương sai mẫu: + Phương sai mẫu cải biên: Ví dụ 4.2.1: Điều tra năng suất lúa X (tạ/ha) trên 100 ha trồng lúa, ta có bảng số liệu: 2 2 2 2 1 1 1 1( ) ( ) (4.2.2) k k i i i i i i s n x X n x X n n       2 2 2 1 1ˆ ( ) s (4.2.3) 1 1 k i i i ns n x X n n     11 4.2 Các đặc trưng mẫu 4.2.2 Trường hợp mẫu có tần số (mẫu lặp) Khi đó các đặc trưng mẫu: + (tạ/ha) + + + (tạ/ha) 7 1 1 1 4630 46,3 100i ii X n x n      7 2 2 2 2 1 1 1( ) 215740 (46,3) 13,71 100i ii s n x X n        2 2 100ˆ 13,71 13,848 1 100 1 ns s n      2ˆ ˆ 3,848 3,271s s   12 ThS Lê Văn Minh 44.2 Các đặc trưng mẫu 4.2.3 Trường hợp mẫu chia khoảng trong đó: ni là tần số giá trị xi rơi vào khoảng [ai,ai+1) và (cỡ mẫu). Khi đó + Trung bình mẫu: trong đó: 1 2 kn n n n    1 1 (4.2.1) k i i i X n n     1= , 1, (4.2.4) 2 i i i a a i k   13 4.2 Các đặc trưng mẫu 4.2.3 Trường hợp mẫu chia khoảng + Phương sai mẫu: + Phương sai mẫu cải biên: 2 2 2 2 1 1 1 1( ) ( ) (4.2.2) k k i i i i i i s n X n X n n          2 2 2 1 1ˆ ( ) s (4.2.3) 1 1 k i i i ns n X n n       14 ThS Lê Văn Minh 4.2 Các đặc trưng mẫu 4.2.3 Trường hợp mẫu chia khoảng Ví dụ 4.2.2: Điều tra mức xăng hao phí của một loại ô tô khi đi từ A đến B người ta có bảng số liệu: Hãy tính các đặc trưng mẫu của mức xăng hao phí. Giải Số lít xăng X 18-18,5 18,5-19 19-19,5 19,5-20 20-21 Số lần đi (ni) 1 3 4 5 2 15 4.2 Các đặc trưng mẫu Từ bảng số liệu ta tính được: xi 18.0 18.5 18.5 19.0 19.0 19.5 19.5 20 20 21 ni 1.0 3.0 4.0 4.0 2 i 18.25 18.75 19.25 19.75 20.50 5 1 1 1 271,5 19,3929 ( ) 14i ii X n l n       5 2 2 2 2 1 1 1( ) 5270,75 (19,3929) 0,3976 14i ii s n X n         2 2 14ˆ 0,3976 0,4282 1 14 1 ns s n      2ˆ ˆ 0,4282 0,6544 ( )s s l   16 ThS Lê Văn Minh 54.3 Một vài định lý sử dụng trong thống kê Định lý 4.3.1: Cho . Khi đó biến ngẫu nhiên i.e., Z là bnn có phân phối chi bình phương với n-1 bậc tự do. Định lý 4.3.2: cho . Khi đó: i) Nếu n<30 thì ii) Nếu n 30 thì 17 2 1~ ( , ) và ( ,..., )X nX N W X X   2 2 2 1 ˆ ~ ( 1)nZ s n    2 1~ ( , ) và ( ,..., )X nX N W X X   ( ) ~ ( 1) ˆ n XY t n s   ( ) ~ (0,1) ˆ n XY N s  ThS Lê Văn Minh