Bài giảng Lý thuyết xác suất và thống kê toán học - Chương 5: Không gian mẫu và thống kê trên không gian mẫu - Phan Văn Tân

5.1 Không gian mẫu • Tập tổng thể: Tập hợp tất cả các thành phần có thể có – Tập toàn bộ, tập chính qui • Tập mẫu: Tập hợp các thành phần được lấy ra để thí nghiệm, kiểm tra – Số thành phần được chọn: Dung lượng mẫu – Tập hợp tất cả các mẫu có thể lấy được gọi là không gian mẫu – Mỗi mẫu lấy ra là một điểm trong không gian mẫu • Không gian mẫu ứng với không gian các sự kiện sơ cấp • Mỗi mẫu ứng với một sự kiện sơ cấp trong lý thuyết xác suất • Có hai loại mẫu: – Mẫu có lặp – Mẫu không lặp

pdf29 trang | Chia sẻ: thanhle95 | Lượt xem: 276 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Bài giảng Lý thuyết xác suất và thống kê toán học - Chương 5: Không gian mẫu và thống kê trên không gian mẫu - Phan Văn Tân, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN HỌC Phan Văn Tân Bộ mô Khí tượng CHƯƠNG 5. KHÔNG GIAN MẪU VÀ THỐNG KÊ TRÊN KHÔNG GIAN MẪU 5.1 Không gian mẫu • Mẫu là gì? – Là tập hợp hữu hạn các phần tử lấy từ tập tất cả các phần tử có thể có nào đó • Tại sao phải lấy mẫu? – Để nghiên cứu một hiện tượng, một sự kiện nào đó ta không thể xem xét tất cả các thành phần cấu thành nó, vì số thành phần là vô hạn hoặc quá nhiều – Ví dụ: • Nghiên cứu tâm lý lứa tuổi • Điều tra xã hội học về một chính sách nào đó • Đánh giá chất lượng sản phNm của nhà máy • CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ TRÊN KHÔN G GIAN MẪU 5.1 Không gian mẫu • Tập tổng thể: Tập hợp tất cả các thành phần có thể có – Tập toàn bộ, tập chính qui • Tập mẫu: Tập hợp các thành phần được lấy ra để thí nghiệm, kiểm tra – Số thành phần được chọn: Dung lượng mẫu – Tập hợp tất cả các mẫu có thể lấy được gọi là không gian mẫu – Mỗi mẫu lấy ra là một điểm trong không gian mẫu • Không gian mẫu ứng với không gian các sự kiện sơ cấp • Mỗi mẫu ứng với một sự kiện sơ cấp trong lý thuyết xác suất • Có hai loại mẫu: – Mẫu có lặp – Mẫu không lặp CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ TRÊN KHÔN G GIAN MẪU 5.1 Không gian mẫu • Giả sử tập tổng thể gồm N phần tử, tập mẫu gồm n phần tử (n<N ) – Mẫu được lấy bằng cách rút ngẫu nhiên n lần, mỗi lần một phần tử từ tập tổng thể rồi trả lại tập tổng thể sau khi đã ghi nhận kết quả ¾Đó là cách lấy mẫu có lặp: Một phần tử có thể được lấy nhiều lần – Mẫu được lấy bằng cách rút ngẫu nhiên n phần tử từ tập tổng thể, sau mỗi lần lấy ghi nhận kết quả nhưng không trả lại tập tổng thể ¾Đó là cách lấy mẫu không lặp: Mỗi phần tử chỉ có thể được chọn một lần duy nhất CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ TRÊN KHÔN G GIAN MẪU 5.1 Không gian mẫu • Đối với cách lấy mẫu lặp: – Mỗi phần tử trong số n phần tử của mẫu có N cách chọn, vì mỗi phần tử sau khi chọn được trả lại tập ban đầu – Î Có tất cả N n cách lấy mẫu khác nhau • Đối với các lấy mẫu không lặp: – Có N cách chọn phần tử thứ nhất của tập mẫu – Có (N –1) cách chọn phần tử thứ hai, vì phần tử thứ nhất không được trả lại tập ban đầu – – Có (N –n+1) cách chọn phần tử thứ n của tập mẫu – Î Có tất cả N (N –1)(N –n+1)=AN n cách lấy mẫu CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ TRÊN KHÔN G GIAN MẪU 5.1 Không gian mẫu • N hận thấy: Khi n << N thì Î hai cách lấy mẫu tương đương nhau • Để có kết luận tương đối chính xác về tập tổng thể thì tập mẫu n phải tiêu biểu • Mẫu được coi là tiêu biểu nếu nó được lấy một cách ngẫu nhiên, tức mọi phần tử của tập tổng thể phải có xác suất được chọn như nhau • N ếu mẫu được lấy để nghiên cứu đại lượng ngẫu nhiên X thì tập mẫu (X1, X2,, Xn) được coi là mẫu của X • Mỗi Xi, i=1,2,..,n, đều được chọn từ tập giá trị của X nên các Xi là những đại lượng ngẫu nhiên có cùng phân bố với X 1~n n N N A CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ TRÊN KHÔN G GIAN MẪU 5.1 Không gian mẫu • Ví dụ: Giả sử X={1,2,3,4,5,6,7,8,9} Î N =9 • N ếu n=3, với cách lấy mẫu có lặp ta có thể có các mẫu: – (X1, X2, X3) = (1,4,6) – (X1, X2, X3) = (2,3,8) – (X1, X2, X3) = (9,1,7) – (X1, X2, X3) = (4,2,1) – • Î Xi={1,2,3,4,5,6,7,8,9} X1 X2 X3 CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ TRÊN KHÔN G GIAN MẪU 5.2 Phân bố mẫu và phân bố chính xác • Giả sử có mẫu (X1, X2,, Xn) của đại lượng ngẫu nhiên X có phân bố F(x) (F(x) được gọi là phân bố chính xác của X) • Vì F(x) chưa biết nên cần tìm F(x) trên cơ sở tập mẫu lấy được • Từ tập mẫu (X1, X2,, Xn) ta lập hàm Fn(x): ⎪⎩ ⎪⎨ ⎧ <= = xn n nxF x x n in21 X m·n tháa XX(X cña tö phÇn Sè ),...,, )( • Fn(x) được gọi là phân bố mẫu của X • Ứng với mỗi đối số x giá trị hàm Fn(x) là tần suất của sự kiện X<x • N ói cách khác, Fn(x) là ước lượng của xác suất P(X<x) • Từ luật số lớn, với ∀ε>0 ta có 1)|)()((| =<−∞→ εxFxFP nnlim CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ TRÊN KHÔN G GIAN MẪU 5.2 Phân bố mẫu và phân bố chính xác • Từ hệ thức n nxF xn =)( • N hư vậy, có thể xem mẫu (X1, X2,, Xn) như là tập các giá trị có thể của biến ngẫu nhiên rời rạc X’, trong đó xác suất để X’ nhận các giá trị có thể của nó là như nhau và bằng 1/n • Để nghiên cứu X ta dựa vào tập mẫu (X1, X2,, Xn), điều đó tương đương với việc nghiên cứu biến ngẫu nhiên rời rạc X’ • Sự khác biệt cơ bản là: – Phân bố của X là phân bố chính xác, các đặc trưng của X là các đặc trưng chính xác – Phân bố của X’ là phân bố mẫu, các đặc trưng của X’ là các đặc trưng mẫu suy ra ni n XXP i ,...,2,1, 1)( === CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ TRÊN KHÔN G GIAN MẪU 5.3 Các đặc trưng mẫu của đại lượng ngẫu nhiên • Xét biến ngẫu nhiên X với mẫu lấy được X’={X1, X2,, Xn} • Ký hiệu các đặc trưng chính xác của X là: – Hàm phân bố F(x)=P(X<x) – Kỳ vọng: μ=M[X], phương sai: σ2=D[X]=M[(X–μ)2] – Mômen gốc bậc k: mk=M[Xk] – Mômen trung tâm bậc k: μk=M[(X–μ)k] • Cần xác định các đặc trưng mẫu của X • Từ mục trước: n nxF xn =)( ni n XXP i ,...,2,1, 1)( === CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ TRÊN KHÔN G GIAN MẪU 5.3 Các đặc trưng mẫu của đại lượng ngẫu nhiên • Kỳ vọng mẫu: ∑∑ == ==′=′= n i i n i ii Xn XXPXXMX 11 1)(][ • Phương sai mẫu: 222 1 2 1 22 1)(1][~ XXXX n XX n XDsD n i i n i ixx −−≡−=−=′== ∑∑ == • Mômen gốc mẫu bậc k: ∑ = =′= n i k i k k Xn XMm 1 1][~ • Mômen trung tâm mẫu bậc k: ∑ = −=−′= n i k i k k XXn XXM 1 )(1])[(~μ CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ TRÊN KHÔN G GIAN MẪU 5.4 Phân bố của các đặc trưng thống kê • Xét biến ngẫu nhiên X có mật độ xác suất f(x) và mẫu (X1, X2,, Xn) là mẫu có lặp của X • Vì các Xi là độc lập và có cùng phân bố với X nên f(xi)≡f(x) • Có thể xét (X1, X2,, Xn) như là hệ n đại lượng ngẫu nhiên hay vector ngẫu nhiên n chiều nhận các giá trị có thể (x1, x2,, xn) • Các (x1, x2,, xn) là các hằng số ứng với một mẫu đã được chọn • (X1, X2,, Xn) có mật độ f(x1)×f(x2)××f(xn) X1 X2 X3 (x1, x2, x3) CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ TRÊN KHÔN G GIAN MẪU 5.4 Phân bố của các đặc trưng thống kê • Định nghĩa: Một hàm số g(X1, X2,, Xn) bất kỳ với các biến là (X1, X2,, Xn) được gọi là một đại lượng thống kê hay một đặc trưng thống kê trên không gian mẫu • Vì (X1, X2,, Xn) là một hệ các đại lượng ngẫu nhiên nên g(X1, X2,, Xn) cũng là một đại lượng ngẫu nhiên ∑ = = n i iXn X 1 1• Ví dụ: Kỳ vọng mẫu: ∑ = −== n i ixx XXn sD 1 22 )(1~• Phương sai mẫu: • Các mômen gốc, mômen trung tâm mẫu đều là những đại lượng thống kê trên không gian mẫu CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ TRÊN KHÔN G GIAN MẪU 5.4 Phân bố của các đặc trưng thống kê • Cho Y=g(X1, X2,, Xn) là một đại lượng thống kê và f(x1)×f(x2)××f(xn) là mật độ xác suất của (X1, X2,, Xn) • Cần xác định phân bố Fy(y) của Y • Về nguyên tắc ta có: }),...,(:),...,{( ,...)()...()( 11 11 yxxgxxG dxdxxfxfyF nn G nny <= = ∫ • Sau đây sẽ xét phân bố của một số đặc trưng thống kê thông dụng CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ TRÊN KHÔN G GIAN MẪU 5.4 Phân bố của các đặc trưng thống kê • Phân bố của một số đại lượng thống kê thường gặp • Định lý 1: N ếu mẫu (X1, X2,, Xn) được lấy từ đại lượng ngẫu nhiên X có phân bố chuNn N (μ,σ) thì ∑ = = n i iXn X 1 1 có phân bố chuNn ),( 2 n N σμ • Định nghĩa: N ếu (X1, X2,, Xn) là các đại lượng ngẫu nhiên độc lập có cùng phân bố chuNn N (0,1) thì đại lượng ngẫu nhiên ∑ = = n i iXU 1 2 có phân bố χ2 (khi bình phương) với n bậc tự do, ký hiệu U∈χ2(n) CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ TRÊN KHÔN G GIAN MẪU 5.4 Phân bố của các đặc trưng thống kê • Phân bố của một số đại lượng thống kê thường gặp • Định lý 2: N ếu X có phân bố chuNn N (μ,σ) và (X1, X2,, Xn) là mẫu của X thì 2* 2 1 xs nU σ −= có phân bố χ2 với (n–1) bậc tự do, U∈χ2(n–1), với ∑∑ == =−−= n i i n i ix Xn XXX n s 11 22* 1,)( 1 1 • Định nghĩa: N ếu Z có phân bố chuNn N (0,1), U có phân bố χ2 với n bậc tự do, χ2(n), thì n U Z nU Zt == / có phân bố Student với n bậc tự do, ký hiệu t∈St(n) CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ TRÊN KHÔN G GIAN MẪU 5.4 Phân bố của các đặc trưng thống kê • Phân bố của một số đại lượng thống kê thường gặp • Định lý 3: N ếu X có phân bố chuNn N (μ,σ) và (X1, X2,, Xn) là mẫu của X thì ns Xt x / * μ−= có phân bố Student với (n–1) bậc tự do, t∈St(n–1), với ∑∑ == =−−= n i i n i ix Xn XXX n s 11 22* 1,)( 1 1 • Định nghĩa: N ếu U1 và U2 độc lập có phân bố χ2 với n1 và n2 bậc tự do, U1∈χ2(n1), U2∈χ2(n2)thì 22 11 / / nU nUF = có phân bố Fisher (phân bố F) với n1 và n2 bậc tự do, ký hiệu F∈F(n1,n2) hoặc F∈Fn1,n2 CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ TRÊN KHÔN G GIAN MẪU 5.4 Phân bố của các đặc trưng thống kê • Phân bố của một số đại lượng thống kê thường gặp • Định lý 4: N ếu X và Y đều có phân bố chuNn và có cùng phương sai, D[X]=D[Y]=σ2, (X1, X2,, Xn1) là mẫu của X, (Y1, Y2,, Yn2) là mẫu của Y, thì 2* 2* y x s sf = có phân bố F với (n1–1) và (n2–1) bậc tự do, f∈F(n1–1,n2–1), với ∑∑ == =−−= 11 111 2 1 2* 1,)( 1 1 n i i n i ix Xn XXX n s ∑∑ == =−−= 22 121 2 2 2* 1,)( 1 1 n i i n i iy Yn YYY n s CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ TRÊN KHÔN G GIAN MẪU Những điều cần chú ý • Khi xét đại lượng ngẫu nhiên X với mẫu (X1, X2,, Xn): – Các Xi nhận các giá trị trong tập các giá trị có thể của X nên các Xi có cùng phân bố với X, f(xi)=f(x) – Các Xi là độc lập với nhau – Có thể xét (X1, X2,, Xn) như là một hệ n đại lượng ngẫu nhiên, phân bố của hệ: f(x1,,xn)=f(x1)××f(xn) – Bộ giá trị (x1,,xn) là những hằng số cụ thể, và là kết quả của một lần chọn nào đóÎ Khái niệm mẫu (X1, X2,, Xn) là một khái niệm trừu tượng ∑∑ == =≠=≠ n i i n i i xn xX n XXM 11 11][• Phân biệt: • Tương tự, với các đặc trưng khác: Phương sai, mômen, CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ TRÊN KHÔN G GIAN MẪU 5.5 Các đặc trưng mẫu của hệ các đại lượng ngẫu nhiên • Xét hệ hai đại lượng ngẫu nhiên (X,Y) với mẫu lấy được (X1,Y1), (X2,Y2),, (Xn,Yn) • Khi đó, ngoài các đặc trưng riêng như kỳ vọng, phương sai, mômen gốc, mômen trung tâm của từng đại lượng ngẫu nhiên, các đặc trưng quan trọng cần được xem xét là mômen tương quan và hệ số tương quan ∑ = −−= n i iixy YYXXn 1 ))((1~μ • Mômen tương quan mẫu giữa hai đại lượng ngẫu nhiên được xác định bởi • Trong đó ∑∑ == == n i i n i i Yn YX n X 11 1,1 tương ứng là kỳ vọng mẫu của X và Y Do tính ứng dụng phổ biến của mômen tương quan mẫu nên để thuận tiện ta sẽ sử dụng ký hiệu Rxy thay cho xyμ~ CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ TRÊN KHÔN G GIAN MẪU 5.5 Các đặc trưng mẫu của hệ các đại lượng ngẫu nhiên ∑∑ ∑ == = −− −− === n i i n i i n i ii yx xy yx xy xy YY n XX n YYXX n ssDD r 1 2 1 2 1 )(1)(1 ))((1~ ~~ ~ μμ • Hệ số tương quan mẫu giữa X và Y được xác định bởi • Trong đó ∑∑ == −==−== n i iyy n i ixx YYn sDXX n sD 1 22 1 22 )(1~,)(1~ tương ứng là phương sai mẫu của X và Y CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ TRÊN KHÔN G GIAN MẪU 5.5 Các đặc trưng mẫu của hệ các đại lượng ngẫu nhiên • Đối với hệ m đại lượng ngẫu nhiên (X1,X2,,Xm) với mẫu lấy được (X11,X21,,Xn1),, (X1m,X22,,Xnm) • Có thể sắp xếp mẫu thành ma trận n hàng (dung lượng mẫu) và m cột (tương ứng với m đại lượng ngẫu nhiên) • Các đặc trưng mẫu được xác định như sau mjX n X n i ijj ,...,2,1, 1 1 == ∑ = • Các kỳ vọng mẫu: • Các phương sai mẫu: • Trong nhiều trường hợp để đơn giản ta sử dụng ký hiệu thay cho ký hiệu 2,~ jj sD mjXX n sD n i jijxx jj ,...,2,1,)(1~ 1 22 =−== ∑ = 2,~ jj xx sD CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ TRÊN KHÔN G GIAN MẪU 5.5 Các đặc trưng mẫu của hệ các đại lượng ngẫu nhiên mkjXXXX n n i kikjijxx kj ,...,2,1,,))((1~ 1 =−−= ∑ = μ • Các mômen tương quan mẫu: • Tập hợp các mômen tương quan mẫu lập thành ma trận tương quan mẫu: • Sử dụng ký hiệu thay cho ký hiệu jkR kj xx μ~ ⎟⎟ ⎟⎟ ⎟ ⎠ ⎞ ⎜⎜ ⎜⎜ ⎜ ⎝ ⎛ = mmmm m m xxxxxx xxxxxx xxxxxx xxR μμμ μμμ μμμ ~...~~ ............ ~...~~ ~...~~ 21 22212 12111 ⎟⎟ ⎟⎟ ⎟ ⎠ ⎞ ⎜⎜ ⎜⎜ ⎜ ⎝ ⎛ = mmmm m m xx RRR RRR RRR R ... ............ ... ... 21 22221 11211 CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ TRÊN KHÔN G GIAN MẪU 5.5 Các đặc trưng mẫu của hệ các đại lượng ngẫu nhiên ),...,2,1,( ,~))((1))((1~ 11 mkj XXXX n XXXX n jkkj xx n i jijkik n i kikjijxx = =−−=−−= ∑∑ == μμ • N hận thấy: • Ma trận tương quan mẫu là ma trận đối xứng • Khi j≡k: ),...,2,1( ,~)(1))((1~ 1 2 1 mj DXX n XXXX n jjj x n i jij n i jijjijxx = =−=−−= ∑∑ == μ • Các phần tử trên đường chéo chính là phương sai của các đại lượng ngẫu nhiên thành phần CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ TRÊN KHÔN G GIAN MẪU 5.5 Các đặc trưng mẫu của hệ các đại lượng ngẫu nhiên mkj ss R ssDD r kj jk xx xx xx xx xx kj kj kj kj kj ,...,2,1,, ~ ~~ ~ =≡== μμ • Các hệ số tương quan mẫu: • Tập hợp các hệ số tương quan mẫu lập thành ma trận tương quan mẫu chuNn hóa: • Sử dụng ký hiệu thay cho ký hiệu jkr kj xx r ⎟⎟ ⎟⎟ ⎟ ⎠ ⎞ ⎜⎜ ⎜⎜ ⎜ ⎝ ⎛ = mmmm m m xxxxxx xxxxxx xxxxxx xx rrr rrr rrr P ... ............ ... ... 21 22212 12111 ⎟⎟ ⎟⎟ ⎟ ⎠ ⎞ ⎜⎜ ⎜⎜ ⎜ ⎝ ⎛ = mmmm m m xx rrr rrr rrr P ... ............ ... ... 21 22221 11211 CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ TRÊN KHÔN G GIAN MẪU 5.5 Các đặc trưng mẫu của hệ các đại lượng ngẫu nhiên • N hận thấy: • Ma trận tương quan mẫu chuNn hóa cũng là ma trận đối xứng • Khi j≡k: • Các phần tử trên đường chéo chính bằng 1 mkjr DDDD r jk jk jk kj kj kj xx xx xx xx xx xx ,...,2,1,,~~ ~ ~~ ~ ==== μμ mj D D DD r j j jj jj jj x x xx xx xx ,...,2,1,1~ ~ ~~ ~ ==== μ CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ TRÊN KHÔN G GIAN MẪU 5.5 Các đặc trưng mẫu của hệ các đại lượng ngẫu nhiên • Có thể viết lại: ⎟⎟ ⎟⎟ ⎟ ⎠ ⎞ ⎜⎜ ⎜⎜ ⎜ ⎝ ⎛ = mmm m m xx DRR RDR RRD R ... ............ ... ... 21 2221 1121 ⎟⎟ ⎟⎟ ⎟ ⎠ ⎞ ⎜⎜ ⎜⎜ ⎜ ⎝ ⎛ = 1... ............ ...1 ...1 21 221 112 mm m m xx rr rr rr P CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ TRÊN KHÔN G GIAN MẪU 5.5 Các đặc trưng mẫu của hệ các đại lượng ngẫu nhiên 22 222 1 2 11 2 1 22 1 2 2121 )2(1)(1~ XX XXXX n XX n X n XXXX n XX n D n i n i i n i i n i ii n i ix −= +−=+−= =+−=−= ∑∑∑ ∑∑ === == • Chú ý: Sử dụng một số phép biến đổi đơn giản ta có thể nhận được các hệ thức tương đương sau • Phương sai mẫu: YXXYYXYX n YYXX n n i ii n i iixy −=−=−−= ∑∑ == 11 1))((1~μ • Tương tự cho mômen tương quan: • Tổng quát hơn: kjkj n i kikjijjkxx XXXXXXXXn R kj −=−−=≡ ∑ =1 ))((1~μ CHƯƠN G 5. KHÔN G GIAN MẪU VÀ THỐN G KÊ TRÊN KHÔN G GIAN MẪU HẾT CHƯƠN G 5