Bài giảng chương 2: Đại lượng ngẫu nhiên và quy luật phân phối xác suất

Đại lượng ngẫu nhiên (còn gọi là biến ngẫu nhiên) là một đại lượng (tức là cân, đong, đo hoặc đếm được) mà có thểnhận giá trịbất kỳthuộc một tập hợp sốxác định một cách ngẫu nhiên với xác suất nhất định. ĐLNN thường được ký hiệu bởi các chữX, Y, Z , Còn các giá trịcủa ĐLNN thường được ký hiệu bởi x, y, z, Trong ví dụ2.1, đại lượng ngẫu nhiên X nhận giá trịmột cách ngẫu nhiên thuộc tập {0, 1, 2, 3, 4, 5}, ta viết X = {0, 1, 2, 3, 4, 5}. Khảnăng (xác suất) đểX nhận giá trị3 là 27,7%. Trong ví dụ2.2, đại lượng ngẫu nhiên K nhận giá trịmột cách ngẫu nhiên thuộc tập [0, 50cm]. Căn cứvào tập giá trịcủa ĐLNN, ta phân chúng thành hai loại: rời rạcvà liên tục. Cụthể, ta có phân loại dưới đây. ‰ Đại lượng ngẫu nhiên rời rạc: Đó là ĐLNN mà tập các giá trịcó thểcó của nó là một tập rời rạc, tức là có thể đánh sốthành một dãy (hữu hạn hay vô hạn). ‰ Đại lượng ngẫu nhiên liên tục: Đó là ĐLNN mà tập các giá trịcó thểcó của nó là một đoạn hay khoảng (hữu hạn hay vô hạn). Nhận xét quan trọng Cần phân biệt ĐLNN với BCNN. ĐLNN thì nhận giá trịnày khác một cách ngẫu nhiên nhưng không có xác suất, BCNN là một sựkiện có thểxẩy ra sau khi thực hiện phép thử với xác suất xác định nhưng BCNN không có giá trị.

pdf18 trang | Chia sẻ: haohao89 | Lượt xem: 11801 | Lượt tải: 1download
Bạn đang xem nội dung tài liệu Bài giảng chương 2: Đại lượng ngẫu nhiên và quy luật phân phối xác suất, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Chương 2: Đại Lượng Ngẫu Nhiên Rời Rạc PGS-TS. Lê Anh Vũ Tài Liệu Xác Suất Thống Kê II.1 CHÖÔNG 2 ÑAÏI LÖÔÏNG NGAÃU NHIEÂN VAØ QUY LUAÄT PHAÂN PHOÁI XAÙC SUAÁT Nội dung ‰ Đại lượng ngẫu nhiên (ĐLNN) và phân loại cácĐLNN. Quy luật phân phối xác suất (PPXS) của ĐLNN. ‰ Bảng PPXS của ĐLNN rời rạc. Hàm PPXS của ĐLNN ( rời rạc hay liên tục). Hàm mật độ xác suất của ĐLNN liên tục. ‰ Các phép toán trên các ĐLNN. Hàm của đại lượng ngẫu nhiên rời rạc ‰ Các đặc trưng số cơ bản của ĐLNN. ‰ Các phân phối thông dụng: Nhị thức, Siêu bội, Poisson, Chuẩn. ‰ Phương pháp tính xấp xỉ giữa các phân phối xác suất. 1. ÑAÏI LÖÔÏNG NGAÃU NHIEÂN - QUYLUAÄT PHAÂN PHOÁI XAÙC SUAÁT CUÛA ÑAÏI LÖÔÏNG NGAÃU NHIEÂN Ví duï 2.1. Bảng dưới đây ghi kết quả khảo sát số xe máy hiện có ở 6.487 hộ gia đình tại Tp. Hồ Chí Minh năm 2003. Số xe máy (X) Số hộ (ni) Tần suất 0 27 0,004 1 1422 0,219 2 2865 0,442 3 1796 0,277 4 324 0,050 5 53 0,008 6487 1,000 Giả sử ta chọn ngẫu nhiên một hộ gia đình trong 6487 hộ trên, gọi X là số xe máy của hộ đã chọn tại thời điểm khảo sát. Khi đó X là một đại lượng vì nó có thể nhận các giá trị số (0, 1, …, 5); tuy nhiên ta không thể biết trước một cách chắc chắn giá trị của X bằng bao nhiêu vì nó tùy thuộc vào hộ được chọn. Nói cách khác X có thể nhận một giá trị ngẫu nhiên thuộc tập {0, 1, …, 5}. Ta bảo X là một đại lượng ngẫu nhiên. Ví duï 2.2. Một xạ thủ bắn một viên đạn trúng vào bia hình tròn bán kính 50cm. Gọi K là khoảng cách ( đo bằng cm) từ tâm của bia đến điểm chạm của viên đạn vào bia. Khi đó T cũng là một đại lượng ngẫu nhiên nhận giá trị thuộc tập [0, 50]. Chương 2: Đại Lượng Ngẫu Nhiên Rời Rạc PGS-TS. Lê Anh Vũ Tài Liệu Xác Suất Thống Kê II.2 1.1. MO TAÛ KHAÙI NIEÄM ÑAÏI LÖÔÏNG NGAÃU NHIEÂN – PHAÂN LOAÏI CAÙC ÑAÏI LÖÔÏNG NGAÃU NHIEÂN ‰ Đại lượng ngẫu nhiên (còn gọi là biến ngẫu nhiên) là một đại lượng (tức là cân, đong, đo hoặc đếm được) mà có thể nhận giá trị bất kỳ thuộc một tập hợp số xác định một cách ngẫu nhiên với xác suất nhất định. ĐLNN thường được ký hiệu bởi các chữ X, Y, Z , … Còn các giá trị của ĐLNN thường được ký hiệu bởi x, y, z, … Trong ví dụ 2.1, đại lượng ngẫu nhiên X nhận giá trị một cách ngẫu nhiên thuộc tập {0, 1, 2, 3, 4, 5}, ta viết X = {0, 1, 2, 3, 4, 5}. Khả năng (xác suất) để X nhận giá trị 3 là 27,7%. Trong ví dụ 2.2, đại lượng ngẫu nhiên K nhận giá trị một cách ngẫu nhiên thuộc tập [0, 50cm]. Căn cứ vào tập giá trị của ĐLNN, ta phân chúng thành hai loại: rời rạc và liên tục. Cụ thể, ta có phân loại dưới đây. ‰ Đại lượng ngẫu nhiên rời rạc: Đó là ĐLNN mà tập các giá trị có thể có của nó là một tập rời rạc, tức là có thể đánh số thành một dãy (hữu hạn hay vô hạn). ‰ Đại lượng ngẫu nhiên liên tục: Đó là ĐLNN mà tập các giá trị có thể có của nó là một đoạn hay khoảng (hữu hạn hay vô hạn). Nhận xét quan trọng Cần phân biệt ĐLNN với BCNN. ĐLNN thì nhận giá trị này khác một cách ngẫu nhiên nhưng không có xác suất, BCNN là một sự kiện có thể xẩy ra sau khi thực hiện phép thử với xác suất xác định nhưng BCNN không có giá trị. Tuy nhiên ĐLNN và BCNN có mối quan hệ khăng khít với nhau. Cụ thể, khi gán cho mỗi ĐLNN một giá trị cụ thể hoặc một ràng buộc nào đó về giá trị, ta sẽ nhận được một BCNN với xác suất xác định. Về mặt hình thức, có thể hình dung ĐLNN như là hàm của BCNN trên không gian các biến cố sơ cấp Trở lại ví dụ 2.1. Ta có (X=3) là một BCNN với P(X=3) = 0,277. Tương tự (X<3), (X>3), (X≤3), (X≥3) cũng là những BCNN mà có thể dễ dàng tính xác suất của chúng theo bảng số liệu đã cho. Một cách tổng quát, với mỗi ĐLNN X tùy ý và x, y là hai số thực bất kỳ (x<y), (X<x), (X=x), (X>x), (X≤x), (X≥x), (x<X<y), ... đều là các BC mà nói chung là ngẫu nhiên. Qua xác suất của các BC này, ta sẽ biết được những giá trị nào hoặc những khoảng giá trị nào X dễ nhận, những giá trị nào hay những khoảng giá trị nào X ít nhận hay không thể nhận. Nói một cách khác, xác suất của những BC đó (khi cho x, y chạy khắp tập số thực) phản ánh quy luật phân phối xác suất của X. 1.2. BAÛNG PHAÂN PHOÁI XAÙC SUAÁT CUÛA ÑLNN RÔØØI RAÏC Đối với ĐLNN rời rạc, quy luật PPXS thường được cho bằng bảng. ‰ Bảng phân phối xác suất: Đó là bảng liệt kê tất cả các giá trị có thể có của đại lượng ngẫu nhiên rời rạc X cùng với xác suất để X nhận từng giá trị đó. X x1 x2 … xn … (nếu vô hạn) XS tương ứng P(X = xi) p1 p2 … pn … Chương 2: Đại Lượng Ngẫu Nhiên Rời Rạc PGS-TS. Lê Anh Vũ ‰ Tính chất đặc trưng: Các xác suất tương ứng pi trong bảng PPXS có hai tính chất đặc trưng sau đây. (i) 0 ≤ pi ≤1; (ii) 1p . n 1i i =∑= ‰ Các tính chất khác (i) P(a ≤ X < b) = i i a x b p ≤ < ∑ ; (ii) P(a < X < b) = i i a x b p < < ∑ . Tương tự cho các BCNN với các dấu bất đẳng thức khác. Ví duï 2.3. Xét lại ví dụ 2.1. Chọn ngẫu nhiên một hộ, đặt X là số xe máy của hộ được chọn. Khi đó X là ĐLNN có các giá trị là thuộc tập{ }0,1, 2,3, 4,5 . Tìm quy luật PPXS của đại lượng ngẫu nhiên X (tức là lập bảng PPXS của X). Tính xác suất để của BCNN (2<X<5). Giải Chúng ta sẽ tính xác suất tương ứng để X nhận từng các giá trị của nó. Bảng PPXS của X như sau: X 0 1 2 3 4 5 P(X=i) 0,004 0,219 0,442 0,277 0,050 0,008 P(2<X<5) = 0,277 + 0,050 = 0, 327. Ví duï 2.4. Một xạ thủ được phép bắn 3 viên đạn. Biết xác suất bắn trúng mục tiêu của mỗi viên đạn đều 0,8. Gọi X là số viên đạn anh ta bắn trúng bia. Hãy lập bảng phân phối xác suất của X. Giải Ta có X = {0, 1, 2, 3}. Ta cần tìm P(X = k), k = 0, 1, 2, 3. Xem phép thử là bắn 1 viên đạn và A là biến cố viên đạn đó trúng mục tiêu. Ta có P(A) = 0,8 không đổi ở mỗi lần bắn nên đây là một dãy 3 phép thử Bernoulli với p = 0,8 ; q = 1 – p = 0,2. Áp dụng công thức Bernoulli, ta được P(X = 0) = P3(0 ; 0,8) = 0,80.0,23 = 0,008 ; 03C P(X = 1) = P3(1 ; 0,8) = 0,81.0,22 = 0,96 ; 13C P(X = 2) = P3(2 ; 0,8) = 0,82.0,21 = 0,384 ; 23C Tài Liệu Xác Suất Thống Kê II.3 Chương 2: Đại Lượng Ngẫu Nhiên Rời Rạc PGS-TS. Lê Anh Vũ P(X = 3) = P3(3 ; 0,8) = 0,83.0,20 = 0,512. 03C Vậy, bảng phân phối xác suất của X là X 0 1 2 3 P 0,008 0,096 0,384 0,512 1.3. HAØM PHAÂN PHOÁI XAÙC SUAÁT CUÛA ÑLNN ‰ Hàm phân phối xác suất của ĐLNN tùy ý X (rời rạc hay liên tục) là hàm số F(x) xác định trên tập số thực bởi công thức sau F(x) = P(X < x) , x ∈ . \ ‰ Tính chất : Hàm phân phối xác suất có các tính chất sau (1) F(x) là hàm không giảm và liên tục trái; (2) 0 ≤ F(x) ≤ 1, ∀ x ∈ ; \ (3) 0)(lim =−∞→ xFx (4) ; 1)(lim = +∞→ xF x (5) P(a ≤ X < b) = F(b) – F(a), với mọi a, b ∈ , a < b. \ (6) F(x) đặc trưng cho loại của ĐLNN X theo nghĩa sau * F(x) gián đoạn khi và chỉ khi X rời rạc; * F(x) liên tục trên \ khi và chỉ khi X liên tục. Chú ý: Ba tính chất đầu đặc trưng cho hàm PPXS theo nghĩa sau đây: nếu F(x) là hàm số xác định trên và có các tính chất (1), (2), (3) thì F(x) là hàm phân phối xác suất của một đại lượng ngẫu nhiên nào đó. Hàm PPXS còn gọi là hàm tích lũy xác suất. \ Nếu X là đại lượng ngẫu nhiên rời rạc hữu hạn có bảng phân phối xác suất như sau X x1 x2 … xn P p1 p2 … pn ( x1 < x2 < … < xn), thì hàm phân phối xác suất của X là 1 21 11 2 1 0 ( ) .......................................... .... 1 n nn n x x x x xp F x x x xp p p x x −− ≤⎧⎪ ⎪⎩ ,neáu ,neáu ............. ,neáu ,neáu 1.4. HAØM MAÄT ÑOÄ XAÙC SUAÁT CUÛA ÑLNN LIEÂN TUÏC Khác với bảng PPXS của ĐLNN rời rạc, hàm PPXS không cho ta biết rõ PPXS của ĐLNN trong lân cận của bất kỳ điểm nào trên trục số. Hơn nữa, cần chú ý rằng nếu X Tài Liệu Xác Suất Thống Kê II.4 Chương 2: Đại Lượng Ngẫu Nhiên Rời Rạc PGS-TS. Lê Anh Vũ là ĐLNN liên tục thì P(X=x) = 0 với mọi số thực x. Ta sẽ dưa vào khái niệm hàm mật độ xác suất cho ĐLNN liên tục. ‰ Hàm mật độ xác suất của ĐLNN liên tục X là hàm f(x) định nghĩa như sau f(x): = 0 ( )lim x P x X x x xΔ → + ≤ ≤ + Δ Δ = 0 ( )lim x P x x X x xΔ → + − Δ ≤ ≤ Δ ; Tất nhiên là trong giả thiết rằng cả hai giới hạn đó tồn tại hữu hạn. Nếu đại lượng ngẫu nhiên liên tục X có hàm phân phối xác suất F(x) khả vi thì hàm mật độ XS chính là đạo hàm của hàm PPXS: f(x) = F’(x), x∈ . \ ‰ Tính chất: Hàm mật độ xác suất có các tính chất sau (1) f(x) ≥ 0, x ∈ \ ; (2) ∫ ; +∞ ∞− = 1)( dxxf Ngược lại , một hàm số f(x) có các tính chất (1), (2) phải là hàm mật độ xác suất của một đại lượng ngẫu nhiên nào đó. (3) P(a < X < b) = P(a ≤ X < b) = P(a < X ≤ b) = P(a ≤ X ≤ b) = ; ∫a b dxxf )( (a,b ∈ , a < b) \ (4) F(x) = ∫ , x ∈ \ . ∞− x dttf )( 1.5. CAÙC PHEÙP TOAÙN TREÂN CAÙC ÑLNN – HAØM TREÂN ÑLNN 1.5.1. CAÙC PHEÙP TOAÙN TREÂN CAÙC ÑLNN Để đơn giản, ta chỉ xét các ĐLNN rời rạc. Giả sử X và Y là các ĐLNN rời rạc độc lập (tức là dù ĐL này nhận giá trị nào cũng không hề ảnh hưởng đến PPXS của ĐL kia) có bảng phân phối xácsuất như sau X x1 x2 … xm P p1 p2 … pm Y y1 y2 … yn P p’1 p’2 … p’n Khi đó X + Y là đại lượng ngẫu nhiên rời rạc có bảng phân phối xác suất là X + Y z1 z2 … zs P p”1 p”2 … p”s Tài Liệu Xác Suất Thống Kê II.5 Chương 2: Đại Lượng Ngẫu Nhiên Rời Rạc PGS-TS. Lê Anh Vũ Trong đó zk là các giá trị khác nhau của các tổng xi + yj và p’’k = , i j k i j x y p p z+ = ∑ . Còn XY là đại lượng ngẫu nhiên rời rạc có bảng phân phối xác suất là X Y z1 z2 … zs P p”1 p”2 … P”s Trong đó zk là các giá trị khác nhau của các tích xiyj và p’’k = , i j k i j x y p p z= ∑ 1.5.2. HAØM TREÂN ÑLNN Nếu ta có một hàm số ϕ được xác định trên tập tát cả các giá trị của đại lượng ngẫu nhiên X thì Y = ϕ(X) trở thành một đại lượng ngẫu nhiên mới có cùng luật PPXS với X. Giá trị của đại lượng ngẫu nhiên Y được xác địnhtheo giá trị của X thông qua hàm ϕ. Giả sử ta có quy luật phân phối xác suất của X như sau X x1 x2 … xj … xn P(X = xi) P1 P2 … Pj … Pn Khi đó, , ta xác định các giá trị yi của Y=ϕ(X) bởi nixy ii ,1),( == ϕ Y ϕ(x1) ϕ(x2) … ϕ(xj) … ϕ(xn) P(Y = yi) p1 p2 … pj … pn Chú ý nếu ϕ(xi)= ϕ(xj) thì ta đặt y*= ϕ(xi)= ϕ(xj) và cộng dồn xác suất của chúng lại: p(Y = y*) = pi + pj. Ví duï 2.5. Cho hai đại lượng ngẫu nhiên X và Y có bảng phân phối xác suất lần lượt là X 0 1 2 Y -1 1 2 P 0,2 0,3 0,5 P 0,4 0,3 0,3 Hãy lập bảng phân phối xác suất của các đại lượng X+Y, XY. Giải Đối với từng phép toán đã cho ta lập bảng ghi các giá trị và xác suất tương ứng. a) Trường hợp X+Y X Y 0 1 2 X Y 0,2 0,3 0,5 -1 -1 0 1 0,4 0,008 0,12 0,20 1 1 2 3 0,3 0,06 0,09 0,15 2 2 3 4 0,3 0,06 0,09 0,15 Bảng 1 Bảng 2 Tài Liệu Xác Suất Thống Kê II.6 Chương 2: Đại Lượng Ngẫu Nhiên Rời Rạc PGS-TS. Lê Anh Vũ Tài Liệu Xác Suất Thống Kê II.7 1 và Bảng 2 suy ra } 0,09 = 0,24 , (X+Y = 4) = 0,15. Vậy, bảng i xá của X+Y là Từ Bảng X+Y = { ,2,1,0,1− ,4,3 P (X+Y = -1) = 0,08 , P (X+Y = 0) = 0,12 , P (X+Y = 1) = 0,20 + 0,06 = 0,26 , P (X+Y = 2) = 0,09 + 0,06 = 0,15 , P (X+Y = 3) = 0,15 + P phân phố c suất X+Y -1 0 1 2 3 4 P 0,08 0,12 0,26 0,15 0,24 0,15 b) Trường XY Ta chỉ cần lập lại bảng giá trị của tích XY tương tự như Bảng 1, nhưng kết quả ở mỗi ô giữa trong bảng mới sẽ l hợp à tích các giá trị thuộc dòng 1 lần lượt với các giá trị thuộc cột 1 (xem Bảng 3). X 0 1 2 Y -1 0 -1 -2 1 0 1 2 2 0 2 4 Bảng 3 ảng 2 suy ra } 0,06 + 0,06 = 0,20 , 0,09 = 0,24 , ậy, bảng phân phối xác suất của XY là Từ Bảng 3 và B XY = { ,0,1,2 −− ,4,2,1 P (XY = -2) = 0,20 , P (XY = -1) = 0,12 , P (XY = 0) = 0,08 + P (XY = 1) = 0,09 , P (XY = 2) = 0,15 + P (XY = 4) = 0,15. V XY -2 -1 0 1 2 3 P 0,20 0,12 0,20 0,09 0,24 0,15 Chương 2: Đại Lượng Ngẫu Nhiên Rời Rạc PGS-TS. Lê Anh Vũ Lưu ý: Bảng 1 và Bảng 2 có thể ghi chung thành một bảng (xem Bảng A) ; Bảng 3 và Bảng 2 có thể ghi chung thành một bảng (xem Bảng B). Trong hai bảng này, góc trái của mỗi ô ghi giá trị, góc phải ghi xác suất tương ứng. X Y 0 0,2 1 0,3 2 0,5 X Y 0 1 2 -1 0,4 -1 0,08 0 0,12 1 0,20 -1 0 0,08 -1 0,12 -2 0,20 1 0,3 1 0,06 2 0,09 3 0,15 1 0 0,06 1 0,09 2 0,15 2 0,3 2 0,06 3 0,09 4 0,12 2 0 0,06 2 0,09 4 0,15 Bảng A Bảng B 2. CAÙC SOÁ ÑAËC TRÖNG CUÛA ÑAÏI LÖÔÏNG NGAÃU NHIEÂN Ngoài bảng phân phối của ĐLNN rời rạc, hàm phân phối của ĐLNN tùy ý và hàm mật độ của ĐLNN liên tục, chúng ta còn dùng vài con số để đặc trưng cho ĐLNN – đó là các số đặc trưng về vị trí và độ phân tán của các giá trị và xác suất tương ứng của ĐLNN. 2.1. KYØ VOÏNG CUÛA ÑAÏI LÖÔÏNG NGAÃU NHIEÂN ‰ Định nghĩa: Kỳ vọng của đại lượng ngẫu nhiên X là một số, ký hiệu là EX, được xác định như sau: Đối với ĐLNN rời rạc có giá trị xi và xác suất tương ứng pi, i = 1, 2, 3, … Đối với ĐLNN liên tục có hàm mật độ f(x), x∈\ EX := i i i x p∑ Khi X vô hạn thì phải giả thiết rằng chuỗi trên hội tụ EX := ( )xf x dx +∞ −∞ ∫ Khi tập giá trị của X là khoảng vo hạn thì phải giả thiết tích phân trên hội tụ ‰ Ý nghĩa: Kỳ vọng của ĐLNN X là giá trị trung bình theo xác suất của X, tức là giá trị trung bình của X khi mỗi giá trị của X được gắn với trọng số chính là xác suất tương ứng của giá trị đó. EX sẽ trùng với trung bình cộng số học 1 1 n i i x n = ∑ của các giá trị của X khi X rời rạc hữu hạn n giá trị và 1 2 1... np p p n = = = = , tức là khi phân phối xác suất của X đều. Tài Liệu Xác Suất Thống Kê II.8 Chương 2: Đại Lượng Ngẫu Nhiên Rời Rạc PGS-TS. Lê Anh Vũ Ví dụ 2.6. Công ty dịch vụ có 8 nhân viên. Bảng 2.3 thể hiện tiền lương hàng tuần của 8 nhân viên đó như sau: Bảng 2.3 Lương xi (USD) Số nhân viên (ni) Tần suất 240 3 0,375 320 2 0,250 450 1 0,125 600 2 0,250 Σ 8 1,000 Chọn ngẫu nhiên một nhân viên của công ty. Đặt X là tiền lương của nhân viên đó. Hãy lập bảng PPXS và tính kỳ vọng của đại lượng ngẫu nhiên X. Giải Ta có luật phân phối xác suất của X như sau: X 240 320 450 600 Px 0,375 0,250 0,125 0,250 Do đó (USD) 1 : 376,25 n i i i EX x p = = =∑ Giá trị trung bình cộng số học ở đây là 402,5 (USD). Rõ ràng kỳ vọng phản ánh chính xác hơn tình hình lương của công ty. Tuy công ty có 4 mức lương nhưng lương bình quân của 8 nhân viên không phải là 402,5 USD mà chỉ là 376,24USD. ‰ Tính chất Với mọi ĐLNN X, Y và đại lượng hằng C, ta có: (1) E(C) = C ; (2) E(C.X) = C.E(X); (3) E(X + Y) = E(X) + E(Y); (4) E(X.Y) = E(X).E(Y) nếu X, Y độc lập. 2.2. PHÖONG SAI VAØ ÑOÄ LEÄCH CHUAÅN CUUA ÑAÏI LÖOÏNG NGAÃU NHIEAN ‰ Định nghĩa: Phương sai của đại lượng ngẫu nhiên X, ký hiệu là DX (hayVarX), được xác định bởi biểu thức sau: 2 2: ( ) ( ) ( )DX E X EX E X EX= − = − 2 ≥ 0. Còn độ lệch chuẩn của X, ký hiệu σX, được xác định bởi σX := DX ≥ 0. Tài Liệu Xác Suất Thống Kê II.9 Chương 2: Đại Lượng Ngẫu Nhiên Rời Rạc PGS-TS. Lê Anh Vũ Đối với ĐLNN rời rạc có giá trị xi và xác suất tương ứng pi, i = 1, 2, 3, … Đối với ĐLNN liên tục có hàm mật độ f(x), x∈\ DX := 2 2 i i i i i i x p x p⎛ ⎞− ⎜ ⎟⎝ ⎠∑ ∑ ; σX := DX . Khi X vô hạn thì phải giả thiết rằng các chuỗi trên hội tụ DX := 2 2 ( ) ( )x f x dx xf x dx +∞ +∞ −∞ −∞ ⎛ ⎞− ⎜ ⎟⎝ ⎠∫ ∫ σX := DX . Khi tập giá trị của X là khoảng vô hạn thì phải giả thiết các tích phân trên hội tụ ‰ Ý nghĩa: Phương sai và độ lệch chuẩn của X là số không âm dùng để đo mức độ phân tán của các giá trị của X xung quanh trọng tâm EX của nó. DX còn gọi là độ phân tán trung bình bình phương, σX còn gọi là độ phân tán trung bình. DX (σX) càng nhỏ thì giá trị của X càng ít phân tán mà có độ tập trung xung quanh kỳ vọng càng lớn. Ngược lại, DX (σX) càng lớn thì các giá trị của X càng ít tập trung mà phân tán rộng. Độ lệch chuẩn hay dùng hơn phương sai vì nó cùng đơn vị với X. ‰ Tính chất Với mọi ĐLNN X, Y và đại lượng hằng C, ta có (1) D(C) = 0; (2) DCX = C2.DX; (3) D(X+Y) = DX + DY nếu X, Y độc lập. Ví dụ 2.7. Xét lại ví dụ 2.3. Tính phương sai và độ lệch chuẩn σX của X. Giải Ta có { với bảng phân phối như sau }600,450,320,240=X X 240 320 450 600 Px 0,375 0,250 0,125 0,250 Theo ví dụ 2.3, ta đã tính được . Còn phương sai và độ lệch chuẩn của X như sau: 1 376,25 n i i i EX x p = = =∑ ; 2 2 2 2 2240 .0,375 320 .0, 25 450 .0,125 600 .0, 25 376, 25 20.948, 44DX = + + + − = 2 0 .9 4 8 , 4 4 1 4 4 , 7 4D Xσ = = = . 2.3. MODE VAØ MEDIAN CUÛA ÑAÏI LÖÔÏNG NGAÃU NHIEÂN Ngoài hai đặc trưng cơ bản là kỳ vọng và phương sai, người ta còn xét một vài đặc trưng khác của ĐLNN như Mode, Median (trung vị), Moment, hệ số bất đối xứng, hệ số chọn. Chúng giúp đặc trưng đầy đủ hơn các ĐLNN. Ở đây chúng ta chỉ giới thiệu thêm hai đặc trưng là Mode và Median (trung vị). ‰ Mode: Cho ĐLNN X. Nếu X rời rạc thì Mode của X, ký hiệu Mod(X), là giá trị mà tại đó xác suất tương ứng lớn nhất. Nếu X liên tục với hàm mật độ XS là f(x) thì Mode của X là giá trị mà tại đó f(x) đạt giá trị lớn nhất. Tất nhiên X có thể không có hoặc có nhiều giá trị Mod(X). Tài Liệu Xác Suất Thống Kê II.10 Chương 2: Đại Lượng Ngẫu Nhiên Rời Rạc PGS-TS. Lê Anh Vũ ‰ Median(trung vị): Cho ĐLNN X. Median của X, ký hiệu μX hay Med(X), là giá trị phân đôi khối lượng xác suất thành hai phần bằng nhau. Cụ thể, Med(X) được xác định như sau: ( ( )) ( ( )) P X Med X P X Med X ≤⎩ 0,5; 0,5. Ở đó, F(x) là hàm PPXS của X. Nếu X liên tục, tức là hàm PPXS F(x) liên tục thì hai hệ thức trên tương đương với đẳng thức F(Med(X)) = 0,5. Nếu phương trình F(x) = 0,5 có nhiều nghiệm thì mọi nghiệm đều là trung vị. ‰ Nhận xét: Nếu phân phối XS của X có Mod(X) duy nhất và đối xứng (tức là đồ thị hàm mật độ f(x) có trục đối xứng cùng phương với trục tung khi X liên tục hoặc là các XS tương ứng của X đối xứng: pi = pn-i khi X rời rạc hữu hạn) thì cả 3 số đặc trưng kỳ vọng EX, Mod(X) và Med(X) trùng nhau. Do đó khi PPXS của X là đối xứng hoặc gần đối xứng thì chỉ cần dùng kỳ vọng là đủ để định vị trọng tâm cho các giá trị của X. Còn nếu PPXS của X không đối xứng mà quá lệch thì dùng Med(X) và Mod(X) để định vị sẽ là tốt hơn. Ví dụ 2.8. Một sinh viên thi ba môn Toán, Lý, Hóa với xác suất đậu lần lượt là 0,6 ; 0,7 ; 0,8. Gọi X là số môn anh ta đậu trong ba môn đó. Hãy lập bảng và hàm PPXS của X, tính kỳ vọng phương sai, độ lệch chuẩn, Mode và Median của X. Giải Ta có X = ⎨0, 1, 2, 3⎬. Ta cần lập bảng PPXS của X, tức là tính P(X = k); k = 0, 1, 2, 3. Gọi T, L, H lần lượt là các biến cố sinh viên đó đậu Toán, Lý, Hóa. Khi đó P(X = 0) = P( T L H ) = 0,024, P(X = 1) = P(T L H + T L H + T L H) = 0,188, P(X = 2) = P(TL H + T L H + T LH) = 0,452, P(X = 3) = P(TLH) = 0,336. Vậy, bảng phân phối xác suất của X là X 0 1 2 3 P 0,024 0,188 0,452 0,336 Từ đó, ta có hàm phân phối xác suất của X là F(x) = 0 0,024 0,024 0,188 0, 212 0,024 0,188 0, 452 0,664 1 ≤⎧⎪ < ≤⎪⎪ + = < ≤⎨⎪ + + = < ≤⎪⎪⎩ neáu x 0; neáu 0 x 1; neáu 1 x 2; neáu 2 x 3; neáu 3 < x. Tài Liệu Xác Suất Thống Kê II.11 Chương 2: Đại Lượng Ngẫu Nhiên Rời Rạc PGS-TS. Lê Anh Vũ Do đó EX = 0 . 0,024 + 1 . 0,188 + 2 . 0,452 + 3 . 0,336 = 2,1; DX = EX2 – (EX)2 = = 02. 0,024 + 12. 0,188 + 22. 0,452 + 32. 0,336 – 2,12 = 0,61; σX = 0,61 = 0,7810; Mod(X) = 2; Med(X) = 2. 3. CÁC PHÂN PHỐI THÔNG DỤNG 3.1. PHAÂN PHOÁI NHÒ THÖÙC 3.1.1. ÑÒNH NGHÓA Thực hiện dãy n ( 0< n ∈ ) phép thử Bernoulli và xác suất xẩy ra của biến cố A ở mỗi lần thử là p ( 0 < p < 1). Gọi X là số lần A xẩy ra trong n lần thử. Khi đó X là ĐLNN nhận giá trị thuộc {0,1, ..., n}. Ta nói X có phân phối nhị thức kiểu B(n; p), ký hiệu X ~ B(n, p). Nói cách khác, ĐLNN rời rạc hữu hạn X có PP nhị thức kiểu B(n, p) nếu X có bảng PPXS như sau: ` X 0 1 ... n P 0 0 (1 )nnC p p− 1 1 1(1 )nnC p p −− … 0(1 )n nnC p p− Tức là ( ) ( ; ) (1 )k k n kn nP X k P k p C p p