Đại lượng ngẫu nhiên (còn gọi là biến ngẫu nhiên) là một đại lượng (tức
là cân, đong, đo hoặc đếm được) mà có thểnhận giá trịbất kỳthuộc một
tập hợp sốxác định một cách ngẫu nhiên với xác suất nhất định. ĐLNN
thường được ký hiệu bởi các chữX, Y, Z , Còn các giá trịcủa ĐLNN
thường được ký hiệu bởi x, y, z,
Trong ví dụ2.1, đại lượng ngẫu nhiên X nhận giá trịmột cách ngẫu nhiên thuộc
tập {0, 1, 2, 3, 4, 5}, ta viết X = {0, 1, 2, 3, 4, 5}. Khảnăng (xác suất) đểX nhận giá trị3
là 27,7%. Trong ví dụ2.2, đại lượng ngẫu nhiên K nhận giá trịmột cách ngẫu nhiên
thuộc tập [0, 50cm]. Căn cứvào tập giá trịcủa ĐLNN, ta phân chúng thành hai loại: rời
rạcvà liên tục. Cụthể, ta có phân loại dưới đây.
Đại lượng ngẫu nhiên rời rạc: Đó là ĐLNN mà tập các giá trịcó thểcó
của nó là một tập rời rạc, tức là có thể đánh sốthành một dãy (hữu hạn hay
vô hạn).
Đại lượng ngẫu nhiên liên tục: Đó là ĐLNN mà tập các giá trịcó thểcó
của nó là một đoạn hay khoảng (hữu hạn hay vô hạn).
Nhận xét quan trọng
Cần phân biệt ĐLNN với BCNN. ĐLNN thì nhận giá trịnày khác một cách ngẫu nhiên
nhưng không có xác suất, BCNN là một sựkiện có thểxẩy ra sau khi thực hiện phép thử
với xác suất xác định nhưng BCNN không có giá trị.
18 trang |
Chia sẻ: haohao89 | Lượt xem: 11897 | Lượt tải: 1
Bạn đang xem nội dung tài liệu Bài giảng chương 2: Đại lượng ngẫu nhiên và quy luật phân phối xác suất, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Chương 2: Đại Lượng Ngẫu Nhiên Rời Rạc PGS-TS. Lê Anh Vũ
Tài Liệu Xác Suất Thống Kê II.1
CHÖÔNG 2
ÑAÏI LÖÔÏNG NGAÃU NHIEÂN VAØ
QUY LUAÄT PHAÂN PHOÁI XAÙC SUAÁT
Nội dung
Đại lượng ngẫu nhiên (ĐLNN) và phân loại cácĐLNN. Quy luật phân phối xác suất
(PPXS) của ĐLNN.
Bảng PPXS của ĐLNN rời rạc. Hàm PPXS của ĐLNN ( rời rạc hay liên tục). Hàm
mật độ xác suất của ĐLNN liên tục.
Các phép toán trên các ĐLNN. Hàm của đại lượng ngẫu nhiên rời rạc
Các đặc trưng số cơ bản của ĐLNN.
Các phân phối thông dụng: Nhị thức, Siêu bội, Poisson, Chuẩn.
Phương pháp tính xấp xỉ giữa các phân phối xác suất.
1. ÑAÏI LÖÔÏNG NGAÃU NHIEÂN - QUYLUAÄT PHAÂN PHOÁI
XAÙC SUAÁT CUÛA ÑAÏI LÖÔÏNG NGAÃU NHIEÂN
Ví duï 2.1.
Bảng dưới đây ghi kết quả khảo sát số xe máy hiện có ở 6.487 hộ gia đình tại Tp.
Hồ Chí Minh năm 2003.
Số xe máy (X) Số hộ (ni) Tần suất
0 27 0,004
1 1422 0,219
2 2865 0,442
3 1796 0,277
4 324 0,050
5 53 0,008
6487 1,000
Giả sử ta chọn ngẫu nhiên một hộ gia đình trong 6487 hộ trên, gọi X là số xe máy
của hộ đã chọn tại thời điểm khảo sát. Khi đó X là một đại lượng vì nó có thể nhận các
giá trị số (0, 1, …, 5); tuy nhiên ta không thể biết trước một cách chắc chắn giá trị của X
bằng bao nhiêu vì nó tùy thuộc vào hộ được chọn. Nói cách khác X có thể nhận một giá
trị ngẫu nhiên thuộc tập {0, 1, …, 5}. Ta bảo X là một đại lượng ngẫu nhiên.
Ví duï 2.2.
Một xạ thủ bắn một viên đạn trúng vào bia hình tròn bán kính 50cm. Gọi K là
khoảng cách ( đo bằng cm) từ tâm của bia đến điểm chạm của viên đạn vào bia. Khi đó T
cũng là một đại lượng ngẫu nhiên nhận giá trị thuộc tập [0, 50].
Chương 2: Đại Lượng Ngẫu Nhiên Rời Rạc PGS-TS. Lê Anh Vũ
Tài Liệu Xác Suất Thống Kê II.2
1.1. MOÂ TAÛ KHAÙI NIEÄM ÑAÏI LÖÔÏNG NGAÃU NHIEÂN – PHAÂN LOAÏI CAÙC
ÑAÏI LÖÔÏNG NGAÃU NHIEÂN
Đại lượng ngẫu nhiên (còn gọi là biến ngẫu nhiên) là một đại lượng (tức
là cân, đong, đo hoặc đếm được) mà có thể nhận giá trị bất kỳ thuộc một
tập hợp số xác định một cách ngẫu nhiên với xác suất nhất định. ĐLNN
thường được ký hiệu bởi các chữ X, Y, Z , … Còn các giá trị của ĐLNN
thường được ký hiệu bởi x, y, z, …
Trong ví dụ 2.1, đại lượng ngẫu nhiên X nhận giá trị một cách ngẫu nhiên thuộc
tập {0, 1, 2, 3, 4, 5}, ta viết X = {0, 1, 2, 3, 4, 5}. Khả năng (xác suất) để X nhận giá trị 3
là 27,7%. Trong ví dụ 2.2, đại lượng ngẫu nhiên K nhận giá trị một cách ngẫu nhiên
thuộc tập [0, 50cm]. Căn cứ vào tập giá trị của ĐLNN, ta phân chúng thành hai loại: rời
rạc và liên tục. Cụ thể, ta có phân loại dưới đây.
Đại lượng ngẫu nhiên rời rạc: Đó là ĐLNN mà tập các giá trị có thể có
của nó là một tập rời rạc, tức là có thể đánh số thành một dãy (hữu hạn hay
vô hạn).
Đại lượng ngẫu nhiên liên tục: Đó là ĐLNN mà tập các giá trị có thể có
của nó là một đoạn hay khoảng (hữu hạn hay vô hạn).
Nhận xét quan trọng
Cần phân biệt ĐLNN với BCNN. ĐLNN thì nhận giá trị này khác một cách ngẫu nhiên
nhưng không có xác suất, BCNN là một sự kiện có thể xẩy ra sau khi thực hiện phép thử
với xác suất xác định nhưng BCNN không có giá trị.
Tuy nhiên ĐLNN và BCNN có mối quan hệ khăng khít với nhau. Cụ thể, khi gán cho
mỗi ĐLNN một giá trị cụ thể hoặc một ràng buộc nào đó về giá trị, ta sẽ nhận được một
BCNN với xác suất xác định. Về mặt hình thức, có thể hình dung ĐLNN như là hàm của
BCNN trên không gian các biến cố sơ cấp
Trở lại ví dụ 2.1. Ta có (X=3) là một BCNN với P(X=3) = 0,277. Tương tự (X<3),
(X>3), (X≤3), (X≥3) cũng là những BCNN mà có thể dễ dàng tính xác suất của chúng
theo bảng số liệu đã cho.
Một cách tổng quát, với mỗi ĐLNN X tùy ý và x, y là hai số thực bất kỳ (x<y), (X<x),
(X=x), (X>x), (X≤x), (X≥x), (x<X<y), ... đều là các BC mà nói chung là ngẫu nhiên. Qua
xác suất của các BC này, ta sẽ biết được những giá trị nào hoặc những khoảng giá trị nào
X dễ nhận, những giá trị nào hay những khoảng giá trị nào X ít nhận hay không thể nhận.
Nói một cách khác, xác suất của những BC đó (khi cho x, y chạy khắp tập số thực) phản
ánh quy luật phân phối xác suất của X.
1.2. BAÛNG PHAÂN PHOÁI XAÙC SUAÁT CUÛA ÑLNN RÔØØI RAÏC
Đối với ĐLNN rời rạc, quy luật PPXS thường được cho bằng bảng.
Bảng phân phối xác suất: Đó là bảng liệt kê tất cả các giá trị có thể có
của đại lượng ngẫu nhiên rời rạc X cùng với xác suất để X nhận từng giá
trị đó.
X x1 x2 … xn … (nếu vô hạn)
XS tương ứng
P(X = xi)
p1 p2 … pn …
Chương 2: Đại Lượng Ngẫu Nhiên Rời Rạc PGS-TS. Lê Anh Vũ
Tính chất đặc trưng: Các xác suất tương ứng pi trong bảng PPXS có hai
tính chất đặc trưng sau đây.
(i) 0 ≤ pi ≤1;
(ii) 1p .
n
1i
i =∑=
Các tính chất khác
(i) P(a ≤ X < b) =
i
i
a x b
p
≤ <
∑ ;
(ii) P(a < X < b) =
i
i
a x b
p
< <
∑ .
Tương tự cho các BCNN với các dấu bất đẳng thức khác.
Ví duï 2.3.
Xét lại ví dụ 2.1. Chọn ngẫu nhiên một hộ, đặt X là số xe máy của hộ được chọn.
Khi đó X là ĐLNN có các giá trị là thuộc tập{ }0,1, 2,3, 4,5 .
Tìm quy luật PPXS của đại lượng ngẫu nhiên X (tức là lập bảng PPXS của X).
Tính xác suất để của BCNN (2<X<5).
Giải
Chúng ta sẽ tính xác suất tương ứng để X nhận từng các giá trị của nó. Bảng PPXS của X
như sau:
X 0 1 2 3 4 5
P(X=i) 0,004 0,219 0,442 0,277 0,050 0,008
P(2<X<5) = 0,277 + 0,050 = 0, 327.
Ví duï 2.4.
Một xạ thủ được phép bắn 3 viên đạn. Biết xác suất bắn trúng mục tiêu của mỗi viên
đạn đều 0,8. Gọi X là số viên đạn anh ta bắn trúng bia. Hãy lập bảng phân phối xác
suất của X.
Giải
Ta có X = {0, 1, 2, 3}. Ta cần tìm P(X = k), k = 0, 1, 2, 3.
Xem phép thử là bắn 1 viên đạn và A là biến cố viên đạn đó trúng mục tiêu. Ta có
P(A) = 0,8 không đổi ở mỗi lần bắn nên đây là một dãy 3 phép thử Bernoulli với p = 0,8 ;
q = 1 – p = 0,2. Áp dụng công thức Bernoulli, ta được
P(X = 0) = P3(0 ; 0,8) = 0,80.0,23 = 0,008 ; 03C
P(X = 1) = P3(1 ; 0,8) = 0,81.0,22 = 0,96 ; 13C
P(X = 2) = P3(2 ; 0,8) = 0,82.0,21 = 0,384 ; 23C
Tài Liệu Xác Suất Thống Kê II.3
Chương 2: Đại Lượng Ngẫu Nhiên Rời Rạc PGS-TS. Lê Anh Vũ
P(X = 3) = P3(3 ; 0,8) = 0,83.0,20 = 0,512. 03C
Vậy, bảng phân phối xác suất của X là
X 0 1 2 3
P 0,008 0,096 0,384 0,512
1.3. HAØM PHAÂN PHOÁI XAÙC SUAÁT CUÛA ÑLNN
Hàm phân phối xác suất của ĐLNN tùy ý X (rời rạc hay liên tục) là hàm
số F(x) xác định trên tập số thực bởi công thức sau
F(x) = P(X < x) , x ∈ . \
Tính chất : Hàm phân phối xác suất có các tính chất sau
(1) F(x) là hàm không giảm và liên tục trái;
(2) 0 ≤ F(x) ≤ 1, ∀ x ∈ ; \
(3) 0)(lim =−∞→ xFx
(4) ; 1)(lim =
+∞→
xF
x
(5) P(a ≤ X < b) = F(b) – F(a), với mọi a, b ∈ , a < b. \
(6) F(x) đặc trưng cho loại của ĐLNN X theo nghĩa sau
* F(x) gián đoạn khi và chỉ khi X rời rạc;
* F(x) liên tục trên \ khi và chỉ khi X liên tục.
Chú ý: Ba tính chất đầu đặc trưng cho hàm PPXS theo nghĩa sau đây: nếu F(x) là hàm số
xác định trên và có các tính chất (1), (2), (3) thì F(x) là hàm phân phối xác suất của
một đại lượng ngẫu nhiên nào đó. Hàm PPXS còn gọi là hàm tích lũy xác suất.
\
Nếu X là đại lượng ngẫu nhiên rời rạc hữu hạn có bảng phân phối xác suất như sau
X x1 x2 … xn
P p1 p2 … pn
( x1 < x2 < … < xn), thì hàm phân phối xác suất của X là
1
21
11 2 1
0
( ) ..........................................
....
1
n nn
n
x x
x x xp
F x
x x xp p p
x x
−−
≤⎧⎪ ⎪⎩
,neáu
,neáu
.............
,neáu
,neáu
1.4. HAØM MAÄT ÑOÄ XAÙC SUAÁT CUÛA ÑLNN LIEÂN TUÏC
Khác với bảng PPXS của ĐLNN rời rạc, hàm PPXS không cho ta biết rõ PPXS
của ĐLNN trong lân cận của bất kỳ điểm nào trên trục số. Hơn nữa, cần chú ý rằng nếu X
Tài Liệu Xác Suất Thống Kê II.4
Chương 2: Đại Lượng Ngẫu Nhiên Rời Rạc PGS-TS. Lê Anh Vũ
là ĐLNN liên tục thì P(X=x) = 0 với mọi số thực x. Ta sẽ dưa vào khái niệm hàm mật độ
xác suất cho ĐLNN liên tục.
Hàm mật độ xác suất của ĐLNN liên tục X là hàm f(x) định nghĩa như
sau
f(x): =
0
( )lim
x
P x X x x
xΔ → +
≤ ≤ + Δ
Δ = 0
( )lim
x
P x x X x
xΔ → +
− Δ ≤ ≤
Δ ;
Tất nhiên là trong giả thiết rằng cả hai giới hạn đó tồn tại hữu hạn. Nếu đại lượng
ngẫu nhiên liên tục X có hàm phân phối xác suất F(x) khả vi thì hàm mật độ XS chính là
đạo hàm của hàm PPXS: f(x) = F’(x), x∈ . \
Tính chất: Hàm mật độ xác suất có các tính chất sau
(1) f(x) ≥ 0, x ∈ \ ;
(2) ∫ ; +∞
∞−
= 1)( dxxf
Ngược lại , một hàm số f(x) có các tính chất (1), (2) phải là hàm mật độ xác suất
của một đại lượng ngẫu nhiên nào đó.
(3) P(a < X < b) = P(a ≤ X < b) = P(a < X ≤ b) = P(a ≤ X ≤ b) = ; ∫a
b
dxxf )(
(a,b ∈ , a < b) \
(4) F(x) = ∫ , x ∈ \ .
∞−
x
dttf )(
1.5. CAÙC PHEÙP TOAÙN TREÂN CAÙC ÑLNN – HAØM TREÂN ÑLNN
1.5.1. CAÙC PHEÙP TOAÙN TREÂN CAÙC ÑLNN
Để đơn giản, ta chỉ xét các ĐLNN rời rạc. Giả sử X và Y là các ĐLNN rời
rạc độc lập (tức là dù ĐL này nhận giá trị nào cũng không hề ảnh hưởng đến
PPXS của ĐL kia) có bảng phân phối xácsuất như sau
X x1 x2 … xm
P p1 p2 … pm
Y y1 y2 … yn
P p’1 p’2 … p’n
Khi đó X + Y là đại lượng ngẫu nhiên rời rạc có bảng phân phối xác suất là
X + Y z1 z2 … zs
P p”1 p”2 … p”s
Tài Liệu Xác Suất Thống Kê II.5
Chương 2: Đại Lượng Ngẫu Nhiên Rời Rạc PGS-TS. Lê Anh Vũ
Trong đó zk là các giá trị khác nhau của các tổng xi + yj và p’’k =
,
i j k
i j
x y
p p
z+ =
∑ .
Còn XY là đại lượng ngẫu nhiên rời rạc có bảng phân phối xác suất là
X Y z1 z2 … zs
P p”1 p”2 … P”s
Trong đó zk là các giá trị khác nhau của các tích xiyj và p’’k =
,
i j k
i j
x y
p p
z=
∑
1.5.2. HAØM TREÂN ÑLNN
Nếu ta có một hàm số ϕ được xác định trên tập tát cả các giá trị của đại
lượng ngẫu nhiên X thì Y = ϕ(X) trở thành một đại lượng ngẫu nhiên mới có cùng luật
PPXS với X. Giá trị của đại lượng ngẫu nhiên Y được xác địnhtheo giá trị của X thông
qua hàm ϕ.
Giả sử ta có quy luật phân phối xác suất của X như sau
X x1 x2 … xj … xn
P(X = xi) P1 P2 … Pj … Pn
Khi đó, , ta xác định các giá trị yi của Y=ϕ(X) bởi nixy ii ,1),( == ϕ
Y ϕ(x1) ϕ(x2) … ϕ(xj) … ϕ(xn)
P(Y = yi) p1 p2 … pj … pn
Chú ý nếu ϕ(xi)= ϕ(xj) thì ta đặt y*= ϕ(xi)= ϕ(xj) và cộng dồn xác suất của chúng lại:
p(Y = y*) = pi + pj.
Ví duï 2.5.
Cho hai đại lượng ngẫu nhiên X và Y có bảng phân phối xác suất lần lượt là
X 0 1 2 Y -1 1 2
P 0,2 0,3 0,5 P 0,4 0,3 0,3
Hãy lập bảng phân phối xác suất của các đại lượng X+Y, XY.
Giải
Đối với từng phép toán đã cho ta lập bảng ghi các giá trị và xác suất tương ứng.
a) Trường hợp X+Y
X
Y
0 1 2 X
Y
0,2 0,3 0,5
-1 -1 0 1 0,4 0,008 0,12 0,20
1 1 2 3 0,3 0,06 0,09 0,15
2 2 3 4 0,3 0,06 0,09 0,15
Bảng 1 Bảng 2
Tài Liệu Xác Suất Thống Kê II.6
Chương 2: Đại Lượng Ngẫu Nhiên Rời Rạc PGS-TS. Lê Anh Vũ
Tài Liệu Xác Suất Thống Kê II.7
1 và Bảng 2 suy ra
}
0,09 = 0,24 ,
(X+Y = 4) = 0,15.
Vậy, bảng i xá của X+Y là
Từ Bảng
X+Y = { ,2,1,0,1− ,4,3
P (X+Y = -1) = 0,08 ,
P (X+Y = 0) = 0,12 ,
P (X+Y = 1) = 0,20 + 0,06 = 0,26 ,
P (X+Y = 2) = 0,09 + 0,06 = 0,15 ,
P (X+Y = 3) = 0,15 +
P
phân phố c suất
X+Y -1 0 1 2 3 4
P 0,08 0,12 0,26 0,15 0,24 0,15
b) Trường XY
Ta chỉ cần lập lại bảng giá trị của tích XY tương tự như Bảng 1, nhưng kết
quả ở mỗi ô giữa trong bảng mới sẽ l
hợp
à tích các giá trị thuộc dòng 1 lần lượt với
các giá trị thuộc cột 1 (xem Bảng 3).
X 0 1 2
Y
-1 0 -1 -2
1 0 1 2
2 0 2 4
Bảng 3
ảng 2 suy ra
}
0,06 + 0,06 = 0,20 ,
0,09 = 0,24 ,
ậy, bảng phân phối xác suất của XY là
Từ Bảng 3 và B
XY = { ,0,1,2 −− ,4,2,1
P (XY = -2) = 0,20 ,
P (XY = -1) = 0,12 ,
P (XY = 0) = 0,08 +
P (XY = 1) = 0,09 ,
P (XY = 2) = 0,15 +
P (XY = 4) = 0,15.
V
XY -2 -1 0 1 2 3
P 0,20 0,12 0,20 0,09 0,24 0,15
Chương 2: Đại Lượng Ngẫu Nhiên Rời Rạc PGS-TS. Lê Anh Vũ
Lưu ý: Bảng 1 và Bảng 2 có thể ghi chung thành một bảng (xem Bảng A) ; Bảng 3 và
Bảng 2 có thể ghi chung thành một bảng (xem Bảng B). Trong hai bảng này, góc trái của
mỗi ô ghi giá trị, góc phải ghi xác suất tương ứng.
X
Y
0
0,2
1
0,3
2
0,5
X
Y
0 1 2
-1
0,4
-1
0,08
0
0,12
1
0,20
-1 0
0,08
-1
0,12
-2
0,20
1
0,3
1
0,06
2
0,09
3
0,15
1 0
0,06
1
0,09
2
0,15
2
0,3
2
0,06
3
0,09
4
0,12
2 0
0,06
2
0,09
4
0,15
Bảng A
Bảng B
2. CAÙC SOÁ ÑAËC TRÖNG CUÛA ÑAÏI LÖÔÏNG NGAÃU NHIEÂN
Ngoài bảng phân phối của ĐLNN rời rạc, hàm phân phối của ĐLNN tùy ý và hàm mật độ
của ĐLNN liên tục, chúng ta còn dùng vài con số để đặc trưng cho ĐLNN – đó là các số
đặc trưng về vị trí và độ phân tán của các giá trị và xác suất tương ứng của ĐLNN.
2.1. KYØ VOÏNG CUÛA ÑAÏI LÖÔÏNG NGAÃU NHIEÂN
Định nghĩa: Kỳ vọng của đại lượng ngẫu nhiên X là một số, ký hiệu là EX,
được xác định như sau:
Đối với ĐLNN rời rạc có giá trị xi và xác
suất tương ứng pi, i = 1, 2, 3, …
Đối với ĐLNN liên tục có hàm mật độ
f(x), x∈\
EX := i i
i
x p∑
Khi X vô hạn thì phải giả thiết rằng chuỗi
trên hội tụ
EX := ( )xf x dx
+∞
−∞
∫
Khi tập giá trị của X là khoảng vo hạn thì
phải giả thiết tích phân trên hội tụ
Ý nghĩa: Kỳ vọng của ĐLNN X là giá trị trung bình theo xác suất của X, tức
là giá trị trung bình của X khi mỗi giá trị của X được gắn với trọng số chính là
xác suất tương ứng của giá trị đó. EX sẽ trùng với trung bình cộng số
học
1
1 n
i
i
x
n =
∑ của các giá trị của X khi X rời rạc hữu hạn n giá trị và
1 2
1... np p p n
= = = = , tức là khi phân phối xác suất của X đều.
Tài Liệu Xác Suất Thống Kê II.8
Chương 2: Đại Lượng Ngẫu Nhiên Rời Rạc PGS-TS. Lê Anh Vũ
Ví dụ 2.6.
Công ty dịch vụ có 8 nhân viên. Bảng 2.3 thể hiện tiền lương hàng tuần của 8
nhân viên đó như sau:
Bảng 2.3
Lương xi (USD) Số nhân viên (ni) Tần suất
240 3 0,375
320 2 0,250
450 1 0,125
600 2 0,250
Σ 8 1,000
Chọn ngẫu nhiên một nhân viên của công ty. Đặt X là tiền lương của nhân viên
đó. Hãy lập bảng PPXS và tính kỳ vọng của đại lượng ngẫu nhiên X.
Giải
Ta có luật phân phối xác suất của X như sau:
X 240 320 450 600
Px 0,375 0,250 0,125 0,250
Do đó (USD)
1
: 376,25
n
i i
i
EX x p
=
= =∑
Giá trị trung bình cộng số học ở đây là 402,5 (USD). Rõ ràng kỳ vọng phản ánh
chính xác hơn tình hình lương của công ty. Tuy công ty có 4 mức lương nhưng lương
bình quân của 8 nhân viên không phải là 402,5 USD mà chỉ là 376,24USD.
Tính chất Với mọi ĐLNN X, Y và đại lượng hằng C, ta có:
(1) E(C) = C ;
(2) E(C.X) = C.E(X);
(3) E(X + Y) = E(X) + E(Y);
(4) E(X.Y) = E(X).E(Y) nếu X, Y độc lập.
2.2. PHÖONG SAI VAØ ÑOÄ LEÄCH CHUAÅN CUUA ÑAÏI LÖOÏNG
NGAÃU NHIEAN
Định nghĩa: Phương sai của đại lượng ngẫu nhiên X, ký hiệu là DX (hayVarX),
được xác định bởi biểu thức sau:
2 2: ( ) ( ) ( )DX E X EX E X EX= − = − 2 ≥ 0.
Còn độ lệch chuẩn của X, ký hiệu σX, được xác định bởi σX := DX ≥ 0.
Tài Liệu Xác Suất Thống Kê II.9
Chương 2: Đại Lượng Ngẫu Nhiên Rời Rạc PGS-TS. Lê Anh Vũ
Đối với ĐLNN rời rạc có giá trị xi và xác
suất tương ứng pi, i = 1, 2, 3, …
Đối với ĐLNN liên tục có hàm mật độ
f(x), x∈\
DX :=
2
2
i i i i
i i
x p x p⎛ ⎞− ⎜ ⎟⎝ ⎠∑ ∑ ;
σX := DX .
Khi X vô hạn thì phải giả thiết rằng các
chuỗi trên hội tụ
DX :=
2
2 ( ) ( )x f x dx xf x dx
+∞ +∞
−∞ −∞
⎛ ⎞− ⎜ ⎟⎝ ⎠∫ ∫
σX := DX .
Khi tập giá trị của X là khoảng vô hạn thì
phải giả thiết các tích phân trên hội tụ
Ý nghĩa: Phương sai và độ lệch chuẩn của X là số không âm dùng để đo mức độ
phân tán của các giá trị của X xung quanh trọng tâm EX của nó. DX còn gọi là độ
phân tán trung bình bình phương, σX còn gọi là độ phân tán trung bình. DX (σX)
càng nhỏ thì giá trị của X càng ít phân tán mà có độ tập trung xung quanh kỳ vọng
càng lớn. Ngược lại, DX (σX) càng lớn thì các giá trị của X càng ít tập trung mà phân
tán rộng. Độ lệch chuẩn hay dùng hơn phương sai vì nó cùng đơn vị với X.
Tính chất Với mọi ĐLNN X, Y và đại lượng hằng C, ta có
(1) D(C) = 0;
(2) DCX = C2.DX;
(3) D(X+Y) = DX + DY nếu X, Y độc lập.
Ví dụ 2.7.
Xét lại ví dụ 2.3. Tính phương sai và độ lệch chuẩn σX của X.
Giải
Ta có { với bảng phân phối như sau }600,450,320,240=X
X 240 320 450 600
Px 0,375 0,250 0,125 0,250
Theo ví dụ 2.3, ta đã tính được . Còn phương sai và độ lệch chuẩn
của X như sau:
1
376,25
n
i i
i
EX x p
=
= =∑
; 2 2 2 2 2240 .0,375 320 .0, 25 450 .0,125 600 .0, 25 376, 25 20.948, 44DX = + + + − =
2 0 .9 4 8 , 4 4 1 4 4 , 7 4D Xσ = = = .
2.3. MODE VAØ MEDIAN CUÛA ÑAÏI LÖÔÏNG NGAÃU NHIEÂN
Ngoài hai đặc trưng cơ bản là kỳ vọng và phương sai, người ta còn xét một vài
đặc trưng khác của ĐLNN như Mode, Median (trung vị), Moment, hệ số bất đối xứng,
hệ số chọn. Chúng giúp đặc trưng đầy đủ hơn các ĐLNN. Ở đây chúng ta chỉ giới thiệu
thêm hai đặc trưng là Mode và Median (trung vị).
Mode: Cho ĐLNN X. Nếu X rời rạc thì Mode của X, ký hiệu Mod(X), là giá trị mà
tại đó xác suất tương ứng lớn nhất. Nếu X liên tục với hàm mật độ XS là f(x) thì
Mode của X là giá trị mà tại đó f(x) đạt giá trị lớn nhất. Tất nhiên X có thể không có
hoặc có nhiều giá trị Mod(X).
Tài Liệu Xác Suất Thống Kê II.10
Chương 2: Đại Lượng Ngẫu Nhiên Rời Rạc PGS-TS. Lê Anh Vũ
Median(trung vị): Cho ĐLNN X. Median của X, ký hiệu μX hay Med(X), là giá trị
phân đôi khối lượng xác suất thành hai phần bằng nhau. Cụ thể, Med(X) được xác
định như sau:
( ( ))
( ( ))
P X Med X
P X Med X
≤⎩
0,5;
0,5.
Ở đó, F(x) là hàm PPXS của X.
Nếu X liên tục, tức là hàm PPXS F(x) liên tục thì hai hệ thức trên tương đương
với đẳng thức F(Med(X)) = 0,5. Nếu phương trình F(x) = 0,5 có nhiều nghiệm thì mọi
nghiệm đều là trung vị.
Nhận xét: Nếu phân phối XS của X có Mod(X) duy nhất và đối xứng (tức là đồ thị
hàm mật độ f(x) có trục đối xứng cùng phương với trục tung khi X liên tục hoặc là
các XS tương ứng của X đối xứng: pi = pn-i khi X rời rạc hữu hạn) thì cả 3 số đặc
trưng kỳ vọng EX, Mod(X) và Med(X) trùng nhau. Do đó khi PPXS của X là đối
xứng hoặc gần đối xứng thì chỉ cần dùng kỳ vọng là đủ để định vị trọng tâm cho các
giá trị của X. Còn nếu PPXS của X không đối xứng mà quá lệch thì dùng Med(X) và
Mod(X) để định vị sẽ là tốt hơn.
Ví dụ 2.8.
Một sinh viên thi ba môn Toán, Lý, Hóa với xác suất đậu lần lượt là 0,6 ; 0,7 ;
0,8. Gọi X là số môn anh ta đậu trong ba môn đó. Hãy lập bảng và hàm PPXS của X,
tính kỳ vọng phương sai, độ lệch chuẩn, Mode và Median của X.
Giải
Ta có X = ⎨0, 1, 2, 3⎬. Ta cần lập bảng PPXS của X, tức là tính P(X = k); k = 0, 1, 2, 3.
Gọi T, L, H lần lượt là các biến cố sinh viên đó đậu Toán, Lý, Hóa. Khi đó
P(X = 0) = P( T L H ) = 0,024,
P(X = 1) = P(T L H + T L H + T L H) = 0,188,
P(X = 2) = P(TL H + T L H + T LH) = 0,452,
P(X = 3) = P(TLH) = 0,336.
Vậy, bảng phân phối xác suất của X là
X 0 1 2 3
P 0,024 0,188 0,452 0,336
Từ đó, ta có hàm phân phối xác suất của X là
F(x) =
0
0,024
0,024 0,188 0, 212
0,024 0,188 0, 452 0,664
1
≤⎧⎪ < ≤⎪⎪ + = < ≤⎨⎪ + + = < ≤⎪⎪⎩
neáu x 0;
neáu 0 x 1;
neáu 1 x 2;
neáu 2 x 3;
neáu 3 < x.
Tài Liệu Xác Suất Thống Kê II.11
Chương 2: Đại Lượng Ngẫu Nhiên Rời Rạc PGS-TS. Lê Anh Vũ
Do đó EX = 0 . 0,024 + 1 . 0,188 + 2 . 0,452 + 3 . 0,336 = 2,1;
DX = EX2 – (EX)2 =
= 02. 0,024 + 12. 0,188 + 22. 0,452 + 32. 0,336 – 2,12 = 0,61;
σX = 0,61 = 0,7810; Mod(X) = 2; Med(X) = 2.
3. CÁC PHÂN PHỐI THÔNG DỤNG
3.1. PHAÂN PHOÁI NHÒ THÖÙC
3.1.1. ÑÒNH NGHÓA
Thực hiện dãy n ( 0< n ∈ ) phép thử Bernoulli và xác suất xẩy ra của biến cố A
ở mỗi lần thử là p ( 0 < p < 1). Gọi X là số lần A xẩy ra trong n lần thử. Khi đó X là
ĐLNN nhận giá trị thuộc {0,1, ..., n}. Ta nói X có phân phối nhị thức kiểu B(n; p), ký
hiệu X ~ B(n, p). Nói cách khác, ĐLNN rời rạc hữu hạn X có PP nhị thức kiểu B(n, p)
nếu X có bảng PPXS như sau:
`
X 0 1 ... n
P 0 0 (1 )nnC p p− 1 1 1(1 )nnC p p −−
… 0(1 )n nnC p p−
Tức là ( ) ( ; ) (1 )k k n kn nP X k P k p C p p