ĐLNN rời rạc là ĐLNN mà các giá trị nó có
thể nhận liệt kê được. Lúc này biến cố để X nhận
giá trị x ghi là (X = x). Xác suất của biến cố này được
ghi là P(X = x).
Ví dụ
(1) Tung con xúc sắc, gọi X là số chấm xuất hiện thì
X là một ĐLNN có thể nhận các giá trị 1, 2, 3, 4, 5,
6. Đây là một ĐLNN rời rạc. Ta có P(X=1) = 1/6.
(2) Mua một vé số 5.000đ của thành phố A, gọi X là
số tiền trúng số thì X là một ĐLNN rời rạc.
(3) Gọi X là số lần tung đồng xu cho đến khi được
mặt sấp thì X là ĐLNN rời rạc.(4) Chiều cao X (cm) của một sinh viên trong lớp
được chọn ngẫu nhiên có thể nhận giá trị là một số
thực trong khoảng [140; 220]. Các giá trị này không
liệt kê được. X không phải là ĐLNN rời rạc.
45 trang |
Chia sẻ: thanhle95 | Lượt xem: 313 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Bài giảng Lý thuyết xác suất và thống kê - Chương 2: Đại lượng ngẫu nhiên – Phân phối xác suất, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
CHƯƠNG 2
Đại lượng ngẫu nhiên – Phân phối XS
1. Đại lượng ngẫu nhiên rời rạc
1.1 Định nghĩa
Nếu mỗi kết quả của một phép thử ngẫu nhiên
được biểu thị bằng một giá trị số, ta có một đại
lượng ngẫu nhiên (ĐLNN).
Chính xác hơn, ĐLNN X là một hàm số xác
định trên không gian mẫu Ω sao cho mọi tập hợp có
dạng (X < x) = {ω∈Ω / X(ω) = x} đều là biến cố.
Ghi chú
(X x), (X = x) đều là biến cố.
ĐLNN rời rạc là ĐLNN mà các giá trị nó có
thể nhận liệt kê được. Lúc này biến cố để X nhận
giá trị x ghi là (X = x). Xác suất của biến cố này được
ghi là P(X = x).
Ví dụ
(1) Tung con xúc sắc, gọi X là số chấm xuất hiện thì
X là một ĐLNN có thể nhận các giá trị 1, 2, 3, 4, 5,
6. Đây là một ĐLNN rời rạc. Ta có P(X=1) = 1/6.
(2) Mua một vé số 5.000đ của thành phố A, gọi X là
số tiền trúng số thì X là một ĐLNN rời rạc.
(3) Gọi X là số lần tung đồng xu cho đến khi được
mặt sấp thì X là ĐLNN rời rạc.
(4) Chiều cao X (cm) của một sinh viên trong lớp
được chọn ngẫu nhiên có thể nhận giá trị là một số
thực trong khoảng [140; 220]. Các giá trị này không
liệt kê được. X không phải là ĐLNN rời rạc.
1.2 Bảng phân phối xác suất của ĐLNN rời rạc
Quy luật phân phối xác suất của ĐLNN rời rạc
được biểu thị dưới dạng bảng phân phối xác suất
(bảng PPXS):
X x1 x2 ... xn
P p1 p2 ... pn
Bảng phân phối ký hiệu là (xi, pi), i=1,n.
Ta phải có: pi > 0, i=1,n và p1 + p2 + ... + pn = 1.
Ví dụ
(1) Lô hàng gồm 6 chính phẩm và 4 phế phẩm. Lấy
ngẫu nhiên 2 sản phẩm. Gọi X là số chính phẩm.
Các giá trị có thể nhận của X là 0, 1, 2. Ta có:
p1 = P(X=0) =
2
4
2
10
C
C
=
2
15
p2 = P(X=1) =
1 1
4 6
2
10
C .C
C
=
8
15
p3 = P(X=2) = 1 – p1 – p2 =
5
15
Bảng phân phối của X:
(2) Xác suất trị khỏi bệnh của 1 viên thuốc là 90%.
Bệnh nhân uống từng viên, chưa hết bệnh thì uống
tiếp nhưng tối đa 3 viên. Gọi X là số viên thuốc bệnh
nhân uống. Lập bảng phân phối XS của X.
X 0 1 2
P 2/15 8/15 5/15
2. Các số đặc trưng của ĐLNN
2.1 Kỳ vọng
2.1.1 Định nghĩa
Để đánh giá giá trị trung bình của một ĐLNN,
ta tính kỳ vọng. Kỳ vọng của ĐLNN X ký hiệu là
E(X). Kỳ vọng của ĐLNN X có bảng phân phối
(xi, pi), i=1,n được định nghĩa:
E(X) =
n
i i
i 1
x p
=
∑
Excel
Nếu các giá trị xi, pi được ghi trong miền M1, M2 thì
E(X) =SUMPRODUCT(M1; M2) .
Ví dụ
(1) Một lớp có 50 sinh viên. Sau một kỳ thi, kết quả
điểm được thống kê như sau:
Điểm 3 4 5 6 7 8 9
Số SV 3 7 15 10 5 6 4
Gọi X là điểm của một sinh viên gặp ngẫu nhiên.
Bảng phân phối của ĐLNN X:
X 3 4 5 6 7 8 9
P
3
50
7
50
15
50
10
50
5
50
6
50
4
50
Điểm trung bình: E(X) = 5,82 (điểm)
(2) Một lô hàng gồm 15 chính phẩm và 3 thứ phẩm.
Chính phẩm được bán với giá 200.000đ còn thứ
phẩm bán với giá 150.000đ. Tính trung bình thì thu
được bao nhiêu tiền khi bán một sản phẩm?
(3) Tung con xúc sắc. Nếu xuất hiện mặt 1 hoặc mặt
2 hoặc mặt 3 thì thua 1đ, mặt 4 thì hoà, mặt 5 thì
thắng 1đ, mặt 6 thì thắng 2đ. Gọi X là số tiền thu
được sau mỗi lần chơi. Tính kỳ vọng của ĐLNN X.
(4) Xét ĐLNN X có bảng phân phối (xi, pi), i 1,m= .
Thực hiện phép thử n lần. Gọi ki là số lần X nhận
giá trị xi. Giá trị trung bình của X trong n phép thử:
X = 1 1 2 2 m m
k x k x ... k x
n
+ + +
= 1 2 m1 2 m
k k k
x x ... x
n n n
+ + + = 1 1 2 2 m mf x f x ... f x+ + +
Trong đó fi là tần suất của biến cố (X=xi) ( i 1,m= ).
Cho n→∞ thì fi → pi ( i 1,m= ) và do đó X → E(X).
Vậy khi n đủ lớn thì X ≈ E(X). Ta nói kỳ vọng của
một ĐLNN gần bằng với giá trị trung bình của một
quan sát của ĐLNN này.
2.1.2 Tính độc lập của ĐLNN rời rạc
Hai ĐLNN rời rạc X, Y gọi là độc lập nếu mỗi
biến cố (X = x) đều độc lập với mọi tổ hợp tích của
các biến cố có dạng (Y = yj).
Ví dụ
Gọi X là điểm thi môn Toán, Y là ngày sinh, U
là số ngày đi học môn toán của một sinh viên trong
lớp được chọn ngẫu nhiên thì X, Y là hai ĐLNN độc
lập. X, U là hai ĐLNN không độc lập.
2.1.3 Tính chất
(i) E(c) = c (c là ĐLNN hằng và bằng c)
(ii) E(cX) = cE(X)
(iii) E(X + Y) = E(X) + E(Y)
(iv) E(X.Y) = E(X).E(Y) nếu X, Y độc lập.
Ví dụ
(1) Một sinh viên sắp thi môn Toán và môn Kinh
tế. Khả năng đạt điểm như sau:
Điểm Toán 3 4 5 6 7 8 9 Điểm K.Tế 4 5 6 7 8 9
Khả năng (%) 5 10 15 20 25 15 10 Khả năng (%) 5 15 15 30 25 10
Dự kiến điểm trung bình hai môn của sinh viên
này là bao nhiêu?
Gọi X, Y là điểm thi môn Toán và môn Kinh tế. Cần
tính E( (X+Y)/2 ). Ta có:
E(X) = 6,35 E(Y) = 6,85
⇒ E( (X+Y)/2 ) = (E(X) + E(Y))/2 = 6,6 (điểm)
(2) Trong một tuần, một người có thể điểm tâm từ 5
cho đến 7 lần. Số tiền phải trả cho mỗi lần điểm
tâm thay đổi từ 20 ngàn đến 40 ngàn. Chi tiết cho
bởi bảng:
Số ngày 5 6 7 Số tiền 20 25 30 35 40
Khả năng (%) 25 60 15 Khả năng (%) 10 15 35 25 15
Được biết số ngày điểm tâm và chi phí cho mỗi
lần điểm tâm không phụ thuộc nhau. Trung bình mỗi
tuần người này chi bao nhiêu cho điểm tâm?
2.2 Phương sai
2.2.1 Phương sai của ĐLNN rời rạc
Độ lệnh của X so với E(X) là X – E(X). Tuy
nhiên, để tiện cho các phép tính vi tích, người ta xét
độ lệch bình phương [X – E(X)]2. Độ lệch bình phương
lớn thì độ lệch cũng lớn và ngược lại.
Để đánh giá mức độ phân tán các giá trị của
ĐLNN X quanh giá trị trung bình E(X), ta tính kỳ
vọng của độ lệch bình phương và gọi giá trị này là
phương sai:
var(X) = E([X − E(X)]2)
Trong thực tế, phương sai của ĐLNN X được
tính theo công thức:
var(X) = E(X2) − [E(X)]2
Để có cùng đơn vị đo với X, ta lấy căn của
phương sai và gọi giá trị này là độ lệch chuẩn:
σ(X) = Var(X)
Phương sai của ĐLNN X có bảng phân phối
(xi, pi), i=1,n được tính theo công thức:
var(X) =
2
n n
2
i i i i
i 1 i 1
x p x p
= =
−
∑ ∑
Ví dụ
Lấy ngẫu nhiên 100 gói mì ăn liền nhãn hiệu A
và 100 gói mì nhãn hiệu B rồi đem cân, ta có bảng:
Cân nặng (g) 82 83 84 85 86 87
Số gói mì A 10 20 10 30 20 10
Số gói mì B 18 6 16 31 16 13
Nên mua mì ăn liền nhãn hiệu nào?
Gọi X (Y) là trọng lượng một gói mì nhãn hiệu A (B)
được chọn ngẫu nhiên. Ta có bảng PPXS của ĐLNN
X và X2:
X2 6.724 6.889 7.056 7.225 7.396 7.569
X 82 83 84 85 86 87
P 10% 20% 10% 30% 20% 10%
E(X) = 84,6 E(X2) = 7159,4
var(X) = E(X2) − [E(X)]2 ≈ 2,24
Bảng phân phối của ĐLNN Y và Y2:
Y2 6.724 6.889 7.056 7.225 7.396 7.569
Y 82 83 84 85 86 87
p 18% 6% 16% 31% 16% 13%
E(Y) = 84,6 E(Y2) = 7159,7
⇒ var(Y) = E(Y2) − [E(Y)]2 ≈ 2,54
Trọng lượng trung bình của một gói mì của cả 2
nhãn hiệu đều là 84,6g. Tuy nhiên var(X) < var(Y)
nên gói mì nhãn hiệu A có trọng lượng ổn định hơn.
Nên mua mì ăn liền nhãn hiệu A.
2.2.2 Tính chất
(i) var(c) = 0 (c là ĐLNN hằng và bằng c)
(ii) var(cX) = c2.var(X)
(iii) var(X ± Y) = var(X) + var(Y) X, Y độc lập
(iv) var(X + c) = var(X)
Ví dụ
(1) Xét X, Y là hai ĐLNN độc lập. Biết var(X) = 4,
var(Y) = 1. Hãy tính σ(2X – 3Y + 1).
Theo tính chất của phương sai:
var(2X – 3Y + 1) = 4var(X) + 9var(Y) = 25
⇒ σ(2X – 3Y + 1) = 25 = 5
(2) Trò chơi A: Tung con xúc sắc. Nếu xuất hiện mặt
1 hoặc mặt 2 hoặc mặt 3 thì thua 1đ, mặt 4 thì hoà,
mặt 5 thì thắng 1đ, mặt 6 thì thắng 2đ.
Trò chơi B: Tung con xúc sắc. Nếu xuất hiện mặt
chẳn thì thì thắng 2đ, mặt lẻ thì thua 2đ.
Cách chơi I: Chơi 2 ván theo trò chơi A và 3 ván
theo trò chơi B.
Cách chơi II: Chơi 3 ván theo trò chơi A và 2
ván theo trò chơi B.
Tính kỳ vọng và phương sai của số tiền thắng
cuộc khi chơi theo cách I, cách II. Các cách chơi này
có công bằng? Cách chơi nào có tính đỏ đen hơn?
2.3 Giá trị tin chắc nhất của ĐLNN rời rạc
Xét X là ĐLNN rời rạc. Nếu phải dự đoán giá trị
của X thì ta sẽ chọn giá trị xo sao cho biến cố (X = xo)
có nhiều khả năng xảy ra nhất. xo gọi là giá trị tin
chắc nhất của ĐLNN X, ký hiệu Mod(X).
Do
x
maxP(X x)= có thể đạt tại nhiều giá trị x
nên Mod(X) không chắc duy nhất.
Ví dụ
(1) X là số nút khi tung xúc xắc thì Mod(X) là giá
trị 1 hay 2 ... hay 6.
(2) ĐLNN X có bảng phân phối sau có Mod(X) = 85:
X 82 83 84 85 86 87
p 10% 20% 10% 30% 20% 10%
2.4 Trung vị của ĐLNN rời rạc
Xét hai dãy số:
A: 1, 1, 5, 7, 8 B: 3, 3, 4, 6, 6, 9
Giá trị nằm giữa dãy số, gọi là trung vị, bằng
bao nhiêu?
Đối với dãy A, trung vị là 5. Đối với B, có hai
giá trị nằm giữa là 4 và 6. Ta lấy trung bình của hai
giá trị này là 5 làm trung vị.
Excel
Trung vị của dãy số ghi trong miền D là =MEDIAN(D).
Để tính trung vị của ĐLNN X có bảng phân phối
(xi, pi), i=1,n, ta đưa các số pi về dạng các phân số
có chung mẫu số là i
m
n
. Thành lập dãy số bằng cách
lặp lại mi lần giá trị xi và sắp thứ tự. Trung vị của
dãy số này gọi là trung vị của ĐLNN X, ký hiệu
Med(X).
Med(X) thoả tính chất:
P(X ≤ Med(X)) ≥
1
2
và P(X ≥ Med(X)) ≥
1
2
Ví dụ
Xét ĐLNN X:
Ta có:
0,25 =
5
20
0,1 =
2
20
0,4 =
8
20
Dãy số tương ứng:
01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20
2 2 2 2 2 3 3 3 3 3 4 4 5 5 5 5 5 5 5 5
⇒ Med(X) = 3,5
X 2 3 4 5
P 0,25 0,25 0,1 0,4
3. Đại lượng ngẫu nhiên liên tục
Nếu các giá trị mà ĐLNN có thể nhận không
liệt kê được thì ĐLNN được gọi là liên tục.
Đối với ĐLNN X liên tục, các biến cố đáng quan
tâm có dạng (X a), (a a),
(X < a) ...
Trọng lượng một con gia súc chọn ngẫu nhiên
trong chuồng, nhiệt độ trong phòng vào một thời
điểm chọn ngẫu nhiên là các ví dụ về ĐLNN liên
tục.
3.1 Hàm phân phối XS và hàm mật độ XS
3.1.1 Hàm phân phối xác suất
Quy luật phân phối xác suất của ĐLNN liên tục
được xác định bởi hàm phân phối xác suất (hàm
PPXS). Hàm PPXS F của ĐLNN X được định nghĩa:
F(x) = P(X < x)
Hàm PPXS còn gọi là hàm tích luỹ xác suất.
Hàm PPXS F của một ĐLNN phải thỏa:
* F(x) ∈ [0, 1]
* F là hàm tăng.
*
x
lim F(x) 0
→−∞
= và
x
lim F(x) 1
→+∞
=
Nếu X là ĐLNN có hàm PPXS liên tục thì:
(i) P(X=x) = 0
(ii) P(a < x < b) = F(b) – F(a)
Ví dụ
(1) Cho F(x) =
cx
khi x 0
x 1
0 khi x 0
≥
+
<
Tìm c để F liên tục và là hàm PPXS của một
ĐLNN X. Tính P(X < 1), P(X=1), P(1 < X ≤ 2).
Do phải có
x
lim F(x) 1
→+∞
= nên c = 1. Với giá trị c này
thì F liên tục. Vậy:
P(X < 1) = F(1) = 1/2 P(X=1) = 0
P(1 < X ≤ 2) = F(2) – F(1) = 1/6
(2) Từ bảng phân phối (xi, pi), i=1,n của một ĐLNN
rời rạc, ta có thể thành lập hàm phân phối cho
ĐLNN này bằng cách đặt:
i i
i i
x x i/ x x
F(x) P(X x ) p
< <
= = =∑ ∑
Chẳng hạn xét ĐLNN có bảng PPXS:
X 1 3 4 7
p 0,2 0,3 0,4 0,1
0 khi x < 1
0,2 khi 1 x < 3
F(x) 0,5 khi 3 x 4
0,9 khi 4 x 7
1 khi x 7
≤
= ≤ <
≤ <
≥
3.1.2 Hàm mật độ xác suất
Xét ĐLNN X liên tục có hàm phân phối F. Nếu
F có đạo hàm thì hàm f = F′ được gọi là hàm mật
độ xác suất (hàm MĐXS) của ĐLNN X.
Theo định nghĩa:
P(X < x) = F(x) =
x
f(t)dt
−∞∫
Trong thực tế, các ĐLNN liên tục đáng quan
tâm đều được định nghĩa thông qua hàm mật độ.
Theo tính chất của hàm phân phối, hàm MĐXS f
phải thoả các tính chất:
* f(x) ≥ 0
* f (x)dx
∞
−∞∫
+
= 1
Hàm mật độ còn có các tính chất sau:
(i) P(a < X < b) =
b
a
f (t)dt∫
(ii) P(x–∆x < X < x+∆x) ≈ f(x).2∆x
(f liên tục, ∆x dương và đủ nhỏ)
Tính chất (ii) cho thấy giá trị của f(x) là thước
đo mức độ tập trung giá trị của X quanh x.
Ví dụ
Tìm c để hàm f(x) = c
2x /2e− là hàm mật độ.
f là hàm mật độ thì phải có f(x) ≥ 0 và f (x)dx
∞
−∞∫
+
= 1.
Ta đã biết
2x /2e dx 2
∞ −
−∞
= pi∫
+
. Vậy phải có c = 1 / 2pi .
3.2 Phân phối Chuẩn
3.2.1 Phân phối Chuẩn chuẩn tắc, hàm Laplace
Hàm Gauss ϕ(z) =
2z /21 e
2
−
pi
là hàm mật độ của
một ĐLNN liên tục có tên là phân phối Chuẩn
chuẩn tắc, ký hiệu Z ~ N(0; 1).
Ta có:
P(Z < z) =
2z x /21 e dx
2
−
−∞pi
∫
=
2 20 zx /2 x /2
0
1 1
e dx e dx
2 2
− −
−∞
+
pi pi
∫ ∫
= 0,5 +
2z x /2
0
1
e dx
2
−
pi
∫
Giá trị của tích phân sau cùng phụ thuộc vào z.
Hàm Φ theo biến z này có tên là hàm Laplace:
2z x /2
0
1
(z) e dx
2
−Φ =
pi
∫ =NORMSDIST(z) – 0.5
Việc tính giá trị Φ(z) bằng cách tính nguyên
hàm là không thực hiện được. Người ta dùng phương
pháp khác để tính Φ(z) theo z, với bước nhảy 0,01,
và ghi thành Bảng kê số hàm Laplace.
Với lưu ý Φ(–z) = –Φ(z) và Φ(z) ≈ 0,5 khi z ≥ 4,
dùng bảng kê số ta có thể tính các giá trị sau:
* P(Z z) = 0,5 – Φ(z)
* P(a < Z < b) = Φ(b) – Φ(a)
* P(Z < a) = 2Φ(a)
Ngoài ra do Φ là hàm tăng nên:
* Φ(a) = Φ(b) ⇔ a = b
* Φ(a) > Φ(b) ⇔ a > b
Ví dụ
(1) P(Z > 2) = 0,5 – Φ(2)
Tra bảng kê số hàm Laplace để tìm Φ(2):
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
⇒ P(Z > 2) = 0,5 – 0,4772 = 0,0228
(2) P(–2 < Z < 1,91) = Φ(1,91) – Φ(–2) = Φ(1,91) + Φ(2)
= 0,4719 + 0,4772 = 0,9491
3.2.2 Phân vị mức α
Xét Z ~ N(0; 1) và một số α∈(0; 0,5). Phân vị
mức α của phân phối Chuẩn chuẩn tắc là giá trị zα
sao cho P(Z > zα) = α.
Ta có:
P(Z > zα) = α ⇒ 0,5 – Φ(zα) = α ⇒ Φ(zα) = 0,5 – α
Vậy:
zα = Φ
–1(0,5 – α) =NORMSINV(1–α)
Ta cũng có bảng kê số để tìm zα theo α.
Khi dùng bảng kê số hàm Laplace, nếu tra thấy
giá trị 0,5–α của Φ thì giá trị z tương ứng là zα.
Trường hợp trên bảng không tìm thấy giá trị
cần tra thì lấy hai giá trị nhỏ hơn, lớn hơn và gần
giá trị cần tra nhất rồi dùng quy tắc nội suy.
Ghi chú
Tổng quát hoá, giá trị m sao cho P(X > m) = α được
gọi là phân vị mức α của ĐLNN X.
3.2.3 Phân phối Chuẩn
Xét Z ~ N(0; 1). Đặt X = σZ + µ với σ và µ là hai
tham số dương thì X là một ĐLNN liên tục có tên là
phân phối Chuẩn, ký hiệu X ~ N(µ, σ2). Hàm MĐXS:
f(x) =
2
1 x
exp / 2
2
− µ − σ σ pi
Do X ~ N(µ, σ2) thì Z =
X − µ
σ
~ N(0, 1) nên:
* P(X < x) = 0,5 + Φ(
x − µ
σ
) =NORMDIST(x; µ; σ; 1)
* P(a < X < b) = Φ(
b − µ
σ
) – Φ(
a − µ
σ
)
=NORMDIST(b; µ; σ; 1) – NORMDIST(a; µ; σ; 1)
* P(X − µ < ε) = 2Φ(ε/σ) =2*NORMSDIST(ε/σ) − 1
Ví dụ
Cho X ~ N(450; 225) thì:
P(X ≥ 420) = 0,5 – Φ(
420 450
225
−
) = 0,5 – Φ(–2)
= 0,5 + Φ(2) ≈ 97,725%
=1–NORMDIST(420; 450; 225^0,5; 1)
P(X – 450 < 12) = 2Φ(
12
225
) = 2Φ(0,8) ≈ 57,63%
=2*NORMSDIST(0,8)−1
3.3 Các số đặc trưng của ĐLNN liên tục
Xét X là ĐLNN có hàm mật độ f.
3.3.1 Kỳ vọng, phương sai, độ lệch chuẩn
E(X) xf(x)dx
∞
−∞
= ∫
+
2
2Var(X) x f(x)dx xf(x)dx
∞ ∞
−∞ −∞
= − ∫ ∫
+ +
σ(X) = Var(X)
Các tính chất của kỳ vọng và phương sai của
ĐLNN rời rạc cũng đúng cho ĐLNN liên tục. Lưu ý
định nghĩa ĐLNN liên tục X, Y độc lập nếu mỗi biến
cố (X < x) đều độc lập với mọi tổ hợp tích của các
biến cố có dạng (Y < yj).
Ví dụ
(1) Xét Z ~ N(0; 1).
E(Z) =
2x /2xe dx
+∞ −
−∞∫ = 0
var(Z) =
22 x /2x e dx
+∞ −
−∞∫ –
2
2
x /2xe dx
+∞ −
−∞
∫
=
22 x /2x e dx
+∞ −
−∞∫ = 1
Xét X ~ N(µ; σ2). Do X = σZ + µ nên:
E(X) = µ var(X) = σ2 σ(X) = σ
Vậy hai tham số µ và σ2 của N(µ; σ2) chính là kỳ
vọng và phương sai.
(2) Xét X ~ N(µ; σ2)
P(X – µ < 3σ) = 2Φ(3σ/σ) = 2Φ(3) ≈ 99,73%
=2*NORMSDIST(3)–1
Vậy, gần như tất cả các giá trị của N(µ; σ2) đều tập
trung quanh giá trị trung bình với khoảng cách bằng
3 lần độ lệch chuẩn.
3.3.2 Giá trị tin chắc nhất, trung vị
Theo ý nghĩa của hàm mật độ, giá trị tin chắc
nhất Mod(X) là giá trị xo sao cho f(xo) =
x
max f (x)
Do P(X ≤ Med(X)) ≥
1
2
và P(X ≥ Med(X)) ≥
1
2
nên
trung vị Med(X) được định nghĩa là giá trị m sao cho:
m
f (x)dx 1/2
−∞
=∫
Ví dụ
Xét X ~ N(µ; σ2). Ta có Mod(X) = µ
3.3.3 Hệ số bất đối xứng, hệ số nhọn
Để đo mức độ bất đối xứng của đồ thị hàm mật
độ qua trục E(X), ta tính hệ số bất đối xứng Ske(X):
Ske(X) =
3
3
E([X E(X)] )−
σ
Xét trục E(X). Đồ thị của hàm mật độ đối xứng
thì Ske(X) = 0. Khi Ske(X) < 0, X có xu hướng nhỏ hơn
E(X). Khi Ske(X) > 0, X có xu hướng lớn hơn E(X).
Để đo độ nhọn của đồ thị hàm mật độ gần giá
trị E(X), ta tính hệ số nhọn Kur(X):
Kur(X) =
4
4
E([X E(X)] )−
σ
Kur(X) càng lớn thì đồ thị quanh E(X) càng
nhọn, xu hướng X bằng E(X) càng cao.