Bài giảng Lý thuyết xác suất và thống kê - Chương 2: Đại lượng ngẫu nhiên – Phân phối xác suất

ĐLNN rời rạc là ĐLNN mà các giá trị nó có thể nhận liệt kê được. Lúc này biến cố để X nhận giá trị x ghi là (X = x). Xác suất của biến cố này được ghi là P(X = x). Ví dụ (1) Tung con xúc sắc, gọi X là số chấm xuất hiện thì X là một ĐLNN có thể nhận các giá trị 1, 2, 3, 4, 5, 6. Đây là một ĐLNN rời rạc. Ta có P(X=1) = 1/6. (2) Mua một vé số 5.000đ của thành phố A, gọi X là số tiền trúng số thì X là một ĐLNN rời rạc. (3) Gọi X là số lần tung đồng xu cho đến khi được mặt sấp thì X là ĐLNN rời rạc.(4) Chiều cao X (cm) của một sinh viên trong lớp được chọn ngẫu nhiên có thể nhận giá trị là một số thực trong khoảng [140; 220]. Các giá trị này không liệt kê được. X không phải là ĐLNN rời rạc.

pdf45 trang | Chia sẻ: thanhle95 | Lượt xem: 313 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Bài giảng Lý thuyết xác suất và thống kê - Chương 2: Đại lượng ngẫu nhiên – Phân phối xác suất, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
CHƯƠNG 2 Đại lượng ngẫu nhiên – Phân phối XS 1. Đại lượng ngẫu nhiên rời rạc 1.1 Định nghĩa Nếu mỗi kết quả của một phép thử ngẫu nhiên được biểu thị bằng một giá trị số, ta có một đại lượng ngẫu nhiên (ĐLNN). Chính xác hơn, ĐLNN X là một hàm số xác định trên không gian mẫu Ω sao cho mọi tập hợp có dạng (X < x) = {ω∈Ω / X(ω) = x} đều là biến cố. Ghi chú (X x), (X = x) đều là biến cố. ĐLNN rời rạc là ĐLNN mà các giá trị nó có thể nhận liệt kê được. Lúc này biến cố để X nhận giá trị x ghi là (X = x). Xác suất của biến cố này được ghi là P(X = x). Ví dụ (1) Tung con xúc sắc, gọi X là số chấm xuất hiện thì X là một ĐLNN có thể nhận các giá trị 1, 2, 3, 4, 5, 6. Đây là một ĐLNN rời rạc. Ta có P(X=1) = 1/6. (2) Mua một vé số 5.000đ của thành phố A, gọi X là số tiền trúng số thì X là một ĐLNN rời rạc. (3) Gọi X là số lần tung đồng xu cho đến khi được mặt sấp thì X là ĐLNN rời rạc. (4) Chiều cao X (cm) của một sinh viên trong lớp được chọn ngẫu nhiên có thể nhận giá trị là một số thực trong khoảng [140; 220]. Các giá trị này không liệt kê được. X không phải là ĐLNN rời rạc. 1.2 Bảng phân phối xác suất của ĐLNN rời rạc Quy luật phân phối xác suất của ĐLNN rời rạc được biểu thị dưới dạng bảng phân phối xác suất (bảng PPXS): X x1 x2 ... xn P p1 p2 ... pn Bảng phân phối ký hiệu là (xi, pi), i=1,n. Ta phải có: pi > 0, i=1,n và p1 + p2 + ... + pn = 1. Ví dụ (1) Lô hàng gồm 6 chính phẩm và 4 phế phẩm. Lấy ngẫu nhiên 2 sản phẩm. Gọi X là số chính phẩm. Các giá trị có thể nhận của X là 0, 1, 2. Ta có: p1 = P(X=0) = 2 4 2 10 C C = 2 15 p2 = P(X=1) = 1 1 4 6 2 10 C .C C = 8 15 p3 = P(X=2) = 1 – p1 – p2 = 5 15 Bảng phân phối của X: (2) Xác suất trị khỏi bệnh của 1 viên thuốc là 90%. Bệnh nhân uống từng viên, chưa hết bệnh thì uống tiếp nhưng tối đa 3 viên. Gọi X là số viên thuốc bệnh nhân uống. Lập bảng phân phối XS của X. X 0 1 2 P 2/15 8/15 5/15 2. Các số đặc trưng của ĐLNN 2.1 Kỳ vọng 2.1.1 Định nghĩa Để đánh giá giá trị trung bình của một ĐLNN, ta tính kỳ vọng. Kỳ vọng của ĐLNN X ký hiệu là E(X). Kỳ vọng của ĐLNN X có bảng phân phối (xi, pi), i=1,n được định nghĩa: E(X) = n i i i 1 x p = ∑ Excel Nếu các giá trị xi, pi được ghi trong miền M1, M2 thì E(X) =SUMPRODUCT(M1; M2) . Ví dụ (1) Một lớp có 50 sinh viên. Sau một kỳ thi, kết quả điểm được thống kê như sau: Điểm 3 4 5 6 7 8 9 Số SV 3 7 15 10 5 6 4 Gọi X là điểm của một sinh viên gặp ngẫu nhiên. Bảng phân phối của ĐLNN X: X 3 4 5 6 7 8 9 P 3 50 7 50 15 50 10 50 5 50 6 50 4 50 Điểm trung bình: E(X) = 5,82 (điểm) (2) Một lô hàng gồm 15 chính phẩm và 3 thứ phẩm. Chính phẩm được bán với giá 200.000đ còn thứ phẩm bán với giá 150.000đ. Tính trung bình thì thu được bao nhiêu tiền khi bán một sản phẩm? (3) Tung con xúc sắc. Nếu xuất hiện mặt 1 hoặc mặt 2 hoặc mặt 3 thì thua 1đ, mặt 4 thì hoà, mặt 5 thì thắng 1đ, mặt 6 thì thắng 2đ. Gọi X là số tiền thu được sau mỗi lần chơi. Tính kỳ vọng của ĐLNN X. (4) Xét ĐLNN X có bảng phân phối (xi, pi), i 1,m= . Thực hiện phép thử n lần. Gọi ki là số lần X nhận giá trị xi. Giá trị trung bình của X trong n phép thử: X = 1 1 2 2 m m k x k x ... k x n + + + = 1 2 m1 2 m k k k x x ... x n n n + + + = 1 1 2 2 m mf x f x ... f x+ + + Trong đó fi là tần suất của biến cố (X=xi) ( i 1,m= ). Cho n→∞ thì fi → pi ( i 1,m= ) và do đó X → E(X). Vậy khi n đủ lớn thì X ≈ E(X). Ta nói kỳ vọng của một ĐLNN gần bằng với giá trị trung bình của một quan sát của ĐLNN này. 2.1.2 Tính độc lập của ĐLNN rời rạc Hai ĐLNN rời rạc X, Y gọi là độc lập nếu mỗi biến cố (X = x) đều độc lập với mọi tổ hợp tích của các biến cố có dạng (Y = yj). Ví dụ Gọi X là điểm thi môn Toán, Y là ngày sinh, U là số ngày đi học môn toán của một sinh viên trong lớp được chọn ngẫu nhiên thì X, Y là hai ĐLNN độc lập. X, U là hai ĐLNN không độc lập. 2.1.3 Tính chất (i) E(c) = c (c là ĐLNN hằng và bằng c) (ii) E(cX) = cE(X) (iii) E(X + Y) = E(X) + E(Y) (iv) E(X.Y) = E(X).E(Y) nếu X, Y độc lập. Ví dụ (1) Một sinh viên sắp thi môn Toán và môn Kinh tế. Khả năng đạt điểm như sau: Điểm Toán 3 4 5 6 7 8 9 Điểm K.Tế 4 5 6 7 8 9 Khả năng (%) 5 10 15 20 25 15 10 Khả năng (%) 5 15 15 30 25 10 Dự kiến điểm trung bình hai môn của sinh viên này là bao nhiêu? Gọi X, Y là điểm thi môn Toán và môn Kinh tế. Cần tính E( (X+Y)/2 ). Ta có: E(X) = 6,35 E(Y) = 6,85 ⇒ E( (X+Y)/2 ) = (E(X) + E(Y))/2 = 6,6 (điểm) (2) Trong một tuần, một người có thể điểm tâm từ 5 cho đến 7 lần. Số tiền phải trả cho mỗi lần điểm tâm thay đổi từ 20 ngàn đến 40 ngàn. Chi tiết cho bởi bảng: Số ngày 5 6 7 Số tiền 20 25 30 35 40 Khả năng (%) 25 60 15 Khả năng (%) 10 15 35 25 15 Được biết số ngày điểm tâm và chi phí cho mỗi lần điểm tâm không phụ thuộc nhau. Trung bình mỗi tuần người này chi bao nhiêu cho điểm tâm? 2.2 Phương sai 2.2.1 Phương sai của ĐLNN rời rạc Độ lệnh của X so với E(X) là X – E(X). Tuy nhiên, để tiện cho các phép tính vi tích, người ta xét độ lệch bình phương [X – E(X)]2. Độ lệch bình phương lớn thì độ lệch cũng lớn và ngược lại. Để đánh giá mức độ phân tán các giá trị của ĐLNN X quanh giá trị trung bình E(X), ta tính kỳ vọng của độ lệch bình phương và gọi giá trị này là phương sai: var(X) = E([X − E(X)]2) Trong thực tế, phương sai của ĐLNN X được tính theo công thức: var(X) = E(X2) − [E(X)]2 Để có cùng đơn vị đo với X, ta lấy căn của phương sai và gọi giá trị này là độ lệch chuẩn: σ(X) = Var(X) Phương sai của ĐLNN X có bảng phân phối (xi, pi), i=1,n được tính theo công thức: var(X) = 2 n n 2 i i i i i 1 i 1 x p x p = =   −      ∑ ∑ Ví dụ Lấy ngẫu nhiên 100 gói mì ăn liền nhãn hiệu A và 100 gói mì nhãn hiệu B rồi đem cân, ta có bảng: Cân nặng (g) 82 83 84 85 86 87 Số gói mì A 10 20 10 30 20 10 Số gói mì B 18 6 16 31 16 13 Nên mua mì ăn liền nhãn hiệu nào? Gọi X (Y) là trọng lượng một gói mì nhãn hiệu A (B) được chọn ngẫu nhiên. Ta có bảng PPXS của ĐLNN X và X2: X2 6.724 6.889 7.056 7.225 7.396 7.569 X 82 83 84 85 86 87 P 10% 20% 10% 30% 20% 10% E(X) = 84,6 E(X2) = 7159,4 var(X) = E(X2) − [E(X)]2 ≈ 2,24 Bảng phân phối của ĐLNN Y và Y2: Y2 6.724 6.889 7.056 7.225 7.396 7.569 Y 82 83 84 85 86 87 p 18% 6% 16% 31% 16% 13% E(Y) = 84,6 E(Y2) = 7159,7 ⇒ var(Y) = E(Y2) − [E(Y)]2 ≈ 2,54 Trọng lượng trung bình của một gói mì của cả 2 nhãn hiệu đều là 84,6g. Tuy nhiên var(X) < var(Y) nên gói mì nhãn hiệu A có trọng lượng ổn định hơn. Nên mua mì ăn liền nhãn hiệu A. 2.2.2 Tính chất (i) var(c) = 0 (c là ĐLNN hằng và bằng c) (ii) var(cX) = c2.var(X) (iii) var(X ± Y) = var(X) + var(Y) X, Y độc lập (iv) var(X + c) = var(X) Ví dụ (1) Xét X, Y là hai ĐLNN độc lập. Biết var(X) = 4, var(Y) = 1. Hãy tính σ(2X – 3Y + 1). Theo tính chất của phương sai: var(2X – 3Y + 1) = 4var(X) + 9var(Y) = 25 ⇒ σ(2X – 3Y + 1) = 25 = 5 (2) Trò chơi A: Tung con xúc sắc. Nếu xuất hiện mặt 1 hoặc mặt 2 hoặc mặt 3 thì thua 1đ, mặt 4 thì hoà, mặt 5 thì thắng 1đ, mặt 6 thì thắng 2đ. Trò chơi B: Tung con xúc sắc. Nếu xuất hiện mặt chẳn thì thì thắng 2đ, mặt lẻ thì thua 2đ. Cách chơi I: Chơi 2 ván theo trò chơi A và 3 ván theo trò chơi B. Cách chơi II: Chơi 3 ván theo trò chơi A và 2 ván theo trò chơi B. Tính kỳ vọng và phương sai của số tiền thắng cuộc khi chơi theo cách I, cách II. Các cách chơi này có công bằng? Cách chơi nào có tính đỏ đen hơn? 2.3 Giá trị tin chắc nhất của ĐLNN rời rạc Xét X là ĐLNN rời rạc. Nếu phải dự đoán giá trị của X thì ta sẽ chọn giá trị xo sao cho biến cố (X = xo) có nhiều khả năng xảy ra nhất. xo gọi là giá trị tin chắc nhất của ĐLNN X, ký hiệu Mod(X). Do x maxP(X x)= có thể đạt tại nhiều giá trị x nên Mod(X) không chắc duy nhất. Ví dụ (1) X là số nút khi tung xúc xắc thì Mod(X) là giá trị 1 hay 2 ... hay 6. (2) ĐLNN X có bảng phân phối sau có Mod(X) = 85: X 82 83 84 85 86 87 p 10% 20% 10% 30% 20% 10% 2.4 Trung vị của ĐLNN rời rạc Xét hai dãy số: A: 1, 1, 5, 7, 8 B: 3, 3, 4, 6, 6, 9 Giá trị nằm giữa dãy số, gọi là trung vị, bằng bao nhiêu? Đối với dãy A, trung vị là 5. Đối với B, có hai giá trị nằm giữa là 4 và 6. Ta lấy trung bình của hai giá trị này là 5 làm trung vị. Excel Trung vị của dãy số ghi trong miền D là =MEDIAN(D). Để tính trung vị của ĐLNN X có bảng phân phối (xi, pi), i=1,n, ta đưa các số pi về dạng các phân số có chung mẫu số là i m n . Thành lập dãy số bằng cách lặp lại mi lần giá trị xi và sắp thứ tự. Trung vị của dãy số này gọi là trung vị của ĐLNN X, ký hiệu Med(X). Med(X) thoả tính chất: P(X ≤ Med(X)) ≥ 1 2 và P(X ≥ Med(X)) ≥ 1 2 Ví dụ Xét ĐLNN X: Ta có: 0,25 = 5 20 0,1 = 2 20 0,4 = 8 20 Dãy số tương ứng: 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 2 2 2 2 2 3 3 3 3 3 4 4 5 5 5 5 5 5 5 5 ⇒ Med(X) = 3,5 X 2 3 4 5 P 0,25 0,25 0,1 0,4 3. Đại lượng ngẫu nhiên liên tục Nếu các giá trị mà ĐLNN có thể nhận không liệt kê được thì ĐLNN được gọi là liên tục. Đối với ĐLNN X liên tục, các biến cố đáng quan tâm có dạng (X a), (a a), (X < a) ... Trọng lượng một con gia súc chọn ngẫu nhiên trong chuồng, nhiệt độ trong phòng vào một thời điểm chọn ngẫu nhiên là các ví dụ về ĐLNN liên tục. 3.1 Hàm phân phối XS và hàm mật độ XS 3.1.1 Hàm phân phối xác suất Quy luật phân phối xác suất của ĐLNN liên tục được xác định bởi hàm phân phối xác suất (hàm PPXS). Hàm PPXS F của ĐLNN X được định nghĩa: F(x) = P(X < x) Hàm PPXS còn gọi là hàm tích luỹ xác suất. Hàm PPXS F của một ĐLNN phải thỏa: * F(x) ∈ [0, 1] * F là hàm tăng. * x lim F(x) 0 →−∞ = và x lim F(x) 1 →+∞ = Nếu X là ĐLNN có hàm PPXS liên tục thì: (i) P(X=x) = 0 (ii) P(a < x < b) = F(b) – F(a) Ví dụ (1) Cho F(x) = cx khi x 0 x 1 0 khi x 0  ≥ +  < Tìm c để F liên tục và là hàm PPXS của một ĐLNN X. Tính P(X < 1), P(X=1), P(1 < X ≤ 2). Do phải có x lim F(x) 1 →+∞ = nên c = 1. Với giá trị c này thì F liên tục. Vậy: P(X < 1) = F(1) = 1/2 P(X=1) = 0 P(1 < X ≤ 2) = F(2) – F(1) = 1/6 (2) Từ bảng phân phối (xi, pi), i=1,n của một ĐLNN rời rạc, ta có thể thành lập hàm phân phối cho ĐLNN này bằng cách đặt: i i i i x x i/ x x F(x) P(X x ) p < < = = =∑ ∑ Chẳng hạn xét ĐLNN có bảng PPXS: X 1 3 4 7 p 0,2 0,3 0,4 0,1 0 khi x < 1 0,2 khi 1 x < 3 F(x) 0,5 khi 3 x 4 0,9 khi 4 x 7 1 khi x 7   ≤ = ≤ <  ≤ <  ≥ 3.1.2 Hàm mật độ xác suất Xét ĐLNN X liên tục có hàm phân phối F. Nếu F có đạo hàm thì hàm f = F′ được gọi là hàm mật độ xác suất (hàm MĐXS) của ĐLNN X. Theo định nghĩa: P(X < x) = F(x) = x f(t)dt −∞∫ Trong thực tế, các ĐLNN liên tục đáng quan tâm đều được định nghĩa thông qua hàm mật độ. Theo tính chất của hàm phân phối, hàm MĐXS f phải thoả các tính chất: * f(x) ≥ 0 * f (x)dx ∞ −∞∫ + = 1 Hàm mật độ còn có các tính chất sau: (i) P(a < X < b) = b a f (t)dt∫ (ii) P(x–∆x < X < x+∆x) ≈ f(x).2∆x (f liên tục, ∆x dương và đủ nhỏ) Tính chất (ii) cho thấy giá trị của f(x) là thước đo mức độ tập trung giá trị của X quanh x. Ví dụ Tìm c để hàm f(x) = c 2x /2e− là hàm mật độ. f là hàm mật độ thì phải có f(x) ≥ 0 và f (x)dx ∞ −∞∫ + = 1. Ta đã biết 2x /2e dx 2 ∞ − −∞ = pi∫ + . Vậy phải có c = 1 / 2pi . 3.2 Phân phối Chuẩn 3.2.1 Phân phối Chuẩn chuẩn tắc, hàm Laplace Hàm Gauss ϕ(z) = 2z /21 e 2 − pi là hàm mật độ của một ĐLNN liên tục có tên là phân phối Chuẩn chuẩn tắc, ký hiệu Z ~ N(0; 1). Ta có: P(Z < z) = 2z x /21 e dx 2 − −∞pi ∫ = 2 20 zx /2 x /2 0 1 1 e dx e dx 2 2 − − −∞ + pi pi ∫ ∫ = 0,5 + 2z x /2 0 1 e dx 2 − pi ∫ Giá trị của tích phân sau cùng phụ thuộc vào z. Hàm Φ theo biến z này có tên là hàm Laplace: 2z x /2 0 1 (z) e dx 2 −Φ = pi ∫ =NORMSDIST(z) – 0.5 Việc tính giá trị Φ(z) bằng cách tính nguyên hàm là không thực hiện được. Người ta dùng phương pháp khác để tính Φ(z) theo z, với bước nhảy 0,01, và ghi thành Bảng kê số hàm Laplace. Với lưu ý Φ(–z) = –Φ(z) và Φ(z) ≈ 0,5 khi z ≥ 4, dùng bảng kê số ta có thể tính các giá trị sau: * P(Z z) = 0,5 – Φ(z) * P(a < Z < b) = Φ(b) – Φ(a) * P(Z < a) = 2Φ(a) Ngoài ra do Φ là hàm tăng nên: * Φ(a) = Φ(b) ⇔ a = b * Φ(a) > Φ(b) ⇔ a > b Ví dụ (1) P(Z > 2) = 0,5 – Φ(2) Tra bảng kê số hàm Laplace để tìm Φ(2): z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767 2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817 ⇒ P(Z > 2) = 0,5 – 0,4772 = 0,0228 (2) P(–2 < Z < 1,91) = Φ(1,91) – Φ(–2) = Φ(1,91) + Φ(2) = 0,4719 + 0,4772 = 0,9491 3.2.2 Phân vị mức α Xét Z ~ N(0; 1) và một số α∈(0; 0,5). Phân vị mức α của phân phối Chuẩn chuẩn tắc là giá trị zα sao cho P(Z > zα) = α. Ta có: P(Z > zα) = α ⇒ 0,5 – Φ(zα) = α ⇒ Φ(zα) = 0,5 – α Vậy: zα = Φ –1(0,5 – α) =NORMSINV(1–α) Ta cũng có bảng kê số để tìm zα theo α. Khi dùng bảng kê số hàm Laplace, nếu tra thấy giá trị 0,5–α của Φ thì giá trị z tương ứng là zα. Trường hợp trên bảng không tìm thấy giá trị cần tra thì lấy hai giá trị nhỏ hơn, lớn hơn và gần giá trị cần tra nhất rồi dùng quy tắc nội suy. Ghi chú Tổng quát hoá, giá trị m sao cho P(X > m) = α được gọi là phân vị mức α của ĐLNN X. 3.2.3 Phân phối Chuẩn Xét Z ~ N(0; 1). Đặt X = σZ + µ với σ và µ là hai tham số dương thì X là một ĐLNN liên tục có tên là phân phối Chuẩn, ký hiệu X ~ N(µ, σ2). Hàm MĐXS: f(x) = 2 1 x exp / 2 2   − µ −   σ σ pi   Do X ~ N(µ, σ2) thì Z = X − µ σ ~ N(0, 1) nên: * P(X < x) = 0,5 + Φ( x − µ σ ) =NORMDIST(x; µ; σ; 1) * P(a < X < b) = Φ( b − µ σ ) – Φ( a − µ σ ) =NORMDIST(b; µ; σ; 1) – NORMDIST(a; µ; σ; 1) * P(X − µ < ε) = 2Φ(ε/σ) =2*NORMSDIST(ε/σ) − 1 Ví dụ Cho X ~ N(450; 225) thì: P(X ≥ 420) = 0,5 – Φ( 420 450 225 − ) = 0,5 – Φ(–2) = 0,5 + Φ(2) ≈ 97,725% =1–NORMDIST(420; 450; 225^0,5; 1) P(X – 450 < 12) = 2Φ( 12 225 ) = 2Φ(0,8) ≈ 57,63% =2*NORMSDIST(0,8)−1 3.3 Các số đặc trưng của ĐLNN liên tục Xét X là ĐLNN có hàm mật độ f. 3.3.1 Kỳ vọng, phương sai, độ lệch chuẩn E(X) xf(x)dx ∞ −∞ = ∫ + 2 2Var(X) x f(x)dx xf(x)dx ∞ ∞ −∞ −∞  = −   ∫ ∫ + + σ(X) = Var(X) Các tính chất của kỳ vọng và phương sai của ĐLNN rời rạc cũng đúng cho ĐLNN liên tục. Lưu ý định nghĩa ĐLNN liên tục X, Y độc lập nếu mỗi biến cố (X < x) đều độc lập với mọi tổ hợp tích của các biến cố có dạng (Y < yj). Ví dụ (1) Xét Z ~ N(0; 1). E(Z) = 2x /2xe dx +∞ − −∞∫ = 0 var(Z) = 22 x /2x e dx +∞ − −∞∫ – 2 2 x /2xe dx +∞ − −∞      ∫ = 22 x /2x e dx +∞ − −∞∫ = 1 Xét X ~ N(µ; σ2). Do X = σZ + µ nên: E(X) = µ var(X) = σ2 σ(X) = σ Vậy hai tham số µ và σ2 của N(µ; σ2) chính là kỳ vọng và phương sai. (2) Xét X ~ N(µ; σ2) P(X – µ < 3σ) = 2Φ(3σ/σ) = 2Φ(3) ≈ 99,73% =2*NORMSDIST(3)–1 Vậy, gần như tất cả các giá trị của N(µ; σ2) đều tập trung quanh giá trị trung bình với khoảng cách bằng 3 lần độ lệch chuẩn. 3.3.2 Giá trị tin chắc nhất, trung vị Theo ý nghĩa của hàm mật độ, giá trị tin chắc nhất Mod(X) là giá trị xo sao cho f(xo) = x max f (x) Do P(X ≤ Med(X)) ≥ 1 2 và P(X ≥ Med(X)) ≥ 1 2 nên trung vị Med(X) được định nghĩa là giá trị m sao cho: m f (x)dx 1/2 −∞ =∫ Ví dụ Xét X ~ N(µ; σ2). Ta có Mod(X) = µ 3.3.3 Hệ số bất đối xứng, hệ số nhọn Để đo mức độ bất đối xứng của đồ thị hàm mật độ qua trục E(X), ta tính hệ số bất đối xứng Ske(X): Ske(X) = 3 3 E([X E(X)] )− σ Xét trục E(X). Đồ thị của hàm mật độ đối xứng thì Ske(X) = 0. Khi Ske(X) < 0, X có xu hướng nhỏ hơn E(X). Khi Ske(X) > 0, X có xu hướng lớn hơn E(X). Để đo độ nhọn của đồ thị hàm mật độ gần giá trị E(X), ta tính hệ số nhọn Kur(X): Kur(X) = 4 4 E([X E(X)] )− σ Kur(X) càng lớn thì đồ thị quanh E(X) càng nhọn, xu hướng X bằng E(X) càng cao.