Khoảng số thực
khoảng đóng [a, b]= {x là số thực : a ≤x ≤b}
khoảng nửa đóng nửa mở
[a, b) = {x là số thực : a ≤x < b}
hoặc (a, b]= {x là số thực : a < x ≤b}
khoảng mở(a, b) = {x là số thực : a < x < b}.
74 trang |
Chia sẻ: lylyngoc | Lượt xem: 2540 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Chương 2 Thống kê, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Chương 2
THỐNG KÊ
Bài 1
THAM SỐ MẪU
MỤC TIÊU
1. Trình bày được công thức định nghĩa và công thức tính các tham số mẫu.
2. Tính được các tham số mẫu và nêu được ý nghĩa của chúng.
1. CÁC KHÁI NIỆM
Khoảng số thực
khoảng đóng [a, b] = {x là số thực : a ≤ x ≤ b}
khoảng nửa đóng nửa mở
[a, b) = {x là số thực : a ≤ x < b}
hoặc (a, b] = {x là số thực : a < x ≤ b}
khoảng mở (a, b) = {x là số thực : a < x < b}.
Ký hiệu tổng:
Tập hợp tổng quát và tập hợp mẫu
Tập hợp tổng quát là tập hợp bao gồm tất cả các đối tượng cần nghiên cứu. Số phần tử của tập hợp tổng
quát gọi là kích thước tập hợp tổng quát, ký hiệu là N.
Vì các điều kiện hạn chế, thường lấy ra một mẫu để nghiên cứu. Tập hợp mẫu là tập hợp gồm các đối
tượng lấy ra để nghiên cứu. Số phần tử của tập hợp mẫu gọi là kích thước mẫu, ký hiệu n. Nói chung N ≥ n.
1 2
1
...
=
= + + +∑
n
i n
i
x x x x
1 1 1
( )
= = =
+ = +∑ ∑ ∑
n n n
i i i i
i i i
x y x y
1 1= =
=∑ ∑
n n
i i
i i
ax a x
1
.
=
=∑
n
i
a n a
Page 1 of 74
12/10/2012file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm
Cần lấy mẫu ngẫu nhiên, khách quan sao cho tính chất của tập hợp mẫu phản ánh đúng tính chất tập hợp
tổng quát.
Có hai cách lấy các phần tử ra để nghiên cứu. Lấy có hoàn lại là lấy ra một phần tử để nghiên cứu rồi trả
lại tập hợp mẫu. Kết quả các lần nghiên cứu sau không phụ thuộc các kết quả nghiên cứu trước đó, phép thử
độc lập. Lấy không hoàn lại là lấy ra một phần tử để nghiên cứu sau đó không trả lại tập hợp mẫu. Kết quả
các nghiên cứu sau phụ thuộc kết quả các nghiên cứu trước, phép thử không độc lập.
Dấu hiệu nghiên cứu
Khi nghiên cứu chỉ quan tâm xem xét một số mặt, một số tính chất của đối tượng nghiên cứu. Các đặc
tính, tính chất cần nghiên cứu gọi là dấu hiệu nghiên cứu. Có dấu hiệu nghiên cứu về chất, có dấu hiệu
nghiên cứu về lượng. Các dấu hiệu về chất được nghiên cứu khả năng xuất hiện của chúng, các dấu hiệu về
lượng được tính các tham số mẫu.
2. SẮP XẾP SỐ LIỆU
Khi tiến hành nghiên cứu, số liệu thu được theo thứ tự thời gian. Như vậy số liệu chưa có thứ tự theo giá
trị. Trước khi tính các tham số mẫu, số liệu được sắp xếp theo thứ tự giá trị.
Việc sắp xếp lại số liệu không làm thay đổi kết quả tính. Có những bài toán mà thuật toán đòi hỏi phải
giữ nguyên thứ tự thu được theo thời gian thì không được sắp xếp lại số liệu.
Sắp xếp số liệu thành dãy tăng hoặc bằng gọi là dãy không giảm
(1)
Sắp xếp số liệu thành dãy giảm hoặc bằng gọi là dãy không tăng
(2)
Có thể sắp xếp số liệu thành dãy các giá trị khác nhau tăng dần tương ứng với tần số xuất hiện của
chúng.
với (3)
Với những nghiên cứu có kích thước mẫu n rất lớn, để tính các tham số mẫu thuận tiện mà sai số không
đáng kể, có thể phân chia số liệu thành nhiều lớp.
Gọi k là số lớp cần phân chia : k ≥ 1 + 3,32 lgn.
Gọi khoảng rộng của mỗi lớp là ∆x
Như vậy sai số . Với ∆x đã biết, phân chia số liệu vào các lớp từ αi– 1 đến αi.
1 2 3 nx x x ... x≤ ≤ ≤ ≤
1 2 3 nx x x ... x≥ ≥ ≥ ≥
1 2 kx x xK
1 2 km m mK
k
i
i 1
m n
=
=∑
xRx
k
∆ ≤
x
2
∆δ =
Page 2 of 74
12/10/2012file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm
Kết quả thu được dãy giá trị giữa các lớp tương ứng với tần số xuất hiện của lớp:
Đôi khi từ số liệu thu được, chọn δ sao cho phù hợp với số liệu, từ đó có:
∆x = 2δ, sau đó phân chia số liệu vào các lớp như trên.
Gọi x là áp lực động mạch phổi thì tâm thu bệnh nhân hẹp hai lá (mmHg).
Đo 153 bệnh nhân, ,
.
Lấy k = 9 .
Sắp xếp số liệu vào 9 lớp được kết quả sau:
Chú ý : Từ số liệu chia k lớp sẽ thành k + 1 lớp.
Tính các tham số mẫu khi chia lớp sẽ có sai số.
3. CÁC THAM SỐ MẪU
Trong phần này chỉ nêu các tham số mẫu thường dùng. Đó là trung bình mẫu, phương sai và độ lệch
mẫu.
3.1. Trung bình mẫu
Định nghĩa và công thức tính
theo (1) (4)
theo (3) (5)
. (6)
Trong (6) với x0 và ∆x tuỳ chọn.
(αi-1 - αi) 13 – 28 28 – 43 43 – 58 58 – 73 73 – 88 88 – 103
103 –
118
118 –
133
133 –
148
148 –
163
xi 20,5 35,5 50,5 65,5 80,5 95,5 110,5 125,5 140,5 155,5
mi 6 20 33 24 28 12 17 8 4 1
i
i
max x 157
∀
= i
i
min x 15
∀
=
xR 157 15 142= − =
k 1 3,32 lg153 8, 2≥ + =
142
x 15,77 x 15
9
∆ ≤ = ⇒ ∆ =
10
i
i 1
m 153
=
=∑
x
n
i
i 1
1
x x
n
=
= ∑
k
i i
i 1
1
m x
n
=
= ∑
k
0 i i 0
i 1
1
x x . m u x xu
n
=
= + ∆ = + ∆∑
i 0
i
x x
u
x
−
=
∆
Page 3 of 74
12/10/2012file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm
Từ (5) suy ra (6) bằng cách thay vào (5)
Trung bình cộng là trị số bình quân của các giá trị khác nhau, nhưng thuộc cùng một loại.
có cùng đơn vị xi. Số thập phân của hơn số thập phân của xi một chữ số.
là tâm quần tụ của tập hợp mẫu.
Tính chất
3.2. Phương sai s2, độ lệch mẫu s
Định nghĩa và công thức tính
theo (1) (7)
theo (3) (8)
(9)
(10)
trong đó với ∆x, x0 tuỳ chọn, ∆x ≠ 0.
Từ (8), sau khi bình phương và thay suy ra (9).
Trong (9) thay dẫn đến
0.= ∆ +i ix x u x
k k k
0
i i 0 i i i
i 1 i 1 i 1
x1 x
m ( x.u x ) m u m
n n n
= = =
∆∆ + = +∑ ∑ ∑
k
0 i i
i 1
1
x x m u
n
=
= + ∆ ∑
x x
x
i i 0 0 0y x x y x x x y-x= + ⇒ = + ⇔ =
i
i
x xy ( x 0) y x xy
x x
= ∆ ≠ ⇒ = ⇔ = ∆
∆ ∆
i i iz y x z y x . = + ⇒ = +
n
2 2
i
i 1
1
s (x x)
n 1
=
= −
−
∑
k
2
i i
i 1
1
m (x x)
n 1
=
= −
−
∑
2k k
2
i i i i
i 1 i 1
1
n m x m x
n(n 1)
= =
= − −
∑ ∑
22 k k
2
i i i i
i 1 i 1
x
n m u m u
n(n 1)
= =
∆ = − −
∑ ∑
i 0
i
x x
u
x
−
=
∆
k
i i
i 1
1
x m x
n
=
= ∑
i i 0x x.u x= ∆ +
Page 4 of 74
12/10/2012file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm
s2 =
. (10) được chứng minh.
s2 không cùng đơn vị với xi.
s = được gọi là độ lệch mẫu.
s có cùng đơn vị và số thập phân với . Như vậy s2 có số thập phân gấp hai số thập phân của s.
s2 là trung bình của bình phương khoảng lệch giữa xi và cho nên gọi tắt là phương sai. s
2 hay s cho
biết mức độ tản mạn của xi so với tâm của mẫu là như vậy cũng cho biết độ đại diện của cho các xi tốt
hay không. Khi đo một đại lượng nhiều lần, s2 và s cho biết độ chính xác của các giá trị đo được, s2 hay s
được xem là sai số của cách đo.
s và cùng đơn vị, có cùng số thập phân. Người ta thường viết ± s đại diện cho mẫu thu được.
Công thức (6) và (10) được sử dụng khi các xi lớn hoặc có số thập phân hoặc cách đều.
Tính chất
khi X và Y là hai đại lượng độc lập.
Các công thức khác
Trong một số trường hợp, phương sai được cho dưới dạng sau:
được xem là phương sai lý thuyết DX của đại lượng ngẫu nhiên khi n đủ lớn.
với MX đã biết. (11)
2k k
2
i i 0 i i 0
i 1 i 1
1
n m ( xu x ) m ( xu x )
n(n 1)
= =
∆ + − ∆ + −
∑ ∑
2k k k
2 2 2 2
i i 0 i i 0 i i
i 1 i 1 i 1
k
2
0 i i 0
i 1
1
n x m u 2nx x m u (nx ) x m u
n(n 1)
2nx x m u (nx )
= = =
=
= ∆ + ∆ + − ∆ −
−
− ∆ −
∑ ∑ ∑
∑
22 k k
2
i i i i
i 1 i 1
x
n m u m u
n(n 1)
= =
∆ = − −
∑ ∑
2s
x
x
,x x
x x
2 2
i i 0 y xy x x s s= + ⇒ =
2
2 2 2 2i x
i y x y2
x sy ( x 0) s s x s
x x
= ∆ ≠ = ⇔ = ∆
∆ ∆
2 2 2
i i i z x yz x y s s s= + ⇒ = +
*2 2
1
1 ( )
=
= −∑
k
i i
i
s m x MX
n
*2s
Page 5 of 74
12/10/2012file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm
. (12)
là phương sai chệch của phương sai lý thuyết của đại lượng ngẫu nhiên. Cách viết (12) thường gặp
trong các công thức tính tham số của đường cong hồi quy và hệ số tương quan tuyến tính.
3.3. Phương sai của k dãy giá trị
Trong các nghiên cứu đồng thời k đại lượng, số liệu được cho dưới dạng sau:
Gọi là trung bình chung của k dãy, là trung bình của dãy thứ j
(13)
(14)
Tuỳ thuộc k dãy giá trị của cùng một đại lượng hay của k đại lượng khác nhau sẽ có tương ứng hai
phương sai.
Phương sai của k dãy giá trị của cùng một đại lượng
(15)
(16)
2 2
= −x x
2
*s
1 2 j k
1 2 j k
11 12 1j 1k
21 22 2 j 2k
i1 i2 ij ik
n 1 n 2 n j n k
X X X X
x x x x
x x x x
x x x x
x x x x
K K
K K
K K
M M K M K M
K K
M M K M K M
K K
x jx
jk,n
ij
j,i 1
1
x x
N
=
= ∑
jn
j ij
j i 1
1
x x
n
=
= ∑ j 1, k=
2
S
k2 2
j j
j 1
1S n (x x)
k 1
=
= −
−
∑
j j
2 2
n k,nk
ij ij
jj 1 i 1 j,i 1
1 1 1
x x
k 1 n N
= = =
= −
−
∑ ∑ ∑
Page 6 of 74
12/10/2012file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm
với , .
là trung bình của bình phương khoảng lệch giữa trung bình của từng dãy và trung bình chung của k
dãy
Thực hiện bình phương công thức (15)
Thu được công thức (16)
Phương sai của k dãy giá trị của k đại lượng khác nhau thuộc cùng một loại S2
(17)
(18)
, với và B đã biết.
là trung bình của bình phương các khoảng lệch giữa các giá trị trong dãy và trung bình của dãy.
Thực hiện bình phương công thức (17)
B C
k 1
−
−
j
2
nk
ij
jj 1 i 1
1B x
n
= =
=
∑ ∑
j
2k,n
ij
j, i 1
1C x
N
=
=
∑
2
S
2 2 2
1
1 ( 2 )
1
=
= − +
−
∑
k
j j j
j
S n x x x x
k
2
,
2
1 1 , 1
1 1 2
1
−
= = =
= − +
−
∑ ∑ ∑
j jn k nk
ij ij
jj i j i
x x x Nx
k n
2 2
,
1 1 , 1
1 1 1
1
= = =
= −
−
∑ ∑ ∑
j jn k nk
ij ij
jj i j i
x x
k n N
jk, n
2 2
ij j
j, i 1
1S (x x )
N k
=
= −
−
∑
j j
2k,n nk
2
i j ij
jj,i 1 j 1 i 1
1 1
x x
N k n
= = =
= −
−
∑ ∑ ∑
2 A BS
N k
−
=
−
jk,n
2
ij
j,i 1
A x
=
= ∑
2S
jk,n
2 2
ij j
j, i 1
1S ( x x )
N k
=
= −
−
∑
jk,n
2 2
ij j ij j
j,i 1
1 (x 2x x x )
N k
=
= − +
−
∑
Page 7 of 74
12/10/2012file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm
Công thức (18) được chứng minh.
3.4. Các tham số khác
Hệ số biến thiên Cv
(0/00)
Cv cho biết độ chính xác tương đối giữa s so với . Cv là tỷ số, viết dưới dạng % hay
0
/00
.
, cho phép so
sánh độ chính xác tương đối giữa các đại lượng không cùng đơn vị.
Số trung vị :
là giá trị giữa của n giá trị đã sắp xếp
Số mốt M0
M0 = xi mà mi lớn nhất trong các m1, m2,..., mk
M0 là giá trị hay gặp nhất trong k giá trị x1, x2, …, xk.
Với số liệu chuẩn theo một nghĩa nào đấy thì Me = M0 =
Vậy Me, M0 là các giá trị cũng cho biết tâm của tập hợp mẫu.
Trung bình nhân, Trung bình điều hoà.
Khi nghiên cứu thu được dãy số liệu x1 x2 . . . xn.
Đôi khi sử dụng trung bình nhân hoặc trung bình điều hoà trong xử lý số liệu. Công thức tính có
dạng sau:
Ví dụ:
1. Gọi X là áp lực động mạch phổi thời tâm trương người bình thường
j j j
2k,n n nk k
2 jij ij j ij
jj,i 1 j 1 i 1 j 1 i 1
1 1
x 2 x x n x
N k n
= = = = =
= − +
−
∑ ∑ ∑ ∑ ∑
j j
2k,n nk
2
i j ij
jj,i 1 j 1 i 1
1 1
x x
N k n
= = =
= −
−
∑ ∑ ∑
v
sC
x
=
x
eM
eM
x
g h
1 2
1 2
...
1 1 1
...
=
= + + +
n
n
n
g x x x
h
x x x
Page 8 of 74
12/10/2012file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm
Đo 30 người được kết quả sau:
Tính các tham số của mẫu trên.
Giải:
Cách 1. Lập bảng tính theo (5) và theo (9)
.
Cách 2. Lập bảng kiểm tra, tính theo (6) và theo (10).
Giá trị xi (mm Hg)
2 3 4 5 6 7 8 9
Số người mi
1 4 7 8 2 5 2 1
i xi mi mi xi mi
1 2 1 2 4
2 3 4 12 36
3 4 7 28 112
4 5 8 40 200
5 6 2 12 72
6 7 5 35 245
7 8 2 16 128
k = 8 9 1 9 81
∑ 30 154 878
Chọn x0 = 5 và ∆x = 1 dẫn
đến
x
2
xs
2
ix
154
x 5,133 5,1.
30
= = −%
2 2 2
x
1 2624
s [30 878 154 ] 3,0161 1,74
30 29 870
= × − = = −
×
%
v
1,74C 0,339
5,13
= =
e 30
2
M x 5,= = 0M 5=
x
2
xs
i
i i
x - 5
u = = x -5
1
Page 9 of 74
12/10/2012file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm
Các giá trị của và trùng với các kết quả trên.
2. Gọi X là lượng Protein huyết thanh người bình thường (g/l). Điện di 17 mẫu của 17 người thu được
kết quả sau:
Tính các tham số của mẫu trên
Giải:
Lập bảng tính theo (6) và theo (10) với và
.
3. Gọi X1, X2, X3, X4 là thời gian hết ký sinh trùng sốt rét trong máu (giờ) của bốn nhóm bệnh nhân
điều trị theo bốn cách khác nhau. Kết quả nghiên cứu thu được số liệu sau:
Giá trị xi (g/l)
6,9 7,2 7,6 8,2 8,5
Số người mi
2 3 5 6 1
X1
18 37 46 46 46 51 62 78 85 90
X2
38 41 41 42 43 44 45 50 50 52
X3
36 48 50 52 58 60 60 68 74 74
36 38 40 42 48 60 62 70 72 72
15 4 5,133 5,1.
30
= + × = −x %
2
2 2 2
x
1 2624
s [30 88 4 ] 3,0161 1,74
30 29 870
= × − = = −
×
%
x
2
xs
x 2xs
i
i
x 7,5
u
0,1
−
=
i
i
x 8
v
0,1
−
=
0,1 0,1
x = 7,5 + ×36 = 8 + ×(-49) = 7,71
17 17
2 2 2
2 2 2 2
x
0,1 0,1 0,1 ×7170
s = 17×498 -36 = 17×563- 49 = = 0,2636 = 0,51
17×16 17×16 272
x s 7,71 0,51(g / l)± = ± v e 0
0,51C 0,066, M 7,6, M 8,2
7,71
= = = =
Page 10 of 74
12/10/2012file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm
Tính các tham số , s, của bốn dãy số liệu.
10 + 10 + 10 + 10 = 40
[10 x 35.895 – 559 2] = 516,3222 = 22,722
A = 35.895 + 20.084 + 34.944 + 31.120 = 122.043
X4
i
1 18 324 38 1444 36 1296 36 1296
2 37 1369 41 1681 48 2304 38 1444
3 46 2116 41 1681 50 2500 40 1600
4 46 2116 42 1764 52 2704 42 1764
5 46 2116 43 1849 58 3364 48 2304
6 51 2601 44 1936 60 3600 60 3600
7 62 3844 45 2025 60 3600 62 3844
8 78 6084 50 2500 68 4624 70 4900
9 85 7225 50 2500 74 5476 72 5184
10 90 8100 52 2704 74 5476 72 5184
Σ 559 35.895 446 20.084 580 34.944 540 31.120
x
2 2S ,S%
1X
2
1X 2X
2
2X 3X
2
3X 4X
2
4X
4
j
i 1
n
=
=∑
1
559
x 55,9
10
= =
1
2
x
1
s
10 9
=
×
2
446
x 44,6
10
= =
2
2 2 2
x
1
s 10 20.084 446 21,3778 4,62
10 9
= × − = =
×
3
580
x 58
10
= =
3
2 2 2
x
1
s 10 34.944 580 144,8889 12,04
10 9
= × − = =
×
4
540
x 54
10
= =
4
2 2 2
x
1
s 10 31.120 540 217,7778 14,76
10 9
= × − = =
×
1
x (559 446 580 540) 53,125.
40
= + + + =
2 2 2 2559 446 580 540B 113.939,7
10 10 10 10
= + + + =
21C [559 446 580 540] 112.890,625
40
= + + + =
2 1 [113.939,7 112.890,625] 349,6917
4 1
s = − =
−
%
2 1 [122.043 113.939,7] 225,0917.
40 4
s = − =
−
%
Page 11 of 74
12/10/2012file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm
Chú ý: Nếu k dãy số liệu của cùng một đại lượng, có thể đổi biến
với x0 và ∆x tuỳ chọn , tính toán sẽ thuận lợi hơn.
Khi đó , B và C tính theo uj.
Chú ý: Đôi khi giá trị trung bình không phản ánh đúng kết quả nghiên cứu như ở các ví dụ dưới đây.
4. Đánh giá một phương pháp điều trị ngoại khoa mới kéo dài 10 năm nhận thấy:
Năm 1, 2, 3 điều trị cho 47 bệnh nhân, kết quả tốt: 31 người
Năm 4, 5, 6, 7 điều trị cho 96 bệnh nhân, kết quả tốt: 71 người.
Năm 8, 9, 10 điều trị cho 64 bệnh nhân, kết quả tốt: 58 người.
Tỷ lệ tốt trung bình của phương pháp điều trị bằng Từ năm 11 trở đi tỷ lệ điều trị tốt lớn
hơn . Vậy giá trị trung bình không phản ánh đúng kết quả nghiên cứu.
5. Chỉ tiêu tuyển sinh vào khoa I (ĐK) năm 2000 của ĐH X là 260.
Số thí sinh đăng ký thi : 3267; Trung bình 13 thí sinh lấy 1 người.
Chỉ tiêu tuyển sinh vào khoa II (KTYH) của ĐH X là 50.
Số thí sinh đăng ký thi : 641; Trung bình 13 thí sinh lấy 1 người.
Chỉ tiêu tuyển sinh vào khoa III (YTCC) của ĐH X là 30.
Số thí sinh đăng ký thi : 1134; Trung bình 38 thí sinh lấy 1 người.
Thí sinh thi vào khoa III có nên chuyển sang thi vào khoa I không?
Để đỗ vào khoa I, mỗi thí sinh phải hơn ít nhất 3007 thí sinh khác.
Để đỗ vào khoa III, mỗi thí sinh chỉ phải hơn ít nhất 1104 thí sinh khác. Thí sinh thi vào khoa II không
nên đổi nguyện vọng sang khoa khác vì khó hơn.
CÂU HỎI TỰ LƯỢNG GIÁ
Hãy chọn một kết quả đúng.
1. Định lượng Protein dịch não tủy người bình thường (X, đv mg%) thu được số liệu sau:
Tính của số liệu trên theo công thức tính.
Kết quả:
A. 17,94±2,37; B. 17,94±2,40; C. 18,48±2,40; D. 18,48±2,37; E. số khác
11 17 19 12 17 19 14 18 19 16 18 20
16 18 20 16 18 20 16 19 20 16 19 20
16 19 21 17 19 21 17 19 21 17 19 22
j 0
j
X x
u
x
−
=
∆
j 1, k=
2
2 x (B C)
k 1
s ∆ −=
−
%
160 0,773.
207
=
58 (90,6%)
64
x s±
Page 12 of 74
12/10/2012file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm
2. Gọi X là áp lực trung bình của động mạch phổi bệnh nhân hẹp hai lá đơn thuần (đv: mmHg), nghiên
cứu thu được số liệu sau:
Tính của số liệu trên.
Kết quả:
A. 50,162±20,690; B. 49,839±20,690; C. 50,162±20,757; D. 49,839±20,757; E. số khác
3. Đếm nhịp tim (tần số tim) của trẻ nam 3 lứa tuổi thu được kết quả sau:
Nhóm I 9 tuổi n1 = 30 = 72,77±4,60
Nhóm II 10 tuổi n2 = 45 = 72,47±5,06
Nhóm III 11 tuổi n3 = 32 = 73,63±5,42.
Tính phương sai chung S2 của 3 nhóm số liệu trên.
Kết quả:
A. 25,3800; B. 25,2674; C. 25,4891; D. 12,9012; E. số khác.
4. Theo dõi số chuột chết khi cho các lô chuột thí nghiệm sử dụng các liều thuốc có độc tăng dần thu
được số liệu sau:
Tính liều chết trung bình của số liệu trên (Số liệu Finney).
Kết quả:
A. 0,02846; B. 0,0247; C. 0,0253; D. 0,0255; E. số khác.
xi
13 23 33 43 53 63 73 83 93 103
mi
5 20 27 24 25 23 15 10 4 2
xi(liều, mg/kg) 0,015 0,02 0,025 0,03 0,035 0,04
Số chuột mỗi lô 20 69 95 78 44 20
Số chết 0 11 50 61 37 20
x s±
1 1x s±
2 2x s±
3 3x s±
Page 13 of 74
12/10/2012file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm
Bài 2
KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
MỤC TIÊU
Trình bày được các bước của bài toán kiểm định.
Điều trị một bệnh bằng nhiều phương pháp, mỗi phương pháp có một tỷ lệ khỏi nhất định. Các tỷ lệ
khỏi của các phương pháp có như nhau không ?
Định lượng Protein toàn phần trong máu trẻ suy dinh dưỡng trước và sau điều trị. Phương pháp điều trị
có hiệu quả không ? Nói cách khác, lượng Protein toàn phần trung bình sau điều trị có cao hơn hẳn lượng
Protein toàn phần trung bình trước điều trị không ?
Điều tra n đối tượng nghiên cứu thấy m đối tượng có đặc tính A. Khả năng xuất hiện hiện tượng A là p
o
có đúng không ?
Trên đây là những bài toán kiểm định giả thiết thống kê.
1. GIẢ THIẾT VÀ ĐỐI GIẢ THIẾT
Trong bài toán kiểm định giả thiết thống kê, giả thiết cần kiểm định ký hiệu , được nêu ra dưới
dạng: các tỷ lệ như nhau, các trung bình như nhau... Các giả thiết đối lập với giả thiết gọi tắt là đối thiết,
ký hiệu H1. Đối giả thiết không như nhau hay khác nhau được gọi là đối giả thiết hai phía. Đối giả thiết lớn
hơn hay nhỏ hơn là các đối giả thiết một phía. Tuỳ theo giá trị thu được trong nghiên cứu để đưa ra đối giả
thiết một phía hay hai phía.
2. ĐIỀU KIỆN
Các bài toán khác nhau có những điều kiện khác nhau, song để đảm bảo tính đúng đắn và chính xác của
kiểm định có một số điều kiện sau:
+ Điều kiện chuẩn.
+ Điều kiện n đủ lớn.
+ Điều kiện đám đông thuần nhất.
3. TÍNH GIÁ TRỊ CỦA ĐẠI LƯỢNG NGẪU NHIÊN
Đó là các giá trị của đại lượng ngẫu nhiên chuẩn T hoặc Student T
n
hoặc đại lượng ngẫu nhiên …
Các công thức tính được nêu trong từng bài toán cụ thể.
4. TRA GIÁ TRỊ TỚI HẠN
Trước hết cần chọn mức α, sau đó tra giá trị tới hạn tương ứng mức α đó. Mức thường chọn là 0,05,
cũng có khi chọn tới mức 0,01 hay 0,001.
0H
0H
2χ
α
Page 14 of 74
12/10/2012file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm
Giá trị tới hạn chia miền giá trị của đại lượng ngẫu nhiên thành hai miền: miền có giá trị ứng với xác
suất lớn 1 – là miền giữ giả thiết H0, miền có giá trị ứng với xác suất bé α là miền bác giả thiết H0. Tuỳ
theo giá trị tính được của đại lượng ngẫu nhiên thuộc miền nào mà quyết định kết luận bài toán kiểm định.
5. CÁC XÁC SUẤT CỦA BÀI TOÁN KIỂM ĐỊNH
H0 đúng
Giá trị của đại lượng ngẫu nhiên thuộc miền giữ giả thiết. Xác suất giữ giả thiết khi giả thiết đúng gọi là
độ tin cậy.
Giá trị của đại lượng ngẫu nhiên thuộc miền bác giả thiết. Xác suất bác giả thiết khi giả thiết đúng gọi là
nguy hiểm loại I hay sai lầm loại I. Do Ho đúng, sai lầm loại I chính là , còn