Chương 2 Thống kê

 Khoảng số thực khoảng đóng [a, b]= {x là số thực : a ≤x ≤b} khoảng nửa đóng nửa mở [a, b) = {x là số thực : a ≤x < b} hoặc (a, b]= {x là số thực : a < x ≤b} khoảng mở(a, b) = {x là số thực : a < x < b}.

pdf74 trang | Chia sẻ: lylyngoc | Lượt xem: 2530 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Chương 2 Thống kê, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Chương 2 THỐNG KÊ Bài 1 THAM SỐ MẪU MỤC TIÊU 1. Trình bày được công thức định nghĩa và công thức tính các tham số mẫu. 2. Tính được các tham số mẫu và nêu được ý nghĩa của chúng. 1. CÁC KHÁI NIỆM  Khoảng số thực khoảng đóng [a, b] = {x là số thực : a ≤ x ≤ b} khoảng nửa đóng nửa mở [a, b) = {x là số thực : a ≤ x < b} hoặc (a, b] = {x là số thực : a < x ≤ b} khoảng mở (a, b) = {x là số thực : a < x < b}.  Ký hiệu tổng:  Tập hợp tổng quát và tập hợp mẫu Tập hợp tổng quát là tập hợp bao gồm tất cả các đối tượng cần nghiên cứu. Số phần tử của tập hợp tổng quát gọi là kích thước tập hợp tổng quát, ký hiệu là N. Vì các điều kiện hạn chế, thường lấy ra một mẫu để nghiên cứu. Tập hợp mẫu là tập hợp gồm các đối tượng lấy ra để nghiên cứu. Số phần tử của tập hợp mẫu gọi là kích thước mẫu, ký hiệu n. Nói chung N ≥ n. 1 2 1 ... = = + + +∑ n i n i x x x x 1 1 1 ( ) = = = + = +∑ ∑ ∑ n n n i i i i i i i x y x y 1 1= = =∑ ∑ n n i i i i ax a x 1 . = =∑ n i a n a Page 1 of 74 12/10/2012file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm Cần lấy mẫu ngẫu nhiên, khách quan sao cho tính chất của tập hợp mẫu phản ánh đúng tính chất tập hợp tổng quát. Có hai cách lấy các phần tử ra để nghiên cứu. Lấy có hoàn lại là lấy ra một phần tử để nghiên cứu rồi trả lại tập hợp mẫu. Kết quả các lần nghiên cứu sau không phụ thuộc các kết quả nghiên cứu trước đó, phép thử độc lập. Lấy không hoàn lại là lấy ra một phần tử để nghiên cứu sau đó không trả lại tập hợp mẫu. Kết quả các nghiên cứu sau phụ thuộc kết quả các nghiên cứu trước, phép thử không độc lập.  Dấu hiệu nghiên cứu Khi nghiên cứu chỉ quan tâm xem xét một số mặt, một số tính chất của đối tượng nghiên cứu. Các đặc tính, tính chất cần nghiên cứu gọi là dấu hiệu nghiên cứu. Có dấu hiệu nghiên cứu về chất, có dấu hiệu nghiên cứu về lượng. Các dấu hiệu về chất được nghiên cứu khả năng xuất hiện của chúng, các dấu hiệu về lượng được tính các tham số mẫu. 2. SẮP XẾP SỐ LIỆU Khi tiến hành nghiên cứu, số liệu thu được theo thứ tự thời gian. Như vậy số liệu chưa có thứ tự theo giá trị. Trước khi tính các tham số mẫu, số liệu được sắp xếp theo thứ tự giá trị. Việc sắp xếp lại số liệu không làm thay đổi kết quả tính. Có những bài toán mà thuật toán đòi hỏi phải giữ nguyên thứ tự thu được theo thời gian thì không được sắp xếp lại số liệu. Sắp xếp số liệu thành dãy tăng hoặc bằng gọi là dãy không giảm (1) Sắp xếp số liệu thành dãy giảm hoặc bằng gọi là dãy không tăng (2) Có thể sắp xếp số liệu thành dãy các giá trị khác nhau tăng dần tương ứng với tần số xuất hiện của chúng. với (3) Với những nghiên cứu có kích thước mẫu n rất lớn, để tính các tham số mẫu thuận tiện mà sai số không đáng kể, có thể phân chia số liệu thành nhiều lớp. Gọi k là số lớp cần phân chia : k ≥ 1 + 3,32 lgn. Gọi khoảng rộng của mỗi lớp là ∆x Như vậy sai số . Với ∆x đã biết, phân chia số liệu vào các lớp từ αi– 1 đến αi. 1 2 3 nx x x ... x≤ ≤ ≤ ≤ 1 2 3 nx x x ... x≥ ≥ ≥ ≥ 1 2 kx x xK 1 2 km m mK k i i 1 m n = =∑ xRx k ∆ ≤ x 2 ∆δ = Page 2 of 74 12/10/2012file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm Kết quả thu được dãy giá trị giữa các lớp tương ứng với tần số xuất hiện của lớp: Đôi khi từ số liệu thu được, chọn δ sao cho phù hợp với số liệu, từ đó có: ∆x = 2δ, sau đó phân chia số liệu vào các lớp như trên. Gọi x là áp lực động mạch phổi thì tâm thu bệnh nhân hẹp hai lá (mmHg). Đo 153 bệnh nhân, , . Lấy k = 9 . Sắp xếp số liệu vào 9 lớp được kết quả sau: Chú ý : Từ số liệu chia k lớp sẽ thành k + 1 lớp. Tính các tham số mẫu khi chia lớp sẽ có sai số. 3. CÁC THAM SỐ MẪU Trong phần này chỉ nêu các tham số mẫu thường dùng. Đó là trung bình mẫu, phương sai và độ lệch mẫu. 3.1. Trung bình mẫu  Định nghĩa và công thức tính theo (1) (4) theo (3) (5) . (6) Trong (6) với x0 và ∆x tuỳ chọn. (αi-1 - αi) 13 – 28 28 – 43 43 – 58 58 – 73 73 – 88 88 – 103 103 – 118 118 – 133 133 – 148 148 – 163 xi 20,5 35,5 50,5 65,5 80,5 95,5 110,5 125,5 140,5 155,5 mi 6 20 33 24 28 12 17 8 4 1 i i max x 157 ∀ = i i min x 15 ∀ = xR 157 15 142= − = k 1 3,32 lg153 8, 2≥ + = 142 x 15,77 x 15 9 ∆ ≤ = ⇒ ∆ = 10 i i 1 m 153 = =∑ x n i i 1 1 x x n = = ∑ k i i i 1 1 m x n = = ∑ k 0 i i 0 i 1 1 x x . m u x xu n = = + ∆ = + ∆∑ i 0 i x x u x − = ∆ Page 3 of 74 12/10/2012file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm Từ (5) suy ra (6) bằng cách thay vào (5) Trung bình cộng là trị số bình quân của các giá trị khác nhau, nhưng thuộc cùng một loại.  có cùng đơn vị xi. Số thập phân của hơn số thập phân của xi một chữ số.  là tâm quần tụ của tập hợp mẫu.  Tính chất 3.2. Phương sai s2, độ lệch mẫu s  Định nghĩa và công thức tính theo (1) (7) theo (3) (8) (9) (10) trong đó với ∆x, x0 tuỳ chọn, ∆x ≠ 0. Từ (8), sau khi bình phương và thay suy ra (9). Trong (9) thay dẫn đến 0.= ∆ +i ix x u x k k k 0 i i 0 i i i i 1 i 1 i 1 x1 x m ( x.u x ) m u m n n n = = = ∆∆ + = +∑ ∑ ∑ k 0 i i i 1 1 x x m u n = = + ∆ ∑ x x x i i 0 0 0y x x y x x x y-x= + ⇒ = + ⇔ = i i x xy ( x 0) y x xy x x = ∆ ≠ ⇒ = ⇔ = ∆ ∆ ∆ i i iz y x z y x . = + ⇒ = + n 2 2 i i 1 1 s (x x) n 1 = = − − ∑ k 2 i i i 1 1 m (x x) n 1 = = − − ∑ 2k k 2 i i i i i 1 i 1 1 n m x m x n(n 1) = =     = −    −    ∑ ∑ 22 k k 2 i i i i i 1 i 1 x n m u m u n(n 1) = =   ∆  = −    −    ∑ ∑ i 0 i x x u x − = ∆ k i i i 1 1 x m x n = = ∑ i i 0x x.u x= ∆ + Page 4 of 74 12/10/2012file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm s2 = . (10) được chứng minh.  s2 không cùng đơn vị với xi.  s = được gọi là độ lệch mẫu. s có cùng đơn vị và số thập phân với . Như vậy s2 có số thập phân gấp hai số thập phân của s.  s2 là trung bình của bình phương khoảng lệch giữa xi và cho nên gọi tắt là phương sai. s 2 hay s cho biết mức độ tản mạn của xi so với tâm của mẫu là như vậy cũng cho biết độ đại diện của cho các xi tốt hay không. Khi đo một đại lượng nhiều lần, s2 và s cho biết độ chính xác của các giá trị đo được, s2 hay s được xem là sai số của cách đo. s và cùng đơn vị, có cùng số thập phân. Người ta thường viết ± s đại diện cho mẫu thu được. Công thức (6) và (10) được sử dụng khi các xi lớn hoặc có số thập phân hoặc cách đều.  Tính chất khi X và Y là hai đại lượng độc lập.  Các công thức khác Trong một số trường hợp, phương sai được cho dưới dạng sau: được xem là phương sai lý thuyết DX của đại lượng ngẫu nhiên khi n đủ lớn. với MX đã biết. (11) 2k k 2 i i 0 i i 0 i 1 i 1 1 n m ( xu x ) m ( xu x ) n(n 1) = =     ∆ + − ∆ +   −    ∑ ∑ 2k k k 2 2 2 2 i i 0 i i 0 i i i 1 i 1 i 1 k 2 0 i i 0 i 1 1 n x m u 2nx x m u (nx ) x m u n(n 1) 2nx x m u (nx ) = = = =    = ∆ + ∆ + − ∆ −    −     − ∆ −   ∑ ∑ ∑ ∑ 22 k k 2 i i i i i 1 i 1 x n m u m u n(n 1) = =   ∆  = −    −    ∑ ∑ 2s x x ,x x x x 2 2 i i 0 y xy x x s s= + ⇒ = 2 2 2 2 2i x i y x y2 x sy ( x 0) s s x s x x = ∆ ≠ = ⇔ = ∆ ∆ ∆ 2 2 2 i i i z x yz x y s s s= + ⇒ = + *2 2 1 1 ( ) = = −∑ k i i i s m x MX n *2s Page 5 of 74 12/10/2012file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm . (12) là phương sai chệch của phương sai lý thuyết của đại lượng ngẫu nhiên. Cách viết (12) thường gặp trong các công thức tính tham số của đường cong hồi quy và hệ số tương quan tuyến tính. 3.3. Phương sai của k dãy giá trị Trong các nghiên cứu đồng thời k đại lượng, số liệu được cho dưới dạng sau: Gọi là trung bình chung của k dãy, là trung bình của dãy thứ j (13) (14) Tuỳ thuộc k dãy giá trị của cùng một đại lượng hay của k đại lượng khác nhau sẽ có tương ứng hai phương sai.  Phương sai của k dãy giá trị của cùng một đại lượng (15) (16) 2 2 = −x x 2 *s 1 2 j k 1 2 j k 11 12 1j 1k 21 22 2 j 2k i1 i2 ij ik n 1 n 2 n j n k X X X X x x x x x x x x x x x x x x x x K K K K K K M M K M K M K K M M K M K M K K x jx jk,n ij j,i 1 1 x x N = = ∑ jn j ij j i 1 1 x x n = = ∑ j 1, k= 2 S k2 2 j j j 1 1S n (x x) k 1 = = − − ∑ j j 2 2 n k,nk ij ij jj 1 i 1 j,i 1 1 1 1 x x k 1 n N = = =          = −      −       ∑ ∑ ∑ Page 6 of 74 12/10/2012file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm với , . là trung bình của bình phương khoảng lệch giữa trung bình của từng dãy và trung bình chung của k dãy Thực hiện bình phương công thức (15) Thu được công thức (16)  Phương sai của k dãy giá trị của k đại lượng khác nhau thuộc cùng một loại S2 (17) (18) , với và B đã biết. là trung bình của bình phương các khoảng lệch giữa các giá trị trong dãy và trung bình của dãy. Thực hiện bình phương công thức (17) B C k 1 − − j 2 nk ij jj 1 i 1 1B x n = =    =     ∑ ∑ j 2k,n ij j, i 1 1C x N =    =     ∑ 2 S 2 2 2 1 1 ( 2 ) 1 = = − + − ∑ k j j j j S n x x x x k 2 , 2 1 1 , 1 1 1 2 1 − = = =      = − +    −     ∑ ∑ ∑ j jn k nk ij ij jj i j i x x x Nx k n 2 2 , 1 1 , 1 1 1 1 1 = = =          = −      −       ∑ ∑ ∑ j jn k nk ij ij jj i j i x x k n N jk, n 2 2 ij j j, i 1 1S (x x ) N k = = − − ∑ j j 2k,n nk 2 i j ij jj,i 1 j 1 i 1 1 1 x x N k n = = =      = −    −     ∑ ∑ ∑ 2 A BS N k − = − jk,n 2 ij j,i 1 A x = = ∑ 2S jk,n 2 2 ij j j, i 1 1S ( x x ) N k = = − − ∑ jk,n 2 2 ij j ij j j,i 1 1 (x 2x x x ) N k = = − + − ∑ Page 7 of 74 12/10/2012file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm Công thức (18) được chứng minh. 3.4. Các tham số khác  Hệ số biến thiên Cv (0/00) Cv cho biết độ chính xác tương đối giữa s so với . Cv là tỷ số, viết dưới dạng % hay 0 /00 . , cho phép so sánh độ chính xác tương đối giữa các đại lượng không cùng đơn vị.  Số trung vị : là giá trị giữa của n giá trị đã sắp xếp  Số mốt M0 M0 = xi mà mi lớn nhất trong các m1, m2,..., mk M0 là giá trị hay gặp nhất trong k giá trị x1, x2, …, xk. Với số liệu chuẩn theo một nghĩa nào đấy thì Me = M0 = Vậy Me, M0 là các giá trị cũng cho biết tâm của tập hợp mẫu.  Trung bình nhân, Trung bình điều hoà. Khi nghiên cứu thu được dãy số liệu x1 x2 . . . xn. Đôi khi sử dụng trung bình nhân hoặc trung bình điều hoà trong xử lý số liệu. Công thức tính có dạng sau: Ví dụ: 1. Gọi X là áp lực động mạch phổi thời tâm trương người bình thường j j j 2k,n n nk k 2 jij ij j ij jj,i 1 j 1 i 1 j 1 i 1 1 1 x 2 x x n x N k n = = = = =      = − +    −     ∑ ∑ ∑ ∑ ∑ j j 2k,n nk 2 i j ij jj,i 1 j 1 i 1 1 1 x x N k n = = =      = −    −     ∑ ∑ ∑ v sC x = x eM eM x g h 1 2 1 2 ... 1 1 1 ... = = + + + n n n g x x x h x x x Page 8 of 74 12/10/2012file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm Đo 30 người được kết quả sau: Tính các tham số của mẫu trên. Giải: Cách 1. Lập bảng tính theo (5) và theo (9) . Cách 2. Lập bảng kiểm tra, tính theo (6) và theo (10). Giá trị xi (mm Hg) 2 3 4 5 6 7 8 9 Số người mi 1 4 7 8 2 5 2 1 i xi mi mi xi mi 1 2 1 2 4 2 3 4 12 36 3 4 7 28 112 4 5 8 40 200 5 6 2 12 72 6 7 5 35 245 7 8 2 16 128 k = 8 9 1 9 81 ∑ 30 154 878 Chọn x0 = 5 và ∆x = 1 dẫn đến x 2 xs 2 ix 154 x 5,133 5,1. 30 = = −% 2 2 2 x 1 2624 s [30 878 154 ] 3,0161 1,74 30 29 870 = × − = = − × % v 1,74C 0,339 5,13 = = e 30 2 M x 5,= = 0M 5= x 2 xs i i i x - 5 u = = x -5 1 Page 9 of 74 12/10/2012file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm Các giá trị của và trùng với các kết quả trên. 2. Gọi X là lượng Protein huyết thanh người bình thường (g/l). Điện di 17 mẫu của 17 người thu được kết quả sau: Tính các tham số của mẫu trên Giải: Lập bảng tính theo (6) và theo (10) với và . 3. Gọi X1, X2, X3, X4 là thời gian hết ký sinh trùng sốt rét trong máu (giờ) của bốn nhóm bệnh nhân điều trị theo bốn cách khác nhau. Kết quả nghiên cứu thu được số liệu sau: Giá trị xi (g/l) 6,9 7,2 7,6 8,2 8,5 Số người mi 2 3 5 6 1 X1 18 37 46 46 46 51 62 78 85 90 X2 38 41 41 42 43 44 45 50 50 52 X3 36 48 50 52 58 60 60 68 74 74 36 38 40 42 48 60 62 70 72 72 15 4 5,133 5,1. 30 = + × = −x % 2 2 2 2 x 1 2624 s [30 88 4 ] 3,0161 1,74 30 29 870 = × − = = − × % x 2 xs x 2xs i i x 7,5 u 0,1 − = i i x 8 v 0,1 − = 0,1 0,1 x = 7,5 + ×36 = 8 + ×(-49) = 7,71 17 17 2 2 2 2 2 2 2 x 0,1 0,1 0,1 ×7170 s = 17×498 -36 = 17×563- 49 = = 0,2636 = 0,51 17×16 17×16 272         x s 7,71 0,51(g / l)± = ± v e 0 0,51C 0,066, M 7,6, M 8,2 7,71 = = = = Page 10 of 74 12/10/2012file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm Tính các tham số , s, của bốn dãy số liệu. 10 + 10 + 10 + 10 = 40 [10 x 35.895 – 559 2] = 516,3222 = 22,722 A = 35.895 + 20.084 + 34.944 + 31.120 = 122.043 X4 i 1 18 324 38 1444 36 1296 36 1296 2 37 1369 41 1681 48 2304 38 1444 3 46 2116 41 1681 50 2500 40 1600 4 46 2116 42 1764 52 2704 42 1764 5 46 2116 43 1849 58 3364 48 2304 6 51 2601 44 1936 60 3600 60 3600 7 62 3844 45 2025 60 3600 62 3844 8 78 6084 50 2500 68 4624 70 4900 9 85 7225 50 2500 74 5476 72 5184 10 90 8100 52 2704 74 5476 72 5184 Σ 559 35.895 446 20.084 580 34.944 540 31.120 x 2 2S ,S% 1X 2 1X 2X 2 2X 3X 2 3X 4X 2 4X 4 j i 1 n = =∑ 1 559 x 55,9 10 = = 1 2 x 1 s 10 9 = × 2 446 x 44,6 10 = = 2 2 2 2 x 1 s 10 20.084 446 21,3778 4,62 10 9  = × − = =  × 3 580 x 58 10 = = 3 2 2 2 x 1 s 10 34.944 580 144,8889 12,04 10 9  = × − = =  × 4 540 x 54 10 = = 4 2 2 2 x 1 s 10 31.120 540 217,7778 14,76 10 9  = × − = =  × 1 x (559 446 580 540) 53,125. 40 = + + + = 2 2 2 2559 446 580 540B 113.939,7 10 10 10 10 = + + + = 21C [559 446 580 540] 112.890,625 40 = + + + = 2 1 [113.939,7 112.890,625] 349,6917 4 1 s = − = − % 2 1 [122.043 113.939,7] 225,0917. 40 4 s = − = − % Page 11 of 74 12/10/2012file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm Chú ý: Nếu k dãy số liệu của cùng một đại lượng, có thể đổi biến với x0 và ∆x tuỳ chọn , tính toán sẽ thuận lợi hơn. Khi đó , B và C tính theo uj. Chú ý: Đôi khi giá trị trung bình không phản ánh đúng kết quả nghiên cứu như ở các ví dụ dưới đây. 4. Đánh giá một phương pháp điều trị ngoại khoa mới kéo dài 10 năm nhận thấy: Năm 1, 2, 3 điều trị cho 47 bệnh nhân, kết quả tốt: 31 người Năm 4, 5, 6, 7 điều trị cho 96 bệnh nhân, kết quả tốt: 71 người. Năm 8, 9, 10 điều trị cho 64 bệnh nhân, kết quả tốt: 58 người. Tỷ lệ tốt trung bình của phương pháp điều trị bằng Từ năm 11 trở đi tỷ lệ điều trị tốt lớn hơn . Vậy giá trị trung bình không phản ánh đúng kết quả nghiên cứu. 5. Chỉ tiêu tuyển sinh vào khoa I (ĐK) năm 2000 của ĐH X là 260. Số thí sinh đăng ký thi : 3267; Trung bình 13 thí sinh lấy 1 người. Chỉ tiêu tuyển sinh vào khoa II (KTYH) của ĐH X là 50. Số thí sinh đăng ký thi : 641; Trung bình 13 thí sinh lấy 1 người. Chỉ tiêu tuyển sinh vào khoa III (YTCC) của ĐH X là 30. Số thí sinh đăng ký thi : 1134; Trung bình 38 thí sinh lấy 1 người. Thí sinh thi vào khoa III có nên chuyển sang thi vào khoa I không? Để đỗ vào khoa I, mỗi thí sinh phải hơn ít nhất 3007 thí sinh khác. Để đỗ vào khoa III, mỗi thí sinh chỉ phải hơn ít nhất 1104 thí sinh khác. Thí sinh thi vào khoa II không nên đổi nguyện vọng sang khoa khác vì khó hơn. CÂU HỎI TỰ LƯỢNG GIÁ Hãy chọn một kết quả đúng. 1. Định lượng Protein dịch não tủy người bình thường (X, đv mg%) thu được số liệu sau: Tính của số liệu trên theo công thức tính. Kết quả: A. 17,94±2,37; B. 17,94±2,40; C. 18,48±2,40; D. 18,48±2,37; E. số khác 11 17 19 12 17 19 14 18 19 16 18 20 16 18 20 16 18 20 16 19 20 16 19 20 16 19 21 17 19 21 17 19 21 17 19 22 j 0 j X x u x − = ∆ j 1, k= 2 2 x (B C) k 1 s ∆ −= − % 160 0,773. 207 = 58 (90,6%) 64 x s± Page 12 of 74 12/10/2012file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm 2. Gọi X là áp lực trung bình của động mạch phổi bệnh nhân hẹp hai lá đơn thuần (đv: mmHg), nghiên cứu thu được số liệu sau: Tính của số liệu trên. Kết quả: A. 50,162±20,690; B. 49,839±20,690; C. 50,162±20,757; D. 49,839±20,757; E. số khác 3. Đếm nhịp tim (tần số tim) của trẻ nam 3 lứa tuổi thu được kết quả sau: Nhóm I 9 tuổi n1 = 30 = 72,77±4,60 Nhóm II 10 tuổi n2 = 45 = 72,47±5,06 Nhóm III 11 tuổi n3 = 32 = 73,63±5,42. Tính phương sai chung S2 của 3 nhóm số liệu trên. Kết quả: A. 25,3800; B. 25,2674; C. 25,4891; D. 12,9012; E. số khác. 4. Theo dõi số chuột chết khi cho các lô chuột thí nghiệm sử dụng các liều thuốc có độc tăng dần thu được số liệu sau: Tính liều chết trung bình của số liệu trên (Số liệu Finney). Kết quả: A. 0,02846; B. 0,0247; C. 0,0253; D. 0,0255; E. số khác. xi 13 23 33 43 53 63 73 83 93 103 mi 5 20 27 24 25 23 15 10 4 2 xi(liều, mg/kg) 0,015 0,02 0,025 0,03 0,035 0,04 Số chuột mỗi lô 20 69 95 78 44 20 Số chết 0 11 50 61 37 20 x s± 1 1x s± 2 2x s± 3 3x s± Page 13 of 74 12/10/2012file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm Bài 2 KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ MỤC TIÊU Trình bày được các bước của bài toán kiểm định. Điều trị một bệnh bằng nhiều phương pháp, mỗi phương pháp có một tỷ lệ khỏi nhất định. Các tỷ lệ khỏi của các phương pháp có như nhau không ? Định lượng Protein toàn phần trong máu trẻ suy dinh dưỡng trước và sau điều trị. Phương pháp điều trị có hiệu quả không ? Nói cách khác, lượng Protein toàn phần trung bình sau điều trị có cao hơn hẳn lượng Protein toàn phần trung bình trước điều trị không ? Điều tra n đối tượng nghiên cứu thấy m đối tượng có đặc tính A. Khả năng xuất hiện hiện tượng A là p o có đúng không ? Trên đây là những bài toán kiểm định giả thiết thống kê. 1. GIẢ THIẾT VÀ ĐỐI GIẢ THIẾT Trong bài toán kiểm định giả thiết thống kê, giả thiết cần kiểm định ký hiệu , được nêu ra dưới dạng: các tỷ lệ như nhau, các trung bình như nhau... Các giả thiết đối lập với giả thiết gọi tắt là đối thiết, ký hiệu H1. Đối giả thiết không như nhau hay khác nhau được gọi là đối giả thiết hai phía. Đối giả thiết lớn hơn hay nhỏ hơn là các đối giả thiết một phía. Tuỳ theo giá trị thu được trong nghiên cứu để đưa ra đối giả thiết một phía hay hai phía. 2. ĐIỀU KIỆN Các bài toán khác nhau có những điều kiện khác nhau, song để đảm bảo tính đúng đắn và chính xác của kiểm định có một số điều kiện sau: + Điều kiện chuẩn. + Điều kiện n đủ lớn. + Điều kiện đám đông thuần nhất. 3. TÍNH GIÁ TRỊ CỦA ĐẠI LƯỢNG NGẪU NHIÊN Đó là các giá trị của đại lượng ngẫu nhiên chuẩn T hoặc Student T n hoặc đại lượng ngẫu nhiên … Các công thức tính được nêu trong từng bài toán cụ thể. 4. TRA GIÁ TRỊ TỚI HẠN Trước hết cần chọn mức α, sau đó tra giá trị tới hạn tương ứng mức α đó. Mức thường chọn là 0,05, cũng có khi chọn tới mức 0,01 hay 0,001. 0H 0H 2χ α Page 14 of 74 12/10/2012file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm Giá trị tới hạn chia miền giá trị của đại lượng ngẫu nhiên thành hai miền: miền có giá trị ứng với xác suất lớn 1 – là miền giữ giả thiết H0, miền có giá trị ứng với xác suất bé α là miền bác giả thiết H0. Tuỳ theo giá trị tính được của đại lượng ngẫu nhiên thuộc miền nào mà quyết định kết luận bài toán kiểm định. 5. CÁC XÁC SUẤT CỦA BÀI TOÁN KIỂM ĐỊNH  H0 đúng Giá trị của đại lượng ngẫu nhiên thuộc miền giữ giả thiết. Xác suất giữ giả thiết khi giả thiết đúng gọi là độ tin cậy. Giá trị của đại lượng ngẫu nhiên thuộc miền bác giả thiết. Xác suất bác giả thiết khi giả thiết đúng gọi là nguy hiểm loại I hay sai lầm loại I. Do Ho đúng, sai lầm loại I chính là , còn
Tài liệu liên quan