Bài giảng Thống kê nghiên cứu - Bài: Đại cương về mục tiêu, biến số và phân tích số liệu - Lưu Ngọc Hoạt

Bài tập Nếu muốn xác định các biến số cần và đủ cho một nghiên cứu thì cần dựa vào cách nào dới đây (chọn cách mà Anh/Chị cho là hợp lý nhất)? A.  Kinh nghiệm của các nghiên cứu tõng tự đã đợc tác giả khác triển khai, B.  Cây vấn đề đợc phát triển từ đề tài nghiên cứu C.  Kế hoạch trình bày phần kết quả nghiên cứu và bàn luận D.  Mục tiêu nghiên cứu Phân biệt thống kê mô tả và thống kê suy luận% •  Thống kê mô tả: ‒  là mô tả kết quả thu đợc từ mẫu nghiên cứu ‒  biểu thị độ lớn, sự phân bố của các tham số của mẫu nghiên cứu nh , độ lệch chuẩn, các tỷ lệ, bảng, biểu, đồ thị sự phân bố theo các biến số khác nhau nh tuổi, giới, địa d. •  Thống kê suy luận: ‒  là quá trình ngoại suy kết quả nghiên cứu từ mẫu ra quần thể nghiên cứu. ‒  bao gồm 2 phơng pháp: ớc lợng và kiểm định

pdf27 trang | Chia sẻ: thanhle95 | Lượt xem: 305 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Bài giảng Thống kê nghiên cứu - Bài: Đại cương về mục tiêu, biến số và phân tích số liệu - Lưu Ngọc Hoạt, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
1 Đại cương về 
 Mục tiêu, Biến số và Phân tích số liệu % Lưu Ngọc Hoạt Viện YHDP và YTCC, ĐH Y Hà Nội MT cụ thể: ỹ  Xỏc định tỷ lệ cao HA của người cao tuổi tại huyện A. ỹ  Xỏc định một số yếu tố liờn quan đến tỡnh trạng cao HA. ỹ  Đỏnh giỏ hiệu quả của một số giải phỏp can thiệp làm giảm tỷ lệ tăng huyết ỏp. Tờn đề tài: Huyết ỏp của người dõn tại huyện A năm 2005 và một số yếu tố ảnh hưởng MT chung: Xỏc định tỷ lệ cao HA của người cao tuổi tại huyện A năm 2005 và một số yếu tố ảnh hưởng Mối liờn quan giữa tờn đề tài, mục tiờu chung và mục tiờu cụ thể M ục t iờ u 3 M ục t iờ u 2 M ục t iờ u 1 Mục tiờu chu g % % Tờn đề tài M ục t iờ u 3 M ục t iờ u 2 M ục t iờ u 1 Mục tiờu chung Tờn đề tài Cao HA của người cao tuổi tại huyện A năm 2005 và một số yếu tố ảnh hưởng •  Xỏc định tỷ lệ cao HA của người cao tuổi tại huyện A năm 2005 và một số yếu tố ảnh hưởng ỹ  Xỏc định tỷ lệ cao HA của người cao tuổi tại huyện A. ỹ  Xỏc định một số yếu tố liờn quan đến tỡnh trạng cao HA. ỹ  Đề xuất (và thăm dũ) một số giải phỏp can thiệp làm giảm tỷ lệ tăng huyết ỏp. M ục t iờ u 3 M ục t iờ u 2 M ục t iờ u 1 Mục tiờu chung Biến số 1 Biến số 2 Biến số 3 Biến số 4 Mối liờn quan giữa một số thành phần của NC Biến số 1 Biến số 2 Biến số 3 Biến số 4 Biến số 1 Biến số 2 Biến số 3 Biến số 4 Tờn đề tài   Định nghĩa Biến số% • Đặc tính của người, vật sự việc, hiện tư ợng biến thiên theo các điều kiện khác nhau • Do người nghiên cứu lựa chọn phù hợp với từng mục tiêu nghiên cứu • Triển khai nghiên cứu chính là thu thập số liệu cho các biến số này • Đối lập với biến số là các hằng số 2 Phân loại theo bản chất của biến số Biến định lượng Biến định tính Biến liên tục Biến rời rạc Biến tỷ suất Biến khoảng chia Biến danh mục Biến thứ hạng Biến nhị phân Bài tập 1: Phân loại các biến số Định tính Định lượng Danh mục Thứ hạng Nhị phân Khoảng chia Tỷ suất Liên tục Rời rạc Tuổi Hàm lượng đường huyết Độ cận, viễn của mắt (đi ốp) Số lượng hồng cầu Nhiệt độ không khí Giới Dân tộc Trình độ văn hoá Số vi khuẩn/vi trư ờng Bài tập 1: Phân loại các biến số Định tính Định lượng Danh mục Thứ hạng Nhị phân Khoảng chia Tỷ suất Liên tục Rời rạc Tuổi X X X Hàm lượng đường huyết X X X Độ cận, viễn của mắt (đi ốp) X X X Số lượng hồng cầu X X X Nhiệt độ không khí X X X Giới X X Dân tộc X X Trình độ văn hoá X X Số vi khuẩn/vi trư ờng X X X Phân loại theo mối tương quan giữa các biến số Biến độc lập (phơi nhiễm) Biến phụ thuộc (bệnh) Yếu tố nhiễu l  Nhiễu là yếu tố làm sai lệch ảnh hưởng của phơi nhiễm với bệnh (thay đổi độ lớn và ý nghĩa thống kê) l  Biến độc lập, phụ thuộc và nhiễu được xác định bởi ngư ời nghiên cứu và chỉ có ý nghĩa trong nghiên cứu đó. 3 Tiêu chuẩn của 1 yếu tố nhiễu% v  Phải là 1 yếu tố nguy cơ đối với bệnh v  Phải có liên quan đối với phơi nhiễm như ng không lệ thuộc vào phơi nhiễm v  Không phải là yếu tố trung gian giữa phơi nhiễm và bệnh v  Phải thực sự tác động lên mối tương quan giữa phơi nhiễm và bệnh (khẳng định khi phân tích số liệu) v  Có thể đổi chỗ cho yếu tố phơi nhiễm tuỳ theo mục đích người làm nghiên cứu Trường hợp nào sau đây là nhiễu?% E E E D E E D D D D D D E E E D D E F F F F F F F F F Bài tập Nếu muốn xác định các biến số cần và đủ cho một nghiên cứu thì cần dựa vào cách nào dưới đây (chọn cách mà Anh/Chị cho là hợp lý nhất)? A.  Kinh nghiệm của các nghiên cứu tưõng tự đã được tác giả khác triển khai, B.  Cây vấn đề được phát triển từ đề tài nghiên cứu C.  Kế hoạch trình bày phần kết quả nghiên cứu và bàn luận D.  Mục tiêu nghiên cứu Phân biệt thống kê mô tả và thống kê suy luận% •  Thống kê mô tả: ‒  là mô tả kết quả thu được từ mẫu nghiên cứu ‒  biểu thị độ lớn, sự phân bố của các tham số của mẫu nghiên cứu như , độ lệch chuẩn, các tỷ lệ, bảng, biểu, đồ thị sự phân bố theo các biến số khác nhau như tuổi, giới, địa dư... •  Thống kê suy luận: ‒  là quá trình ngoại suy kết quả nghiên cứu từ mẫu ra quần thể nghiên cứu. ‒  bao gồm 2 phương pháp: ước lượng và kiểm định 4 Quần thể đích% Quần thể nghiên cứu% Mẫu% Tham số quần thể % (à, σ, P...)%Mẫu xác suất% - Ngẫu nhiên đơn ! - Ngẫu nhiên hệ thống! - Mẫu phân tầng ! - Mẫu chùm ! - Mẫu nhiều bậc ! Mẫu không xác suất% - Mẫu kinh nghiệm % - Mẫu thuận tiện ! - Mẫu chỉ tiêu! - Mẫu có mục đích.% Chọn mẫu % Ước lượng % •  điểm% •  khoảng % Kiểm định giả thuyết% Suy luận thông kê (Chỉ áp dụng cho mẫu xác suất với cỡ mẫu đủ lớn) % Kết luận ngoại suy ! Các test thống kê Giá trị p Lựa chọn! Mô tả các tham số mẫu% (trình bày kết quả nghiên cưú) % Tham số mẫu% ( , s, p...)!XBiến số ! Thống kê mô tả % Thống kê suy luận% 1. Thống kê mô tả % Bài tập Nếu một người nghiờn cứu muốn thu thập số liệu về huyết ỏp tối đa của cỏc đối tượng NC, cỏch thu thập nào dưới đõy Anh/Chị cho là hợp lý nhất? A.  Phõn huyết ỏp thành cỏc nhúm (vớ dụ < 90 mmHg; 90-120; 121-140...) sau đú chọn nhúm thớch hợp B.  Ghi đầy đủ trị số huyết ỏp tối đa của từng đối tượng. C.  Phõn đối tượng thành hai loại cú và khụng cao huyết ỏp tối đa D.  Phõn thành cỏc nhúm: huyết ỏp thấp, bỡnh thường, cao và rất cao Bài tập Nếu một người nghiờn cứu muốn thu thập số liệu về số điếu thuốc lỏ một người hỳt trung bỡnh/ngày, cỏch thu thập nào dưới đõy Anh/Chị cho là hợp lý nhất? A.  Phõn thành cỏc nhúm (vớ dụ < 5 điếu; 5-10; 11-15; 16-20...) sau đú chọn nhúm thớch hợp B.  Ghi chớnh xỏc số điếu thuốc hỳt trung bỡnh mà đối tượng đó trả lời. C.  Phõn đối tượng thành hai loại: hỳt trờn 1 bao hoặc dưới một bao D.  Phõn thành cỏc nhúm: hỳt nhẹ, hỳt trung bỡnh, hỳt nhiều, hỳt rất nhiều. 5 Ví dụ 1: Mô tả đặc điểm của cân nặng khi đẻ của 500 trẻ mới sinh tại bệnh viện M: % 1. Khi cân nặng tính bằng gram (biến định lượng)! ố Đo lường độ tập trung của số liệu: - Giá trị trung bình: với số liệu phân bố chuẩn - Giá trị trung vị: với bộ số liệu phân bố không chuẩn ố Đo lường độ phân tán của bộ số liệu: - Khoảng dao động (Max ‒ Min) - Độ lệch chuẩn 2. Khi cân nặng tính theo mốc < hoặc ≥ 2500 gram (biến định tính) ! ố Tỷ lệ trẻ có cân nặng < 2500 gr Ưu điểm của phân tích số liệu dưới dạng định lượng (ví dụ cân nặng khi đẻ của trẻ)% BA XX >>PA = PB = 10% % 2500 gr % 50 trẻ 450 trẻ B 2500 gr % 50 trẻ 450 trẻ A % Ưu điểm của phân tích số liệu dưới dạng định lượng (tiếp) (Huyết áp tối đa) % PA = PB = 60% % 120 mmHg % 300 người 200 người A 120 mmHg % 300 người 200 người B BA XX ≈ sB >> sA % Các nội dung chính của thống kê mô tả % I. Tổng hợp các biến số% ‒  Với các biến định tính:! • Tần số (frequency)! • Tỷ số (ratio)! • Tỷ lệ (proportion)! • Tỷ suất (rate)! ‒  Với các biến định lượng: ! • Đo lường độ tập trung: giá trị trung bình, trung vị, mốt! • Đo lường độ phân tán: phương sai, độ lệch chuẩn, % 6 Các nội dung chính của thống kê mô tả % II. Trình bày số liệu bằng bảng: % ‒  Bảng 1 chiều % ‒  Bảng 2 chiều% III. Trình bày số liệu bằng biểu và đồ thị % ‒  Đồ thị cột: % •  Cột rời, ! •  Cột chồng, ! •  Cột liên tục ! ‒  Đồ thị hình tròn% ‒  Biểu đồ gấp khúc % ‒  Biểu đồ đa giác % ‒  Biểu đồ chấm (đám mây)% ‒  Bản đồ % 1/ Tổng hợp số liệu với các biến định tính 1.1. Tần số (frequency):% •  Biểu thị số lần xuất hiện của 1 quan sát nào đó% •  VD : Phân bố nhóm dân tộc trong số 22 người nghiên cứu. 22 %Tổng cộng% 6%Nùng % 12 %Tày% 4%Kinh % Tần số%Đếm số lần xuất hiện%Giá trị biến% 1.2. Tỷ số (ratio):% •  Là phân số mà mẫu số không bao hàm tử số n  Tử số và mẫu số có thể khác nhau về đơn vị đo lường n  Hệ số k có thể là 1, 10, 100, 1000... n  Ví dụ: a% --- x k % b% số học sinh nam ---------------------- số học sinh nữ số giường bệnh ---------------------------- dân số trong khu vực 7 1.3. Tỷ lệ (proportion):% : Là 1 phân số mà mẫu số bao hàm tử số, do vậy cả mẫu và tử đều phải cùng đơn vị a% ------- x k % a + b% n  Hệ số k có thể là 1, 10, 100, 1000... n  Khi k = 100, ta có tỷ lệ phần trăm (percentage)! n  Ví dụ:% số học sinh nam Tỷ lệ học sinh nam = ----------------------- tổng số học sinh số người mắc sốt rét Tỷ lệ mắc sốt rét = ---------------------------------- tổng số người được khám 1.4. Tỷ suất (rate):% •  Là 1 dạng đặc biệt của tỷ lệ khi nó được đo lư ờng trong một khoảng thời gian nhất định •  Ví dụ: số biến cố xẩy ra trong 1 khoảng thời gian ------------------------------------------------------------ x k dân số trung bình trong khoảng thời gian đó n  Hệ số k có thể là 1, 10, 100, 1000... n  Ví dụ:% số người bị sốt rét tại huyện A năm 2000 ------------------------------------------------------------- x 100 dân số trung bình của huyện A trong năm đó 2/ Tổng hợp số liệu với các biến định lượng 2.1. Đo lường độ tập trung: Bài tập Tham số nào là thớch hợp nhất để đo lường độ tập trung của bộ số liệu dưới đõy: 12, 15, 17, 20, 23, 24, 26, 28, 80 A.  Trung vị B.  Khoảng phần trăm C.  Giỏ trị trung bỡnh D.  Độ lệch chuẩn 8 •  Được tính bằng tổng số các giá trị quan sát đư ợc chia cho số lần quan sát. •  Giá trị trung bình chỉ tính được với các số dạng liệu số (biến định lượng) •  Ví dụ:! ‒  Chiều cao của 7 em gái đo được như sau: ‒  141, 141, 143, 144, 145, 146, 155 cm (tổng cộng tất cả chiều cao là 1015 cm) ‒  Vì vậy trung bình bằng 1015/7, tức là 145 cm. n X n XXXX n i i n ∑ == +++ = 121 ... v  Trung bình số học (trung bình cộng): •  Là giá trị giữa của 1 bộ số liệu khi chúng được sắp xếp theo thứ tự tăng dần hoặc giảm dần. •  Giá trị này chia sự phân bố của số liệu thành hai phần bằng nhau ! •  Ví dụ:! ‒  ta có bộ số liệu: 47, 41, 44, 43, 42, 40, 72 kg. ‒  để tính trung vị, trước hết sắp xếp số liệu theo thứ tự: 40, 41, 42, 43, 44, 47, 72 kg. ‒  trung vị sẽ là giá trị của quan sát thứ (n+1)/2, tức là (7+1)/2 =4, và giá trị thứ 4 = 43 kg là trung vị. ‒  Với bộ số liệu: 40, 41, 42, 43, 44, 47, 49 và 72 thì trung vị là giá trị trung bình cộng của giá trị thứ 4 và thứ 5 = (43+44)/2 = 43,5 v  Trung vị (giá trị trung tâm): •  Là giá trị quan sát được nhiều lần nhất trong bộ số liệu •  Trong bộ số liệu dưới đây:141, 141, 143, 144, 145, 146, 155 thì 141 được coi là mốt vì quan sát được nhiều lần nhất. •  Mốt ít có giá trị trong đo lường độ tập trung của bộ số liệu khi ở dạng định lượng, nhưng có giá trị với bộ số liệu phân nhóm, hoặc biến định tính •  Ví dụ: Trong bảng dưới, nhóm tuổi 36-45 là mốt Nhóm tuổi Tần số Nhóm tuổi Tần số Nhóm tuổi Tần số < 5 15 26-35 67 56-65 43 5-15 24 36-45 120 66-75 27 16-25 32 46-55 94 >75 12 v  Mốt: Phân biệt về giá trị trung bình, trung vị và mốt: Mốt = 10 Trung vị = 11 Trung bình = 11,3 Đo lường (cm) 9 Ví dụ phân bố chuẩn% Fr eq ue nc y bwt 709 % 4990 % 0 % 29 % Phân biệt về giá trị trung bình, trung vị và mốt (tiếp): •  Giá trị trung bình được sử dụng thường xuyên hơn và có giá trị khi bộ số liệu là 1 phân bố chuẩn. % •  Khi bộ số liệu phân bố không chuẩn, trung vị có ý nghĩa hơn:% •  Ví dụ: ! ‒  Với bộ số liệu này: 40, 41, 42, 43, 44, 47, 72 thì giá trị trung bình = 47, trong khi giá trị trung vị bằng 43. ‒  Nếu ta thay giá trị 72 trong bộ số liệu trên = 51, giá trị trung vị không đổi, nhưng giá trị trung bình chỉ còn là 44! 2/ Tổng hợp số liệu với các biến định lượng (tiếp) 2.2. Đo lường độ phân tán: v  Khoảng số liệu (range): % ‒  Là hiệu giữa hai giá trị đo lường cao nhất và thấp nhất trong một bộ số liệu. ‒  Khoảng số liệu (R) = Xmax ‒ Xmin •  Ví dụ: nếu cân nặng của 7 phụ nữ là 40, 41, 42, 43, 44, 47 và 72 kg, khoảng quan sát sẽ là 72 - 40 = 32 kg.% 1 )( 1 2 2 − − = ∑ = n XXi s n i v  Phương sai (variance)% ‒  Là tổng bình phương các khoảng cách giữa giá trị quan sát so với giá trị trung bình chia cho số các quan sát trừ đi 1. v  Độ lệch chuẩn (standard deviation)% 2ss = 10 v  Ví dụ minh hoạ: X v  Ví dụ minh hoạ (tiếp): 6 10 0 30 Σ 1 2 1 0 4 Bình phương khoảng chênh lệch giữa giá trị quan sát so với giá trị trung bình 1 2 -1 0 -2 Khoảng chênh lệch so với giá trị trung bình 7 8 5 6 4 Tỷ lệ phụ nữ làm kinh tế giỏi (Xi) 01 00 99 98 97 )( XXi − 5,2 4 10 1 )( 1 2 2 == − − = ∑ = n XXi s n i X 2)( XXi − 58,15,2 ==⇒ s v  Hệ số biến thiên (coeficient of variation)% •  Là tỷ số giữa độ lệch chuẩn và trị tuyệt đối của giá trị trung bình •  Hệ số biến thiên được biểu thị bằng tỷ lệ phần trăm (%) và biểu thị mức độ biến thiên của độ lệch chuẩn so với giá trị trung bình •  Giúp cho việc so sánh mức độ phân tán của nhiều bộ số liệu với nhau: •  Ví dụ:! •  CV của cân nặng nam =12/60 = 20% •  CV của cân nặng nữ = 8/54 = 15% •  Vậy bộ số liệu của cân nặng nam phân tán hơn X sCV = 8 54 Cân nặng nữ thanh niên 12 60 Cân nặng nam thanh niên s X •  Thống kê mô tả: Quan tâm đến mẫu NC ‒  Tổng hợp số liệu: • tỷ lệ, tỷ số, tỷ suất • Độ tập trung, độ phân tán của bộ số liệu định lượng ‒  Trình bày kết quả nghiên cứu: • Bảng • Biểu đồ, đồ thị •  Thống kê suy luận: quan tâm đến quần thể ‒  Ước lượng : • Điểm, • Khoảng ‒  Kiểm định giả thuyết • Khác nhau • Tương quan 11 2. Thống kê suy luận % 2.1. Ước lượng điểm, khoảng% Phân biệt ước lượng và kiểm định% •  ước lượng: ‒  ngoại suy từ tham số mẫu ra tham số quần thể: ‒  từ trung bình của mẫu ( ) sang TB quần thể (à) ‒  từ tỷ lệ của mẫu (p) sang tỷ lệ của quần thể (P) ‒  từ OR, RR, r của mẫu ra quần thể. •  Kiểm định giả thuyết: ‒  so sánh 2 hoặc nhiều quần thể NC từ sự khác biệt của 2 hoặc nhiều mẫu rút ra từ các quần thể đó. ‒  kiểm định mối tương quan của quần thể dựa theo mối tương quan thu được từ mẫu X Ví dụ: Cân nặng khi đẻ của trẻ mới sinh tại huyện A: tham số mẫu và quần thể % Trẻ sơ sinh% tại huyện A % 5000 trẻ % Mẫu% 500 trẻ % 12802954±=± sXTham số mẫu: ??±=±σàTham số QT: ước lượng hay kiểm định? Ví dụ: Cân nặng khi đẻ của trẻ mới sinh tại huyện A: tham số mẫu và quần thể % Trẻ sơ sinh% tại huyện A % 5000 trẻ % Mẫu% 500 trẻ % Tỷ lệ trẻ (p) có cân nặng < 2500 gram = 20% ước lượng hay kiểm định? Tỷ lệ trẻ (P) có cân nặng < 2500 gram = ? 12 Ví dụ: Cân nặng khi đẻ của trẻ mới sinh tại huyện A và huyện B % Trẻ sơ sinh% tại huyện A % 5000 trẻ % Trẻ sơ sinh% tại huyện B % 6000 trẻ % Mẫu% 500 trẻ % Mẫu B % 500 trẻ % ? 12802954± 8862785±> ước lượng hay kiểm định? * Ước lượng điểm:% X=à P = p ! + Với biến định lượng: ố + Với biến định tính: ố n  Nhược điểm của ước lượng điểm: n  Ví dụ điểm thi của 9 sinh viên Sinh viên số 1 2 3 4 5 6 7 8 9 Điểm đạt được 9 8 7 9 6 4 5 8 3 Nếu coi 9 sinh viên này là 1 quần thể ố 56,6 9 385469789 = ++++++++ =à Nếu chọn ngẫu nhiên1 mẫu có 2 SV, ta sẽ có 36 cơ hội. N! % ---------% n!(N-n)!% * Ước lượng điểm (tiếp)% Mẫu số: Cặp sinh viên số: Điểm của từng sinh viên Điểm trung bình của 2 sinh viên 1 1, 2 9 8 8,5 2 1, 3 9 7 8,0 3 1, 4 9 9 9,0 4 1, 5 9 6 7,5 5 1, 6 9 4 6,5 6 1, 7 9 5 7,0 7 1, 8 9 8 8,5 8 1, 9 9 3 6,0 9 2, 3 8 7 7,5 10 2, 4 8 9 8,5 11 2, 5 8 6 7,0 12 2, 6 8 4 6,0 36 8,9 8 3 5,5 * Ước lượng điểm (tiếp)% Tần số quan sát với các trung bình mẫu khác nhau (phân bố mẫu): TB mẫu 3,5 4,0 4,5 5,0 5,5 6,0 6,5 7,0 7,5 8,0 8,5 9,0 Tần số 1 1 2 2 4 5 5 4 4 3 4 1 13 Ví dụ phân bố chuẩn% Fr eq ue nc y bwt 709 % 4990 % 0 % 29 % * Ước lượng khoảng % + Với biến định lượng: ố + Với biến định tính: ố + Công thức tổng quát: Tham số quần thể = tham số mẫu ± Zα/2.SE SE (Sai số chuẩn) = độ lệch chuẩn của các trung bình mẫu Ước lượng khoảng còn dùng với nhiều tham số mẫu khác như OR, RR, r... n sZX 2/αà ±= n ppZpP )1.(2/ − ±= α * Nguyên lý ước lượng khoảng và khoảng tin cậy % à 2.2. Kiểm định giả thuyết% * So sánh sự khác nhau giữa 2 nhóm % 14 Ví dụ 2: So sánh cân nặng khi đẻ của trẻ mới sinh tại huyện A so với huyện B:% Trẻ sơ sinh% tại huyện A % 5000 trẻ % Trẻ sơ sinh% tại huyện B % 6000 trẻ % Mẫu A % 500 trẻ % Mẫu B % 500 trẻ % 1. Khi cân nặng của trẻ dưới dạng gram% Trẻ sơ sinh% tại huyện A % 5000 trẻ % Trẻ sơ sinh% tại huyện B % 5000 trẻ % Mẫu A % 500 trẻ % Mẫu B % 500 trẻ % ? Test t! 12802954± 8862785±> 2. Khi cân nặng của trẻ dưới dạng < hoặc ≥ 2500 gram% Trẻ sơ sinh% tại huyện A % 5000 trẻ % Trẻ sơ sinh% tại huyện B % 5000 trẻ % Mẫu A % 500 trẻ % Mẫu B % 500 trẻ % >% ? Test χ2 hoặc Fisher test! pA = 25% pB = 22% 2.2. Kiểm định giả thuyết% * So sánh sự khác nhau giữa > 2 nhóm % 15 Trẻ sơ sinh% tại huyện A % 5000 trẻ % Trẻ sơ sinh% tại huyện B % 5000 trẻ % Mẫu A % 500 trẻ % Mẫu B % 500 trẻ % 12802954± 10242645±> 1. Với biến định lượng% Trẻ sơ sinh% tại huyện C % 5000 trẻ % Mẫu C % 500 trẻ % 8862785±< ? ? Test ANOVA % Trẻ sơ sinh% tại huyện A % 5000 trẻ % Trẻ sơ sinh% tại huyện B % 5000 trẻ % Mẫu A % 500 trẻ % Mẫu B % 500 trẻ % > 2. Với biến định tính% Trẻ sơ sinh% tại huyện C % 5000 trẻ % Mẫu C % 500 trẻ % > ? ? Test χ2 % pA = 25% pB = 21% pc = 16% Không % ghép cặp % t test ! cho cặp% test t-student hoặc Z test % Khi so sánh trên 2 nhóm % ANOVA % (F test) % Phân tích% sự % khác nhau Biến định tính% Biến định lượng% Ghép cặp % Không % ghép cặp %Với tất cả các loại nghiên cứu% McNemar’s test (χ2) % χ2 hoặc Fisher test % Khi so sánh % 2 nhóm% Ghép cặp % Không % ghép cặp % Ghép cặp % t test ! cho cặp% Tổng hợp phân tích sự khác nhau Phõn bổ tựy ý Tổng số bệnh nhõn Can thiệp mới Can thiệp cũ (hoặc dựng Placebo) Tỷ lệ khỏi Lần điều trị thứ nhất Can thiệp mới Can thiệp cũ (hoặc dựng Placebo) Lần điều trị thứ hai Nhúm B Nhúm B Nhúm A Nhúm A Tỷ lệ khỏi Tỷ lệ khỏi Tỷ lệ khỏi 16 2.2. Kiểm định giả thuyết% Kiểm định mối tương quan giữa 2 biến nhị phân % Kiểm định mối quan hệ nhân quả Phân tích Sự " Tương quan" Đo lường độ lớn của mối tư ơng quan % Biến nhị phân% Biến định lượng% NC ngang/ % NC bệnh-chứng% Tỷ suất chênh (OR)% NC thuần tập/% NC Thử nghiệm % Nguy cơ tư ơng đối (RR) và OR! Với tất cả các loại nghiên cứu% Phân tích tư ơng quan và hồi quy% Test ý nghĩa TK của mối tư ơng quan% Biến nhị phân% Với tất cả các loại nghiên cứu% χ2 hoặc χ2 của McNemar’s % Phân tích tư ơng quan và hồi quy% % Với tất cả các loại nghiên cứu% % Biến định lượng% Môí liên quan giữa tuổi và huyết áp tối đa % sb p age 17 70 110 220 - Hệ số tương quan r - Phương trình hồi quy tuyến tính Bảng lựa chọn test thống kê % Biến độc lập Biến Phụ thuộc 1 biến định tính >2 biến định tính 1 định lư ợng 1 định tính, 1 định lư ợng Nhiều biến định tính và/hoặc định lượng Có 2 nhóm Trên 2 nhóm 1 biến định lư ợng Test t Test ANOVA Factorial design (thừa số) Hệ số tư ơng quan r hoặc hồi quy tuyến tính ANCOVA Phân tích hồi quy đa biến 1 biến nhị phân OR, RR, χ2 hoặc Fisher test χ2 hoặc Fisher test Phân tích tầng Test t Factorial design (thừa số) Hồi quy logistics 1 biến định tính χ2 hoặc Fisher test χ2 hoặc Fisher test Phân tích tầng ANOVA Fac