Bài giảng Xác suất thống kê y học - Tuần 5: Thống kê mô tả (Phần 2) - Lê Huỳnh Thị Cẩm Hồng

Công cụ trình bày số liệu  Trình bày bảng o Bảng phân phối tần suất (Bảng đơn biến - Bảng đa biến)  Biểu đồ - đồ thị o Biểu đồ hình thanh o Biểu đồ hình bánh o Tổ chức đồ và đa giác tần suấtBảng phân phối tần suất Trình bày số liệu cho biến định tính và biến định lượng Nếu muốn trình bày cho số liệu biến định lượng cần phải phân nhóm các biến định lượng thành biến định tính

pdf46 trang | Chia sẻ: thanhle95 | Lượt xem: 280 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Bài giảng Xác suất thống kê y học - Tuần 5: Thống kê mô tả (Phần 2) - Lê Huỳnh Thị Cẩm Hồng, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
THỐNG KÊ MÔ TẢ (phần 2) THS. LÊ HUỲNH THỊ CẨM HỒNG Ôn lại 1, Biến số định tính - Biến số định lượng Biến định tính gồm 3 loại: nhị giá, danh định, thứ tự Biến định lượng gồm 2 loại: biến liên tục hoặc biến không liên tục 2, Biến số độc lập - Biến số phụ thuộc 3, Biến số gây nhiễu 4, Thống kê mô tả (biến định lượng) Mô tả khuynh hướng tập trung: trung bình, trung vị, yếu vị Mô tả tính phân tán: độ lệch chuẩn, khoảng tứ vị, phạm vi số liệu Thí dụ  Thuốc hạ áp A được sử dụng trên 5 bệnh nhân và huyết áp tâm thu sau khi dùng thuôc là 110, 115, 120, 125, 130 (trung bình = 120)  Thuốc hạ áp B được sử dụng trên 5 bệnh nhân và huyết áp tâm thu sau khi dùng thuôc là 100, 110, 120, 130, 140 (trung binh = 120) Hiệu quả 2 thuốc tương đương nhau (trung bình bằng nhau) Nhưng thuốc B phân tán rộng hơn, cho thấy kém hiệu quả hơn Để đánh giá sự phân tán, người ta sử dụng: Độ lệch của giá trị so với trung bình Độ lệch của huyết áp tâm thu của thuốc A là 110 – 120 = -10 115 – 120 = -5 120 – 120 = 0 125 – 120 = 5 130 – 120 = 10  Để mô tả độ lớn của độ lệch ta không thể lấy số trung bình của độ lệch , vì bao gồm giá trị âm và dương nên trung bình độ lệch là zero.  Do đó sử dụng trung bình của bình phương độ lệch => gọi là PHƯƠNG SAI PHƯƠNG SAI Trung bình bình phương độ lệch Variance. Ký hiệu: s2 110 – 120 = -10 => (-10)2 = 100 115 – 120 = -5 => (-5)2 = 25 120 – 120 = 0 => 02 = 0 125 – 120 = 5 => (5) 2 = 25 130 – 120 = 10 => (10) 2 = 100 PHƯƠNG SAI: s2 = (100 + 25 +0 +25 +100) / (5-1) = 62,5 • Độ lệch chuẩn: Standard deviation – SD. Ký hiệu: s • Phản ánh khoảng cách trung bình của số liệu so với giá trị tiêu biểu • Công thức: Độ lệch chuẩn là căn bậc 2 của phương sai Độ lệch chuẩn ĐỘ LỆCH CHUẨN: s = 7,9 Số liêu về huyết áp tâm thu của 5 người là: 135, 150, 120, 125, 130, có trung bình = 132. Tính độ lệch chuẩn? SD = (135-132)2 + (150-132)2 + (120-132)2 + (125-132)2 + (130-132)2 / (5-1) = 11.5 Nên cần mô tả cả khuynh hướng tập trung và tính phân tán 8 Trung bình Trung vị Min, Max, Phạm vi số liệu, Khoảng tứ vị Độ lệch chuẩn STT Tuổi 1 32 2 35 3 23 4 29 5 31 6 30 7 34 8 27 9 27 10 29 11 34 12 32 13 32 14 23 15 29 16 32 17 23 18 35 19 31 20 32 STT Tuổi Phạm vi số liệu (min – max) Khoảng tứ vị Trung vị Trung bình Độ lệch chuẩn THỐNG KÊ MÔ TẢ BIẾN ĐỊNH TÍNH Thống kê mô tả biến định tính  Mô tả biến định tính dễ dàng hơn  Trình bày tần số (số ca/số người) và tỷ lệ phần trăm ở mỗi giá trị của biến số Giới tính Số lượng (%) Nam 57 (37.5) Nữ 95 (62.5) Tổng cộng 152 Nghề nghiệp Số lượng (%) Nông dân 14 (9) Nhân viên văn phòng 98 (64) Buôn bán, kinh doanh 40 (26) Khác 1 (1) Chuyển biến số: biến định lượng => biến định tính 12 20, 21,22,23,69 (năm tuổi) 20-29, 30-39, 40-49, 50- 59,60-69 Trẻ; Già Lứa tuổi 20; 30; 40; 50; 60 Biến định lượng có thể chuyển thành biến định tính Biến định tính không thể chuyển đổi thành biến định lượng Ví dụ: Biến định lượng có thể được trình bày ở cả 2 dạng Nhóm N (%) Tuổi 38.9 (14.2) (mean, SD) Dưới 30 tuổi 40 (26) 30-50 tuổi 83 (53) Trên 50 tuổi 32 (21) Số năm sống ở Úc 2 (2) (median, IQR) Ít hơn 2 năm 43 (28) 2-4 năm 94 (60) Trên $ năm 19 (12) CÔNG CỤ TRÌNH BÀY VÀ THỐNG KÊ SỐ LIỆU Công cụ trình bày số liệu  Trình bày bảng o Bảng phân phối tần suất (Bảng đơn biến - Bảng đa biến)  Biểu đồ - đồ thị o Biểu đồ hình thanh o Biểu đồ hình bánh o Tổ chức đồ và đa giác tần suất Bảng phân phối tần suất Trình bày số liệu cho biến định tính và biến định lượng Nếu muốn trình bày cho số liệu biến định lượng cần phải phân nhóm các biến định lượng thành biến định tính Bảng đơn biến Tháng Số mắc (ca bệnh) 1 1.328 2 3.511 3 6.059 4 4.368 5 2.599 6 2.030 7 1.460 8 1.102 9 604 10 601 11 706 12 2.372 Tổng cộng 26.740 Bảng 1: Số mắc bệnh thủy đậu theo tháng ở Miền Bắc, 2007 Bảng đa biến Tháng Số mắc (ca bệnh) Miền Bắc Miền Trung Miền Nam Tây Nguyên Cả nước 1 23 5 40 1 69 2 21 11 59 1 92 3 18 22 131 1 172 4 34 9 113 4 160 5 125 7 68 1 201 6 211 8 62 4 285 7 80 5 25 9 119 8 91 6 41 3 141 9 88 1 37 0 126 10 28 2 31 1 62 11 22 2 33 0 57 12 23 4 30 0 57 Tổng cộng 764 82 670 25 1.541 Bảng 2: Số mắc viêm não do vi rút ở Việt Nam, 2006 Bảng phân phối tần suất Giới Số trẻ Phần trăm Nam 45 65% Nữ 24 35% Tổng số 69 100% Bảng: Phân phối giới tính của học sinh lớp A, trường mầm non 23/11, Hóc Môn Hình thức của bảng • Có tựa ngắn gọn, rõ ràng • Đặt tên và ghi rõ đơn vị cho hàng và cột • Trình bày tổng số của hàng và cột • Định nghĩa các ký hiệu và chữ viết tắt dưới bảng (nếu có) • Ghi nguồn số liệu ở dưới bảng • Khi tỉ lệ phần trăm, thông thường chỉ lấy phần nguyên của số phần trăm. Nếu cỡ mẫu lớn, có thể lấy 1 số lẻ thập phân. Biểu đồ hình thanh Biểu đồ hình thanh • Mô tả sự phân bố của biến số rời rạc. • Gồm trục hoành, trục tung. • Luôn có khoảng trống giữa các thanh. Biểu đồ hình bánh Biểu đồ hình bánh • Là một vòng tròn được chia thành nhiều cung tương ứng với các giá trị của biến số • Mô tả sự phân bố của biến số rời rạc • Mô tả cho một biến số của một quần thể duy nhất Biểu đồ hình bánh • Mô tả cho các biến số của nhiều quần thể, đem lại nhiều thông tin hơn • Mô tả cho một biến số của một quần thể duy nhất Tổ chức đồ (Histogram) Tổ chức đồ (Histogram)  Mô tả phân bố của biến liên tục Cách vẽ:  Người ta chia biên độ giá trị thành nhiều khoảng giá trị và tính tần suất của những khoảng giá trị đó  Những khoảng giá trị nằm trên trục hoành  Ứng với mỗi giá trị, ta vẽ những hình chữ nhật có diện tích tỷ lệ với tần suất của khoảng giá trị đó  Các hình chữ nhật của tổ chức đồ phải nằm sát nhau Ví dụ Biểu đồ hình hộp (boxplot) Biểu đồ hình hộp (boxplot)  Mô tả sự phân phối của biến định lượng  Gồm 1 hình chữ nhật và 2 đoạn thẳng đứng.   Bản đồ   Bản đồ  Chỉ vị trí xảy ra bệnh.  Thông thường: bản đồ chấm hoặc bản đồ vùng.  Bản đồ chấm: “chấm” = 1 ca bệnh, trình bày về phân bố địa lý của bệnh, vì không tính đến kích cỡ của dân số.  Bản đồ vùng: minh họa vùng hoặc địa dư xảy ra bệnh, có thể nêu rõ số lượng hoặc tỷ lệ, để minh hoạ sự khác biệt về nguy cơ mắc bệnh giữa các vùng, cần biểu diễn dưới dạng tỷ lệ. Bảng đồ chấm Bản đồ vùng Một nghiên cứu về hội chứng bệnh lý chức năng hô hấp thu được kết quả như sau:  Ở nhóm nam, có 39 người có hội chứng hạn chế, có 12 người có hội chứng tắc nghẽn, và 02 người có hội chứng hỗn hợp  Ở nhóm nữ: có 26 người có hội chứng hạn chế, có 32 người có hội chứng tắc nghẽn, và 08 người có hội chứng hỗn hợp Hãy vẽ trình bày số liệu trên dạng bảng và vẽ biểu đồ phù hợp Các số đo kết hợp RR, OR, PR 36 NGUY CƠ TƯƠNG ĐỐI (Đoàn hệ: số mới mắc)  Nguy cơ tương đối (RR) được xác định bằng cách tính tỷ số nguy cơ giữa nhóm tiêp xúc và nhóm không tiếp xúc 37 Nguy cơ mắc bệnh trong nhóm tiếp xúc với yếu tố nguy cơ (R1) a a + b c + d cNguy cơ tương đối = = Nguy cơ mắc bệnh trong nhóm không tiếp xúc với yếu tố nguy cơ(R0) 38 TỶ SỐ SỐ CHÊNH Odds ratio (OR) O 1 = R1 / 1- R1 O0 = R0 / 1- R0 OR = O1 / O0 40 TỶ SỐ TỶ LỆ HIỆN MẮC (PR) 41 Tỷ lệ nhẹ cân ở trẻ có mẹ uống rượu P1 = 64 : 234 = 0.27 Mẹ uống rượu Cân nặng sơ sinh Tổng Nhẹ cân Bình thường Có 64 170 234 Không 36 130 166 Tổng 100 300 400 Tỷ lệ nhẹ cân ở trẻ có mẹ không uống rượu P2 = 36 : 166 = 0.22 TỶ LỆ HIỆN MẮC 42 Tỷ số tỷ lệ hiện mắc = P1 : P2 Mẹ uống rượu Cân nặng sơ sinh Tổng Nhẹ cân Bình thường Có 64 170 234 Không 36 130 166 Tổng 100 300 400 TỶ LỆ HIỆN MẮC 43 PR (Prevalence ratio) = P1 : P2 Tỷ số tỷ lệ hiện mắc= (64 : 234) : (36 : 166) PR = [a / (a + b)] : [c / (c + d)] Mẹ uống rượu Cân nặng sơ sinh Tổng Nhẹ cân Bình thường Có 64 170 234 Không 36 130 166 Tổng 100 300 400 TỶ SỐ TỶ LỆ HIỆN MẮC = 1.23 4 4 RR Nguy cơ tương đối Dựa vào số mới mắc Nghiên cứu đoàn hệ OR Tỉ số Số chênh Nghiên cứu bệnh- chứng, PR Tỉ số tỉ lệ hiện mắc Dựa vào số hiện mắc Nghiên cứu cắt ngang SỐ ĐO KẾT HỢP 45 RR , OR, PR = 1 Yếu tố phơi nhiễm Không Liên Quan đến bệnh RR , OR, PR > 1 Yếu tố phơi nhiễm là Yếu Tố Nguy Cơ RR , OR, PR < 1 Yếu tố phơi nhiễm là Yếu Tố Bảo Vệ SỐ ĐO KẾT HỢP Thank you!!!