Công cụ trình bày số liệu
Trình bày bảng
o Bảng phân phối tần suất (Bảng đơn biến - Bảng đa biến)
Biểu đồ - đồ thị
o Biểu đồ hình thanh
o Biểu đồ hình bánh
o Tổ chức đồ và đa giác tần suấtBảng phân phối tần suất
Trình bày số liệu cho biến định tính và biến
định lượng
Nếu muốn trình bày cho số liệu biến định
lượng cần phải phân nhóm các biến định
lượng thành biến định tính
46 trang |
Chia sẻ: thanhle95 | Lượt xem: 279 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Bài giảng Xác suất thống kê y học - Tuần 5: Thống kê mô tả (Phần 2) - Lê Huỳnh Thị Cẩm Hồng, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
THỐNG KÊ MÔ TẢ
(phần 2)
THS. LÊ HUỲNH THỊ CẨM HỒNG
Ôn lại
1, Biến số định tính - Biến số định lượng
Biến định tính gồm 3 loại: nhị giá, danh định, thứ tự
Biến định lượng gồm 2 loại: biến liên tục hoặc biến không liên tục
2, Biến số độc lập - Biến số phụ thuộc
3, Biến số gây nhiễu
4, Thống kê mô tả (biến định lượng)
Mô tả khuynh hướng tập trung: trung bình, trung vị, yếu vị
Mô tả tính phân tán: độ lệch chuẩn, khoảng tứ vị, phạm vi số liệu
Thí dụ
Thuốc hạ áp A được sử dụng trên 5 bệnh nhân và huyết áp tâm thu
sau khi dùng thuôc là 110, 115, 120, 125, 130 (trung bình = 120)
Thuốc hạ áp B được sử dụng trên 5 bệnh nhân và huyết áp tâm thu
sau khi dùng thuôc là 100, 110, 120, 130, 140 (trung binh = 120)
Hiệu quả 2 thuốc tương đương nhau (trung bình bằng nhau)
Nhưng thuốc B phân tán rộng hơn, cho thấy kém hiệu quả hơn
Để đánh giá sự phân tán, người ta sử dụng:
Độ lệch của giá trị so với trung bình
Độ lệch của huyết áp tâm thu của thuốc A là
110 – 120 = -10
115 – 120 = -5
120 – 120 = 0
125 – 120 = 5
130 – 120 = 10
Để mô tả độ lớn của độ lệch ta không thể lấy số trung bình của độ lệch , vì
bao gồm giá trị âm và dương nên trung bình độ lệch là zero.
Do đó sử dụng trung bình của bình phương độ lệch => gọi là PHƯƠNG SAI
PHƯƠNG SAI
Trung bình bình phương độ lệch
Variance. Ký hiệu: s2
110 – 120 = -10 => (-10)2 = 100
115 – 120 = -5 => (-5)2 = 25
120 – 120 = 0 => 02 = 0
125 – 120 = 5 => (5) 2 = 25
130 – 120 = 10 => (10) 2 = 100
PHƯƠNG SAI: s2 = (100 + 25 +0 +25 +100) / (5-1) = 62,5
• Độ lệch chuẩn: Standard deviation – SD. Ký hiệu: s
• Phản ánh khoảng cách trung bình của số liệu so với giá trị tiêu biểu
• Công thức:
Độ lệch chuẩn là căn bậc 2 của phương sai
Độ lệch chuẩn
ĐỘ LỆCH CHUẨN: s = 7,9
Số liêu về huyết áp tâm thu của 5 người là: 135, 150, 120, 125,
130, có trung bình = 132. Tính độ lệch chuẩn?
SD = (135-132)2 + (150-132)2 + (120-132)2 + (125-132)2
+ (130-132)2 / (5-1)
= 11.5
Nên cần mô tả cả khuynh hướng
tập trung và tính phân tán
8
Trung bình
Trung vị
Min, Max,
Phạm vi số liệu,
Khoảng tứ vị
Độ lệch chuẩn
STT Tuổi
1 32
2 35
3 23
4 29
5 31
6 30
7 34
8 27
9 27
10 29
11 34
12 32
13 32
14 23
15 29
16 32
17 23
18 35
19 31
20 32
STT Tuổi
Phạm vi số liệu
(min – max)
Khoảng tứ vị
Trung vị
Trung bình
Độ lệch chuẩn
THỐNG KÊ MÔ TẢ
BIẾN ĐỊNH TÍNH
Thống kê mô tả biến định tính
Mô tả biến định tính dễ dàng hơn
Trình bày tần số (số ca/số người) và tỷ lệ phần trăm ở mỗi giá trị của
biến số
Giới tính Số lượng (%)
Nam 57 (37.5)
Nữ 95 (62.5)
Tổng cộng 152
Nghề nghiệp Số lượng (%)
Nông dân 14 (9)
Nhân viên văn phòng 98 (64)
Buôn bán, kinh doanh 40 (26)
Khác 1 (1)
Chuyển biến số: biến định lượng => biến định tính 12
20, 21,22,23,69 (năm
tuổi)
20-29, 30-39, 40-49, 50-
59,60-69
Trẻ; Già
Lứa tuổi 20; 30; 40;
50; 60
Biến định
lượng có thể
chuyển thành
biến định tính
Biến định
tính không
thể chuyển
đổi thành
biến định
lượng
Ví dụ:
Biến định lượng có thể được trình bày ở cả 2 dạng
Nhóm N (%)
Tuổi 38.9 (14.2) (mean, SD)
Dưới 30 tuổi 40 (26)
30-50 tuổi 83 (53)
Trên 50 tuổi 32 (21)
Số năm sống ở Úc 2 (2) (median, IQR)
Ít hơn 2 năm 43 (28)
2-4 năm 94 (60)
Trên $ năm 19 (12)
CÔNG CỤ
TRÌNH BÀY VÀ THỐNG KÊ SỐ LIỆU
Công cụ trình bày số liệu
Trình bày bảng
o Bảng phân phối tần suất (Bảng đơn biến - Bảng đa biến)
Biểu đồ - đồ thị
o Biểu đồ hình thanh
o Biểu đồ hình bánh
o Tổ chức đồ và đa giác tần suất
Bảng phân phối tần suất
Trình bày số liệu cho biến định tính và biến
định lượng
Nếu muốn trình bày cho số liệu biến định
lượng cần phải phân nhóm các biến định
lượng thành biến định tính
Bảng đơn biến
Tháng Số mắc (ca bệnh)
1 1.328
2 3.511
3 6.059
4 4.368
5 2.599
6 2.030
7 1.460
8 1.102
9 604
10 601
11 706
12 2.372
Tổng cộng 26.740
Bảng 1:
Số mắc
bệnh thủy
đậu theo
tháng ở
Miền Bắc,
2007
Bảng đa biến
Tháng
Số mắc (ca bệnh)
Miền Bắc Miền Trung Miền Nam Tây Nguyên Cả nước
1 23 5 40 1 69
2 21 11 59 1 92
3 18 22 131 1 172
4 34 9 113 4 160
5 125 7 68 1 201
6 211 8 62 4 285
7 80 5 25 9 119
8 91 6 41 3 141
9 88 1 37 0 126
10 28 2 31 1 62
11 22 2 33 0 57
12 23 4 30 0 57
Tổng cộng 764 82 670 25 1.541
Bảng 2:
Số mắc
viêm não
do vi rút
ở Việt
Nam,
2006
Bảng phân phối tần suất
Giới Số trẻ Phần trăm
Nam 45 65%
Nữ 24 35%
Tổng số 69 100%
Bảng: Phân phối giới tính của học sinh lớp A, trường mầm non 23/11, Hóc Môn
Hình thức của bảng
• Có tựa ngắn gọn, rõ ràng
• Đặt tên và ghi rõ đơn vị cho hàng và cột
• Trình bày tổng số của hàng và cột
• Định nghĩa các ký hiệu và chữ viết tắt dưới bảng (nếu có)
• Ghi nguồn số liệu ở dưới bảng
• Khi tỉ lệ phần trăm, thông thường chỉ lấy phần nguyên của
số phần trăm. Nếu cỡ mẫu lớn, có thể lấy 1 số lẻ thập
phân.
Biểu đồ hình thanh
Biểu đồ hình thanh
• Mô tả sự phân bố của biến số rời rạc.
• Gồm trục hoành, trục tung.
• Luôn có khoảng trống giữa các thanh.
Biểu đồ hình bánh
Biểu đồ hình bánh
• Là một vòng tròn được chia thành nhiều cung tương ứng
với các giá trị của biến số
• Mô tả sự phân bố của biến số rời rạc
• Mô tả cho một biến số của một quần thể duy nhất
Biểu đồ hình bánh
• Mô tả cho các biến số của nhiều quần thể, đem lại nhiều
thông tin hơn
• Mô tả cho một biến số của một quần thể duy nhất
Tổ chức đồ (Histogram)
Tổ chức đồ (Histogram)
Mô tả phân bố của biến liên tục
Cách vẽ:
Người ta chia biên độ giá trị thành nhiều khoảng giá
trị và tính tần suất của những khoảng giá trị đó
Những khoảng giá trị nằm trên trục hoành
Ứng với mỗi giá trị, ta vẽ những hình chữ nhật có
diện tích tỷ lệ với tần suất của khoảng giá trị đó
Các hình chữ nhật của tổ chức đồ phải nằm sát nhau
Ví dụ
Biểu đồ hình hộp (boxplot)
Biểu đồ hình hộp (boxplot)
Mô tả sự phân phối
của biến định lượng
Gồm 1 hình chữ
nhật và 2 đoạn
thẳng đứng.
Bản đồ
Bản đồ
Chỉ vị trí xảy ra bệnh.
Thông thường: bản đồ chấm hoặc bản đồ vùng.
Bản đồ chấm: “chấm” = 1 ca bệnh, trình bày về phân bố địa
lý của bệnh, vì không tính đến kích cỡ của dân số.
Bản đồ vùng: minh họa vùng hoặc địa dư xảy ra bệnh, có thể
nêu rõ số lượng hoặc tỷ lệ, để minh hoạ sự khác biệt về nguy
cơ mắc bệnh giữa các vùng, cần biểu diễn dưới dạng tỷ lệ.
Bảng đồ chấm
Bản đồ vùng
Một nghiên cứu về hội chứng bệnh lý chức năng hô hấp thu
được kết quả như sau:
Ở nhóm nam, có 39 người có hội chứng hạn chế, có 12
người có hội chứng tắc nghẽn, và 02 người có hội chứng hỗn
hợp
Ở nhóm nữ: có 26 người có hội chứng hạn chế, có 32 người
có hội chứng tắc nghẽn, và 08 người có hội chứng hỗn hợp
Hãy vẽ trình bày số liệu trên dạng bảng và vẽ biểu đồ phù hợp
Các số đo kết hợp RR, OR, PR
36
NGUY CƠ TƯƠNG ĐỐI (Đoàn hệ: số mới mắc)
Nguy cơ tương đối (RR) được xác định bằng
cách tính tỷ số nguy cơ giữa nhóm tiêp xúc và
nhóm không tiếp xúc
37
Nguy cơ mắc bệnh trong
nhóm tiếp xúc với yếu tố
nguy cơ (R1)
a
a + b
c + d
cNguy cơ tương đối = =
Nguy cơ mắc bệnh trong nhóm
không tiếp xúc với yếu tố nguy
cơ(R0)
38
TỶ SỐ SỐ CHÊNH
Odds ratio (OR)
O 1 = R1 / 1-
R1
O0 = R0 / 1-
R0
OR = O1 / O0
40
TỶ SỐ TỶ LỆ HIỆN MẮC (PR)
41
Tỷ lệ nhẹ cân ở trẻ có mẹ uống rượu
P1 = 64 : 234 =
0.27
Mẹ uống rượu Cân nặng sơ sinh Tổng
Nhẹ cân Bình thường
Có 64 170 234
Không 36 130 166
Tổng 100 300 400
Tỷ lệ nhẹ cân ở trẻ có mẹ không uống rượu
P2 = 36 : 166 =
0.22
TỶ LỆ HIỆN MẮC
42
Tỷ số tỷ lệ hiện
mắc
= P1 : P2
Mẹ uống rượu Cân nặng sơ sinh Tổng
Nhẹ cân Bình thường
Có 64 170 234
Không 36 130 166
Tổng 100 300 400
TỶ LỆ HIỆN MẮC
43
PR (Prevalence ratio) = P1 : P2
Tỷ số tỷ lệ hiện mắc= (64 : 234) : (36 : 166)
PR = [a / (a + b)] : [c / (c + d)]
Mẹ uống rượu Cân nặng sơ sinh Tổng
Nhẹ cân Bình thường
Có 64 170 234
Không 36 130 166
Tổng 100 300 400
TỶ SỐ TỶ LỆ HIỆN MẮC
= 1.23
4
4
RR Nguy cơ tương đối
Dựa vào số mới mắc
Nghiên cứu đoàn hệ
OR Tỉ số Số chênh
Nghiên cứu bệnh-
chứng,
PR Tỉ số tỉ lệ hiện mắc
Dựa vào số hiện mắc
Nghiên cứu cắt ngang
SỐ ĐO KẾT HỢP
45
RR , OR, PR = 1
Yếu tố phơi nhiễm Không Liên Quan đến bệnh
RR , OR, PR > 1
Yếu tố phơi nhiễm là Yếu Tố Nguy Cơ
RR , OR, PR < 1
Yếu tố phơi nhiễm là Yếu Tố Bảo Vệ
SỐ ĐO KẾT HỢP
Thank you!!!