Thời gian của dự án:
◦ Dự án hoàn thành khi tất cả các công việc của nó hoàn thành
◦ Thời gian hoàn thành các công việc là không chắc chắn.
◦ Hiểu và giảm thiểu sự không chắc chắn này sẽ giúp quản lý tiến độ thành công.
25 trang |
Chia sẻ: nguyenlinh90 | Lượt xem: 779 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Bài giảng Thống kê học ứng dụng trong quản lý xây dựng - Phần 1: Giới thiệu về thống kê học, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
9/7/2010
1
Nguyễn Duy Long, Tiến Sỹ
Bộ môn Thi Công và QLXD
©2010, Nguyễn Duy Long, Tiến Sỹ 1
Phần 01
Nguyễn Duy Long, Tiến Sỹ
Bộ môn Thi Công và QLXD
©2010, Nguyễn Duy Long, Tiến Sỹ 2
9/7/2010
2
Tư duy thống kê
Giới thiệu về thống kê học
Trình bày dữ liệu định tính
©2010, Nguyễn Duy Long, Tiến Sỹ 3
©2010, Nguyễn Duy Long, Tiến Sỹ 4
9/7/2010
3
Thời gian của dự án:
◦ Dự án hoàn thành khi tất cả các công việc của nó
hoàn thành
◦ Thời gian hoàn thành các công việc là không chắc
chắn.
◦ Hiểu và giảm thiểu sự không chắc chắn này sẽ giúp
quản lý tiến độ thành công.
©2010, Nguyễn Duy Long, Tiến Sỹ 5
Nguồn: Glossary oi Statistical Terms, ASQ Quality Press
Phần ngầm Phần khung Hoàn thiện
Là một triết lý của việc học và hành động dựa
trên các nguyên lý cơ bản sau:
◦ Tất cả công việc đều xảy ra trong một hệ thống của
các qui trình kết nối nhau
◦ Sự biến thiên (variation) tồn tại trong tất cả các qui
trình
◦ Hiểu và giảm thiểu sự biến thiên là chìa khóa để
thành công
©2010, Nguyễn Duy Long, Tiến Sỹ 6
Nguồn: Glossary oi Statistical Terms, ASQ Quality Press
9/7/2010
4
Qui trình
Tư duy
Sự biến đổi
Các dữ liệu
thống kê
Phươ há
©2010, Nguyễn Duy Long, Tiến Sỹ 7
Các công cụ
thống kê
ng p p
thống kê
©2010, Nguyễn Duy Long, Tiến Sỹ 8
9/7/2010
5
Đánh giá các kết luận sau đây:
◦ “Những người có cha mẹ có bằng đại học thì có khả
năng (likely) lấy bằng đại học hơn là những người
có cha mẹ không có bằng đại học.”
◦ “Lượng xe máy ở Sài Thành có liên hệ với lượng
nhà và đất ở ở Hà Thành.”
©2010, Nguyễn Duy Long, Tiến Sỹ 9
©2010, Nguyễn Duy Long, Tiến Sỹ 10
Nguồn:
9/7/2010
6
Thống kê: Với
hô it ng t n trong
tay bạn, cái gì
trong thùng?
Xác suất: Với
Nguồn: MIT OCW, dựa trên Gilbert, 1976
11©2010, Nguyễn Duy Long, Tiến Sỹ
thông tin trong
thùng, cái gì
trong tay bạn?
Thống kê học (statistics, số ít): Một cách lý
luận, cùng với các công cụ và phương pháp đi
kèm, được thiết kế để giúp chúng ta hiểu biết
về thế giới.
Thống kê (satistics, số nhiều): các phép tính
cụ thể được thực hiện trên các dữ liệu (data).
12©2010, Nguyễn Duy Long, Tiến Sỹ
9/7/2010
7
Dữ liệu
(Data)
Thống kê
(Statistics)
Thông tin
(Information)
13©2010, Nguyễn Duy Long, Tiến Sỹ
Suy nghĩ (think)
Biểu thị (show)
Trình bày (tell)
©2010, Nguyễn Duy Long, Tiến Sỹ 14
9/7/2010
8
©2010, Nguyễn Duy Long, Tiến Sỹ 15
Quần thể (population): một nhóm gồm tất cả
các thành phần mà nhà thực hành thống kê
quan tâm.
◦ v.d. tất cả các nhà thầu ở Sài Gòn
Mẫu (sample): một tập hợp các dữ liệu rút ra
từ quần thể
◦ v.d. một mẫu 75 nhà thầu ở Sài Gòn
16©2010, Nguyễn Duy Long, Tiến Sỹ
9/7/2010
9
Thông số (parameter): một đại lượng mô tả
quần thể
◦ v.d. doanh thu bình quân của tất các nhà thầu là
100 tỷ đồng.
Trị (tham) số thống kê (statistic): một đại
lượng mô tả mẫu
◦ v.d. doanh thu bình quân của mẫu 75 nhà thầu là
120 tỷ đồng .
17©2010, Nguyễn Duy Long, Tiến Sỹ
Quần thể
Mẫu
Tập con
18
Thông số Trị số thống kê
Các quần thể có các thông số; các mẫu có các trị số thống kê
©2010, Nguyễn Duy Long, Tiến Sỹ
9/7/2010
10
©2010, Nguyễn Duy Long, Tiến Sỹ 19
Phương pháp thông kê
Thống kê học mô tả Thông kê học suy luận
©2010, Nguyễn Duy Long, Tiến Sỹ 20
(descriptive statistics) (inferential statistics)
9/7/2010
11
Thu thập số liệu
d khả á á hí◦ v. . o s t, quan s t, t
nghiệm
Trình bày dữ liệu
◦ v.d. biểu đồ và đồ thị
Xác định đặc điểm của dữ liệu
©2010, Nguyễn Duy Long, Tiến Sỹ 21
◦ v.d. trung bình của mẫu =
n
xi
Quá trình tạo ra một ước lượng, dự đoán, hay
quyết định về quần thể dựa trên mẫu.
Mẫu
Suy luận
Quần thể
22
Thông số Trị số thống kê
©2010, Nguyễn Duy Long, Tiến Sỹ
9/7/2010
12
©2010, Nguyễn Duy Long, Tiến Sỹ 23
Dữ liệu (data): là các đại lượng cùng ngữ
cảnh đi kèm.
Ngữ cảnh của dữ liệu: “Five W’s”: Who, What,
When, Where, and Why. Có thể có cả “How.”
Dữ liệu không có ngữ cảnh đi kèm thì hầu
như vô nghĩa.
24©2010, Nguyễn Duy Long, Tiến Sỹ
9/7/2010
13
Họ Tên Tuổi Loại lao
động
Lương
ngày
Đội Thi
Công
Bảo hiểm
Phan Cam 18 Phổ thông 50,000 1 Không
Vũ Phu 35 Nề 90,000 1 Có
Cao Giá 28 Nề 95,000 2 Không
Trần Ai 45 Sắt 90,000 1 Có
Lê La 30 Điện 85,000 2 Có
Lâm Tặc 30 Mộc 90 000 1 Không
©2010, Nguyễn Duy Long, Tiến Sỹ 25
,
Ngô Khoai 32 Phổ thông 45,000 2 Có
Phạm
Thượng
22 Phổ thông 50,000 2 Không
(Trích từ bảng lương tháng 9/2009, Dự Án “Xây Nhà Từ Nóc”)
Định tính
Biến của dữ
liệu
(categorical)
Định lượng
(quantitative)
©2010, Nguyễn Duy Long, Tiến Sỹ 26
9/7/2010
14
27©2010, Nguyễn Duy Long, Tiến Sỹ
Biểu đồ số người mắc bệnh và tử vong do
cúm A/H1N1:
©2010, Nguyễn Duy Long, Tiến Sỹ 28
Nguồn: Báo Tuổi Trẻ, 28/09/2009
9/7/2010
15
Ba qui tắc:
1. Vẽ/tạo hình ảnh — có thể lộ ra những điều mà
ấchúng ta không th y từ dữ liệu thô.
2. Vẽ/tạo hình ảnh — những đặc điểm quan trọng của
dữ liệu sẽ được thể hiện. Chúng ta có thể thấy
những điều chúng ta không mong đợi.
3. Vẽ/tạo hình ảnh — cách tốt nhất để nói với người
khác rằng dữ liệu của bạn có hình ảnh trình bày
được chọn lựa kỹ.
29©2010, Nguyễn Duy Long, Tiến Sỹ
Đếm số lượng của các giá trị dữ liệu cho mỗi
loại.
Tổ chức chúng vào một bảng chỉ số đếm, thể
hiện tổng số lượng và loại.
Ví dụ hạng vé tàu Titanic:
Hạng vé Đếm
Hạng nhất 325
30©2010, Nguyễn Duy Long, Tiến Sỹ
Hạng nhì 285
Hạng ba 706
Thủy thủ đoàn 885
(Nguồn: De Veaux et al., 2006)
9/7/2010
16
Bảng tần suất tương đối cũng tương tự,
nhưng thể hiện dạng phần trăm (thay vì số
đế ) h ỗ lm c o m i oại.
Hạng vé %
Hạnh nhất 14.77
Hạng nhì 12.95
H ng ba 32 08
31©2010, Nguyễn Duy Long, Tiến Sỹ
ạ .
Thủy thủ đoàn 40.21
Thủy thủ đoàn
Hạng ba
32©2010, Nguyễn Duy Long, Tiến Sỹ
Hạng hai
Hạng nhất
9/7/2010
17
Biểu đồ thanh tần suất tương đối mô tả sự phân phối
tương đối của số đếm cho mỗi loại.
h “ ê lý d í h ” T ỏa mãn nguy n iện t c .
Slide 3- 33©2010, Nguyễn Duy Long, Tiến Sỹ
Nhất Nhì Ba Thủy thủ đoàn
Hạng
Khi quan tâm các phần trong tổng thể, biểu đồ
bánh là chọn lựa hay.
Hạng
Hạng hai
Nhất
Thủy thủ
34©2010, Nguyễn Duy Long, Tiến Sỹ
Hạnn ba
9/7/2010
18
Cho phép trình bày hai biến định tính cùng nhau.
Cho phép thể hiện các thành phần được phân phối như
thế nào theo mỗi biến và tùy thuộc vào giá trị của biến,
khác.
◦ v.d. xem xét hạng vé và sự sống sót của hành khách
trên tàu Titanic:
Hạng
ót
Nhất Nhì Ba Thủy thủ Tổng
35©2010, Nguyễn Duy Long, Tiến Sỹ
Số
ng
só Sống 203 118 178 212 711
Chết 122 167 528 673 1490
Tổng 325 285 706 885 2201
Các cột và hàng lề bên phải và bên dưới cho ra tổng số
và các phân phối tần suất (frequency distributions) cho
mỗi một biến.
Mỗi phân phối tần suất gọi là phân phối lề (marginal
distribution) của biến tương ứng.
◦ Phân phối lề cho biến sống sót (survival) của tàu
Titanic:
Hạng
ót Nhất Nhì Ba Thủy thủ
36©2010, Nguyễn Duy Long, Tiến Sỹ
Số
ng
só
Sống 203 118 178 212
Chết 122 167 528 673
9/7/2010
19
Mỗi phần tử của bảng cho ra số đếm của sự kết hợp giá
trị của hai biến.
◦ Ví dụ phân tử thứ hai ở cột thủy thủ đoàn (crew) chỉ ra,
673 thủy thủ chết khi tàu Titanic bị chìm.
Hạng
g
só
t Nhất Nhì Ba Thủy thủ Tổng
Sống 203 118 178 212 711
ế
37©2010, Nguyễn Duy Long, Tiến Sỹ
Số
ng Ch t 122 167 528 673 1490
Tổng 325 285 706 885 2201
Phân phối có điều kiện (conditional
distribution) cho ra phân phối của một biến
chỉ cho các thành phần thỏa mãn một điều
kiện nào đó của biến khác.
◦ Phân phối có điều kiện của hạng vé với điều kiện
sống:
Hạng
38©2010, Nguyễn Duy Long, Tiến Sỹ
Nhất Nhì Ba Thủy thủ Tổng
Số
ng 203 118 178 212 71128.6% 16.6% 25.0% 29.8% 100%
9/7/2010
20
◦ Phân phối có điều kiện của hạng vé, với điều kiện
thiệt mạng:
Hạng
Nhất Nhì Ba Thủy thủ Tổng
Ch
ết 122 167 528 673 1490
8.2% 11.2% 35.4% 45.2% 100%
39©2010, Nguyễn Duy Long, Tiến Sỹ
Các phân phối có điều kiện cho thấy rằng có sự
khác nhau về hạng vé và tỷ lệ sự sống sót.
Sống sót Chết
40©2010, Nguyễn Duy Long, Tiến Sỹ
Nhất
Nhì
Ba
Thủy thủ
9/7/2010
21
Sự phân phối của hạng vé với người sống sót
và sự phân phối của hạng vé với người không
sống sót là khác nhau.
Hạng vé và sự sống sót là có sự liện hệ, nhưng
chúng không độc lập.
Các biến được coi là độc lập khi sự phân phối
của một biến trong bảng tùy thuộc là giống
nhau cho mỗi loại của biến còn lại.
41©2010, Nguyễn Duy Long, Tiến Sỹ
Biểu đồ thanh phân đốt (segmented bar charts)
trình bày lượng thông tin giống với biểu đồ bánh.
Biểu đồ thanh phân đốt giữa hạng vé và tình trạng
sống sót:
Nhất
Nhì
Ba
Thủy thủ
Hạng
Ph
ần
tră
m
©2010, Nguyễn Duy Long, Tiến Sỹ 42
ChếtSống sót
9/7/2010
22
43©2010, Nguyễn Duy Long, Tiến Sỹ
“Căn hộ giá trung bình bán chạy”:
©2010, Nguyễn Duy Long, Tiến Sỹ 44
Nguồn: Báo Tuổi Trẻ, 24/10/2009
9/7/2010
23
Trình bày thành thật—đảm bảo biểu đồ nói ra
những gì đang thể hiện.
◦ Có vấn đề gì trong biểu đồ trên?
45©2010, Nguyễn Duy Long, Tiến Sỹ
Đừng cường điệu hóa. Không kết luận những
điều chưa thể kết luận
Đừng sử dụng trị trung bình không hợp lý—
mà có thể dẫn đến cái gọi là nghịch lý
Simpson (Simpson’s Paradox).
46©2010, Nguyễn Duy Long, Tiến Sỹ
9/7/2010
24
Hương có điểm TBTL 7.00 ở trường ĐHBK
Thủy có điểm TBTL 7.50 ở trường ĐHBK
Ai có vẻ học tốt hơn trong các môn học ở
ĐHBK? Hương hay Thủy?
Theo bạn thì ai có khả năng đạt điểm cao hơn
trong môn học này?
47©2010, Nguyễn Duy Long, Tiến Sỹ
Chất lượng thi công công trình của hai nhà thầu
A và B theo đánh giá của các chủ đầu tư
(đạt/tổng số hợp đồng):
Loại công trình
Dân dụng Công nghiệp Tổng
Nhà thầu A 40/60
(66.6%)
13/15
(86.7%)
53/75
(70.7%)
Nhà thầu B 5/8 42/50 47/58
Chọn nhà thầu nào để thi công chất lượng hơn?
©2010, Nguyễn Duy Long, Tiến Sỹ 48
(62.5%) (84.0%) (81.0%)
9/7/2010
25
©2010, Nguyễn Duy Long, Tiến Sỹ 49