Bài giảng Thống kê học ứng dụng trong quản lý xây dựng - Phần 1: Giới thiệu về thống kê học

Thời gian của dự án: ◦ Dự án hoàn thành khi tất cả các công việc của nó hoàn thành ◦ Thời gian hoàn thành các công việc là không chắc chắn. ◦ Hiểu và giảm thiểu sự không chắc chắn này sẽ giúp quản lý tiến độ thành công.

pdf25 trang | Chia sẻ: nguyenlinh90 | Lượt xem: 779 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Bài giảng Thống kê học ứng dụng trong quản lý xây dựng - Phần 1: Giới thiệu về thống kê học, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
9/7/2010 1 Nguyễn Duy Long, Tiến Sỹ Bộ môn Thi Công và QLXD ©2010, Nguyễn Duy Long, Tiến Sỹ 1 Phần 01 Nguyễn Duy Long, Tiến Sỹ Bộ môn Thi Công và QLXD ©2010, Nguyễn Duy Long, Tiến Sỹ 2 9/7/2010 2  Tư duy thống kê  Giới thiệu về thống kê học  Trình bày dữ liệu định tính ©2010, Nguyễn Duy Long, Tiến Sỹ 3 ©2010, Nguyễn Duy Long, Tiến Sỹ 4 9/7/2010 3  Thời gian của dự án: ◦ Dự án hoàn thành khi tất cả các công việc của nó hoàn thành ◦ Thời gian hoàn thành các công việc là không chắc chắn. ◦ Hiểu và giảm thiểu sự không chắc chắn này sẽ giúp quản lý tiến độ thành công. ©2010, Nguyễn Duy Long, Tiến Sỹ 5 Nguồn: Glossary oi Statistical Terms, ASQ Quality Press Phần ngầm Phần khung Hoàn thiện  Là một triết lý của việc học và hành động dựa trên các nguyên lý cơ bản sau: ◦ Tất cả công việc đều xảy ra trong một hệ thống của các qui trình kết nối nhau ◦ Sự biến thiên (variation) tồn tại trong tất cả các qui trình ◦ Hiểu và giảm thiểu sự biến thiên là chìa khóa để thành công ©2010, Nguyễn Duy Long, Tiến Sỹ 6 Nguồn: Glossary oi Statistical Terms, ASQ Quality Press 9/7/2010 4 Qui trình Tư duy Sự biến đổi Các dữ liệu thống kê Phươ há ©2010, Nguyễn Duy Long, Tiến Sỹ 7 Các công cụ thống kê ng p p thống kê ©2010, Nguyễn Duy Long, Tiến Sỹ 8 9/7/2010 5  Đánh giá các kết luận sau đây: ◦ “Những người có cha mẹ có bằng đại học thì có khả năng (likely) lấy bằng đại học hơn là những người có cha mẹ không có bằng đại học.” ◦ “Lượng xe máy ở Sài Thành có liên hệ với lượng nhà và đất ở ở Hà Thành.” ©2010, Nguyễn Duy Long, Tiến Sỹ 9 ©2010, Nguyễn Duy Long, Tiến Sỹ 10 Nguồn: 9/7/2010 6 Thống kê: Với hô it ng t n trong tay bạn, cái gì trong thùng? Xác suất: Với Nguồn: MIT OCW, dựa trên Gilbert, 1976 11©2010, Nguyễn Duy Long, Tiến Sỹ thông tin trong thùng, cái gì trong tay bạn?  Thống kê học (statistics, số ít): Một cách lý luận, cùng với các công cụ và phương pháp đi kèm, được thiết kế để giúp chúng ta hiểu biết về thế giới.  Thống kê (satistics, số nhiều): các phép tính cụ thể được thực hiện trên các dữ liệu (data). 12©2010, Nguyễn Duy Long, Tiến Sỹ 9/7/2010 7 Dữ liệu (Data) Thống kê (Statistics) Thông tin (Information) 13©2010, Nguyễn Duy Long, Tiến Sỹ  Suy nghĩ (think)  Biểu thị (show)  Trình bày (tell) ©2010, Nguyễn Duy Long, Tiến Sỹ 14 9/7/2010 8 ©2010, Nguyễn Duy Long, Tiến Sỹ 15  Quần thể (population): một nhóm gồm tất cả các thành phần mà nhà thực hành thống kê quan tâm. ◦ v.d. tất cả các nhà thầu ở Sài Gòn  Mẫu (sample): một tập hợp các dữ liệu rút ra từ quần thể ◦ v.d. một mẫu 75 nhà thầu ở Sài Gòn 16©2010, Nguyễn Duy Long, Tiến Sỹ 9/7/2010 9  Thông số (parameter): một đại lượng mô tả quần thể ◦ v.d. doanh thu bình quân của tất các nhà thầu là 100 tỷ đồng.  Trị (tham) số thống kê (statistic): một đại lượng mô tả mẫu ◦ v.d. doanh thu bình quân của mẫu 75 nhà thầu là 120 tỷ đồng . 17©2010, Nguyễn Duy Long, Tiến Sỹ Quần thể Mẫu Tập con 18 Thông số Trị số thống kê Các quần thể có các thông số; các mẫu có các trị số thống kê ©2010, Nguyễn Duy Long, Tiến Sỹ 9/7/2010 10 ©2010, Nguyễn Duy Long, Tiến Sỹ 19 Phương pháp thông kê Thống kê học mô tả Thông kê học suy luận ©2010, Nguyễn Duy Long, Tiến Sỹ 20 (descriptive statistics) (inferential statistics) 9/7/2010 11  Thu thập số liệu d khả á á hí◦ v. . o s t, quan s t, t nghiệm  Trình bày dữ liệu ◦ v.d. biểu đồ và đồ thị Xác định đặc điểm của dữ liệu ©2010, Nguyễn Duy Long, Tiến Sỹ 21  ◦ v.d. trung bình của mẫu = n xi  Quá trình tạo ra một ước lượng, dự đoán, hay quyết định về quần thể dựa trên mẫu. Mẫu Suy luận Quần thể 22 Thông số Trị số thống kê ©2010, Nguyễn Duy Long, Tiến Sỹ 9/7/2010 12 ©2010, Nguyễn Duy Long, Tiến Sỹ 23  Dữ liệu (data): là các đại lượng cùng ngữ cảnh đi kèm.  Ngữ cảnh của dữ liệu: “Five W’s”: Who, What, When, Where, and Why. Có thể có cả “How.”  Dữ liệu không có ngữ cảnh đi kèm thì hầu như vô nghĩa. 24©2010, Nguyễn Duy Long, Tiến Sỹ 9/7/2010 13 Họ Tên Tuổi Loại lao động Lương ngày Đội Thi Công Bảo hiểm Phan Cam 18 Phổ thông 50,000 1 Không Vũ Phu 35 Nề 90,000 1 Có Cao Giá 28 Nề 95,000 2 Không Trần Ai 45 Sắt 90,000 1 Có Lê La 30 Điện 85,000 2 Có Lâm Tặc 30 Mộc 90 000 1 Không ©2010, Nguyễn Duy Long, Tiến Sỹ 25 , Ngô Khoai 32 Phổ thông 45,000 2 Có Phạm Thượng 22 Phổ thông 50,000 2 Không (Trích từ bảng lương tháng 9/2009, Dự Án “Xây Nhà Từ Nóc”) Định tính Biến của dữ liệu (categorical) Định lượng (quantitative) ©2010, Nguyễn Duy Long, Tiến Sỹ 26 9/7/2010 14 27©2010, Nguyễn Duy Long, Tiến Sỹ  Biểu đồ số người mắc bệnh và tử vong do cúm A/H1N1: ©2010, Nguyễn Duy Long, Tiến Sỹ 28 Nguồn: Báo Tuổi Trẻ, 28/09/2009 9/7/2010 15  Ba qui tắc: 1. Vẽ/tạo hình ảnh — có thể lộ ra những điều mà ấchúng ta không th y từ dữ liệu thô. 2. Vẽ/tạo hình ảnh — những đặc điểm quan trọng của dữ liệu sẽ được thể hiện. Chúng ta có thể thấy những điều chúng ta không mong đợi. 3. Vẽ/tạo hình ảnh — cách tốt nhất để nói với người khác rằng dữ liệu của bạn có hình ảnh trình bày được chọn lựa kỹ. 29©2010, Nguyễn Duy Long, Tiến Sỹ  Đếm số lượng của các giá trị dữ liệu cho mỗi loại.  Tổ chức chúng vào một bảng chỉ số đếm, thể hiện tổng số lượng và loại.  Ví dụ hạng vé tàu Titanic: Hạng vé Đếm Hạng nhất 325 30©2010, Nguyễn Duy Long, Tiến Sỹ Hạng nhì 285 Hạng ba 706 Thủy thủ đoàn 885 (Nguồn: De Veaux et al., 2006) 9/7/2010 16  Bảng tần suất tương đối cũng tương tự, nhưng thể hiện dạng phần trăm (thay vì số đế ) h ỗ lm c o m i oại. Hạng vé % Hạnh nhất 14.77 Hạng nhì 12.95 H ng ba 32 08 31©2010, Nguyễn Duy Long, Tiến Sỹ ạ . Thủy thủ đoàn 40.21 Thủy thủ đoàn Hạng ba 32©2010, Nguyễn Duy Long, Tiến Sỹ Hạng hai Hạng nhất 9/7/2010 17  Biểu đồ thanh tần suất tương đối mô tả sự phân phối tương đối của số đếm cho mỗi loại. h “ ê lý d í h ” T ỏa mãn nguy n iện t c . Slide 3- 33©2010, Nguyễn Duy Long, Tiến Sỹ Nhất Nhì Ba Thủy thủ đoàn Hạng  Khi quan tâm các phần trong tổng thể, biểu đồ bánh là chọn lựa hay. Hạng Hạng hai Nhất Thủy thủ 34©2010, Nguyễn Duy Long, Tiến Sỹ Hạnn ba 9/7/2010 18  Cho phép trình bày hai biến định tính cùng nhau.  Cho phép thể hiện các thành phần được phân phối như thế nào theo mỗi biến và tùy thuộc vào giá trị của biến, khác. ◦ v.d. xem xét hạng vé và sự sống sót của hành khách trên tàu Titanic: Hạng ót Nhất Nhì Ba Thủy thủ Tổng 35©2010, Nguyễn Duy Long, Tiến Sỹ Số ng só Sống 203 118 178 212 711 Chết 122 167 528 673 1490 Tổng 325 285 706 885 2201  Các cột và hàng lề bên phải và bên dưới cho ra tổng số và các phân phối tần suất (frequency distributions) cho mỗi một biến.  Mỗi phân phối tần suất gọi là phân phối lề (marginal distribution) của biến tương ứng. ◦ Phân phối lề cho biến sống sót (survival) của tàu Titanic: Hạng ót Nhất Nhì Ba Thủy thủ 36©2010, Nguyễn Duy Long, Tiến Sỹ Số ng só Sống 203 118 178 212 Chết 122 167 528 673 9/7/2010 19  Mỗi phần tử của bảng cho ra số đếm của sự kết hợp giá trị của hai biến. ◦ Ví dụ phân tử thứ hai ở cột thủy thủ đoàn (crew) chỉ ra, 673 thủy thủ chết khi tàu Titanic bị chìm. Hạng g só t Nhất Nhì Ba Thủy thủ Tổng Sống 203 118 178 212 711 ế 37©2010, Nguyễn Duy Long, Tiến Sỹ Số ng Ch t 122 167 528 673 1490 Tổng 325 285 706 885 2201  Phân phối có điều kiện (conditional distribution) cho ra phân phối của một biến chỉ cho các thành phần thỏa mãn một điều kiện nào đó của biến khác. ◦ Phân phối có điều kiện của hạng vé với điều kiện sống: Hạng 38©2010, Nguyễn Duy Long, Tiến Sỹ Nhất Nhì Ba Thủy thủ Tổng Số ng 203 118 178 212 71128.6% 16.6% 25.0% 29.8% 100% 9/7/2010 20 ◦ Phân phối có điều kiện của hạng vé, với điều kiện thiệt mạng: Hạng Nhất Nhì Ba Thủy thủ Tổng Ch ết 122 167 528 673 1490 8.2% 11.2% 35.4% 45.2% 100% 39©2010, Nguyễn Duy Long, Tiến Sỹ  Các phân phối có điều kiện cho thấy rằng có sự khác nhau về hạng vé và tỷ lệ sự sống sót. Sống sót Chết 40©2010, Nguyễn Duy Long, Tiến Sỹ Nhất Nhì Ba Thủy thủ 9/7/2010 21  Sự phân phối của hạng vé với người sống sót và sự phân phối của hạng vé với người không sống sót là khác nhau.  Hạng vé và sự sống sót là có sự liện hệ, nhưng chúng không độc lập.  Các biến được coi là độc lập khi sự phân phối của một biến trong bảng tùy thuộc là giống nhau cho mỗi loại của biến còn lại. 41©2010, Nguyễn Duy Long, Tiến Sỹ  Biểu đồ thanh phân đốt (segmented bar charts) trình bày lượng thông tin giống với biểu đồ bánh.  Biểu đồ thanh phân đốt giữa hạng vé và tình trạng sống sót: Nhất Nhì Ba Thủy thủ Hạng Ph ần tră m ©2010, Nguyễn Duy Long, Tiến Sỹ 42 ChếtSống sót 9/7/2010 22 43©2010, Nguyễn Duy Long, Tiến Sỹ  “Căn hộ giá trung bình bán chạy”: ©2010, Nguyễn Duy Long, Tiến Sỹ 44 Nguồn: Báo Tuổi Trẻ, 24/10/2009 9/7/2010 23  Trình bày thành thật—đảm bảo biểu đồ nói ra những gì đang thể hiện. ◦ Có vấn đề gì trong biểu đồ trên? 45©2010, Nguyễn Duy Long, Tiến Sỹ  Đừng cường điệu hóa. Không kết luận những điều chưa thể kết luận  Đừng sử dụng trị trung bình không hợp lý— mà có thể dẫn đến cái gọi là nghịch lý Simpson (Simpson’s Paradox). 46©2010, Nguyễn Duy Long, Tiến Sỹ 9/7/2010 24  Hương có điểm TBTL 7.00 ở trường ĐHBK  Thủy có điểm TBTL 7.50 ở trường ĐHBK  Ai có vẻ học tốt hơn trong các môn học ở ĐHBK? Hương hay Thủy?  Theo bạn thì ai có khả năng đạt điểm cao hơn trong môn học này? 47©2010, Nguyễn Duy Long, Tiến Sỹ  Chất lượng thi công công trình của hai nhà thầu A và B theo đánh giá của các chủ đầu tư (đạt/tổng số hợp đồng): Loại công trình Dân dụng Công nghiệp Tổng Nhà thầu A 40/60 (66.6%) 13/15 (86.7%) 53/75 (70.7%) Nhà thầu B 5/8 42/50 47/58  Chọn nhà thầu nào để thi công chất lượng hơn? ©2010, Nguyễn Duy Long, Tiến Sỹ 48 (62.5%) (84.0%) (81.0%) 9/7/2010 25 ©2010, Nguyễn Duy Long, Tiến Sỹ 49