Bài giảng Thống kê cho khoa học xã hội - Bài 2: Các phương pháp thống kê mô tả - Nguyễn Thị Xuân Mai

2.1. TRÌNH BÀY DỮ LIỆU THỐNG KÊ (tiếp theo) Các phương pháp trình bày dữ liệu thống kê • Phân tổ thống kê: Phân chia hiện tượng thành các tổ có tính chất khác nhau.  Là phương pháp cơ bản để tiến hành tổng hợp thống kê.  Là một trong các phương pháp quan trọng của phân tích thống kê, đồng thời là cơ sở để vận dụng các phương pháp phân tích thống kê khác.  Trình tự thực hiện:  Xác định mục đích phân tổ.  Lựa chọn tiêu thức phân tổ: lựa chọn tiêu thức thống kê nào nói rõ bản chất của hiện tượng nhất, phù hợp với mục đích nghiên cúu trong điều kiện thời gian, không gian nhất định.  Xác định số tổ và khoảng cách tổ.  Phân phối các đơn vị vào từng tổ. • Bảng thống kê. • Đồ thị thống kê.

pdf42 trang | Chia sẻ: thanhle95 | Lượt xem: 58 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Bài giảng Thống kê cho khoa học xã hội - Bài 2: Các phương pháp thống kê mô tả - Nguyễn Thị Xuân Mai, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
v1.0016104219 GIỚI THIỆU MÔN HỌC 1 THỐNG KÊ CHO KHOA HỌC XÃ HỘI Giảng viên: ThS. Nguyễn Thị Xuân Mai v1.0016104219 BÀI 2 CÁC PHƯƠNG PHÁP THỐNG KÊ MÔ TẢ Giảng viên: ThS. Nguyễn Thị Xuân Mai 2 v1.0016104219 MỤC TIÊU BÀI HỌC • Trình bày các phương pháp trình bày dữ liệu thống kê. • Trình bày ý nghĩa của số tuyệt đối trong thống kê. • Trình bày ý nghĩa và cách tính các loại số tương đối trong thống kê. • Trình bày đặc điểm, ý nghĩa, tác dụng và cách xác định các mức độ đo xu hướng trung tâm: số trung bình, số trung vị và mốt. • Trình bày đặc điểm, ý nghĩa, tác dụng và cách xác định các mức độ đo độ biến thiên: khoảng biến thiên, phương sai, độ lệch tiêu chuẩn, hệ số biến thiên. • Chỉ ra những đặc trưng phân phối của dãy số thông qua tứ phân vị và biểu đồ boxplot. 3 v1.0016104219 CÁC KIẾN THỨC CẦN CÓ Kiến thức chung về kinh tế - xã hội. 4 v1.0016104219 HƯỚNG DẪN HỌC • Đọc tài liệu tham khảo. • Thảo luận với giáo viên và các sinh viên khác về những vấn đề chưa hiểu rõ. • Trả lời các câu hỏi của bài học. • Đọc và tìm hiểu thêm về các phương pháp thống kê mô tả. 5 v1.0016104219 CẤU TRÚC NỘI DUNG Các tham số thống kê mô tả2.2 Trình bày dữ liệu thống kê2.1 6 v1.0016104219 2.1. TRÌNH BÀY DỮ LIỆU THỐNG KÊ 2.1.1. Trình bày dữ liệu định tính 2.1.2. Trình bày dữ liệu định lượng 7 v1.0016104219 2.1. TRÌNH BÀY DỮ LIỆU THỐNG KÊ (tiếp theo) Các phương pháp trình bày dữ liệu thống kê • Phân tổ thống kê: Phân chia hiện tượng thành các tổ có tính chất khác nhau.  Là phương pháp cơ bản để tiến hành tổng hợp thống kê.  Là một trong các phương pháp quan trọng của phân tích thống kê, đồng thời là cơ sở để vận dụng các phương pháp phân tích thống kê khác.  Trình tự thực hiện:  Xác định mục đích phân tổ.  Lựa chọn tiêu thức phân tổ: lựa chọn tiêu thức thống kê nào nói rõ bản chất của hiện tượng nhất, phù hợp với mục đích nghiên cúu trong điều kiện thời gian, không gian nhất định.  Xác định số tổ và khoảng cách tổ.  Phân phối các đơn vị vào từng tổ. • Bảng thống kê. • Đồ thị thống kê. 8 v1.0016104219 2.1.1. TRÌNH BÀY DỮ LIỆU ĐỊNH TÍNH 9 Loại hình doanh nghiệp Số lượng (doanh nghiệp) Tỷ trọng (%) Doanh nghiệp nhà nước 9 0.69 Công ty cổ phần 428 32.80 Công ty liên doanh 15 1.15 Công ty trách nhiệm hữu hạn 845 64.75 Tư nhân 8 0.61 Tổng số 1305 100.00 • Phân tổ thống kê: mỗi biểu hiện, thuộc tính có thể hình thành một tổ. • Bảng giản đơn. Số doanh nghiệp lữ hành quốc tế trên cả nước năm 2013 phân theo loại hình doanh nghiệp v1.0016104219 9 428 15 845 8 0 100 200 300 400 500 600 700 800 900 Doanh nghiệp nhà nước Công ty cổ phần Công ty liên doanh Công ty trách nhiệm hữu hạn Tư nhân Số lượng DN lữ hành quốc tế trên cả nước năm 2013 phân theo loại hình DN 0.69 32.80 1.15 64.75 0.61 Cơ cấu DN lữ hành quốc tế trên cả nước năm 2013 phân theo loại hình DN (%) Doanh nghiệp nhà nước Công ty cổ phần Công ty liên doanh Công ty trách nhiệm hữu hạn Tư nhân Đồ thị thanh ngang (Bar chart) Đồ thị hình bánh (Pie chart) 2.1.1. TRÌNH BÀY DỮ LIỆU ĐỊNH TÍNH (tiếp theo) • Trình bày một biến dữ liệu định tính 10 v1.0016104219 2.1.1. TRÌNH BÀY DỮ LIỆU ĐỊNH TÍNH (tiếp theo) 11 Mục đích đến Phương tiện đến Đường hàng không Đường thủy Đường bộ Tổng số Du lịch 4000.0 150.0 490.9 4640.9 Thương mại 1200.0 30.0 36.9 1266.9 Thăm thân nhân 580.0 0.0 679.6 1259.6 Các mục đích khác 200.0 13.3 191.7 405.0 Tổng số 5980.0 193.3 1399.1 7572.4 • Trình bày nhiều biến dữ liệu định tính  Bảng kết hợp Số lượt khách quốc tế đến Việt Nam năm 2013 phân theo phương tiện đến và mục đích đến v1.0016104219 2.1.1. TRÌNH BÀY DỮ LIỆU ĐỊNH TÍNH (tiếp theo) 12 0.0 500.0 1000.0 1500.0 2000.0 2500.0 3000.0 3500.0 4000.0 4500.0 Du lịch Thương mại Thăm thân nhân Các mục đích khác Số lượt khách quốc tế (nghìn lượt người) đến ... năm 2013 phân theo mục đích đến và phương tiện đến Đường bộ Đường thủy Đường hàng không 66.89 20.07 9.70 3.34 77.60 15.52 6.88 35.09 2.64 48.57 13.70 0% 20% 40% 60% 80% 100% Du lịch Thương mại Thăm thân nhân Các mục đích khác Tỷ trọng số lượt khách quốc tế đến ... năm 2013 phân theo mục đích đến và phương tiện đến Đường hàng không Đường thủy Đường bộ Biểu đồ nhiều thanh ngang (Side by Side chart) Biểu đồ hình cột (columns) v1.0016104219 2.1.2. TRÌNH BÀY DỮ LIỆU ĐỊNH LƯỢNG • Sắp xếp số liệu theo thứ tự từ nhỏ đến lớn 18 48 15 62 22 30 22 30 36 32 37 49 21 50 43 38 45 50 58 28 15 18 21 22 22 28 30 30 32 36 37 38 43 45 48 49 50 50 58 62 13 • Phân tổ thống kê  Số lượng các lượng biến ít: mỗi lượng biến có thể hình thành nên 1 tổ. → phân tổ không có khoảng cách tổ Số cơ sở lưu trú trên cả nước năm 2013 được xếp hạng theo số sao. Số sao Số cơ sở 1 1996 2 1237 3 375 4 159 5 64 Tổng số 3831 v1.0016104219 2.1.2. TRÌNH BÀY DỮ LIỆU ĐỊNH LƯỢNG (tiếp theo) • Phân tổ thống kê  Số lượng các lượng biến nhiều: mỗi tổ bao gồm một phạm vi lượng biến với 2 giới hạn: giới hạn dưới và giới hạn trên → phân tổ có khoảng cách tổ Khoảng cách tổ = giới hạn trên – giới hạn dưới  Khoảng cách tổ bằng nhau  Khoảng cách tổ không bằng nhau  Khoảng cách tổ mở Số lao động (Người) Số cơ sở lưu trú <10 10-20 21-50 51-100 101-200 >200 Tổng Thu nhập bình quân một tháng (Triệu đồng) Số nhân viên (Người) 3-5 5-7 7-9 9-11 11-13 13-15 Tổng 14 v1.0016104219 2.1.2. TRÌNH BÀY DỮ LIỆU ĐỊNH LƯỢNG (tiếp theo) 15 Lưu ý: • Với tiêu thức số lượng có lượng biến rời rạc (lượng biến biểu thị bằng các số nguyên, như độ tuổi, số lao động), có thể phân tổ có khoảng cách tổ hoặc không có khoảng cách tổ. • Với tiêu thức số lượng có lượng biến liên tục (lượng biến biểu thị bằng trị số bất kỳ, gồm cả số nguyên và số thập phân như thu nhập, ), phải phân tổ có khoảng cách tổ. Khi đó, giới hạn trên của tổ đứng trước được lấy làm giới hạn dưới của tổ đứng sau với mục đích làm cho dãy số kín hay liên tục. • Khi 1 đơn vị nào đó có lượng biến đúng bằng giới hạn trên và giới hạn dưới của 2 tổ liền nhau thì thường được xếp vào tổ đứng sau. • Với dãy số phân tổ có khoảng cách tổ mở, khi tính toán, khoảng cách tổ của tổ liền kề được lấy làm khoảng cách tổ của tổ mở. v1.0016104219 2.1.2. TRÌNH BÀY DỮ LIỆU ĐỊNH LƯỢNG (tiếp theo) 16 v1.0016104219 2.1.2. TRÌNH BÀY DỮ LIỆU ĐỊNH LƯỢNG (tiếp theo) 17 Thu nhập bình quân một tháng (Triệu đồng) Số nhân viên (Người) fi xi di (%) Si (Người) 3-5 3 4 15 3 5-7 5 6 25 8 7-9 6 8 30 14 9-11 3 10 15 17 11-13 2 12 10 19 13-15 1 14 5 20 Tổng 20 100 v1.0016104219 2.1.2. TRÌNH BÀY DỮ LIỆU ĐỊNH LƯỢNG (tiếp theo) 18 v1.0016104219 2.2. CÁC THAM SỐ THỐNG KÊ MÔ TẢ 2.2.1. Số tuyệt đối và số tương đối trong thống kê 2.2.2. Các mức độ đo xu hướng trung tâm 2.2.3. Các mức độ đo độ biến thiên 2.2.4. Đặc trưng phân phối của dãy số 19 v1.0016104219 2.2.1. SỐ TUYỆT ĐỐI VÀ SỐ TƯƠNG ĐỐI TRONG THỐNG KÊ a. Số tuyệt đối trong thống kê: Biểu hiện quy mô, khối lượng của hiện tượng nghiên cứu trong điều kiện thời gian, địa điểm cụ thể. • Luôn bao hàm một nội dung kiến thức xã hội trong điều kiện thời gian, không gian cụ thể. • Phải qua điều tra thực tế và tổng hợp mới xác định được. • Có đơn vị tính cụ thể. • Gồm có:  Số tuyệt đối thời điểm Ví dụ: Tổng số lao động của doanh nghiệp A tại thời điểm 1/7/2014 là 13500 người.  Số tuyệt đối thời kỳ Ví dụ: Tổng doanh thu của doanh nghiệp A năm 2014 là 2200 tỷ đồng. 20 v1.0016104219 2.2.1. SỐ TUYỆT ĐỐI VÀ SỐ TƯƠNG ĐỐI TRONG THỐNG KÊ 21 b. Số tương đối trong thống kê: Biểu hiện quan hệ so sánh giữa hai mức độ nào đó của hiện tượng. • Chỉ thu được qua tính toán. • Mỗi số tương đối đều phải có gốc dùng để so sánh. Gốc so sánh khác nhau, ý nghĩa khác nhau. • Đơn vị tính: lần, %, đơn vị kép. • Có 5 loại số tương đối: v1.0016104219 2.2.1. SỐ TUYỆT ĐỐI VÀ SỐ TƯƠNG ĐỐI TRONG THỐNG KÊ (tiếp theo)  Số tương đối động thái (tốc độ phát triển): phản ánh sự biến động về mức độ của hiện tượng qua thời gian. Ví dụ: Doanh thu của doanh nghiệp A năm 2014 bằng 112% so với năm 2013 tức đã tăng 12%.  Số tương đối kế hoạch: Dùng để lập và kiểm tra tình hình thực hiện kế hoạch. Số tương đối nhiệm vụ kế hoạch: Số tương đối thực hiện (hoàn thành) kế hoạch: 0y yK kn  k t y yK 1 Tn KKt  0 1 y yt  22 v1.0016104219 2.2.1. SỐ TUYỆT ĐỐI VÀ SỐ TƯƠNG ĐỐI TRONG THỐNG KÊ (tiếp theo) 23  Số tương đối kết cấu: Biểu hiện tỷ trọng của từng bộ phận chiếm trong toàn bộ tổng thể.  Số tương đối không gian: Sử dụng trong hai trường hợp: So sánh giữa hai mức độ cùng loại nhưng khác nhau về không gian. So sánh giữa hai bộ phận trong một tổng thể: hai không gian khác nhau cùng tồn tại trong một tổng thể.  Số tương đối cường độ: Nói lên trình độ phổ biến của hiện tượng trong điều kiện lịch sử nhất định, là kết quả so sánh hai mức độ khác loại nhưng có mối liên hệ với nhau. Số tương đối cường độ có đơn vị kép. Ví dụ: Mật độ dân số Việt Nam năm 2014 bằng 269 người/km2. tt bp y y d  v1.0016104219 2.2.1. SỐ TUYỆT ĐỐI VÀ SỐ TƯƠNG ĐỐI TRONG THỐNG KÊ (tiếp theo) 24 • Điều kiện vận dụng chung số tương đối và tuyệt đối trong thống kê  Phải xét đến đặc điểm của hiện tượng nghiên cứu để rút ra kết luận cho đúng.  Phải vận dụng một cách kết hợp các số tương đối với số tuyệt đối, vì:  Số tuyệt đối là cơ sở bảo đảm tính chất chính xác của số tương đối.  Ý nghĩa của số tương đối còn phụ thuộc vào trị số tuyệt đối mà nó phản ánh.  Các nhiệm vụ phân tích thống kê không thể giải quyết được tốt, nếu chỉ dùng các số tuyệt đối. v1.0016104219 2.2.2. CÁC MỨC ĐỘ ĐO XU HƯỚNG TRUNG TÂM • Số trung bình • Số trung vị • Mốt 25 v1.0016104219 2.2.2. CÁC MỨC ĐỘ ĐO XU HƯỚNG TRUNG TÂM 26 • Số trung bình (Mean) trong thống kê là mức độ đại biểu theo một tiêu thức nào đó của một tổng thể gồm nhiều đơn vị cùng loại.  Tác dụng:  Phản ánh mức độ đại biểu, nêu lên đặc trưng chung nhất của tổng thể.  So sánh các hiện tượng không có cùng quy mô.  Nghiên cứu các quá trình biến động qua thời gian.  Lập kế hoạch và phân tích thống kê.  Đặc điểm:  San bằng mọi chênh lệch về lượng biến của tiêu thức.  Chịu ảnh hưởng của lượng biến đột xuất.  Điều kiện vận dụng:  Chỉ được tính ra từ tổng thể đồng chất (không có sự khác biệt về bản chất, chỉ có sự khác biệt về mặt lượng).  Khi phân tích nên kết hợp với dãy số phân tổ. v1.0016104219 2.2.2. CÁC MỨC ĐỘ ĐO XU HƯỚNG TRUNG TÂM (tiếp theo) • Số trung bình  Số trung bình cộng: vận dụng khi các lượng biến có mối quan hệ tổng. → Là mức độ phổ biến nhất  Số trung bình cộng giản đơn: vận dụng khi tài liệu chưa được phân tổ, các lượng biến xi có tần số bằng 1. Số trung bình = Tổng lượng biến của tiêu thức Tổng số đơn vị của tổng thể 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14 TB = 5 TB = 6 n x ... x x x n21  Hay là n x x i 27 v1.0016104219 2.2.2. CÁC MỨC ĐỘ ĐO XU HƯỚNG TRUNG TÂM (tiếp theo) 28 • Số trung bình  Số trung bình cộng gia quyền: vận dụng khi các lượng biến xi có tần số fi khác nhau tức dãy số đã phân tổ. Trong đó: fi đóng vai trò là quyền số cho biết tầm quan trọng của từng lượng biến trong tính số bình quân. Nếu biết tỷ trọng của mỗi bộ phận di: 100  iidx x n2 nn21 f ... f f f x ... f x fx x   1 21 100 i i i f f d  i i i f f d   iidx x Hay là   i ii f fx x v1.0016104219 2.2.2. CÁC MỨC ĐỘ ĐO XU HƯỚNG TRUNG TÂM (tiếp theo) • Số trung bình Ví dụ: Có tài liệu về năng suất lao động của công nhân doanh nghiệp A năm 2014 như sau (cột 1 và 2). Khi đó, năng suất trung bình của công nhân doanh nghiệp A được tính theo công thức: Nếu biết tỷ trọng số công nhân ở từng mức năng suất lao động, năng suất lao động trung bình được tính: Năng suất lao động (Triệu đồng) xi Số công nhân (Người) fi Xifi di xidi 30 15 450 0,075 2,250 35 30 1050 0,150 5,250 40 45 1800 0,225 9,000 45 55 2475 0,275 12,375 50 40 2000 0,200 10,000 55 15 825 0,075 4,125 Tổng 200 8600 1,000 43,000 29 8600 200 i i ixx f f     i i i i i x x f x d f     43 triệu đồng 43 triệu đồng v1.0016104219 2.2.2. CÁC MỨC ĐỘ ĐO XU HƯỚNG TRUNG TÂM (tiếp theo) 30 • Số trung bình  Số trung bình cộng điều hoà: vận dụng khi biết lượng biến xi và tổng lượng biến tiêu thức của từng tổ Mi = xifi. Trong trường hợp các Mi là bằng nhau, số trung bình cộng điều hòa giản đơn được tính: x M ... x M x M M ... M M x n n 2 2 1 1 n21    ix 1 n x Hay là   i i i x M M x v1.0016104219 2.2.2. CÁC MỨC ĐỘ ĐO XU HƯỚNG TRUNG TÂM (tiếp theo) • Số trung bình Ví dụ: Có tài liệu về năng suất lao động và giá trị sản xuất của mỗi nhóm năng suất lao động trong doanh nghiệp A năm 2014 như sau (cột 1, 2). Dãy số phân tổ có khoảng cách tổ, phải tính cột lượng biến xi là trị số giữa của mỗi tổ. Năng suất lao động trung bình của công nhân doanh nghiệp A được tính theo công thức: ݔ௜ ൌ ∑ܯ௜ ∑ܯ௜ݔ௜ ൌ 21250 300 ൌ 70,83 ݐݎ݅ệݑ đồ݊݃ Năng suất lao động (Triệu đồng) Giá trị sản xuất (Triệu đồng) Mi Xi fi=Mi/xi 40-50 1125 45 25 50-60 2200 55 40 60-70 4550 65 70 70-80 6375 75 85 80-90 5100 85 60 ≥90 1900 95 20 Tổng 21250 300 31 v1.0016104219 2.2.2. CÁC MỨC ĐỘ ĐO XU HƯỚNG TRUNG TÂM (tiếp theo) 32 • Số trung bình  Số trung bình nhân: Vận dụng khi các lượng biến có mối quan hệ tích.  Số trung bình nhân giản đơn  Số trung bình nhân gia quyền Ví dụ: Có tốc độ phát triển về số lượng lao động ở tỉnh A trong 10 năm như sau: 5 năm có tốc độ phát triển hàng năm là 110%; 2 năm có tốc độ phát triển hàng năm là 125% và 3 năm có tốc độ phát triển hàng năm là 115%. Vậy tốc độ phát triển trung bình hàng năm trong giai đoạn 10 năm nói trên là: x x... x x x n in n21    i ii n2 f fif fnf2f x x... x x x 11 143611512511110 325 1 ....xx i if fi n i    (lần hay 114.36%) v1.0016104219 2.2.2. CÁC MỨC ĐỘ ĐO XU HƯỚNG TRUNG TÂM (tiếp theo) • Mốt (Mode - Mo) là biểu hiện của một tiêu thức phổ biến nhất hay được gặp nhiều nhất trong tổng thể hay trong một dãy số phân phối. → Mốt là biểu hiện hoặc lượng biến có tần số fi lớn nhất.  Không chịu ảnh hưởng của lượng biến đột xuất.  Có thể không có Mốt nhưng cũng có thể có nhiều Mốt.  Được sử dụng đối với biến thuộc tính và biến định lượng. 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14 Me = 5 Me=(5+7)/2=6 25% 25% 25% 25% Q1 Q2 Q3xmin xmax 33 v1.0016104219 2.2.2. CÁC MỨC ĐỘ ĐO XU HƯỚNG TRUNG TÂM (tiếp theo) 34 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Mo = 9 0 1 2 3 4 5 6 Không có Mốt • Số trung vị (Median - Me) là lượng biến của đơn vị đứng ở vị trí chính giữa trong một dãy số lượng biến, chia dãy số thành hai phần bằng nhau.  Không chịu ảnh hưởng của lượng biến đột xuất.  Chỉ sử dụng đối với biến định lượng.  Nếu số đơn vị tổng thể là lẻ (n=2m+1), Me = xm+1.  Nếu số đơn vị tổng thể là chẵn (n=2m), Me = (xm + xm+1) / 2 v1.0016104219 2.2.2. CÁC MỨC ĐỘ ĐO XU HƯỚNG TRUNG TÂM (tiếp theo) 35 • Phân vị cung cấp thông tin về phân phối của dữ liệu trên khoảng từ giá trị nhỏ nhất đến giá trị lớn nhất.  Phân vị mức p là giá trị mà có ít nhất p% số quan sát có giá trị nhỏ hơn hoặc bằng giá trị phân vị mức p và có ít nhất (100 - p)% số quan sát có giá trị lớn hơn hoặc bằng giá trị phân vị mức p.  Một số trường hợp ứng dụng cụ thể: tam phân vị (chia tổng thể thành 3 phần bằng nhau); tứ phân vị; ngũ phân vị hay thập phân vị. • Tứ phân vị: là các giá trị đặc biệt chia dãy số thành 4 phần bằng nhau.  Q1 - điểm tứ phân vị thứ nhất, tương ứng với phân vị mức 25, có 25% số đơn vị tổng thể có giá trị nhỏ hơn hoặc bằng Q1 và 75% số đơn vị tổng thể có giá trị lớn hơn hoặc bằng Q1.  Q2 - điểm tứ phân vị thứ hai, tương ứng với phân vị mức 50, chính là trung vị.  Q3 - điểm tứ phân vị thứ ba, tương ứng với phân vị mức 75  Khoảng tứ phân vị (interquartile range, IQR=Q3-Q1) cho biết 50% số đơn vị có giá trị nằm trong khoảng từ Q1 đến Q3 v1.0016104219 2.2.3. CÁC MỨC ĐỘ ĐO ĐỘ BIẾN THIÊN Các mức độ đo độ biến thiên cho biết: • Đặc trưng về phân phối. • Kết cấu và tính đồng đều của tổng thể. • Trình độ đại biểu của số trung bình. → Giá trị của các mức độ càng nhỏ, tổng thể càng đồng đều, trình độ đại biểu của số trung bình càng cao. • Gồm 4 mức độ sau:  Khoảng biến thiên (Range): Là sự chênh lệch giữa giá trị nhỏ nhất và giá trị lớn nhất R = xmax - xmin  Không phụ thuộc vào sự phân bố của dữ liệu  Chỉ phụ thuộc vào lượng biến lớn nhất và nhỏ nhất  Rất nhạy cảm với các lượng biến đột xuất 7 8 9 10 11 12 R = 12 - 7 = 5 7 8 9 10 11 12 R = 12 - 7 = 5 36 v1.0016104219 2.2.3. CÁC MỨC ĐỘ ĐO ĐỘ BIẾN THIÊN (tiếp theo) 37 v1.0016104219 2.2.3. CÁC MỨC ĐỘ ĐO ĐỘ BIẾN THIÊN (tiếp theo) 38 v1.0016104219 2.2.4. ĐẶC TRƯNG PHÂN PHỐI CỦA DÃY SỐ Dựa trên 5 giá trị của một dãy số lượng biến gồm: xmin, Q1, Me, Q3 và xmax ta có thể xác định được hình dạng của phân phối chuẩn. 39 Lệch trái Đối xứng Lệch phải Khoảng cách từ xmin tới Me là lớn hơn khoảng cách từ Me tới xmax Hai khoảng cách này là như nhau Khoảng cách từ xmin tới Me là nhỏ hơn khoảng cách từ Me tới xmax Khoảng cách từ xmin tới Q1 là lớn hơn khoảng cách từ Q3 tới xmax Hai khoảng cách này là như nhau Khoảng cách từ xmin tới Q1 là nhỏ hơn khoảng cách từ Q3 tới xmax Khoảng cách từ Q1 tới Me là lớn hơn khoảng cách từ Me tới Q3 Hai khoảng cách này là như nhau Khoảng cách từ Q1 tới Me là nhỏ hơn khoảng cách từ Me tới Q3 ̅ݔ Me > Mo IQR 1.5 IQR1.5 IQR Giới hạn trong Giới hạn ngoài Q1 Me Q3 Nghi ngờ là lượng biến đột xuất Nghi ngờ là lượng biến đột xuất Lượng biến đột xuất Lượng biến đột xuất Khớp nối 1.5 IQR1.5 IQR Giới hạn ngoài Giới hạn trong v1.0016104219 2.2.4. ĐẶC TRƯNG PHÂN PHỐI CỦA DÃY SỐ 40 • Biểu đồ Boxplot là một cách biểu diễn bộ dữ liệu với 5 giá trị quan trọng là giá trị nhỏ nhất (xmin ), tứ phân vị thứ nhất (Q1), tứ phân vị thứ hai (Q2) hay Me, tứ phân vị thứ ba (Q3) và giá trị lớn nhất (xmax).  Hộp (box) giới hạn từ Q1 đến Q3, biểu diễn 50% số đơn vị giữa của tổng thể  “Ria” bên trái từ xmin đến Q1 biểu diễn 25% số đơn vị tổng thể có giá trị nhỏ nhất,  “Ria” bên phải từ Q3 đến xmax biểu diễn 25% số đơn vị tổng thể có giá trị lớn nhất. Nếu là phân phối chuẩn đối xứng thì Q2 hay Me sẽ ở chính giữa hộp. Me 4 6 8 10 12 Q3Q1 XmaxXmi n Lệch phảiLệch trái Đối xứng Q1 M e Q3Q1 M e Q3 Q1 M e Q3 v1.0016104219 2.2.4. ĐẶC TRƯNG PHÂN PHỐI CỦA DÃY SỐ 41 • Biểu đồ Boxplot  Nhận biết vị trí của bộ dữ liệu trên cơ sở Me.  Nhận biết sự dàn trải của dữ liệu trên cơ sở độ dài của hộp (khoảng tứ phân vị IQR) và độ dài của ria mèo  Nhận biết độ lệch phân phối của dữ liệu  So sánh 2 hay nhiều bộ dữ liệu với cùng 1 thước đo  Nhận biết lượng biến đột xuất (outliers) và nghi ngờ có thể là lượng biến đột xuất qua sơ đồ sau: v1.0016104219 TÓM LƯỢC CUỐI BÀI Trong bài học này, chúng ta đã nghiên cứu các nội dung chính sau: • Dữ liệu thống kê đối với dữ liệu định tính và dữ liệu định lượng bằng các phương pháp phân tổ thống kê, bảng thống kê, đồ thị thống kê. • Tính toán các tham số thống kê mô tả: các mức độ trung tâm: số trung bình, số trung vị, mốt; các mức độ đo độ biến thiên: khoảng biến thiên, phương sai, độ lệch tiêu chuẩn, hệ số biến thiên. • Đặc trưng phân phối của dãy số. 42
Tài liệu liên quan