Phân tích dữ liệu và trình bày kết quả nghiên cứu

Các nguyên tắc thiết lập mã hóa  Số lượng "kiểu mã hóa" thích hợp  Tính tương đương của thông tin trả lời trong cùng “loại mã"  Sự khác biệt của các thông tin trả lời giữa các "loại mã"  Nguyên tắc loại trừ giữa các loại mã hóa  Nguyên tắc toàn diện

pdf11 trang | Chia sẻ: tranhoai21 | Lượt xem: 2134 | Lượt tải: 3download
Bạn đang xem nội dung tài liệu Phân tích dữ liệu và trình bày kết quả nghiên cứu, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Page 1 I PHÂN TÍCH DỮ LIỆU II TRÌNH BÀY KẾT QUẢ NGHIÊN CỨU Chương V PHÂN TÍCH DỮ LIỆU VÀ TRÌNH BÀY KẾT QUẢ NGHIÊN CỨU I. XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU Chuẩn bị dữ liệu và xử lý1 Phương pháp mô tả và phân tích dữ liệu2 1. Chuẩn bị dữ liệu và xử lý Chuẩn bị (làm sạch) dữ liệu Phương pháp xử lý dữ liệu Nhập dữ liệu Nhập dữ liệu Thiết kế form nhập dữ liệu Nhập trực tiếp vào phần mềm xử lý Mã hoá dữ liệu Mã hoá dữ liệu Các thủ tục mã hóa  Mã hóa trước  Mã hóa sau Mã hoá dữ liệu  Các nguyên tắc thiết lập mã hóa  Số lượng "kiểu mã hóa" thích hợp  Tính tương đương của thông tin trả lời trong cùng “loại mã"  Sự khác biệt của các thông tin trả lời giữa các "loại mã"  Nguyên tắc loại trừ giữa các loại mã hóa  Nguyên tắc toàn diện Page 2 Mã hoá dữ liệu  Lập danh bạ mã hóa  Danh bạ mã hóa: là bảng gồm nhiều cột, chứa đựng những lời giải thích về mã hiệu đã được sử dụng trong những trường dữ liệu  Chức năng của danh bạ mã hóa: Giúp người làm mã hóa thực hiện việc làm biến đổi từ một câu trả lời ra một ký hiệu (mã hiệu) thích hợp mà máy tính có thể đọc được. Giúp nhà nghiên cứu nhận diện được các biến số sử dụng trong các quá trình phân tích. Chuẩn bị (làm sạch) dữ liệu Kiểm tra dữ liệu Hiệu chỉnh dữ liệu Kiểm tra dữ liệu  Mục đích: xác định dữ liệu đã thu thập được có thể chấp nhận được hay không? Trả lời câu hỏi "dữ liệu đó có thực sự chính xác hay không?"  Nội dung: Kiểm tra: con số và logic...... Kiểm tra dữ liệu Cách làm: - Nếu bản thân người nghiên cứu đi thu thập: kiểm tra tính chính xác trên phiếu điều tra. - Nếu việc thu thập dữ liệu đặt hàng cho một tổ chức khác: kiểm tra lấy mẫu và chọn mẫu, tính chính xác trên phiếu điều tra... Hiệu chỉnh dữ liệu Một số thiếu sót phổ biến cần hiệu chỉnh  Những câu trả lời không đầy đủ  Những câu trả lời thiếu nhất quán  Những câu trả lời không thích hợp  Những câu trả lời không đọc được Quay trở lại điều tra viên hay người trả lời để làm sáng tỏ.  Suy luận từ những câu trả lời khác.  Loại toàn bộ câu trả lời Cách tiếp cận để xử lý Phương pháp xử lý dữ liệu Xử lý thủ công (bằng tay):  - Phương pháp kiểm đếm bằng tay  - Phương pháp lựa ra và đếm  Xử lý bằng máy tính  Ưu điểm:  Không đòi hỏi các thiết bị kỹ thuật phức tạp.  Đơn giản với kỹ thuật viên tính toán  Khi lập bảng có thể dùng ngôn ngữ phổ thông  Nhược điểm  Khả năng phân tích dữ liệu đa chiều  Mất nhiều thời gian khi phải xử lý một số lớn đơn vị điều tra, Không có khả năng thực hiện khi số lượng biến lớn và khối lượng dữ liệu nhiều.  Không có khả năng kết hợp nhập, phân tích dữ liệu, in kết quả và lưu trữ dữ liệu, kết quả. Đây là phương pháp thích hợp nhất và mang lại hiệu quả cao về kinh tế cũng như kỹ thuật xử lý, phân tích. Hiện nay có nhiều phần mềm hữu hiệu cho việc nhập, xử lý và phân tích các dữ liệu phân tích kinh tế xã hội. (SPSS, STATA, SAS, Minitab, Eviews...) Page 3 I. XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU Chuẩn bị dữ liệu và xử lý1 Phương pháp mô tả và phân tích dữ liệu2 2. Phương pháp mô tả và phân tích dữ liệu 2.1. Mô tả dữ liệu 2.2. Phân tích dữ liệu 2.1. Mô tả dữ liệu 2.1.1 Sắp xếp dữ liệu và phân tổ thống kê 2.1.2. Bảng thống kê và đồ thị thống kê 2.1.3. Tóm tắt dữ liệu bằng các tham số đặc trưng 2.1.1.1 Sắp xếp dữ liệu 2.1.1.2 Phân tổ thống kê 2.1.1 Sắp xếp dữ liệu và phân tổ thống kê 2.1.1.1 Sắp xếp dữ liệu  Sắp xếp số liệu theo thứ tự  Biểu hiện bằng sơ đồ thân lá (Stem and leaf) S¾p xÕp??? TUOI Stem-and-Leaf Plot Frequency Stem & Leaf 3,00 2 . 1& 10,00 2 . 2333 30,00 2 . 44444445555555 33,00 2 . 6666667777777777 76,00 2 . 8888888888888888888999999999999999999 56,00 3 . 0000000000000000000001111111 62,00 3 . 2222222222222222222233333333333 51,00 3 . 4444444444455555555555555 25,00 3 . 666666777777 45,00 3 . 8888888888888889999999 31,00 4 . 000000000000011 23,00 4 . 22222233333 41,00 4 . 44444444455555555555 17,00 4 . 66666677 25,00 4 . 888888899999 20,00 5 . 000000011 9,00 5 . 2233 4,00 5 . 5& 4,00 5 . 7& 3,00 5 . 8 Stem width: 10 Each leaf: 2 case(s) 2.1.1.2 Phân tổ thống kê Phân tổ thống kê là căn cứ vào một (hay một số) tiêu thức nào đó để tiến hành phân chia các đơn vị của hiện tượng nghiên cứu thành các tổ (hoặc các tiểu tổ) có tính chất khác nhau Page 4 2.1.1.2 Phân tổ thống kê Các loại phân tổ thống kê Các loại phân tổ thống kê Căn cứ vào số lượng tiêu thức của phân tổ Phân tổ phân loại Phân tổ kết cấu Phân tổ liên hệ Phân tổ theo 1 tiêu thức Phân tổ theo nhiều tiêu thức Phân tổ kết hợp Phân tổ nhiều chiều 2.1.1.2 Phân tổ thống kê Phân phối các đơn vị vào từng tổ Xác định số tổ và khoảng cách tổ Lựa chọn tiêu thức phân tổ Xác định mục đích phân tổ Bước 4 Bước 3 Bước 2 Bước 1 2.1. Mô tả dữ liệu 2.1.1 Sắp xếp dữ liệu và phân tổ thống kê 2.1.2. Bảng thống kê và đồ thị thống kê 2.1.3. Tóm tắt dữ liệu bằng các tham số đặc trưng 2.1.2.1 Bảng thống kê 2.1.2.2 Đồ thị thống kê 2.1.2. Bảng thống kê và đồ thị thống kê 2.1.3.1 Bảng thống kê Bảng thống kê là một hình thức trình bày các tài liệu thống kê một cách có hệ thống, hợp lý và rõ ràng, nhằm nêu lên các đặc trưng về mặt lượng của hiện tượng nghiên cứu. Cấu thành bảng thống kê Tên bảng thống kê (tiêu đề chung) Phần giải thích Phần chủ đề Các chỉ tiêu giải thích (tên cột) (A) (1) (2) (3) (4) Các chỉ tiêu giải thích (tên cột) Nguyên tắc trình bày bảng - Quy mô của bảng thống kê không nên quá lớn. - Các tiêu đề và tiêu mục trong bảng cần ghi chính xác, gọn và dễ hiểu. - Các hàng và cột thường được ký hiệu bằng chữ hoặc bằng số. - Các chỉ tiêu giải thích trong bảng cần được sắp xếp theo thứ tự hợp lý - Cách ghi các số liệu vào bảng thống kê. - Phần ghi chú ở cuối bảng thống kê. Page 5 2.1.3.2 Đồ thị thống kê Là các hình vẽ hoặc đường nét hình học dùng để miêu tả có tính chất quy ước các tài liệu thống kê. Có tính quần chúng, có sức hấp dẫn và sinh động, làm cho người hiểu biết ít về thống kê vẫn lĩnh hội được vấn đề chủ yếu một các dễ dàng, đồng thời giữ được ấn tượng sâu đối với người đọc. Nguyên tắc trình bày đồ thị - Quy mô của đồ thị - Các ký hiệu hình học - Hệ tọa độ - Thang và tỷ lệ xích - Phần ghi chú Đồ thị hình cột 0 5 10 15 20 25 Jan Feb Mar Apr May Jun Food Đồ thị so sánh hình cột 0 5 10 15 20 25 30 Jan Feb Mar Apr May Jun Food Gas Đồ thị đường gấp khúc Food 0 5 10 15 20 25 Jan Feb Mar Apr May Jun Đồ thị cơ cấu 12 17 22 14 19 Page 6 Đồ thị so sánh cơ cấu 0% 20% 40% 60% 80% 100% Jan Feb Mar Apr May Jun Motel Gas Food Đồ thị liên hệ 400 450 500 550 600 650 700 750 0 5 10 15 20 25 30 35 40 Đồ thị hình “mạng nhện” 0 5 10 15 20 25 30 Jan Feb Mar Apr May Jun Food Gas Bản đồ thống kê 2.1. Mô tả dữ liệu 2.1.1 Sắp xếp dữ liệu và phân tổ thống kê 2.1.2. Bảng thống kê và đồ thị thống kê 2.1.3. Tóm tắt dữ liệu bằng các tham số đặc trưng 2.1.3.1 Các mức độ điển hình 2.1.3.2 Các tham số biến thiên (phân tán) 2.1.3. Tóm tắt dữ liệu bằng các tham số đặc trưng Page 7 2.1.3.1 Các mức độ trung tâm Trung vị Số bình quân Mốt Số bình quân Số bình quân trong thống kê là mức độ biểu hiện trị số đại biểu theo một tiêu thức nào đó của một tổng thể bao gồm nhiều đơn vị cùng loại Số bình quân -Số bình quân cộng: + Giản đơn: + Gia quyền: + Điều hoà gia quyền + Điều hoà giản đơn i ii n nn f fx fff fxfxfx x       . ... ...... 21 2211 n x n xxx x in     ...21 _          . . .._ i i i i ii i i x M M x fx fx f fx x ix n x 1   _ Số bình quân - Số bình quân nhân: + Giản đơn: + Gia quyền: n n i i n n xxxxx    1 21 ...    i ii n f n i f i f f n ff xxxxx 1 21 21 ... Số bình quân Đặc điểm •Nêu lên mức độ chung nhất, phổ biến nhất, có tính chất đại biểu nhất của tiêu thức nghiên cứu, không kể đến chênh lệch thực tế giữa các đơn vị tổng thể •San bằng mọi chênh lệch giữa các đơn vị về trị số của tiêu thức nghiên cứu •Chịu ảnh hưởng của các lượng biến đột xuất Số bình quân Điều kiện vận dụng - Số bình quân chỉ được tính ra từ tổng thể đồng chất (bao gồm nhiều đơn vị, phần tử hoặc hiện tượng có cùng chung một tính chất, thuộc cùng một loại hình kinh tế xã hội, xét theo một tiêu thức nào đó) - Số bình quân chung cần được vận dụng kết hợp với các số bình quân tổ hoặc dãy số phân phối Page 8 2.1.3.1 Các mức độ trung tâm Trung vị Số bình quân Mốt Mốt (Mo) Là biểu hiện của một tiêu thức được gặp nhiều nhất trong một tổng thể hay trong một dãy số phân phối (Được sử dụng đối với cả biến định tính và định lượng) - Đối với một dãy số lượng biến, mốt là lượng biến có tần số lớn nhất - Đối với một dãy số lượng biến có khoảng cách tổ, muốn tìm mốt trước hết cần xác định tổ có mốt, tức là tổ có tần số lớn nhất. Sau đó, trị số gần đúng của mốt tính theo công thức: )()( . 11 1 0 0min0      oooo oo MMMM MM MM ffff ff hxM Mốt (Mo) Tác dụng • Là mức độ đại biểu, nên có thể dùng Mo để thay thế cho số trung bình trong những trường hợp tính số trung bình gặp khó khăn. • Không chịu ảnh hưởng bởi các lượng biến đột xuất nên có ý nghĩa hơn số bình quân trong trường hợp dãy số có lượng biến đột xuất •Là một trong những tham số nêu lên đặc trưng phân phối • Phục vụ nhu cầu hợp lý Mốt (Mo) Hạn chế • Kém nhạy bén với sự biến thiên của tiêu thức • Không xác định được trong trường hợp dãy số phân phối không bình thường 2.1.3.1 Các mức độ trung tâm Trung vị Số bình quân Mốt Trung vị (Me) Là một lượng biến tiêu thức của đơn vị đứng ở vị trí giữa trong một dãy số lượng biến -Nếu số đơn vị tổng thể lẻ (n = 2m + 1), số trung vị sẽ là lượng biến của đơn vị đứng ở vị trí giữa - Nếu số đơn vị tổng thể chẵn (n = 2m), số trung vị là bình quân của 2 số đứng ở vị trí giữa: - Dãy số lượng biến có khoảng cách tổ: xác định tổ có số trung vị và tính theo công thức: e e ee M M i MMe f S f hxM    12. min Page 9 Trung vị (Me) Tác dụng • Là mức độ đại biểu, có thể dùng Me để thay thế cho số trung bình trong những trường hợp tính số trung bình gặp khó khăn. • Không chịu ảnh hưởng bởi các lượng biến đột xuất nên có ý nghĩa hơn số bình quân trong trường hợp dãy số có lượng biến đột xuất •Là một trong những tham số nêu lên đặc trưng phân phối • Tác dụng trong kỹ thuật và phục vụ công cộng Khoảng tứ phân vị, Q1 Me Q2 568N = TUOI 70 60 50 40 30 20 10 Đặc trưng phân phối Hệ số bất đối xứng K<0 dãy số phân phối chuẩn lệch trái K>0 dãy số phân phối chuẩn lệch phải K=0 dãy số phân phối chuẩn đối xứng K càng lớn thì dãy số càng không đối xứng  0MxK   X Me Mo 2.1.3.1 Các mức độ điển hình 2.1.3.2 Các tham số biến thiên (phân tán) 2.1.3. Tóm tắt dữ liệu bằng các tham số đặc trưng 2.1.3.2 Các tham số biến thiên (phân tán) Phân tán Ý nghĩa nghiên cứu: - Xét trình độ đại biểu của số bình quân - Thấy rõ nhiều đặc trưng của dãy số, như đặc trưng về phân phối, về kết cấu, tính chất đồng đều của tổng thể nghiên cứu - Sử dụng trong nhiều trường hợp nghiên cứu thống kê khác như: phân tích biến động, phân tích mối liên hệ, dự đoán thống kê... Khoảng biến thiên (R) Là độ lệch giữa lượng biến lớn nhất và lượng biến nhỏ nhất của tiêu thức nghiên cứu, biểu hiện bằng công thức: R = Xmax - Xmin Không phụ thuộc vào sự phân bố của dữ liệu: 7 8 9 10 11 12 R = 12 - 7 = 5 7 8 9 10 11 12 R = 12 - 7 = 5 Page 10 Độ lệch tuyệt đối bình quân Là số bình quân cộng của các độ lệch tuyệt đối giữa các lượng biến với số bình quân cộng của các lượng biến đó n xx d i       i ii f fxx d Phương sai Là số bình quân cộng của bình phương các độ lệch giữa các lượng biến với số bình quân cộng của các lượng biến đó Công thức thực hành: n xxi  2 2 )(    i ii f fxx 22 )( 222 )( xx  Độ lệch tiêu chuẩn Là căn bậc hai của phương sai, tức là số bình quân toàn phương của bình phương các độ lệch giữa các lượng biến với số bình quân cộng của các lượng biến đó Là chỉ tiêu hoàn thiện nhất và thường dùng nhất trong nghiên cứu thống kê để đánh giá độ biến thiên của tiêu thức 222 )(xx   Hệ số biến thiên Là số tương đối (%) rút ra từ sự so sánh giữa độ lệch tuyệt đối bình quân (hoặc độ lệch tiêu chuẩn) với số bình quân cộng Là thước đo độ biến thiên tương đối, có thể dùng để so sánh giữa các chỉ tiêu khác loại hoặc cùng loại và có số trung bình không bằng nhau 100. x V   2. Phương pháp mô tả và phân tích dữ liệu 2.1. Mô tả dữ liệu 2.2. Phân tích dữ liệu 2.2. Phân tích dữ liệu Phương pháp hồi quy tương quan Phương pháp dãy số thời gian Một số phương pháp dự đoán thống kê Page 11 I PHÂN TÍCH DỮ LIỆU Chương V PHÂN TÍCH DỮ LIỆU VÀ TRÌNH BÀY KẾT QUẢ NGHIÊN CỨU II TRÌNH BÀY KẾT QUẢ NGHIÊN CỨU II. TRÌNH BÀY KẾT QUẢ NGHIÊN CỨU Vai trò của báo cáo1 Các loại báo cáo2 Nguyên tắc trình bày kết quả nghiên cứu 3 Cách thuyết trình4 1. Vai trò của báo cáo - Là phương tiện mà qua đó các dữ liệu, các phân tích và các kết quả được sắp xếp có hệ thống. - Phản ánh chất lượng của công trình nghiên cứu. - Hiệu quả của bản báo cáo có thể xác định những hoạt động sẽ được tiến hành (kết luận, đề xuất, kiến nghị giải pháp,). 2. Các loại báo cáo 1 Báo cáo gốc 2 Báo cáo được phổ biến 3 Báo cáo kỹ thuật 4 Báo cáo cho lãnh đạo 3. Nguyên tắc soạn thảo báo cáo - Rõ ràng, dễ theo dõi - Dùng câu có cấu trúc tốt - Tránh dùng ngôn ngữ chuyên môn - Trình bày ngắn gọn - Nhấn mạnh các kết luận có tính thực tiễn - Sử dụng các bảng, đồ thị, hình vẽ, trong bản báo cáo 4. Cách thuyết trình a) Lựa chọn kỹ thuật thuyết trình: - Đọc một bài soạn trước - Đọc thuộc lòng - Nói tuỳ hứng - Nói ứng biến b) Lựa chọn phương tiện hỗ trợ - Tính hiệu quả - Các kỹ thuật