Thu thập, xử lý & phân tích dữ liệu

 Các vấn đề đạo đức  Lựa chọn PP thu thập DL  Chọn mẫu và Tính xác thực, độ tin cậy  Phân tích dữ liệu

pdf15 trang | Chia sẻ: lylyngoc | Lượt xem: 1875 | Lượt tải: 2download
Bạn đang xem nội dung tài liệu Thu thập, xử lý & phân tích dữ liệu, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
20-Oct-12 1 THU THẬP, XỬ LÝ & PHÂN TÍCH DỮ LIỆU Qui trình nghiên cứu (8 bước) XĐ vấn đề NC NC các KN và LT Tìm hiểu các NC trước đây Xây dựng GT Xây dựng ĐC Thu thập DL Phân tích DL Giải thích KQ, viết BC THU THẬP VÀ PHÂN TÍCH DỮ LIỆU  Các vấn đề đạo đức  Lựa chọn PP thu thập DL  Chọn mẫu và Tính xác thực, độ tin cậy  Phân tích dữ liệu Vấn đề đạo đức trong thu thập DL 1) Người tham gia/ chủ thể 2) Người nghiên cứu 3) Cơ quan tài trợ… 20-Oct-12 2 người tham gia  Thái độ đồng ý của người tham gia là tự nguyện, không chịu bất kỳ cáp lực nào.  Nên hay không nên tưởng thưởng cho người tham gia?  Những câu hỏi có thông tin nhạy cảm?  Bảo mật danh tánh người tham gia? người nghiên cứu  Tránh thiên lệch  Sử dụng PPNC thích hợp  Báo cáo chính xác  Sử dụng thông tin đơn vị tài trợ  Đặt ra điều kiện  Sử dụng thông tin Lựa chọn PP thu thập DL 20-Oct-12 3 Lập kế họach thu thập DL  Xác định mục tiêu nghiên cứu cụ thể  Xác định xuất phát điểm của nghiên cứu  Xác định đối tượng nghiên cứu cụ thể của đề tài  Xác định cách thu thập thông tin, thời điểm, chi phí  Lập chương trình hành động cụ thể cho từng công việc Xác định mục tiêu nghiên cứu cụ thể  Cần xem xét một cách hệ thống các mục tiêu trong một cây mục tiêu:  Xem xét mọi khía cạnh, mọi tầng lớp của một tập hợp các mục tiêu có quan hệ tương tác  Xác định được quy mô của đề tài, giới hạn phạm vi nghiên cứu  Tạo cơ sở cho việc hình thành tập hợp nghiên cứu  Số lượng các cấp mục tiêu được quyết định bởi:  Nhu cầu nghiên cứu (sâu hay rộng)  Khả năng tổ chức nghiên cứu (mỗi nhánh phân cho một hay nhiều người) Xác định xuất phát điểm của nghiên cứu Ở đâu? Bao giờ? Trong bao lâu? Đã có những gì rồi? Cần thêm những gì? Cần bao nhiêu người thực hiện? Xác định đối tượng nghiên cứu cụ thể  Đối tượng nghiên cứu cụ thể cho từng mục tiêu nghiên cứu  Cần khảo sát trên bao nhiêu đơn vị nghiên cứu  Điều tra tổng thể hay chọn mẫu?  Chọn mẫu thế nào?  Tiếp cận đối tượng nghiên cứu ra sao?  Vd: Nghiên cứu về nhu cầu du khách  Đối tượng nghiên cứu là du khách  Cần bao nhiêu du khách? Tiến hành chọn thế nào để số lượng đủ đại diện? 20-Oct-12 4 Xác định cách thu thập thông tin  Thu thập thông tin ở đâu?  Như thế nào?  Bằng phương pháp gì?  Các công cụ để thu thập?  Vào thời điểm nào? Trong bao lâu?  Chi phí?  Ai đi thu thập? Có cần huấn luyện không? Chương trình hành động cụ thể cho từng công việc  Phân bố công việc theo từng giai đọan  Dành một phần thời gian dự trữ cho những vấn đề không mong đợi  Lập lịch theo sơ đồ  Có thể lập lịch cho từng thành viên dựa trên lịch chung. Lựa chọn PP thu thập dữ liệu  Dữ liệu thứ cấp (phụ)  Dữ liệu sơ cấp (chính) Không có DL nào thu thập được Có độ tin cậy và xác thực 100%. 20-Oct-12 5 PP thu thập DL Sơ cấp Bảng hỏi Đóng Mở Kết hợp Phỏng vấn Có cấu trúc Không có cấu trúc Quan sát Tham dự Không tham dự Thứ cấp Tư liệu Phương pháp quan sát  Quy trình:  Xác định đối tượng quan sát  Lập kế họach quan sát: thời gian, địa điểm, số lượng đối tượng, người quan sát, phương tiện quan sát…  Lựa chọn phương thức quan sát: trực tiếp hay gián tiếp, một hay nhiều lần, khỏang cách giữa các lần quan sát…  Tiến hành quan sát  Ghi chép  Xử lý  Kiểm tra kết quả quan sát  Cần lưu ý:  Tránh tính chủ quan của người quan sát  Cảm giác, việc lựa chọn  Trình độ của người quan sát  Thiên về mô tả, chưa đạt đến trình độ nhận thức bản chất bên trong của đối tượng.  Nên kết hợp với các phương pháp khác 20-Oct-12 6 Phương pháp chuyên gia  Khái niệm: Là phương pháp sử dụng trí tuệ của đội ngũ chuyên gia có trình độ cao của một chuyên ngành để xem xét, nhận định bản chất của một sự kiện khoa học hay thực tiễn phức tạp, để tìm ra giải pháp tối ưu cho các sự kiện đó hay phân tích, đánh giá một sản phẩm khoa học.  Cần lưu ý:  Chọn đúng chuyên gia  Nếu để nhận định một sự kiện hay một giải pháp, có thể tổ chức dưới dạng hội thảo, ghi chép đầy đủ, xử lý thông tin theo một chuẩn, một hệ thống để tìm ra được các ý kiến gần nhau hoặc trùng nhau  Nếu để đánh giá một công trình, phải xây dựng một hệ thống tiêu chí, có thang điểm để đánh giá  Đảm bảo tính khách quan trong đánh giá và nhận định Bảng hỏi  Dùng để đo được các biến số nhất định có quan hệ tới đối tượng nghiên cứu.  Sử dụng khi: - Vấn đề được xác định rõ ràng, không thay đổi trong suốt quá trình nc. - Các câu hỏi có liên quan đến các sự kiện, số lượng, đồ vật. - Có những câu hỏi trả lời dưới dạng ẩn danh - Người nghiên cứu thích phân tích các con số 20-Oct-12 7 Bố cục bảng hỏi 1. Phần thư giải thích 2. Các câu hỏi liên quan đến thông tin nhân khẩu xã hội của người được hỏi 3. Nội dung chính 4. Lời cảm ơn Lưu ý: Trong nội dung các câu hỏi nên có những câu để kiểm tra độ xác thực của thông tin. Các dạng câu hỏi • Câu hỏi đóng: • Câu hỏi mở: • Kết hợp: Lưu ý: bảng hỏi không nên quá dài dòng, cần bao quát được chủ đề nghiên cứu. Không nên dùng thuật ngữ khoa học mà nên dùng từ ngữ thông dụng, dễ hiểu Phỏng vấn sâu • Mục đích của phỏng vấn sâu? • Khi nào sử dụng phương pháp pvấn? • Phỏng vấn sâu không cấu trúc: một số câu hỏi được dẫn dắt bởi người trả lời (nên sử dụng băng ghi âm) • Phỏng vấn sâu cấu trúc: câu hỏi được xác định rõ ràng. • Phỏng vấn sâu bán cơ cấu: kết hợp 2 loại trên. 20-Oct-12 8 Thang đo • Thang đo danh nghĩa • Thang đo thứ bậc • Thang đo khoảng cách • Thang đo tỉ lệ 1. Thang đo danh nghĩa • Đây là loại thang đo có mức độ đo lường yếu nhất. • là loại thang đo định tính  Như khi đo lường về tôn giáo, ta có thể xây dựng thang đo định danh sau:  1- Không theo tôn giáo nào  2- Phật giáo  3- Thiên chúa giáo  4- Tin lành  5- Hồi giáo  6- Các tôn giáo khác. 2. Thang đo thứ bậc • Đây là thang đo định danh nhưng giữa các biểu hiện của tiêu thức có quan hệ hơn kém, cao thấp.  Với câu hỏi: Có haì lòng với quy định bắt buộc đội mũ bảo hiểm khi đi xe máy không? Ta có thể triển khai một thang đo thứ bậc có 3 nấc: 1- Hài lòng 2- Lưỡng lự 3- Không hàì lòng 20-Oct-12 9 3. Thang đo khoảng cách • Là thang đo thứ bậc có các khoảng cách đều nhau nhưng không có điểm gốc là 0. • Trong thực tế nghiên cứu xã hội, nhiều thang đo thứ bậc được dùng như thang đo khoảng cách. • VD như thang điểm… 4. Thang đo tỷ lệ • Là thang đo khoảng cách với một điểm 0 tuyệt đối (điểm gốc) trên thang đo. • Nhờ điểm gốc và một tiêu chuẩn đo cụ thể, ta có thể sử dụng được mọi công cụ toán - thống kê để phân tích dữ liệu, so sánh được tỷ lệ giữa các trị số đo. • Thang đo tỷ lệ được sử dụng rất rộng rãi để đo lường các hiện tượng kinh tế - xã hội, như: thu nhập, chi tiêu, thời gian lao động, tuổi, số con ... Các đơn vị đo lường vật lý thông thường (kg, mét, lít ..) cũng là các thang đo loại này. Độ giá trị và độ tin cậy • Giá trị (validity) • Về logic và về thống kê.  Logic: xem xét câu hỏi liên quan mục tiêu nghiên cứu  Thống kê: liên kết chặt giữa câu hỏi n/c với biến số đầu ra . • Những khái niệm trừu tượng (hiệu quả, khả thi, thói quen, hài lòng, bền vững…) phải bao quát nhiều khía cạnh và bảo đảm các câu hỏi đo được những cái cần đo. Độ đáng tin (reliability) • Con người đáng tin: phụ thuộc, nhất quán, có thể dự đoán được, ổn định, trung thực. • Công cụ: ổn định, nhất quán, dự đoán đựơc, đâu vào đó. Công cụ càng nhất quán và ổn định, độ đáng tin càng cao. • Sử dụng cùng công cụ, có cùng kết quả trong những điều kiện tương tự hoặc y như vậy. Nếu lập lại cùng điều tra ra kết quả chênh lệch nhiều ĐĐT thấp. 20-Oct-12 10 Yếu tố ảnh hưởng đến độ đáng tin • Từ ngữ không rõ, hiểu nhầm • Bối cảnh hỏi/ trả lời • Phương thức trả lời • Tương tác người hỏi, trả lời. Chọn mẫu Mẫu là tập hợp các yếu tố đã được chọn từ một tổng thể. Khung mẫu: Khung lấy mẫu là sự mô tả chung tất cả các cá thể có thể chọn làm mẫu. Qui mô mẫu:  Mẫu lớn không phải luôn luôn tốt  PP lấy mẫu là vô cùng quan trọng Vì sao phải chọn mẫu? 20-Oct-12 11 • Chọn mẫu, phương pháp nghiên cứu không phù hợp. VD: Tìm hiểu về đời sống dân cư nhưng chỉ phỏng vấn người định cư lâu năm, cần hiểu sâu tâm tư nguyện vọng nhưng chỉ dùng đến bảng hỏi. P/v sâu, ít mẫu, rồi khái quát hóa lên (báo chí)… Phương pháp lấy mẫu Các loại lấy mẫu Hỗn hợp hệ thống Theo xác suất không ngẫu nhiên Thuận tiện Phán đoán Chỉ tiêu Tăng nhanh Theo xác suất ngẫu nhiên Đơn giản Phân tầng Nhóm Phương pháp lấy mẫu Lấy mẫu ngẫu nhiên cho phép mỗi cá nhân trong cộng đồng một cơ hội công bằng được lựa chọn. Phương pháp này có qui trình lựa chọn được xác định rõ và cho phép sai số.  Lấy mẫu không ngẫu nhiên, có chủ ý và trọng tâm hơn trong phạm vi một số lượng nào đó. Mẫu ngẫu nhiên Kiểu Mô tả Dùng khi nào Ưu điểm Nhược điểm Ngẫu nhiên đơn giản Mỗi phần tử của tổng thể có cơ hội được chọn vào mẫu như nhau Khi các phần tử của tổng thể là tương đồng nhau ở những biến số quan trọng Dễ tiến hành Tính tiêu biểu cao Mất nhiều thời gian Cỡ mẫu phải lớn Mẫu chi phí lớn 20-Oct-12 12 Phân tầng Chia tổng thể thành từng phân khúc nhỏ có cùng 1 đặc điểm rồi áp dụng cách chọn mẫu ngẫu nhiên đơn giản cho từng phân khúc Khi tổng thể là đồng nhất và có nhiều phân nhóm khác nhau Kiểm soát được cỡ mẫu Hiệu quả thống kê cao Dễ tăng sai lầm mẫu Chi phí cao Theo nhóm Tổng thể được chia thành từng nhóm tương đồng. Toàn bộ một hoặc vài nhóm sẽ được chọn ngẫu nhiên làm mẫu Khi tổng thể là tập hợp của những Nhóm tương đối độc lập Nếu làm đúng cách sẽ cho phép ước lượng chính xác các tham số của tổng thể Chi phí thấp, đặc biệt với những nhóm khác biệt về địa lý Hiệu quả thống kê thấp (sai lầm mẫu cao) do các nhóm sẽ đồng nhất thay vì đa dạng. mẫu phân tầng mẫu ngẫu nhiên đơn giản Chọn mẫu ngẫu nhiên đơn giản Chọn mẫu không ngẫu nhiên Kiểu mẫu Mô tả Dùng khi nào Ưu điểm Nhược điểm Thuận tiện Chọn mẫu theo sự thuận tiện của người nghiên cứu Khi các phần tử của tổng thể tiện cho việc chọn mẫu Tiện lợi và ít tốn chi phí Không chắc chắn mức độ khái quát của mẫu Phán đoán Dựa trên phán đoán của nguười nghiên cứu. dùng trong giai đoạn đầu của nghiên cứu khám phá Không có xu hướng Không chắc chắn mức độ đại diện của mẫu 20-Oct-12 13 Chỉ tiêu/ định mức quota Chọn các phần tử của mẫu sao cho mẫu phải có sự phân bố giống như của tổng thể đã chọn sẵn Khi tổng thể có nhiều tầng lớp và phương pháp chọn mẫu phân tầng không thể thực hiện được Đảm bảo tính tiêu biểu cho các tầng lớp của tổng thể Không chắc chắn mức độ đại diện của mẫu Tăng nhanh Mẫu được dùng để xác định các mẫu khác có đặc điểm tương tự và phát triển ra Khi tổng thể không xác định và đối tượng nghiên cứu chỉ có thể xác định qua tham chiếu Ít tốn chi phí Dễ thực hiện Độ tin cậy thấp 20-Oct-12 14 Chọn mẫu hỗn hợp Kiểu mẫu Mô tả Dùng khi nào Ưu điểm Nhược điểm Hệ thống Bắt đầu bằng cách chọn 1 phần tử ngẫu nhiên của tổng thể, sau đó chọn các phần tử tiếp theo là phần tử thứ k sau phần tử đã chọn Khi các phần tử của tổng thể là tương đồng nhau ở những biến số quan trọng Thiết kế đơn giản Ít tốn chi phí hơn kiểu chọn mẫu ngẫu nhiên đơn giản Ít tính ngẫu nhiên hơn cách chọn mẫu ngẫu nhiên đơn giản Chọn mẫu hệ thống 20-Oct-12 15 • Chọn mẫu không đại diện => Kiến thức về địa bàn nc. • Mối quan hệ giữa mục tiêu và câu hỏi nghiên cứu (?) • Bỏ qua hay không coi trọng phần tổng quan tư liệu (GDMT => lặp lại n/c đã có, dữ liệu và kết qủa còn sơ xài). • Đánh giá CTGDMT (nhưng lại làm bảng hỏi liên quan đến đánh giá nhận thức của học sinh về MT). Đúng nếu làm before-after studies. Thảo luận trên lớp 1.Cứ mỗi lớp trong Khoa Địa Lý chọn ra 10 sinh viên. 2.Chọn 5 trang trong danh sách sinh viên hệ chính quy của trường. Tất cả các SV trong danh sách này được gọi tới để phỏng vấn. 3.Trên đường Nguyễn Thị Minh Khai, chọn hộ ở số nhà số 02, sau đó cách 3 nhà chọn 1 nhà để phỏng vấn. XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU Dữ liệu thô Hiệu chỉnh Mã hóa Phân tích Thiết kế bảng hỏi Nghiên cứu nhu cầu về nhà ở cho người thu nhập thấp tại TPHCM