Thu thập, xử lý & phân tích dữ liệu
Các vấn đề đạo đức Lựa chọn PP thu thập DL Chọn mẫu và Tính xác thực, độ tin cậy Phân tích dữ liệu
Bạn đang xem nội dung tài liệu Thu thập, xử lý & phân tích dữ liệu, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
20-Oct-12
1
THU THẬP, XỬ LÝ
& PHÂN TÍCH DỮ LIỆU
Qui trình nghiên cứu (8 bước)
XĐ vấn
đề NC
NC các KN và
LT
Tìm hiểu các
NC trước đây
Xây dựng
GT
Xây
dựng
ĐC
Thu
thập DL
Phân
tích DL
Giải
thích
KQ, viết
BC
THU THẬP VÀ PHÂN TÍCH DỮ LIỆU
Các vấn đề đạo đức
Lựa chọn PP thu thập DL
Chọn mẫu và Tính xác thực, độ tin cậy
Phân tích dữ liệu
Vấn đề đạo đức trong thu thập DL
1) Người tham gia/ chủ thể
2) Người nghiên cứu
3) Cơ quan tài trợ…
20-Oct-12
2
người tham gia
Thái độ đồng ý của người tham gia là tự
nguyện, không chịu bất kỳ cáp lực nào.
Nên hay không nên tưởng thưởng cho người
tham gia?
Những câu hỏi có thông tin nhạy cảm?
Bảo mật danh tánh người tham gia?
người nghiên cứu
Tránh thiên lệch
Sử dụng PPNC thích hợp
Báo cáo chính xác
Sử dụng thông tin
đơn vị tài trợ
Đặt ra điều kiện
Sử dụng thông tin Lựa chọn PP thu thập DL
20-Oct-12
3
Lập kế họach thu thập DL
Xác định mục tiêu nghiên cứu cụ thể
Xác định xuất phát điểm của nghiên cứu
Xác định đối tượng nghiên cứu cụ thể của đề tài
Xác định cách thu thập thông tin, thời điểm, chi phí
Lập chương trình hành động cụ thể cho từng công
việc
Xác định mục tiêu nghiên cứu cụ thể
Cần xem xét một cách hệ thống các mục tiêu trong một
cây mục tiêu:
Xem xét mọi khía cạnh, mọi tầng lớp của một tập
hợp các mục tiêu có quan hệ tương tác
Xác định được quy mô của đề tài, giới hạn phạm vi
nghiên cứu
Tạo cơ sở cho việc hình thành tập hợp nghiên cứu
Số lượng các cấp mục tiêu được quyết định bởi:
Nhu cầu nghiên cứu (sâu hay rộng)
Khả năng tổ chức nghiên cứu (mỗi nhánh phân cho
một hay nhiều người)
Xác định xuất phát điểm của nghiên cứu
Ở đâu?
Bao giờ?
Trong bao lâu?
Đã có những gì rồi?
Cần thêm những gì?
Cần bao nhiêu người thực hiện?
Xác định đối tượng nghiên cứu cụ thể
Đối tượng nghiên cứu cụ thể cho từng mục
tiêu nghiên cứu
Cần khảo sát trên bao nhiêu đơn vị nghiên cứu
Điều tra tổng thể hay chọn mẫu?
Chọn mẫu thế nào?
Tiếp cận đối tượng nghiên cứu ra sao?
Vd: Nghiên cứu về nhu cầu du khách
Đối tượng nghiên cứu là du khách
Cần bao nhiêu du khách? Tiến hành chọn thế nào
để số lượng đủ đại diện?
20-Oct-12
4
Xác định cách thu thập thông tin
Thu thập thông tin ở đâu?
Như thế nào?
Bằng phương pháp gì?
Các công cụ để thu thập?
Vào thời điểm nào? Trong bao lâu?
Chi phí?
Ai đi thu thập? Có cần huấn luyện
không?
Chương trình hành động cụ thể
cho từng công việc
Phân bố công việc theo từng giai đọan
Dành một phần thời gian dự trữ cho những vấn
đề không mong đợi
Lập lịch theo sơ đồ
Có thể lập lịch cho từng thành viên dựa trên
lịch chung.
Lựa chọn PP thu thập dữ liệu
Dữ liệu thứ cấp (phụ)
Dữ liệu sơ cấp (chính)
Không có DL nào thu thập được
Có độ tin cậy và xác thực 100%.
20-Oct-12
5
PP thu thập DL
Sơ
cấp
Bảng
hỏi
Đóng
Mở
Kết hợp
Phỏng
vấn
Có cấu trúc
Không có cấu trúc
Quan
sát
Tham dự
Không tham dự
Thứ
cấp
Tư liệu
Phương pháp quan sát
Quy trình:
Xác định đối tượng quan sát
Lập kế họach quan sát: thời
gian, địa điểm, số lượng đối
tượng, người quan sát, phương
tiện quan sát…
Lựa chọn phương thức quan
sát: trực tiếp hay gián tiếp, một
hay nhiều lần, khỏang cách giữa
các lần quan sát…
Tiến hành quan sát
Ghi chép
Xử lý
Kiểm tra kết quả quan sát
Cần lưu ý:
Tránh tính chủ quan
của người quan sát
Cảm giác, việc lựa chọn
Trình độ của người
quan sát
Thiên về mô tả, chưa
đạt đến trình độ nhận
thức bản chất bên
trong của đối tượng.
Nên kết hợp với các
phương pháp khác
20-Oct-12
6
Phương pháp chuyên gia
Khái niệm:
Là phương pháp sử dụng trí tuệ của đội ngũ
chuyên gia có trình độ cao của một chuyên
ngành để xem xét, nhận định bản chất của
một sự kiện khoa học hay thực tiễn phức tạp,
để tìm ra giải pháp tối ưu cho các sự kiện đó
hay phân tích, đánh giá một sản phẩm khoa
học.
Cần lưu ý:
Chọn đúng chuyên gia
Nếu để nhận định một sự kiện hay một giải pháp,
có thể tổ chức dưới dạng hội thảo, ghi chép đầy
đủ, xử lý thông tin theo một chuẩn, một hệ thống
để tìm ra được các ý kiến gần nhau hoặc trùng
nhau
Nếu để đánh giá một công trình, phải xây dựng
một hệ thống tiêu chí, có thang điểm để đánh giá
Đảm bảo tính khách quan trong đánh giá và
nhận định
Bảng hỏi
Dùng để đo được các biến số nhất định có quan hệ
tới đối tượng nghiên cứu.
Sử dụng khi:
- Vấn đề được xác định rõ ràng, không thay đổi
trong suốt quá trình nc.
- Các câu hỏi có liên quan đến các sự kiện, số
lượng, đồ vật.
- Có những câu hỏi trả lời dưới dạng ẩn danh
- Người nghiên cứu thích phân tích các con số
20-Oct-12
7
Bố cục bảng hỏi
1. Phần thư giải thích
2. Các câu hỏi liên quan đến thông tin nhân khẩu
xã hội của người được hỏi
3. Nội dung chính
4. Lời cảm ơn
Lưu ý: Trong nội dung các câu hỏi nên có những
câu để kiểm tra độ xác thực của thông tin.
Các dạng câu hỏi
• Câu hỏi đóng:
• Câu hỏi mở:
• Kết hợp:
Lưu ý: bảng hỏi không nên quá dài dòng, cần bao
quát được chủ đề nghiên cứu. Không nên dùng
thuật ngữ khoa học mà nên dùng từ ngữ thông
dụng, dễ hiểu
Phỏng vấn sâu
• Mục đích của phỏng vấn sâu?
• Khi nào sử dụng phương pháp pvấn?
• Phỏng vấn sâu không cấu trúc: một số câu hỏi
được dẫn dắt bởi người trả lời (nên sử dụng
băng ghi âm)
• Phỏng vấn sâu cấu trúc: câu hỏi được xác định
rõ ràng.
• Phỏng vấn sâu bán cơ cấu: kết hợp 2 loại trên.
20-Oct-12
8
Thang đo
• Thang đo danh nghĩa
• Thang đo thứ bậc
• Thang đo khoảng cách
• Thang đo tỉ lệ
1. Thang đo danh nghĩa
• Đây là loại thang đo có mức độ đo lường yếu
nhất.
• là loại thang đo định tính
Như khi đo lường về tôn giáo, ta có thể
xây dựng thang đo định danh sau:
1- Không theo tôn giáo nào
2- Phật giáo
3- Thiên chúa giáo
4- Tin lành
5- Hồi giáo
6- Các tôn giáo khác.
2. Thang đo thứ bậc
• Đây là thang đo định danh nhưng giữa các biểu hiện
của tiêu thức có quan hệ hơn kém, cao thấp.
Với câu hỏi: Có haì lòng với quy định bắt buộc đội mũ
bảo hiểm khi đi xe máy không? Ta có thể triển khai một
thang đo thứ bậc có 3 nấc:
1- Hài lòng
2- Lưỡng lự
3- Không hàì lòng
20-Oct-12
9
3. Thang đo khoảng cách
• Là thang đo thứ bậc có các khoảng cách
đều nhau nhưng không có điểm gốc là 0.
• Trong thực tế nghiên cứu xã hội, nhiều
thang đo thứ bậc được dùng như thang
đo khoảng cách.
• VD như thang điểm…
4. Thang đo tỷ lệ
• Là thang đo khoảng cách với một điểm 0 tuyệt đối
(điểm gốc) trên thang đo.
• Nhờ điểm gốc và một tiêu chuẩn đo cụ thể, ta có thể sử
dụng được mọi công cụ toán - thống kê để phân tích dữ
liệu, so sánh được tỷ lệ giữa các trị số đo.
• Thang đo tỷ lệ được sử dụng rất rộng rãi để đo lường
các hiện tượng kinh tế - xã hội, như: thu nhập, chi tiêu,
thời gian lao động, tuổi, số con ... Các đơn vị đo lường
vật lý thông thường (kg, mét, lít ..) cũng là các thang đo
loại này.
Độ giá trị và độ tin cậy
• Giá trị (validity)
• Về logic và về thống kê.
Logic: xem xét câu hỏi liên quan mục tiêu nghiên cứu
Thống kê: liên kết chặt giữa câu hỏi n/c với biến số
đầu ra .
• Những khái niệm trừu tượng (hiệu quả, khả thi,
thói quen, hài lòng, bền vững…) phải bao quát
nhiều khía cạnh và bảo đảm các câu hỏi đo được
những cái cần đo.
Độ đáng tin (reliability)
• Con người đáng tin: phụ thuộc, nhất quán,
có thể dự đoán được, ổn định, trung thực.
• Công cụ: ổn định, nhất quán, dự đoán
đựơc, đâu vào đó. Công cụ càng nhất quán
và ổn định, độ đáng tin càng cao.
• Sử dụng cùng công cụ, có cùng kết quả
trong những điều kiện tương tự hoặc y như
vậy. Nếu lập lại cùng điều tra ra kết quả
chênh lệch nhiều ĐĐT thấp.
20-Oct-12
10
Yếu tố ảnh hưởng đến độ đáng tin
• Từ ngữ không rõ, hiểu nhầm
• Bối cảnh hỏi/ trả lời
• Phương thức trả lời
• Tương tác người hỏi, trả lời.
Chọn mẫu
Mẫu là tập hợp các yếu tố đã được chọn từ một
tổng thể.
Khung mẫu: Khung lấy mẫu là sự mô tả chung
tất cả các cá thể có thể chọn làm mẫu.
Qui mô mẫu:
Mẫu lớn không phải luôn luôn tốt
PP lấy mẫu là vô cùng quan trọng
Vì sao phải chọn mẫu?
20-Oct-12
11
• Chọn mẫu, phương pháp nghiên cứu
không phù hợp.
VD: Tìm hiểu về đời sống dân cư nhưng chỉ
phỏng vấn người định cư lâu năm, cần
hiểu sâu tâm tư nguyện vọng nhưng chỉ
dùng đến bảng hỏi. P/v sâu, ít mẫu, rồi
khái quát hóa lên (báo chí)…
Phương pháp lấy mẫu
Các loại
lấy mẫu
Hỗn hợp
hệ thống
Theo xác suất
không ngẫu nhiên
Thuận tiện
Phán đoán
Chỉ tiêu
Tăng nhanh
Theo xác suất
ngẫu nhiên
Đơn giản
Phân tầng
Nhóm
Phương pháp lấy mẫu
Lấy mẫu ngẫu nhiên cho
phép mỗi cá nhân trong
cộng đồng một cơ hội công
bằng được lựa chọn.
Phương pháp này có qui
trình lựa chọn được xác
định rõ và cho phép sai số.
Lấy mẫu không ngẫu
nhiên, có chủ ý và trọng tâm
hơn trong phạm vi một số
lượng nào đó.
Mẫu ngẫu nhiên
Kiểu Mô tả
Dùng khi
nào
Ưu điểm Nhược điểm
Ngẫu
nhiên
đơn
giản
Mỗi phần tử của
tổng thể có cơ hội
được chọn vào mẫu
như nhau
Khi các phần
tử của tổng thể
là tương đồng
nhau ở những
biến số quan
trọng
Dễ tiến hành
Tính tiêu
biểu cao
Mất nhiều thời
gian
Cỡ mẫu phải lớn
Mẫu chi phí lớn
20-Oct-12
12
Phân
tầng
Chia tổng thể
thành từng phân
khúc nhỏ có
cùng 1 đặc điểm
rồi áp dụng cách
chọn mẫu ngẫu
nhiên đơn giản
cho từng phân
khúc
Khi tổng thể
là đồng nhất
và có nhiều
phân nhóm
khác nhau
Kiểm soát được
cỡ mẫu
Hiệu quả thống kê
cao
Dễ tăng sai
lầm mẫu
Chi phí cao
Theo
nhóm
Tổng thể được
chia thành từng
nhóm tương
đồng. Toàn bộ
một hoặc vài
nhóm sẽ được
chọn ngẫu nhiên
làm mẫu
Khi tổng thể
là tập hợp
của những
Nhóm tương
đối độc lập
Nếu làm đúng
cách sẽ cho phép
ước lượng chính
xác các tham số
của tổng thể
Chi phí thấp, đặc
biệt với những
nhóm khác biệt về
địa lý
Hiệu quả
thống kê
thấp (sai
lầm mẫu
cao) do các
nhóm sẽ
đồng nhất
thay vì đa
dạng.
mẫu phân tầng mẫu ngẫu nhiên đơn giản
Chọn mẫu ngẫu nhiên đơn giản
Chọn mẫu không ngẫu nhiên
Kiểu
mẫu
Mô tả
Dùng khi
nào
Ưu điểm Nhược điểm
Thuận
tiện
Chọn mẫu theo
sự thuận tiện của
người nghiên cứu
Khi các phần
tử của tổng
thể tiện cho
việc chọn mẫu
Tiện lợi và
ít tốn chi
phí
Không chắc
chắn mức độ
khái quát của
mẫu
Phán
đoán
Dựa trên phán
đoán của nguười
nghiên cứu.
dùng trong
giai đoạn đầu
của nghiên
cứu khám phá
Không có
xu hướng
Không chắc
chắn mức độ
đại diện của
mẫu
20-Oct-12
13
Chỉ
tiêu/
định
mức
quota
Chọn các phần tử
của mẫu sao cho
mẫu phải có sự phân
bố giống như của
tổng thể đã chọn sẵn
Khi tổng thể có
nhiều tầng lớp và
phương pháp chọn
mẫu phân tầng
không thể thực
hiện được
Đảm bảo
tính tiêu
biểu cho
các tầng
lớp của
tổng thể
Không
chắc chắn
mức độ
đại diện
của mẫu
Tăng
nhanh
Mẫu được dùng để
xác định các mẫu
khác có đặc điểm
tương tự và phát
triển ra
Khi tổng thể
không xác định và
đối tượng nghiên
cứu chỉ có thể xác
định qua tham
chiếu
Ít tốn chi
phí
Dễ thực
hiện
Độ tin cậy
thấp
20-Oct-12
14
Chọn mẫu hỗn hợp
Kiểu
mẫu
Mô tả
Dùng khi
nào
Ưu điểm Nhược điểm
Hệ
thống
Bắt đầu bằng cách
chọn 1 phần tử
ngẫu nhiên của tổng
thể, sau đó chọn các
phần tử tiếp theo là
phần tử thứ k sau
phần tử đã chọn
Khi các phần
tử của tổng thể
là tương đồng
nhau ở những
biến số quan
trọng
Thiết kế đơn
giản
Ít tốn chi phí
hơn kiểu
chọn mẫu
ngẫu nhiên
đơn giản
Ít tính ngẫu
nhiên hơn cách
chọn mẫu ngẫu
nhiên đơn giản
Chọn mẫu hệ thống
20-Oct-12
15
• Chọn mẫu không đại diện => Kiến thức
về địa bàn nc.
• Mối quan hệ giữa mục tiêu và câu hỏi
nghiên cứu (?)
• Bỏ qua hay không coi trọng phần tổng
quan tư liệu (GDMT => lặp lại n/c đã có,
dữ liệu và kết qủa còn sơ xài).
• Đánh giá CTGDMT (nhưng lại làm bảng
hỏi liên quan đến đánh giá nhận thức
của học sinh về MT). Đúng nếu làm
before-after studies.
Thảo luận trên lớp
1.Cứ mỗi lớp trong Khoa Địa Lý chọn ra 10 sinh
viên.
2.Chọn 5 trang trong danh sách sinh viên hệ chính
quy của trường. Tất cả các SV trong danh sách
này được gọi tới để phỏng vấn.
3.Trên đường Nguyễn Thị Minh Khai, chọn hộ ở số
nhà số 02, sau đó cách 3 nhà chọn 1 nhà để phỏng
vấn.
XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU
Dữ liệu thô Hiệu chỉnh Mã hóa Phân tích
Thiết kế bảng hỏi
Nghiên cứu nhu cầu về nhà ở cho
người thu nhập thấp tại TPHCM