GIỚI THIỆU THỐNG KÊ
Trong xã hội ngày nay, nhiều quyết định về chính sách, chiến lược phát triển đều dựa trên cơ sở số liệu.
Hầu hết các ngành khoa học nghiên cứu, công nghiệp thực nghiệm đều sinh ra số liệu. Việc phân tích những số liệu này và rút ra các kết luận “hữu ích” là vấn đề được quan tâm.
Hoạt động thống kê liên quan đến việc nghiên cứu về thu thập, tổ chức, phân tích và rút ra kết luận từ số liệu. Các phương pháp thống kê giúp ta “biến số liệu thành tri thức”.
Một số vấn đề áp dụng thống kê: xử lý tín hiệu, lý thuyết thông tin, chẩn đoán lâm sàng, độ tin cậy hệ thống, phân tích sống sót.
18 trang |
Chia sẻ: thanhtuan.68 | Lượt xem: 960 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Bài giảng Thống kế - Bài 1 Kiến thức mở đầu, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
BÀI 1 KIẾN THỨC MỞ ĐẦUGIỚI THIỆU THỐNG KÊTrong xã hội ngày nay, nhiều quyết định về chính sách, chiến lược phát triển đều dựa trên cơ sở số liệu.Hầu hết các ngành khoa học nghiên cứu, công nghiệp thực nghiệm đều sinh ra số liệu. Việc phân tích những số liệu này và rút ra các kết luận “hữu ích” là vấn đề được quan tâm.Hoạt động thống kê liên quan đến việc nghiên cứu về thu thập, tổ chức, phân tích và rút ra kết luận từ số liệu. Các phương pháp thống kê giúp ta “biến số liệu thành tri thức”.Một số vấn đề áp dụng thống kê: xử lý tín hiệu, lý thuyết thông tin, chẩn đoán lâm sàng, độ tin cậy hệ thống, phân tích sống sót. ĐỐI TƯỢNGTổng thể (population) - Tập hợp các đối tượng mang thông tin, liên quan đến nghiên cứu.Mẫu (sample) - Một nhóm đối tượng lấy ra từ tổng thể.Số liệu (data) - Thông tin thu thập được trên các đối tượng của mẫu.Phân tích số liệu (data analysis) - Dùng các phương pháp thống kê để phân tích, tổng hợp trên số liệu mẫu để rút ra các kết luận cho các vấn đề nghiên cứu.CƠ SỞ CỦA PHÂN TÍCH SỐ LIỆUNguồn gốc của số liệu - Số liệu có được từ đâu: điều tra, đo đạc, tính toán - Mức độ chính xác của số liệu.Kiến thức về số liệu - Nắm các kiến thức chuyên ngành liên quan đến số liệu. Hiểu rõ các vấn đề phân tích trên số liệu.Kiến thức về thống kê - Nắm các mô hình, phương pháp phân tích thống kê.QUY TRÌNH PHÂN TÍCH SỐ LIỆUĐẶT BÀI TOÁNCHỌN THIẾT KẾPHÂN TÍCH THĂM DÒCHỌN MÔ HÌNHPHÂN TÍCH SỐ LIỆUPHÂN TÍCH KẾT QUẢTRÌNH BÀY KẾT QUẢSỐ LIỆU – THÀNH PHẦN SỐ LIỆUBiến số (variable) - Thể hiện đặc trưng, đại lượng nào đó của đối tượng nghiên cứu trong tổng thể. - Ví dụ: giới tính, nghề nghiệp, cân nặng, sở thích Quan sát (case) - Giá trị thu thập được của biến số trên mỗi đối tượng của mẫu. Tập giá trị của biến số - Tập giá trị có khả năng xuất hiện của biến số.SỐ LIỆU – CÁC LOẠI BIẾNBiến định lượng (scale) - Giá trị nhận là các số đo (đo đạc, đếm, quan sát) - Ví dụ: cân nặng, thu nhập, số sinh viên Biến định tính có thứ tự (ordinal) - Giá trị nhận chỉ tính chất, đặc điểm có thể sắp xếp theo thứ tự, biểu thị mức độ quan trọng. - Ví dụ: mức độ hài lòng, trình độ học vấn Biến định tính không có thứ tự (nomial) - Giá trị nhận của biến không có thứ tự hơn kém. - Ví dụ: giới tính, quê quán, tôn giáo SỐ LIỆU – CÁC LOẠI BIẾNBiến độc lập - phụ thuộc (independent - dependent) - Các biến chỉ “nguyên nhân - kết quả” trong mô hình. Giá trị biến độc lập ảnh hưởng đến biến phụ thuộc. - Ví dụ: chiều cao >> cân nặng; quảng cáo >> doanh thu; giới tính, phương pháp dạy >> kết quả học tập Biến nhân tố, nhóm (factor, group) - Biến chia các quan sát thành các nhân tố hay nhóm để phân tích thống kê. - Ví dụ: Thu nhập << trình độ; kết quả học tập << giới tính SỐ LIỆU – CHÚ ÝViệc xác định loại biến định lượng, định tính có thứ tự và định tính không có thứ tự có ý nghĩa quan trọng đối với khâu mã hóa số liệu, và trong việc chọn phương pháp xử lý số liệu thích hợp.Sự phân biệt các loại biến định tính – định lượng, độc lập – phụ thuộc có tính tương đối, tùy thuộc vào mục đích của bài toán và ý đồ của người nghiên cứu.MÃ HÓA SỐ LIỆU – NGUYÊN TẮCMã hóa số liệu (code, recode) - Chuyển các giá trị của biến sang dạng số. Có thể thực hiện trước hoặc sau khi nhập liệu.Nguyên tắc mã hóa - Giữ được thông tin số liệu không bị thất thoát. - Tránh nhầm lẫn, phát hiện các sai sót dễ dàng. - Lượt bỏ những rườm rà, dễ nhập liệu. - Phù hợp với yêu cầu xử lý bài toán.BiếnGiá trịMã hóaThu nhập1.500.0001.52.300.0002.3Điểm thi7755Giới tínhNam1Nữ2Sử dụng ĐTDĐCó1Không0Mức độ hài lòng dịch vụHài lòng1Bình thường0Không hài lòng-1Trình độ Học vấnTHPT1Trung cấp2CĐ3ĐH4MÃ HÓA SỐ LIỆU – KỸ THUẬTMÃ HÓA SỐ LIỆU – KỸ THUẬTBiến nhiều lựa chọn (multiple reponse) - Biến có thể nhận nhiều giá trị trong một lần quan sát. - Ví dụ: Bạn đã từng uống qua các nhãn hiệu nước ngọt có gaz nào trong các nhãn hiệu sau: Coca-Cola Pepsi Sprite 7-Up Fanta Tạo 5 biến nhận giá trị 0-1 (có, không) PHẦN MỀM THỐNG KÊMột số phần mềm - SPSS, STATA, Minitab, Excel - SAS, R - Epi Info, Eview Ưu điểm SPSS - Giao diện đơn giản, thuận tiện, dễ dùng. - Nhiều đối tượng output có thể dùng cho các ứng dụng khác. - Nhiều phương pháp thống kê phân tích chuyên sâu.GIAO DIỆN SPSSMa trận số liệuKhai báo biếnKHAI BÁO BIẾNName: Tên biếnType: Kiểu dữ liệuWidth: Độ rộng dữ liệu Decimals: Số thập phân dữ liệuLabel: Nhãn biếnValues: Mã hóa dữ liệuMissing: Giá trị khuyếtColumns: Độ rộng cột biến Align: Canh lề dữ liệuMeasure: Loại biếnTHỰC HÀNH: NHẬP SỐ LIỆU1. Tuổi của anh (chị) ....................2. Đánh giá mức độ quan trọng nhất, nhì, ba trong việc lựa chọn mua máy di động Chất lượng bắt sóng _____ Kiểu dáng thời trang _____ Nguồn gốc xuất xứ _____3. Cho biết mức độ quan trọng các yếu tố sau trong việc lựa chọn mua máy di độngYếu tốQuan trọngBình thườngKhông quan trọngChất lượng bắt sóng123Kiểu dáng thời trang123Nguồn gốc xuất xứ123THỰC HÀNH: NHẬP SỐ LIỆU4. Anh/Chị biết đến siêu thị Thuận Thành từ những phương tiện thông tin nào? Ti vi Báo, internet Các chương trình khuyến mãi Banner, poster, tờ rơi Bạn bè, người thân5. Trung bình 1 tuần anh/chị đi siêu thị bao nhiêu lần? Dưới 3 lần 3 đến 5 lần Trên 5 lần6. Mức độ thỏa mãn của anh/chị về các dịch vụ của siêu thị? Hoàn toàn thỏa mãn Hoàn toàn không thỏa mãn1 2 3 4 5BÀI TẬPXem và thực hành các kỹ năng - Data\Select Cases - Transform\Compute - Transform\Recode Thực hành file Ketquathitotnghiep.sav - Tái mã hóa biến truong, biến lop - Tạo biến tongdiem là tổng điểm các môn thi. - Tạo biến xeploai là xếp loại điểm thi tốt nghiệp của học sinh (giỏi, khá, trung bình, yếu )