MỤC ĐÍCH
Phân tích hồi quy là phương pháp phân tích thống kê để dự đoán giá trị của biến phụ thuộc (biến dự báo) theo các biến độc lập (biến dùng để dự báo).
Ví dụ: Dự đoán chiều cao của con cái theo các yếu tố như:
- Chiều cao bố, mẹ
- Chế độ dinh dưỡng
- Các môn thể thao tập luyện
Dựa vào phân tích tương quan để lựa chọn mô hình hồi quy phù hợp.
15 trang |
Chia sẻ: thanhtuan.68 | Lượt xem: 1012 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Bài giảng Thống kế - Bài 7 Phân tích hồi quy đơn, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
BÀI 7 PHÂN TÍCH HỒI QUY ĐƠNMỤC ĐÍCHPhân tích hồi quy là phương pháp phân tích thống kê để dự đoán giá trị của biến phụ thuộc (biến dự báo) theo các biến độc lập (biến dùng để dự báo).Ví dụ: Dự đoán chiều cao của con cái theo các yếu tố như: - Chiều cao bố, mẹ - Chế độ dinh dưỡng - Các môn thể thao tập luyện Dựa vào phân tích tương quan để lựa chọn mô hình hồi quy phù hợp. MÔ HÌNH HỒI QUY ĐƠNMô hình hồi quy đơn gồm 1 biến phụ thuộc Y (biến định lượng) và 1 biến độc lập X. Phân tích hồi quy của Y theo X là tìm dạng phụ thuộc hàm giữa chúng (dựa vào đồ thị scatter).Tuyến tínhPhi tuyếnƯỚC LƯỢNG ĐƯỜNG HỒI QUYDùng phương pháp ước lượng bình phương bé nhất để ước lượng các hệ số trong đường hồi quy.Tuyến tínhPhi tuyếnHỒI QUY TUYẾN TÍNH ĐƠNMô hình hồi quy tuyến tính của Y theo X có dạng: trong đó β0, β1: hệ số hồi quy, i: sai số ngẫu nhiên.Điều kiện của mô hình - i có phân phối chuẩn với E(i) = 0 và D(i) = 2 (phương sai không đổi). - Các sai số không tự tương quan nhau cov(i , j) = 0SPSS: Analyze\Regression\Linear CÁC BƯỚC PHÂN TÍCH CƠ BẢNB1. Phân tích tương quan: biến độc lập X tương quan tuyến tính với biến phụ thuộc Y và phương sai sai số không đổi.RP = 0.966RP = 0.872Phương sai thuần nhấtPhương sai không thuần nhấtDùng các phép biến đổi số liệuCÁC BƯỚC PHÂN TÍCH CƠ BẢNB2. Kiểm định ANOVA sự phù hợp mô hình hồi quy H0: β1 = 0 Hệ số xác định R2 – giải thích sự biến thiên của biến dự báo qua hồi quy.Nhận xét: Mô hình đặt ra là phù hợp. Biến độc lập x có thể giải thích đến 93.3% sự biến thiên của biến phụ thuộc y1CÁC BƯỚC PHÂN TÍCH CƠ BẢNB3. Ước lượng các hệ số hồi quy bằng phương pháp bình phương bé nhất, kiểm định xem các hệ số bằng 0 hay không => phương trình hồi quy tuyến tính mẫuNhận xét: Các hệ số hồi quy đều khác 0.Phương trình đường hồi quy thu được làY1 = 2.298 + 1.802 XCÁC BƯỚC PHÂN TÍCH CƠ BẢNB4. Khảo sát mẫu phần dư - Vẽ đồ thị scatter các điểm để khảo sát điều kiện kỳ vọng bằng 0 và phương sai không đổi. - Kiểm định tính chuẩn của mẫu phần dư. - Kiểm định tính tự tương quan bằng Durbin-Watson.CÁC BƯỚC PHÂN TÍCH CƠ BẢNB5. Nếu các bước B1 -> B4 đều đạt được thì ta đưa ra mô hình hồi quy sau cùng và nó để dự báo (nếu mô hình có hiệu quả cao)Ví dụ: Với các minh họa trong các bước trên, ta thu được mô hình hồi quy giữa X và Y1 rất hiệu quả với phương trình hồi quy làY1 = 2.298 + 1.802 XÝ nghĩa hệ số hồi quy: giá trị của X tăng lên 1 đơn vị thì trung bình, giá trị của Y1 tăng lên 1.802 đơn vị và ngược lại.Dự báo: với giá trị quan sát của X = 5 thì dự báo giá trị trung bình mà Y1 nhận là 11.308THỰC HÀNHBài toán: trong file Cholesterol.sav, hãy phân tích hồi quy tuyến tính của mô hình sau: Biến phụ thuộc: Cholesterol Biến độc lập: TuổiHỒI QUY PHI TUYẾN ĐƠNTrong phân tích hồi quy đơn, nếu sự tương quan giữa biến phụ thuộc và biến độc lập không phải là dạng tuyến tính thì gọi là hồi quy phi tuyến.Nói chung, hồi quy phi tuyến rất phức tạp. Thông thường ta dùng các phép đổi biến cho cả biến phụ thuộc và biến độc lập để chuyển về mô hình hồi quy tuyến tính, gọi là tuyến tính hóa mô hình.Ví dụ: Giả sử ta xây dựng mô hình hồi quy phi tuyếnTuyến tính hóa mô hình: Đặt MỘT SỐ DẠNG TUYẾN TÍNH HÓAXét mô hình hồi quy phi tuyến giữa biến phụ thuộc Y và biến độc lập X. Một số dạng tuyến tính hóa:SPSS: Analyze\Regression\Curve Estimation CÁC BƯỚC PHÂN TÍCH CƠ BẢNB1. Dùng biểu đồ Scatter để tìm kiểu phụ thuộc phi tuyến giữa biến phụ thuộc và biến độc lập => chọn mô hình. B2. Kiểm định ANOVA sự phù hợp mô hình hồi quy H0: Các hệ số hồi quy bằng 0. Tính hệ số xác định R2 – giải thích sự biến thiên của biến dự báo qua hồi quy.B3. Ước lượng các hệ số hồi quy và kiểm định xem các hệ số bằng 0 hay không => Phương trình hồi quy phi tuyến mẫu theo mô hình đã chọn.B4. Khảo sát mẫu phần dư. Các mô hình dạng 1 thì tương tự trong hồi quy tuyến tính; các mô hình dạng 2 thì dùng dạng tuyến tính hóa để khảo sát phần dư.THỰC HÀNHBài toán: trong file HamluongCO2.sav, hãy phân tích hồi quy phi tuyến dạng đa thức bậc 2 (Quadratic) của mô hình sau: Biến phụ thuộc: Hàm lượng CO2 Biến độc lập: Thời gian