Tương quan và hồi quy Correlation & Regression

NỘI DUNG Tương quan tuyến tính Hồi quy tuyến tính Kiểm tra các điều kiện áp dụng mô hình Số liệu sai lệch Hồi quy với biến giả (dummy) Phương pháp stepwise

pdf53 trang | Chia sẻ: thanhtuan.68 | Lượt xem: 1243 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Tương quan và hồi quy Correlation & Regression, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics TƯƠNG QUAN VÀ HỒI QUY CORRELATION & REGRESSION TS. LÊ VĂN HUY Email: levanhuy@vnn.vn Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics NỘI DUNG Tương quan tuyến tính Hồi quy tuyến tính Kiểm tra các điều kiện áp dụng mô hình Số liệu sai lệch Hồi quy với biến giả (dummy) Phương pháp stepwise Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics TƯƠNG QUAN (CORRELATION) Xem xét mối quan hệ giữa hai hay nhiều biến Tương quan có: Tương quan 2 biến – Bivariate Correlations Tương quan riêng phần – Partial Correlations Điều kiện: 2 hoặc nhiều biến định lượng Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics TƯƠNG QUAN (CORRELATION) Mục tiêu nghiên cứu: Giả định nhà nghiên cứu muốn tìm hiểu có mối quan hệ như thế nào giữa độ tuổi và thu nhập. Câu hỏi nghiên cứu: Độ tuổi và thu nhập có mối quan hệ với nhau hay không ? Hai biến được chọn: Độ tuổi và thu nhập (2 biến định lượng). Giả thuyết H0: Trình độ học vấn và thu nhập không có liên hệ với nhau. Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics TƯƠNG QUAN (CORRELATION) Vì Pearson = 0,075 và Sig = 0,291 nên chưa có cơ sở để bác bỏ H0 nghĩa là. Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics TƯƠNG QUAN RIÊNG TỪNG PHÂN (PARTIAL CORRELATION) Nghiên cứu mối quan hệ tuyến tính của hai biến có loại trừ ảnh hưởng của các yếu tố khác. Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics TƯƠNG QUAN RIÊNG TỪNG PHÂN (PARTIAL CORRELATION) Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics HỒI QUY ĐƠN Mục đích: Tìm mối quan hệ giữa hai biến (mối quan hệ nhân quả) Điều kiện Hai biến định lượng Hai biến phải tuân theo quy luật phân phối chuẩn Mô hình lý thuyết: Yi = B0 + B1*Xi + ε Xi: trị quan sát thứ i của biến độc lập Yi : giá trị dự đoán thứ i của biến phụ thuộc B0 và B1: hệ số hồi quy Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics DIỄN GIẢI DỮ LIỆU Các hệ số góc (bj) Sự biến đổi của giá trị trung bình của các Y khi Xj tăng thêm 1 đơn vị, mọi yếu tố khác không đổi. Kiểm định: tương tự như hồi qui đơn với (n-p-1) bậc tự do Hệ số chặn - hằng số (b0) Giá trị trung bình của Y khi Xj = 0 Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics HỒI QUY ĐƠN Mục tiêu nghiên cứu: Nên tác động thế nào đến phong cách lãnh đạo để tạo ra sự trung thành của nhân viên. Câu hỏi nghiên cứu: Lòng trung thành của nhân viên có phụ thuộc và phong cách lãnh đạo? Hai biến được chọn: Lãnh đạo là biến độc lập và Lòng trung thành là biến phụ thuộc. Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics HỒI QUY ĐƠN Vì F= 75,549 và Sig = 0,000 <0,05 bác bỏ H0 nghĩa là 2 biến có mối quan hệ MQH thể hiện: LTTi = 0,957 +0,667*lãnh đạo +ε R2=0,276 MQH giữa 2 biến là R2= 0,276 nên biến lãnh đạo giải thích 27,6% LTT Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics HỆ SỐ XÁC ĐỊNH R2 Tỉ lệ biến đổi của biến phụ thuộc được giải thích bằng tất cả các biến độc lập R2 = Biến đổi được giải thích = SCR Tổng biến đổi SCT Không bao giờ giảm khi các đại lượng được thêm vào Vấn đề khi ta so sánh các mô hình Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics HỆ SỐ XÁC ĐỊNH ĐIỀU CHỈNH R2a R2 điều chỉnh (R2a)R2 Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics KIỂM ĐỊNH MỨC Ý NGHĨA (DÙNG F) ANOVA dl SC MC F Regression p SCR MCR =SCR/p MCR/MCE Residue n-p-1 SCE MCE =SCE/(n-p-1) Total n-1 SCT Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics MÔ HÌNH HỒI QUY (BỘI) Mối liên hệ giữa một biến phụ thuộc với ít nhất hai biến độc lập là một hàm tuyến tính Mô hình: Y X X Xi i i p pi i= + + + + +β β β β ε0 1 1 2 2 Biến phụ thuộc Các biến độc lập Các hệ số hồi qui của tổng thểHệ số chặn (hằng số) Sai số ngẫu nhiên Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics MÔ HÌNH HỒI QUY BỘI (2 BIẾN) – TRÊN TỔNG THẾ Yi=β0+ β1X1i+ β2X2i + εi Kết quả β0 Y X1 X2 εi E(Y)=β0+ β1X1+ β2X2 Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics MÔ HÌNH HỒI QUY BỘI (2 BIẾN) – TRÊN MẪU Y Đáp số X1 X2 b0 ei Yi=b0+ b1X1i+ b2X2i + ei Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics ĐIỀU KIỆN VẬN DỤNG MÔ HÌNH Các điều kiện về dạng mô hình : MQH tuyến tính giữa các biến độc lập với biến phụ thuộc Các điều kiện về sai số mô hình (error): Các sai số mô hình là độc lập (không tự tương quan) Các sai số phân phối theo phân phối chuẩn Các điều kiện về các số dự đoán: Các biến độc lập không ngẫu nhiên Các giá trị của các biến độc lập được đo lường không có sai số Các số dự đoán là độc lập theo đường thẳng, (không có bội tương quan giữa các biến độc lập - multicollinearity) Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics MÔ HÌNH NGHIÊN CỨU VÀ CÁC KHÁI NIỆM Items 1.1 Items 1.2 Items 1.3 Items 1.n Items 2.1 Items 2.2 Items 2.3 Items 2.n LÃNH ĐẠO CƠ HỘI ĐTẠO VÀ TTIẾN LƯƠNG, THƯỞNG ĐỒNG NGHIỆP PHÚC LỢI BẢN CHẤT CVIỆC MÔI TRƯỜNG LV LÒNG TRUNG THÀNH Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics VÍ DỤ VỀ HỒI QUY BỘI (PP. ENTER) Phát triển mô hình để giải thích mối quan hệ F1,,F7 với lòng trung thành (LTT) Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics HÃY GIẢI THÍCH KẾT QUẢ Phương trình hồi quy bội LTT = -0,745 + 0,245 F1 + 0,220 F2 + 0,476 F3 - 0,105 F4 Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics VẤN ĐỀ ĐA CỘNG TUYẾN VÀ TỰ TƯƠNG QUAN Đa cộng tuyến là trạng thái các biến độc lập trong mô hình có tương quan chặt chẽ với nhau. Để kiểm tra hiện tượng đa cộng tuyến, có thể sử dụng bảng ma trận tương quan hoặc kiểm tra bằng lựa chọn Collinearity Diagnostic. Kiểm tra tự tương quan, kích vào Durbin-Watson Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics VẤN ĐỀ ĐA CỘNG TUYẾN VÀ TỰ TƯƠNG QUAN Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics VẤN ĐỀ ĐA CỘNG TUYẾN VÀ TỰ TƯƠNG QUAN ĐK không tự tương quan: VIF < 10 Đối với biến Xi, tolerance bằng 1-Ri2 với Ri là hệ số xác định của biến Xi được hồi qui bởi tất cả các biến độc lập khác Nếu Di>4/(n-p-1), quan sát được xem như có ảnh hưởng Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics HỒI QUY BỘI VỚI PHƯƠNG PHÁP STEPWISE Phương pháp này là kết hợp đưa vào dần và loại trừ dần. Biến nào có tương quan riêng cao nhất sẽ được xem xét đưa vào mô hình trước với xác suất là 0,05 Để ngăn chặn hiện tượng 1 biến được chọn vào rồi chọn ra lặp lại thì SPSS mặc định xác suất F vào nhỏ hơn F ra. Thủ tục chọn biến sẽ kết thúc khi không còn biến nào thỏa tiêu chuẩn chọn vào, chọn ra nữa. Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics HỒI QUY BỘI VỚI PHƯƠNG PHÁP STEPWISE Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics HỒI QUY BỘI VỚI PHƯƠNG PHÁP STEPWISE Mô hình chọn luôn là mô hình cuối cùng Mô hình chọn luôn là mô hình cuối cùng Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics HỒI QUY BỘI VỚI PHƯƠNG PHÁP STEPWISE Câu hỏi: Kết quả này có khác gì với kết quả của phương pháp ENTER Mô hình: LTT = -0,247 + 0,459 Lương và thưởng + 0,282 CH Đào tạo và thăng tiến + 0,260 Lãnh đạo Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics ĐIỀU KIỆN VẬN DỤNG MÔ HÌNH Các điều kiện về dạng mô hình : MQH tuyến tính giữa các biến độc lập với biến phụ thuộc Các điều kiện về sai số mô hình (error): Các sai số mô hình là độc lập (không tự tương quan) Các sai số phân phối theo phân phối chuẩn Các điều kiện về các số dự đoán: Các biến độc lập không ngẫu nhiên Các giá trị của các biến độc lập được đo lường không có sai số Các số dự đoán là độc lập theo đường thẳng, (không có bội tương quan giữa các biến độc lập - multicollinearity) Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics CÂU HỎI Nếu có một biến (độc lập) không thỏa các điều kiện để thực hiện một phân tích tương quan thì thế nào? Æ Có khả năng chuyển về biến đính tính không? Nếu muốn phân tích tương quan, trong cac biến độc lập có một biến định tính (biến 2 hoặc nhiều lựa chọn) thì có thể thực hiện được không? Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics BIẾN GIẢ (DUMMY) Các ví dụ: Biến giới tính: nam-nữ, có mặt – vắng mặt miền Bắc, Trung, Nam Được mã hóa 0 hoặc 1 Về mặt lý thuyết, các hằng số (hệ số chặn) phải khác nhau Số các biến giả cần thiết bằng số lựa chọn (của biến định tính) - 1 Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics BIẾN GIẢ (DUMMY) 0 1 1 2 0 1 1 ˆ (0)i i iY b b X b b b X= + + = + 0 1 1 2 0 2 1 1 ˆ (1) ( )i i iY b bX b b b bX= + + = + + Y = tiền lương X1,7 = Lãnh đạo, Cơ hội đào tạo và thăng tiến X8 = Giới tính = Nam (X8 = 1) Nữ (X8 = 0) 0 nữ 1 nam 0 1 1 2 2iˆ i iY b b X b X= + + Cùng hệ số hồi qui Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics BIẾN GIẢ (dummy) Y (Lòng trung thành) N ữ N a m X8 (giới tính) b0 + b2 b0 Cùng hệ số gốc Hệ số chặn (hằng số) khác nhau 1b Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics MÃ HÓA BIẾN DUMMY Biến cũ Giới tính 1: Nam, 2: Nữ Chúng ta phải chuyển thành Giới tính 1: Nam, 0: Nữ trước khi thực hiện phân tích!!! Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics TRÌNH TỰ THỰC HIỆN Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics TRÌNH TỰ THỰC HIỆN Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics KẾT QUẢ Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics KẾT QUẢ Mô hình: LTT = -0,247 + 0,459 Lương và thưởng + 0,282 CH Đào tạo và thăng tiến + 0,260 Lãnh đạo + 0,396 Danh hiệu thi đua Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics CÂU HỎI: MÃ HÓA BIẾN VÀ PHÂN TÍCH (DUMMY) Biến cũ: ĐIAĐIEM Miền Bắc 1 Miền Trung 2 Miền Nam 3 Chúng ta phải chuyển thành ĐIAĐIEM1 Miền Bắc 1 Khác 0 ĐIAĐIEM2 Miền Trung 1 Khác 0 Æ Diễn giải dữ liệu cho phù hợp!!! Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics TÁC ĐỘNG CỦA MÃ HÓA BIẾN Sự mã hóa riêng biệt các biến giả cốt là thay thế các dòng lấy giá trị 0 đối với tất cả các biến giả liên quan đến một biến cụ thể bằng một giá trị -1. Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics TÁC ĐỘNG CỦA MÃ HÓA BIẾN Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics TÁC ĐỘNG CỦA MÃ HÓA BIẾN Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics ĐIỀU KIỆN VẬN DỤNG MÔ HÌNH Các điều kiện về dạng mô hình : MQH tuyến tính giữa các biến độc lập với biến phụ thuộc Các điều kiện về sai số mô hình (error): Các sai số mô hình là độc lập (không tự tương quan) Các sai số phân phối theo phân phối chuẩn Các điều kiện về các số dự đoán: Các biến độc lập không ngẫu nhiên Các giá trị của các biến độc lập được đo lường không có sai số Các số dự đoán là độc lập theo đường thẳng, (không có bội tương quan giữa các biến độc lập - multicollinearity) Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics 4000003000002000001000000 R e g r e s s i o n S t u d e n t i z e d R e s i d u a l 4 2 0 -2 -4 KIỂM TRA 1 Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics KIỂM TRA 2 Regression Standardized Residual 3,25 2,75 2,25 1,75 1,25 ,75,25-,25 -,75 -1,25 -1,75 -2,25 -2,75 -3,25 -3,75 F r e q u e n c y 60 50 40 30 20 10 0 Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics HAI KIỂM ĐỊNH PHÂN PHỐI CHUẨN Nhờ vào hệ số mất cấn đối (Skewness) Nhờ vào Kurtose Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics ĐIỀU KIỆN VẬN DỤNG MÔ HÌNH Câu hỏi: Nếu các điều kiện không đạt thì thế nào? Các điều kiện vận dụng mô hình thường xuyên không đạt được: Tuyến tính Phương sai không đổi của các sai số (errors) của mô hình Một mô hình là tuyến tính nếu các tham số hiện diện trong mô hình là tuyến tính, ngay cả khi các biến độc lập không tuyến tính Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics BIẾN ĐỔI BIẾN Các ví dụ của các mô hình tuyến tính: Ví dụ mô hình không tuyến tính: ε+β+β= XY 10 ε+β+β+β= 2210 XXY ε+β+β= XlogY 10 ε+β+β= XY 10 ε++β= β X0 1eY Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics BIẾN ĐỔI MÔ HÌNH Hàm Phép biến đổi Dạng tuyến tính βα= XY Xlog'X,Ylog'Y == 'Xlog'Y β+α= Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics BIẾN ĐỔI MÔ HÌNH Hàm Phép biến đổi Dạng tuyến tính X eY βα= Yln'Y = Xln'Y β+α= Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics BiẾN ĐỔI MÔ HÌNH Hàm Phép biến đổi Dạng tuyến tính XlogY β+α= Xlog'X = 'XY β+α= Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics BIẾN ĐỔI MÔ HÌNH β−α= X XY X 1'X, Y 1'Y == Hàm Phép biến đổi Dạng tuyến tính 'X'Y β−α= Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics BIẾN ĐỔI MÔ HÌNH X X e1 eY β+α β+α + = Y1 Yln'Y −= Hàm Phép biến đổi Dạng tuyến tính X'Y β+α=