Bài giảng Chương 5: Dự báo với phương pháp hồi quy bội

Hồi quy bội là một quy trình thống kê trong đó biến phụ thuộc (Y) được mô hình hoá như một hàm số của nhiều hơn một biến độc lập (X 1 , X 2 , X n ). Mô hình tổng thể có thể viết như sau: Y = f(X 1 , X 2 , X n ) =  0 +  1 X 1 +  2 X 2 +  3 X 3 + +  k X k + Trong đó  0 là tung độ điểm (Intercept) và các  i là các hệ số góc tương ứng với các biến độc lập. Và,  là sai số tổng thể, là chênh lệch giữa giá trị thực Y và giá trị dự báo của mô hình.

pdf16 trang | Chia sẻ: nyanko | Lượt xem: 1575 | Lượt tải: 1download
Bạn đang xem nội dung tài liệu Bài giảng Chương 5: Dự báo với phương pháp hồi quy bội, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
1CHƯƠNG 5 DỰ BÁO VỚI PHƯƠNG PHÁP HỒI QUY BỘI 2Hồi quy bội là một quy trình thống kê trong đó biến phụ thuộc (Y) được mô hình hoá như một hàm số của nhiều hơn một biến độc lập (X1, X2, Xn). Mô hình tổng thể có thể viết như sau: Y = f(X1, X2, Xn) = 0 + 1X1 + 2X2 + 3X3 ++ kXk+ Trong đó 0 là tung độ điểm (Intercept) và các i là các hệ số góc tương ứng với các biến độc lập. Và,  là sai số tổng thể, là chênh lệch giữa giá trị thực Y và giá trị dự báo của mô hình. MÔ HÌNH HỒI QUY BỘI 3Khi biến phụ thuộc đã được xác định, các biến độc lập được tiến hành chọn lựa. Liệt kê tất cả các yếu tố có thể tác động đến sự biến đổi của biến phụ thuộc. Chọn các biến có mối liên hệ rõ ràng nhất với biến phụ thuộc, hoặc thông qua các nghiên cứu trước. Ví dụ: Doanh số bán lẻ và thu nhập khả dụng. Nhưng ngoài thu nhập khả dụng ra, có thể còn sự tác động của: GDP, Dân số, lãi suất v.v.v Tránh trường hợp các biến độc lập có mối quan hệ với nhau. Vì tác động của nó làm dự báo và kiểm định thiếu chính xác. CHỌN BIẾN ĐỘC LẬP 4Ví dụ: Thu nhập khả dụng quốc dân (DPI) và GDP hay DPI và dân số có mối quan hệ rất lớn (Lỗi này được gọi là Đa công tuyến Multicollinearity). Ngoài ra, phải lưu ý đến những biến đo lường được (measurable variables), phải phân biệt khái niệm và biến số. Một số trường hợp không đo bằng các công cụ, có thể sử dụng bằng biến giả. Ví dụ: Giới tính (Nam=1, Nữ =0) (Hồi quy bằng với biến giả sẽ được trình bày trong phần sau) CHỌN BIẾN ĐỘC LẬP 5VÍ DỤ MINH HỌA DỰ BÁO VỚI MÔ HÌNH HỒI QUI BỘI Thôøi gian oanh thu ( )D RS Laõi suaát ( )MR Thu nhaäp khaû duïng ( )DPI 31- arM - 90 418436 .10 1202 18035 30- unJ - 90 464944 .10 3372 18063 30-epS - 90 464490 .10 1033 18031 31- ecD - 90 496741 .9 9547 17856 .. 31- arM - 98 613448 .7 0547 19632 30- unJ - 98 695875 .7 0938 19719 30-epS - 98 686297 .6 8657 19905 31- ecD - 98 749973 .6 7633 20194 Bài tập c5t1 6VÍ DỤ MINH HỌA DỰ BÁO VỚI MÔ HÌNH HỒI QUI BỘI (tt) Tiến hành hồi quy Doanh thu RS theo Lãi suất (MR) và Thu nhập khả dụng (DPI). Theo đó, mô hình được viết dưới dạng: RS = b0 + b1(MR) + b2(DPI) Tiến hành hồi quy cho ra kết quả: RS2 =-1,422,517.59 +((MR)*-9,945.15)+((DPI)*110.77 ) (*) Từ phương trình (*), để dự báo ta chỉ việc thế giá trị các biến số MR và DPI theo từng quý vào để tính. Nếu các giá trị này không có sẵn ta tiến hành dự báo sau đó thế giá trị dự báo vào để tìm doanh thu. 7CÁC KIỂM ĐỊNH THỐNG KÊ HỒI QUI BỘI (tt) 1. BA CÁCH KIỂM TRA NHANH a. Dấu hệ số góc Kiểm tra dấu của hệ số góc có đúng như kỳ vọng không? b. Mức ý nghĩa Kiểm tra mức ý nghĩa bằng P-values để chấp nhận biến c. R-quared Trong mô hình hồi qui bội, chúng ta có khái niệm adjusted R- squared (gọi là R-squared điều chỉnh). Tiêu chí này nhằm hạn chế việc R-squred tăng không ý nghĩa (khi tăng thêm biến độc lập R- square tăng dù biến đó không có ý nghĩa thống kê). R-squared điều chỉnh đánh giá mức độ giải thích của các biến giải thích đối với biến phụ thuộc trong hồi quy bội. 8CÁC KIỂM ĐỊNH THỐNG KÊ HỒI QUI BỘI (tt) 2. ĐA CÔNG TUYẾN Là hiện tương hai hay nhiều biến độc lập có mối quan hệ tuyến tính với nhau. Hiện tượng này gây mô hình có nhiều biến không đạt kiểm định t- test hoặc dấu của các biến không hợp lý mặc dù R-squared có giá trị cao Tuy nhiên, đa cộng tuyến hầu như có trong mọi mô hình vấn đề là mức độ nặng hay nhẹ. Chúng ta có thể biết mức độ cộng tuyến giữa các biến bằng cách nhìn vào ma trận tương quan của các biến độc lập (Xem hướng dẫn thực hành). 9CÁC KIỂM ĐỊNH THỐNG KÊ HỒI QUI BỘI (tt) 3. TỰ TƯƠNG QUAN VÀ HIỆN TƯỢNG THIẾU BIẾN GIẢI THÍCH Tự tương quan: là hiện tượng các giá trị (quan sát) theo thứ tự của một biến có mối tương quan với nhau. Nguyên nhân chính của hiện tượng này là khi xây dựng mô hình đã bỏ qua biến giải thích quan trọng. Vì thế một trong cách chữa hiện tượng này là thêm biến vào mô hình. Xét ví dụ sau: Trường hợp 1: chỉ dùng giá (price) giải thích cho doanh thu (sales); Trường hợp 2: thêm biến thu nhập (income) vào giải thích. 10 CÁC KIỂM ĐỊNH THỐNG KÊ HỒI QUI BỘI (tt) Thôøi gian SALES PRICE INCOME 31- arM - 93 80 5 2620 30- unJ - 93 86 .4 87 2733 30-epS - 93 93 .4 86 2898 . 31- ecD - 93 99 .4 79 3056 31- arM - 96 131 .5 5 4619 30- unJ - 96 136 .5 48 4764 30-epS - 96 137 .5 47 4802 31- ecD - 96 139 .5 49 4916 Bài tập c5t4 11 CÁC KIỂM ĐỊNH THỐNG KÊ HỒI QUI BỘI (tt) Nếu chỉ sử dụng giá (price) giải thích cho doanh thu (sales), kết quả hồi quy cho ra: Audit Trail -- Coefficient Table (Multiple Regression Selected) Series Included Overall Descritpion in Model Coefficient T-test F-test Elasticity F-test SALES Dependent -51.24 -0.94 0.89 8.98 PRICE Yes 30.92 3 8.98 1.46 Audit Trail - Statistics Accuracy Measures Forecast Statistics Value AIC Durbin Watson 0.34 R-sqaure 39.07 12 CÁC KIỂM ĐỊNH THỐNG KÊ HỒI QUI BỘI (tt) Kết quả trên cho ta nhiều bất ổn trong mô hình: 1. R-squared khá thấp (39.07%) 2. Dấu của của biến giải thích là dấu dương. Điều này có ý nghĩa rằng: khi tăng giá thì doanh số cũng tăng (điều này không đúng với lý thuyết kinh tê'). 3. Hệ số DW chỉ 0.34 cho thấy mô hình bị tự tương quan khá nặng. Kết luận: mô hình đã có thể bỏ ra qua một biến giải thích quan trọng. 13 CÁC KIỂM ĐỊNH THỐNG KÊ HỒI QUI BỘI (tt) Nếu sử dụng thêm thu nhập (income) giải thích cho doanh thu, kết quả hồi quy cho ra: Audit Trail -- Coefficient Table (Multiple Regression Selected) Series Included Overall Descritpio n in Model Coefficie nt T-test F-test Elasticit y F-test SALES Depende nt 123.47 6.36 40.51 154.86 PRICE Yes -24.84 -5.02 25.17 -1.17 INCOME Yes 0.03 13.55 183.62 1.06 Audit Trail - Statistics Accuracy Measures Forecast Statistics Value AIC Durbin Watson 1.67 Adjusted R-square 95.35% 14 CÁC KIỂM ĐỊNH THỐNG KÊ HỒI QUI BỘI (tt) Với kết quả trên, ta thấy có nhiều cải thiện đáng kể trong mô hình. + R-squared đã tăng lên: 95.97% + Dấu của biến cũng đã như kỳ vọng (âm), điều này có nghĩa là khi giá tăng thì doanh số sẽ giảm. + Hệ số DW cũng đã tăng lên 1.67 (nằm trong ngưỡng an toàn từ 1.5-2.5). Vậy chứng tỏ thiếu biến giải thích quan trọng sẽ làm mô hình phạm nhiều lỗi và vì thế dự báo không còn chính xác. 15 CÁC KIỂM ĐỊNH THỐNG KÊ HỒI QUI BỘI (tt) Trong bảng kết quả hồi quy chúng ta thường thấy thống kê F- statistic. Kiểm định này dùng để kiểm định giả thuyết: Ho : 1 = 2 = 3 = = k = 0 H1: tất cả các hệ số không đồng thời bằng zero. So sánh giá trị F tính toán (Fcalc) và giá trị F tra bảng (FT) với bậc tự do tử số là K và bậc tự do mẫu là n-(k+1); Với n là số quan sát, K là số lượng biến giải thích. Nếu Fcalc > FT: loại bỏ giả thuyết H0. (Chấp nhận mô hình) 16 THỰC HÀNH Lập ma trận tương quan giữa các biến độc lập Trong Excel (Có thể thực hiện được trong ForecastX) 1. Khởi động Excel nhập dữ liệu. 2. Chọn Tools trên thanh công cụ, chọn tiếp Data Analysis trong hộp thoại hiện ra chọn tiếp Corelation và chọn OK. 3. Trong hộp thoại Input range chọn biểu tượng ở cuối dòng và quét khối phần dữ liệu cần lập ma trận tương quan (gồm cả hàng tên biến), Sau đó click lại biểu tượng nhỏ ở cuối dòng trong hộp thoại. Và chọn tiếp Labels in first row. Và cuối cùng chọn OK.