Hồi quy bội là một quy trình thống kê trong đó biến phụ
thuộc (Y) được mô hình hoá như một hàm số của nhiều hơn
một biến độc lập (X
1
, X
2
, X
n
).
Mô hình tổng thể có thể viết như sau:
Y = f(X
1
, X
2
, X
n
)
=
0
+
1
X
1
+
2
X
2
+
3
X
3
+ +
k
X
k
+
Trong đó
0
là tung độ điểm (Intercept) và các
i
là các hệ số
góc tương ứng với các biến độc lập. Và, là sai số tổng thể, là
chênh lệch giữa giá trị thực Y và giá trị dự báo của mô hình.
16 trang |
Chia sẻ: nyanko | Lượt xem: 1615 | Lượt tải: 1
Bạn đang xem nội dung tài liệu Bài giảng Chương 5: Dự báo với phương pháp hồi quy bội, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
1CHƯƠNG 5
DỰ BÁO VỚI PHƯƠNG PHÁP
HỒI QUY BỘI
2Hồi quy bội là một quy trình thống kê trong đó biến phụ
thuộc (Y) được mô hình hoá như một hàm số của nhiều hơn
một biến độc lập (X1, X2, Xn).
Mô hình tổng thể có thể viết như sau:
Y = f(X1, X2, Xn)
= 0 + 1X1 + 2X2 + 3X3 ++ kXk+
Trong đó 0 là tung độ điểm (Intercept) và các i là các hệ số
góc tương ứng với các biến độc lập. Và, là sai số tổng thể, là
chênh lệch giữa giá trị thực Y và giá trị dự báo của mô hình.
MÔ HÌNH HỒI QUY BỘI
3Khi biến phụ thuộc đã được xác định, các biến độc lập được
tiến hành chọn lựa.
Liệt kê tất cả các yếu tố có thể tác động đến sự biến đổi của
biến phụ thuộc.
Chọn các biến có mối liên hệ rõ ràng nhất với biến phụ thuộc,
hoặc thông qua các nghiên cứu trước.
Ví dụ: Doanh số bán lẻ và thu nhập khả dụng. Nhưng ngoài
thu nhập khả dụng ra, có thể còn sự tác động của: GDP, Dân
số, lãi suất v.v.v
Tránh trường hợp các biến độc lập có mối quan hệ với nhau.
Vì tác động của nó làm dự báo và kiểm định thiếu chính xác.
CHỌN BIẾN ĐỘC LẬP
4Ví dụ:
Thu nhập khả dụng quốc dân (DPI) và GDP hay DPI và dân
số có mối quan hệ rất lớn (Lỗi này được gọi là Đa công tuyến
Multicollinearity).
Ngoài ra, phải lưu ý đến những biến đo lường được
(measurable variables), phải phân biệt khái niệm và biến số.
Một số trường hợp không đo bằng các công cụ, có thể sử
dụng bằng biến giả.
Ví dụ: Giới tính (Nam=1, Nữ =0)
(Hồi quy bằng với biến giả sẽ được trình bày trong phần sau)
CHỌN BIẾN ĐỘC LẬP
5VÍ DỤ MINH HỌA DỰ BÁO VỚI
MÔ HÌNH HỒI QUI BỘI
Thôøi gian oanh thu ( )D RS
Laõi suaát
( )MR
Thu nhaäp khaû duïng
( )DPI
31- arM - 90 418436 .10 1202 18035
30- unJ - 90 464944 .10 3372 18063
30-epS - 90 464490 .10 1033 18031
31- ecD - 90 496741 .9 9547 17856
..
31- arM - 98 613448 .7 0547 19632
30- unJ - 98 695875 .7 0938 19719
30-epS - 98 686297 .6 8657 19905
31- ecD - 98 749973 .6 7633 20194
Bài tập c5t1
6VÍ DỤ MINH HỌA DỰ BÁO VỚI
MÔ HÌNH HỒI QUI BỘI (tt)
Tiến hành hồi quy Doanh thu RS theo Lãi suất (MR) và Thu
nhập khả dụng (DPI).
Theo đó, mô hình được viết dưới dạng:
RS = b0 + b1(MR) + b2(DPI)
Tiến hành hồi quy cho ra kết quả:
RS2 =-1,422,517.59 +((MR)*-9,945.15)+((DPI)*110.77 ) (*)
Từ phương trình (*), để dự báo ta chỉ việc thế giá trị các biến
số MR và DPI theo từng quý vào để tính.
Nếu các giá trị này không có sẵn ta tiến hành dự báo sau đó
thế giá trị dự báo vào để tìm doanh thu.
7CÁC KIỂM ĐỊNH THỐNG KÊ
HỒI QUI BỘI (tt)
1. BA CÁCH KIỂM TRA NHANH
a. Dấu hệ số góc
Kiểm tra dấu của hệ số góc có đúng như kỳ vọng không?
b. Mức ý nghĩa
Kiểm tra mức ý nghĩa bằng P-values để chấp nhận biến
c. R-quared
Trong mô hình hồi qui bội, chúng ta có khái niệm adjusted R-
squared (gọi là R-squared điều chỉnh). Tiêu chí này nhằm hạn chế
việc R-squred tăng không ý nghĩa (khi tăng thêm biến độc lập R-
square tăng dù biến đó không có ý nghĩa thống kê).
R-squared điều chỉnh đánh giá mức độ giải thích của các biến giải
thích đối với biến phụ thuộc trong hồi quy bội.
8CÁC KIỂM ĐỊNH THỐNG KÊ
HỒI QUI BỘI (tt)
2. ĐA CÔNG TUYẾN
Là hiện tương hai hay nhiều biến độc lập có mối quan hệ tuyến tính
với nhau.
Hiện tượng này gây mô hình có nhiều biến không đạt kiểm định t-
test hoặc dấu của các biến không hợp lý mặc dù R-squared có giá trị
cao
Tuy nhiên, đa cộng tuyến hầu như có trong mọi mô hình vấn đề là
mức độ nặng hay nhẹ. Chúng ta có thể biết mức độ cộng tuyến giữa
các biến bằng cách nhìn vào ma trận tương quan của các biến độc
lập (Xem hướng dẫn thực hành).
9CÁC KIỂM ĐỊNH THỐNG KÊ
HỒI QUI BỘI (tt)
3. TỰ TƯƠNG QUAN VÀ HIỆN TƯỢNG THIẾU BIẾN
GIẢI THÍCH
Tự tương quan: là hiện tượng các giá trị (quan sát) theo thứ tự
của một biến có mối tương quan với nhau.
Nguyên nhân chính của hiện tượng này là khi xây dựng mô hình
đã bỏ qua biến giải thích quan trọng.
Vì thế một trong cách chữa hiện tượng này là thêm biến vào mô
hình.
Xét ví dụ sau:
Trường hợp 1: chỉ dùng giá (price) giải thích cho doanh thu
(sales); Trường hợp 2: thêm biến thu nhập (income) vào giải
thích.
10
CÁC KIỂM ĐỊNH THỐNG KÊ
HỒI QUI BỘI (tt)
Thôøi gian SALES PRICE INCOME
31- arM - 93 80 5 2620
30- unJ - 93 86 .4 87 2733
30-epS - 93 93 .4 86 2898
.
31- ecD - 93 99 .4 79 3056
31- arM - 96 131 .5 5 4619
30- unJ - 96 136 .5 48 4764
30-epS - 96 137 .5 47 4802
31- ecD - 96 139 .5 49 4916
Bài tập c5t4
11
CÁC KIỂM ĐỊNH THỐNG KÊ
HỒI QUI BỘI (tt)
Nếu chỉ sử dụng giá (price) giải thích cho doanh thu (sales),
kết quả hồi quy cho ra:
Audit Trail -- Coefficient Table (Multiple Regression Selected)
Series Included Overall
Descritpion in Model Coefficient T-test F-test Elasticity F-test
SALES Dependent -51.24 -0.94 0.89 8.98
PRICE Yes 30.92 3 8.98 1.46
Audit Trail - Statistics
Accuracy Measures Forecast Statistics Value
AIC Durbin Watson 0.34
R-sqaure 39.07
12
CÁC KIỂM ĐỊNH THỐNG KÊ
HỒI QUI BỘI (tt)
Kết quả trên cho ta nhiều bất ổn trong mô hình:
1. R-squared khá thấp (39.07%)
2. Dấu của của biến giải thích là dấu dương. Điều này có
ý nghĩa rằng: khi tăng giá thì doanh số cũng tăng (điều
này không đúng với lý thuyết kinh tê').
3. Hệ số DW chỉ 0.34 cho thấy mô hình bị tự tương quan
khá nặng.
Kết luận: mô hình đã có thể bỏ ra qua một biến giải thích
quan trọng.
13
CÁC KIỂM ĐỊNH THỐNG KÊ
HỒI QUI BỘI (tt)
Nếu sử dụng thêm thu nhập (income) giải thích cho doanh
thu, kết quả hồi quy cho ra:
Audit Trail -- Coefficient Table (Multiple
Regression Selected)
Series Included Overall
Descritpio
n in Model
Coefficie
nt T-test F-test
Elasticit
y F-test
SALES
Depende
nt 123.47 6.36 40.51 154.86
PRICE Yes -24.84 -5.02 25.17 -1.17
INCOME Yes 0.03 13.55 183.62 1.06
Audit Trail - Statistics
Accuracy Measures Forecast Statistics Value
AIC Durbin Watson 1.67
Adjusted R-square 95.35%
14
CÁC KIỂM ĐỊNH THỐNG KÊ
HỒI QUI BỘI (tt)
Với kết quả trên, ta thấy có nhiều cải thiện đáng kể trong mô
hình.
+ R-squared đã tăng lên: 95.97%
+ Dấu của biến cũng đã như kỳ vọng (âm), điều này có nghĩa
là khi giá tăng thì doanh số sẽ giảm.
+ Hệ số DW cũng đã tăng lên 1.67 (nằm trong ngưỡng an toàn
từ 1.5-2.5).
Vậy chứng tỏ thiếu biến giải thích quan trọng sẽ làm mô hình
phạm nhiều lỗi và vì thế dự báo không còn chính xác.
15
CÁC KIỂM ĐỊNH THỐNG KÊ
HỒI QUI BỘI (tt)
Trong bảng kết quả hồi quy chúng ta thường thấy thống kê F-
statistic.
Kiểm định này dùng để kiểm định giả thuyết:
Ho : 1 = 2 = 3 = = k = 0
H1: tất cả các hệ số không đồng thời bằng zero.
So sánh giá trị F tính toán (Fcalc) và giá trị F tra bảng (FT) với
bậc tự do tử số là K và bậc tự do mẫu là n-(k+1); Với n là
số quan sát, K là số lượng biến giải thích.
Nếu Fcalc > FT: loại bỏ giả thuyết H0. (Chấp nhận mô hình)
16
THỰC HÀNH
Lập ma trận tương quan giữa các biến độc lập Trong Excel
(Có thể thực hiện được trong ForecastX)
1. Khởi động Excel nhập dữ liệu.
2. Chọn Tools trên thanh công cụ, chọn tiếp Data Analysis
trong hộp thoại hiện ra chọn tiếp Corelation và chọn OK.
3. Trong hộp thoại Input range chọn biểu tượng ở cuối dòng
và quét khối phần dữ liệu cần lập ma trận tương quan (gồm
cả hàng tên biến), Sau đó click lại biểu tượng nhỏ ở cuối
dòng trong hộp thoại. Và chọn tiếp Labels in first row. Và
cuối cùng chọn OK.