CHƯƠNG V: ĐA CỘNG TUYẾN
(MULTICOLLINEARITY)
5.1. Bản chất của hiện tượng đa cộng tuyến
5.2. Hậu quả của hiện tượng đa cộng tuyến
5.3. Phát hiện đa cộng tuyến
5.4. Khắc phục hiện tượng đa cộng tuyến
5.5. Thí dụ
21 trang |
Chia sẻ: thanhtuan.68 | Lượt xem: 1062 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Bài giảng Kinh tế lượng Econometrics - Chương V: Đa cộng tuyến (Multicollinearity), để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
BÀI GIẢNG
KINH TẾ LƯỢNG
ECONOMETRICS
Lê Anh Đức
Khoa Toán kinh tế
ĐH Kinh tế Quốc dân
1
CHƯƠNG V: ĐA CỘNG TUYẾN
(MULTICOLLINEARITY)
5.1. Bản chất của hiện tượng đa cộng tuyến
5.2. Hậu quả của hiện tượng đa cộng tuyến
5.3. Phát hiện đa cộng tuyến
5.4. Khắc phục hiện tượng đa cộng tuyến
5.5. Thí dụ
2
5.1. Bản chất của đa cộng tuyến
• Trong các mô hình hồi quy bội ta luôn giả thiết các biến
độc lập không có đa cộng tuyến với nhau. Trong thực tế
giả thiết này có thể bị vi phạm.
• Xét mô hình hồi quy k biến
• Đa cộng tuyến là hiện tượng xảy ra đối với mô hình hồi
quy bội khi các biến độc lập có quan hệ cộng tuyến với
nhau và được chia làm hai loại:
- Đa cộng tuyến hoàn hảo (Perfect Multi)
- Đa cộng tuyến không hoàn hảo (Inperfect Multi).
3
1 2 2 3 3 ...i i i k ki iY X X X U
1. Đa cộng tuyến hoàn hảo
• Là hiện tượng mà giữa các biến độc lập của mô hình có
quan hệ thoả mãn điều kiện sau:
Trong đó: λ2, λ3,, λk là các hệ số không đồng thời
bằng không, tức là:
• Giả sử: λ2 ≠0. Khi đó (1) có thể viết thành biểu thức như
sau:
Tức là X2i phụ thuộc hàm số vào các biến độc lập còn
lại.
2 2 3 3 ... 0(1)i i k kiX X X
4
2 2 2
2 3 ... 0k
3 4
2 3 4
2 2 2
... ki i i kiX X X X
2. Đa cộng tuyến không hoàn hảo
• Là hiện tượng mà giữa các biến độc lập của mô hình có
quan hệ thoả mãn điều kiện sau:
Trong đó: Vi là sai số ngẫu nhiên và λ2, λ3,, λk là các
hệ số không đồng thời bằng không, tức là:
• Giả sử: λ2 ≠0. Khi đó (1) có thể viết thành biểu thức như
sau:
Tức là X2i phụ thuộc tương quan với các biến độc lập
còn lại.
2 2 3 3 ... 0(2)i i k ki iX X X V
5
2 2 2
2 3 ... 0k
3 4
2 3 4
2 2 2 2
1
... ki i i ki iX X X X V
1.3. Nguyên nhân của đa cộng tuyến
• Do bản chất các biến độc lập đã có sẵn quan hệ
cộng tuyến với nhau.
• Do số liệu mẫu không ngẫu nhiên hoặc kích
thước mẫu không đủ lớn nên không đại diện tốt
nhất cho tổng thế.
• Do quá trình xử lý số liệu đã được làm trơn.
• Do chỉ định mô hình sai.
6
5.2. Hậu quả của hiện tượng đa cộng tuyến
• Xét mô hình
- Nếu có đa cộng tuyến hoàn hảo thì lúc đó không thể
ước lượng được các hệ số hồi quy và phương sai của
chúng là vô hạn.
- Giả sử:
7
1 2 2 3 3i i i iY X X U
2 3 2 3 23 32( 0) = 1i i i iX X x x r r
- Khi đó:
8
2
2 3 3 2 3
1 1 1 1
2
2 2 2
2 3 2 3
1 1 1
2
3 2 2 2 3
1 1 1 1
3
2 2 2
2 3 2 3
1 1 1
2
2
2
( )( ) ( )( )
0ˆ
0( )( ) ( )
( )( ) ( )( )
0ˆ
0( )( ) ( )
ˆ( )
n n n n
i i i i i i i
i i i i
n n n
i i i i
i i i
n n n n
i i i i i i i
i i i i
n n n
i i i i
i i i
i
x y x x y x x
x x x x
x y x x y x x
x x x x
Var
x
2 2
23
1
2
3
2 2
3 23
1
(1 )
ˆ( )
(1 )
n
i
n
i
i
r
Var
x r
- Nếu có đa cộng tuyến không hoàn hảo thì lúc đó có thể
ước lượng được hệ số hồi quy tuy nhiên sẽ dẫn đến một số
hậu quả nhất định.
- Giả sử:
+ Phương sai và hiệp phương sai của các hệ số hồi quy
ước lượng được sẽ tăng lên cùng với mức độ đa cộng
tuyến.
+ Các khoảng tin cậy của các hệ số hồi quy sẽ rộng hơn
và kiểm định T có thể mất ý nghĩa vì luôn có xu hướng
thừa nhận H0.
9
2 3 23 32( 0) 1i i ix x V r r
+ Hệ số R2 có thể khá cao nhưng các giá trị giá trị thống
kê của kiểm định T khá nhỏ, điều này tạo ra sự mâu thuẫn
về ý nghĩa của hệ số R2. Khi đó các kiểm định T và F có
thể cho kết luận mâu thuẫn vì kiểm định F luôn có xu
hướng bác bỏ H0.
+ Mô hình trở lên nhạy cảm với sự thay đổi của số liệu.
+ Dấu của các hệ số hồi quy ước lượng được có thể không
phù hợp với lý thuyết kinh tế và việc thêm hoặc bớt một
biến độc lập có thể làm thay đổi đáng kể về dấu và giá trị
của các hệ số hồi quy ước lượng được.
10
• Chú ý:
- Trong thực tế đa cộng tuyến hoàn hảo gần như không
bao giờ xảy ra vì sự phụ thuộc hàm số giữa các biến
độc lập chỉ tồn tại về mặt lý thuyết. Do đó trong các
mô hình hồi quy bội khi nói đến vấn đề đa cộng tuyến
thì chúng ta hiểu đó là hiện tượng đa cộng tuyến không
hoàn hảo.
- Đối với mô hình hồi quy bội người ta không xem xét
vấn đề có hay không có đa cộng tuyến mà xem xét
mức độ nghiêm trọng của đa cộng tuyến.
- Nói chung khi có đa cộng tuyến không hoàn hảo các
ước lượng nhận được vẫn có tính chất không chệch
nên vẫn có thể dùng để dự báo.
11
5.3. Phát hiện ra đa cộng tuyến
• Đa cộng tuyến đề cập đến điều kiện của các biến độc
lập được giả thiết là phi ngẫu nhiên nên nó là vấn đề
liên quan đến tệp số liệu mẫu chứ không phải của tổng
thể do đó chúng ta không kiểm định đa cộng tuyến.
• Không có một phương pháp thực sự hoàn thiện để phát
hiện đa cộng tuyến. Chúng ta chỉ có các dấu hiệu cho
thấy có thể có hiện tượng đa cộng tuyến.
• Xét mô hình
12
1 2 2 ... ...i i j ji k ki iY X X X U
1. Phân tích định tính
Căn cứ vào nội dung kinh tế của các biến độc lập có
trong mô hình để xem xét khả năng có tồn tại hiện
tượng đa cộng tuyến trong mô hình hay không.
2. Căn cứ vào các kết luận của kiểm định T và F
Nếu các kết luận mâu thuẫn với nhau thì đó có thể là
dấu hiệu của đa cộng tuyến.
3. Căn cứ vào hệ số tương quan của các biến độc lập:
Nếu các hệ số tương quan khá cao thì có thể nghi ngờ
có hiện tượng đa cộng tuyến.
13
4. Dùng hồi quy phụ
- Bước 1: Hồi quy mô hình phụ sau
- Bước 2: kiểm định cặp giả thiết
mô hình có đa cộng tuyến
mô hình không có đa cộng tuyến
+ Tiêu chuẩn kiểm định:
k số hệ số trong mô hình gốc
+ Miền bác bỏ với mức ý nghĩa α cho trước
14
2
1 2 2 1 1 1 1... ... ( 2 )ji i j j i j j i k ki i jX X X X X V R j k
2
0
2
1
: 0
: 0
j
j
H R
H R
2
2
/( 1 1)
( 2, 1)
(1 ) /( 1)
j
j
j
R k
F F k n k
R n k
: ( 2, 1)j jW F F F k n k
5. Nhân tử phóng đại phương sai (Variance inflating
factor – VIF)
- Bước 1: Hồi quy biến Xj với các biến độc lập còn lại
tìm được
- Bước 2: Xác định đại lượng
- Nếu VIF(Xj) > 10 thì Xj có thể cộng tuyến với các biến
độc lập còn lại.
15
2
jR
2
1
( ) ( 2 )
1j j
VIF X j k
R
6. Độ đo Theil
- Bước 1: hồi quy mô hình đã cho thu được R2
- Bước 2: Lần lượt hồi quy các mô hình sau:
- Bước 3: Xác định đại lượng
+ Nếu thì mô hình gốc không có đa cộng tuyến
+ Nếu thì mô hình gốc có đa cộng tuyến hoàn hảo
- Như vậy độ đo Theil đo mức độ cộng tuyến chung
của mô hình.
16
2
1 2 2 1 1 1 1... ... ( 2 )i i j j i j j i k ki i jY X X X X V R j k
2 2 2
2
( )
k
j
j
m R R R
5.4. Khắc phục hiện tượng đa cộng tuyến
1. Sử dụng thông tin tiên nghiệm
• Các thông tin tiên nghiệm được khai thác từ kinh nghiệm
thông qua quan sát thực tế hoặc sử dụng các kết luận của kinh
tế học.
• Sử dụng các thông tin tiên nghiệm ta có thể ước lượng một
phần các hệ số hồi quy
• Ví dụ
• Nếu có cơ sở cho rằng hàm sản xuất này có tính chất hiệu quả
không đổi theo quy mô thì ta sử dụng kết luận: β2 + β3 = 1 để
ước lượng mô hình sau:
• Mô hình này không có đa cộng tuyến
17
32
1 1 2 3ln ln ln ln
iU
i i i i i i iQ K L e Q K K U
2 2 21
1 1 1 2( ) ln( ) ln ln( )i i
U Ui i i i
i i i i
i i i i
Q K Q K
Q K L e e U
L L L L
2. Sử dụng mô hình sai phân cấp 1
• Xét mô hình 3 biến với số liệu theo thời gian
• Tại thời điểm (t-1) ta có mô hình:
• Giả sử X2 và X3 có đa cộng tuyến. Khi đó ta xét mô hình
sau:
Mô hình này gọi là mô hình sai phân cấp 1
• Thực tế cho thấy mô hình sai phân cấp 1 đã giảm được
đáng kể mức độ đa cộng tuyến của mô hình gốc.
18
1 2 2 3 3t t t tY X X U
1 1 2 2 1 3 3 1 1t t t tY X X U
1 2 2 2 1 3 3 3 1 1
* * *
2 2 3 3
( ) ( ) ( )t t t t t t t t
t t t t
Y Y X X X X U U
Y X X V
• Hạn chế của phương pháp này:
- Chỉ dùng được với những số liệu theo thời gian
- Không ước lượng được
- Mất đi một quan sát đầu tiên
- Ut có thể thoả mãn mọi giả thiết của OLS song
Vt thì có thể vi phạm.
19
3. Giảm đa cộng tuyến trong mô hình hồi quy đa thức
• Khái niệm đa cộng tuyến chỉ tồn tại ở bậc nhất chứ
không ở các bậc khác. Vì vậy không có đa cộng tuyến
giữa các bậc của đa thức song có thể có đa cộng tuyến
trong bản thân dãy số liệu của biến độc lập. Vì vậy để
giảm bớt mức độ đa cộng tuyến ta có thể chuyến sang
hồi quy mô hình sai phân với giá trị trung bình
• Xét mô hình:
- Ta xây dựng mô hình:
- Thay vì tuyến tính hoá mô hình (1) và ước lượng nó
ta sẽ ước lượng mô hình (2).
20
2 3
1 2 3 4 (1)i i i i iTC Q Q Q U
2 3
1 2 3 4
* * * *
1 2 2 3 3 4 4
( ) ( ) ( )
(2)
i i i i i
i i i i i
TC TC Q Q Q Q Q Q U
TC Q Q Q U
4. Một số biện pháp khác
• Tăng kích thước mẫu hoặc lấy mẫu mới nếu có
thể.
• Bỏ bớt biến độc lập ra khỏi mô hình nếu có thể.
21