Bài giảng Kinh tế lượng Econometrics - Chương V: Đa cộng tuyến (Multicollinearity)

CHƯƠNG V: ĐA CỘNG TUYẾN (MULTICOLLINEARITY) 5.1. Bản chất của hiện tượng đa cộng tuyến 5.2. Hậu quả của hiện tượng đa cộng tuyến 5.3. Phát hiện đa cộng tuyến 5.4. Khắc phục hiện tượng đa cộng tuyến 5.5. Thí dụ

pdf21 trang | Chia sẻ: thanhtuan.68 | Ngày: 10/03/2018 | Lượt xem: 91 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Bài giảng Kinh tế lượng Econometrics - Chương V: Đa cộng tuyến (Multicollinearity), để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
BÀI GIẢNG KINH TẾ LƯỢNG ECONOMETRICS Lê Anh Đức Khoa Toán kinh tế ĐH Kinh tế Quốc dân 1 CHƯƠNG V: ĐA CỘNG TUYẾN (MULTICOLLINEARITY) 5.1. Bản chất của hiện tượng đa cộng tuyến 5.2. Hậu quả của hiện tượng đa cộng tuyến 5.3. Phát hiện đa cộng tuyến 5.4. Khắc phục hiện tượng đa cộng tuyến 5.5. Thí dụ 2 5.1. Bản chất của đa cộng tuyến • Trong các mô hình hồi quy bội ta luôn giả thiết các biến độc lập không có đa cộng tuyến với nhau. Trong thực tế giả thiết này có thể bị vi phạm. • Xét mô hình hồi quy k biến • Đa cộng tuyến là hiện tượng xảy ra đối với mô hình hồi quy bội khi các biến độc lập có quan hệ cộng tuyến với nhau và được chia làm hai loại: - Đa cộng tuyến hoàn hảo (Perfect Multi) - Đa cộng tuyến không hoàn hảo (Inperfect Multi). 3 1 2 2 3 3 ...i i i k ki iY X X X U         1. Đa cộng tuyến hoàn hảo • Là hiện tượng mà giữa các biến độc lập của mô hình có quan hệ thoả mãn điều kiện sau: Trong đó: λ2, λ3,, λk là các hệ số không đồng thời bằng không, tức là: • Giả sử: λ2 ≠0. Khi đó (1) có thể viết thành biểu thức như sau: Tức là X2i phụ thuộc hàm số vào các biến độc lập còn lại. 2 2 3 3 ... 0(1)i i k kiX X X      4 2 2 2 2 3 ... 0k      3 4 2 3 4 2 2 2 ... ki i i kiX X X X           2. Đa cộng tuyến không hoàn hảo • Là hiện tượng mà giữa các biến độc lập của mô hình có quan hệ thoả mãn điều kiện sau: Trong đó: Vi là sai số ngẫu nhiên và λ2, λ3,, λk là các hệ số không đồng thời bằng không, tức là: • Giả sử: λ2 ≠0. Khi đó (1) có thể viết thành biểu thức như sau: Tức là X2i phụ thuộc tương quan với các biến độc lập còn lại. 2 2 3 3 ... 0(2)i i k ki iX X X V       5 2 2 2 2 3 ... 0k      3 4 2 3 4 2 2 2 2 1 ... ki i i ki iX X X X V             1.3. Nguyên nhân của đa cộng tuyến • Do bản chất các biến độc lập đã có sẵn quan hệ cộng tuyến với nhau. • Do số liệu mẫu không ngẫu nhiên hoặc kích thước mẫu không đủ lớn nên không đại diện tốt nhất cho tổng thế. • Do quá trình xử lý số liệu đã được làm trơn. • Do chỉ định mô hình sai. 6 5.2. Hậu quả của hiện tượng đa cộng tuyến • Xét mô hình - Nếu có đa cộng tuyến hoàn hảo thì lúc đó không thể ước lượng được các hệ số hồi quy và phương sai của chúng là vô hạn. - Giả sử: 7 1 2 2 3 3i i i iY X X U      2 3 2 3 23 32( 0) = 1i i i iX X x x r r        - Khi đó: 8 2 2 3 3 2 3 1 1 1 1 2 2 2 2 2 3 2 3 1 1 1 2 3 2 2 2 3 1 1 1 1 3 2 2 2 2 3 2 3 1 1 1 2 2 2 ( )( ) ( )( ) 0ˆ 0( )( ) ( ) ( )( ) ( )( ) 0ˆ 0( )( ) ( ) ˆ( ) n n n n i i i i i i i i i i i n n n i i i i i i i n n n n i i i i i i i i i i i n n n i i i i i i i i x y x x y x x x x x x x y x x y x x x x x x Var x                                          2 2 23 1 2 3 2 2 3 23 1 (1 ) ˆ( ) (1 ) n i n i i r Var x r              - Nếu có đa cộng tuyến không hoàn hảo thì lúc đó có thể ước lượng được hệ số hồi quy tuy nhiên sẽ dẫn đến một số hậu quả nhất định. - Giả sử: + Phương sai và hiệp phương sai của các hệ số hồi quy ước lượng được sẽ tăng lên cùng với mức độ đa cộng tuyến. + Các khoảng tin cậy của các hệ số hồi quy sẽ rộng hơn và kiểm định T có thể mất ý nghĩa vì luôn có xu hướng thừa nhận H0. 9 2 3 23 32( 0) 1i i ix x V r r        + Hệ số R2 có thể khá cao nhưng các giá trị giá trị thống kê của kiểm định T khá nhỏ, điều này tạo ra sự mâu thuẫn về ý nghĩa của hệ số R2. Khi đó các kiểm định T và F có thể cho kết luận mâu thuẫn vì kiểm định F luôn có xu hướng bác bỏ H0. + Mô hình trở lên nhạy cảm với sự thay đổi của số liệu. + Dấu của các hệ số hồi quy ước lượng được có thể không phù hợp với lý thuyết kinh tế và việc thêm hoặc bớt một biến độc lập có thể làm thay đổi đáng kể về dấu và giá trị của các hệ số hồi quy ước lượng được. 10 • Chú ý: - Trong thực tế đa cộng tuyến hoàn hảo gần như không bao giờ xảy ra vì sự phụ thuộc hàm số giữa các biến độc lập chỉ tồn tại về mặt lý thuyết. Do đó trong các mô hình hồi quy bội khi nói đến vấn đề đa cộng tuyến thì chúng ta hiểu đó là hiện tượng đa cộng tuyến không hoàn hảo. - Đối với mô hình hồi quy bội người ta không xem xét vấn đề có hay không có đa cộng tuyến mà xem xét mức độ nghiêm trọng của đa cộng tuyến. - Nói chung khi có đa cộng tuyến không hoàn hảo các ước lượng nhận được vẫn có tính chất không chệch nên vẫn có thể dùng để dự báo. 11 5.3. Phát hiện ra đa cộng tuyến • Đa cộng tuyến đề cập đến điều kiện của các biến độc lập được giả thiết là phi ngẫu nhiên nên nó là vấn đề liên quan đến tệp số liệu mẫu chứ không phải của tổng thể do đó chúng ta không kiểm định đa cộng tuyến. • Không có một phương pháp thực sự hoàn thiện để phát hiện đa cộng tuyến. Chúng ta chỉ có các dấu hiệu cho thấy có thể có hiện tượng đa cộng tuyến. • Xét mô hình 12 1 2 2 ... ...i i j ji k ki iY X X X U          1. Phân tích định tính Căn cứ vào nội dung kinh tế của các biến độc lập có trong mô hình để xem xét khả năng có tồn tại hiện tượng đa cộng tuyến trong mô hình hay không. 2. Căn cứ vào các kết luận của kiểm định T và F Nếu các kết luận mâu thuẫn với nhau thì đó có thể là dấu hiệu của đa cộng tuyến. 3. Căn cứ vào hệ số tương quan của các biến độc lập: Nếu các hệ số tương quan khá cao thì có thể nghi ngờ có hiện tượng đa cộng tuyến. 13 4. Dùng hồi quy phụ - Bước 1: Hồi quy mô hình phụ sau - Bước 2: kiểm định cặp giả thiết mô hình có đa cộng tuyến mô hình không có đa cộng tuyến + Tiêu chuẩn kiểm định: k số hệ số trong mô hình gốc + Miền bác bỏ với mức ý nghĩa α cho trước 14 2 1 2 2 1 1 1 1... ... ( 2 )ji i j j i j j i k ki i jX X X X X V R j k                   2 0 2 1 : 0 : 0 j j H R H R     2 2 /( 1 1) ( 2, 1) (1 ) /( 1) j j j R k F F k n k R n k           : ( 2, 1)j jW F F F k n k      5. Nhân tử phóng đại phương sai (Variance inflating factor – VIF) - Bước 1: Hồi quy biến Xj với các biến độc lập còn lại tìm được - Bước 2: Xác định đại lượng - Nếu VIF(Xj) > 10 thì Xj có thể cộng tuyến với các biến độc lập còn lại. 15 2 jR 2 1 ( ) ( 2 ) 1j j VIF X j k R     6. Độ đo Theil - Bước 1: hồi quy mô hình đã cho thu được R2 - Bước 2: Lần lượt hồi quy các mô hình sau: - Bước 3: Xác định đại lượng + Nếu thì mô hình gốc không có đa cộng tuyến + Nếu thì mô hình gốc có đa cộng tuyến hoàn hảo - Như vậy độ đo Theil đo mức độ cộng tuyến chung của mô hình. 16 2 1 2 2 1 1 1 1... ... ( 2 )i i j j i j j i k ki i jY X X X X V R j k                   2 2 2 2 ( ) k j j m R R R     5.4. Khắc phục hiện tượng đa cộng tuyến 1. Sử dụng thông tin tiên nghiệm • Các thông tin tiên nghiệm được khai thác từ kinh nghiệm thông qua quan sát thực tế hoặc sử dụng các kết luận của kinh tế học. • Sử dụng các thông tin tiên nghiệm ta có thể ước lượng một phần các hệ số hồi quy • Ví dụ • Nếu có cơ sở cho rằng hàm sản xuất này có tính chất hiệu quả không đổi theo quy mô thì ta sử dụng kết luận: β2 + β3 = 1 để ước lượng mô hình sau: • Mô hình này không có đa cộng tuyến 17 32 1 1 2 3ln ln ln ln iU i i i i i i iQ K L e Q K K U          2 2 21 1 1 1 2( ) ln( ) ln ln( )i i U Ui i i i i i i i i i i i Q K Q K Q K L e e U L L L L             2. Sử dụng mô hình sai phân cấp 1 • Xét mô hình 3 biến với số liệu theo thời gian • Tại thời điểm (t-1) ta có mô hình: • Giả sử X2 và X3 có đa cộng tuyến. Khi đó ta xét mô hình sau: Mô hình này gọi là mô hình sai phân cấp 1 • Thực tế cho thấy mô hình sai phân cấp 1 đã giảm được đáng kể mức độ đa cộng tuyến của mô hình gốc. 18 1 2 2 3 3t t t tY X X U      1 1 2 2 1 3 3 1 1t t t tY X X U         1 2 2 2 1 3 3 3 1 1 * * * 2 2 3 3 ( ) ( ) ( )t t t t t t t t t t t t Y Y X X X X U U Y X X V                   • Hạn chế của phương pháp này: - Chỉ dùng được với những số liệu theo thời gian - Không ước lượng được - Mất đi một quan sát đầu tiên - Ut có thể thoả mãn mọi giả thiết của OLS song Vt thì có thể vi phạm. 19 3. Giảm đa cộng tuyến trong mô hình hồi quy đa thức • Khái niệm đa cộng tuyến chỉ tồn tại ở bậc nhất chứ không ở các bậc khác. Vì vậy không có đa cộng tuyến giữa các bậc của đa thức song có thể có đa cộng tuyến trong bản thân dãy số liệu của biến độc lập. Vì vậy để giảm bớt mức độ đa cộng tuyến ta có thể chuyến sang hồi quy mô hình sai phân với giá trị trung bình • Xét mô hình: - Ta xây dựng mô hình: - Thay vì tuyến tính hoá mô hình (1) và ước lượng nó ta sẽ ước lượng mô hình (2). 20 2 3 1 2 3 4 (1)i i i i iTC Q Q Q U        2 3 1 2 3 4 * * * * 1 2 2 3 3 4 4 ( ) ( ) ( ) (2) i i i i i i i i i i TC TC Q Q Q Q Q Q U TC Q Q Q U                        4. Một số biện pháp khác • Tăng kích thước mẫu hoặc lấy mẫu mới nếu có thể. • Bỏ bớt biến độc lập ra khỏi mô hình nếu có thể. 21
Tài liệu liên quan