NỘI DUNG CHƯƠNG 5
I. Kỳ vọng của sai số ngẫu nhiên khác không
II. Phương sai sai số thay đổi
III. Sai số ngẫu nhiên không tuân theo quy luật chuẩn
IV. Vấn đề đa cộng tuyến
V. Mô hình chứa biến không thích hợp
22 trang |
Chia sẻ: thanhtuan.68 | Lượt xem: 2932 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Bài giảng Kinh tế lượng - Chương 5 Kiểm định và lựa chọn mô hình, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
9/20/2013
1
CHƢƠNG 5
KIỂM ĐỊNH VÀ LỰA CHỌN MÔ HÌNH
1
Chương 1, 2, 3 cho thấy:
Khi giả thiết 1 → 4 thỏa mãn thì các ước lượng OLS là các
ước lượng BLUE.
Khi giả thiết 5 thỏa mãn thì các suy diễn thống kê là có giá trị.
Vậy:
Nếu một trong các giả thiết không được thỏa mãn?
Khi đó thì làm thế nào để thu được ước lượng tốt nhất, và các
suy diến thống kê đáng tin cây?
=> Nội dung chương 5.
2
CHƢƠNG 5: KIỂM ĐỊNH VÀ LỰA CHỌN MÔ HÌNH
9/20/2013
2
NỘI DUNG CHƢƠNG 5
I. Kỳ vọng của sai số ngẫu nhiên khác không
II. Phương sai sai số thay đổi
III. Sai số ngẫu nhiên không tuân theo quy luật chuẩn
IV. Vấn đề đa cộng tuyến
V. Mô hình chứa biến không thích hợp
3
I. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG
Giả thiết 2: Kỳ vọng của sai số ngẫu nhiên với điều kiện X
bằng 0.
E(ui| Xi) = 0
Phụ lục 1.2 (trang 77) cho thấy rằng nếu giả thiết 2 thỏa mãn
thì sẽ có:
E(u) = 0 (5.1)
cov(X, u) = 0 (5.2)
=> Nếu (5.1) hoặc (5.2) không thỏa mãn thì giả thiết 2 sẽ
không còn thỏa mãn.
4
9/20/2013
3
I. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG
Minh họa giả thiết 2:
Trung bình sai số ngẫu nhiên tại mỗi giá trị Xi: E(u/X=Xi)=0
5
1 2( | )i i iE Y X X
•
•
•
•
Xn Xi X1
Y
X
•
•
•
ui: E(ui|Xi) =0
u1: E(u1|X1) =0
I. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG
1. Nguyên nhân của kỳ vọng sai số ngẫu nhiên khác
không
Mô hình thiếu biến quan trọng
Dạng hàm sai
Tính tác động đồng thời của số liệu
Sai số đo lường của các biến độc lập
6
9/20/2013
4
I. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG
2. Hậu quả của kỳ vọng sai số ngẫu nhiên khác không
Ước lượng OLS sẽ là ước lượng chệch
Các suy diễn thống kê không còn đáng tin cậy
Lượng chệch của các ước lượng OLS:
𝐸 𝛽 𝑗 − 𝛽𝑗
Và lim
𝑛→∞
𝐸 𝛽 𝑗 − 𝛽𝑗 =
𝑐𝑜𝑣(𝑋𝑗,𝑢)
𝑣𝑎𝑟(𝑋𝑗)
=> Lượng chệch không mất đi kể cả khi kích thước mẫu lớn vô
cùng
7
I. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG
Lượng chệch khi mô hình thiếu biến:
• Mô hình phù hợp: Y = β1 + β2X2 + β3X3 + u1
• Mô hình sử dụng: Y = α1 + α2X2 + u2
• ⇒ 𝑬 𝜶 𝟐 = 𝜷𝟐 + 𝜷𝟑𝒃 𝟐 với 𝑏 2 là hệ số góc ước lượng của mô
hình: X3 = b1 + b2X2 + v
• => Lượng chệch 𝜷𝟑𝒃 𝟐 => Chiều của lượng chệch khi mô hình
thiếu biến:
8
r23 > 0 r23<0
+ -
- +
3 0
3 0
9/20/2013
5
I. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG
3. Phát hiện về sự khác không của kỳ vọng sai số ngẫu nhiên
a) Mô hình bỏ sót biến quan trọng
Xét mô hình gốc: (5.3)
Liệu mô hình (5.3) có bỏ sót biến Z hay không? (có số liệu về
biến Z)
=> Ước lượng mô hình: (5.4)
=> Kiểm định cặp giả thuyết:
H0: αk+1 = 0
H1: αk+1 ≠ 0
=> Thực hiện bằng kiểm định T hoặc kiểm định F
9
1 2 2 .. k kY X X u
1 2 2 1.. k k kY X X Z v
I. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG
b) Mô hình có dạng hàm sai
Kiểm định Ramsey:
Xét mô hình gốc: Yi = β1 + β2 Xi + β3 X3i + ui
Tư tưởng của kiểm định Ramsey: sử dụng dạng mũ của
giá trị ước lượng của biến phụ thuộc, ,
để thay thế cho tổ hợp của các biến dạng mũ của các
biến độc lập.
10
m
iii YYY
ˆ&...ˆ;ˆ 32
9/20/2013
6
Các bước thực hiện kiểm định Ramsey:
B1: Ước lượng mô hình gốc =>
B2: Ước lượng mô hình hồi quy phụ:
Việc đưa thành phần dạng lũy thừa của vào mô hình hồi quy
mới không bị hạn chế, nhưng thông thường dừng ở lũy thừa
bậc 2 hoặc bậc 3.
11
iYˆ
i
m
imiiiii vYYYXXY
13
2
2
133221
ˆ...ˆˆ
I. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG
I. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG
B3: Kiểm định cặp giả thuyết:
Hay:
H0: Mô hình gốc có dạng hàm đúng - không thiếu biến
H1: Mô hình gốc có dạng hàm sai - thiếu biến
=> Thực hiện bằng kiểm định F.
12
0...:
0...:
22
2
2
11
210
m
m
H
H
9/20/2013
7
I. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG
Một số kiểm định khác
Kiểm định Davidson – Mac Kinnon (kiểm định J)
Kiểm định sử dụng hàm gộp
(Giáo trình trang 212 – 214)
13
I. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG
4. Một số biện pháp khắc phục
Thêm biến Z bị thiếu vào mô hình (nếu có số liệu của Z)
Xem xét các mô hình thay thế; hoặc thêm các biến dạng
bình phương, lập phương của các biến độc lập đã có trong
mô hình.
Thiếu biến không quan sát được: sử dụng biến đại diện;
hoặc sử dụng phương pháp biến công cụ.
14
9/20/2013
8
II. PHƢƠNG SAI SAI SỐ THAY ĐỔI
Giả thiết 3: Phương sai của sai số ngẫu nhiên là bằng nhau
tại mọi giá trị Xi 𝑉𝑎𝑟 𝑢 𝑋𝑖 = 𝜎
2
Minh họa:
15
1 2( | )i i iE Y X X
Xn X2 X1
f(u|X)
X
Y
Phân phối
của u tại X1
Phân phối
của u tại Xn
Phân phối
của u tại X2
II. PHƢƠNG SAI SAI SỐ THAY ĐỔI
Giả thiết 3 bị vi phạm, tức là sai số ngẫu nhiên u có phương
sai thay đổi: 𝑉𝑎𝑟 𝑢 𝑋𝑖 = 𝜎𝑖
2
Minh họa:
16
1 2( | )i i iE Y X X
Xn X2 X1
f(u|X)
X
Y
Phân phối
của u tại X1
Phân phối
của u tại Xn
Phân phối
của u tại X2
9/20/2013
9
II. PHƢƠNG SAI SAI SỐ THAY ĐỔI
1. Nguyên nhân của phƣơng sai sai số (PSSS) thay đổi
Do bản chất của số liệu
Do mô hình thiếu biến quan trọng hoặc dạng hàm sai
17
2. Hậu quả của phƣơng sai sai số thay đổi
Các ước lượng OLS cho các hệ số vẫn là các ƣớc lƣợng
không chệch:
Các ước lượng hệ số không còn là ước lượng tốt nhất nữa
bị ước lượng chệch, do đó các khoảng tin cậy và
kết luận kiểm định về các giả thuyết thống kê đối với hệ số
hồi quy là không còn giá trị (không chính xác).
)ˆ( jVar
jjE )
ˆ(
18
II. PHƢƠNG SAI SAI SỐ THAY ĐỔI
9/20/2013
10
3. Phát hiện PSSS thay đổi
Xét mô hình:
Yi = β1 + β2 X2i + β3 X3i + + βk Xki + ui
Do giả thiết 2: E(u/X2i,,Xki) = 0
19
),...,/(
)),...,/((),...,/(
),...,/(
2
2
2
22
2
2
kii
kiikii
kii
XXuE
XXuEXXuE
XXuVar
II. PHƢƠNG SAI SAI SỐ THAY ĐỔI
II. PHƢƠNG SAI SAI SỐ THAY ĐỔI
Các biện pháp phát hiện PSSS thay đổi:
Sử dụng đồ thị phần dư
Kiểm định Breusch – Pagan (giáo trình)
Kiểm định White
Kiểm định dựa trên biến phụ thuộc
Một số kiểm định khác: Park, Glejer (giáo trình)
20
9/20/2013
11
II. PHƢƠNG SAI SAI SỐ THAY ĐỔI
Kiểm định White
Với n đủ lớn thì phương sai của các hệ số ước lượng là tiệm cận
với phương sai đúng nếu giả thiết 3’ được thỏa mãn.
Giả thiết 3': không tương quan với các biến độc lập, bình
phương của các biến độc lập, và tích chéo của các biến độc
lập.
=> Xét xem liệu có tương quan với các biến độc lập và
tích các biến độc hay không nhằm đánh giá mô hình gốc có
PSSS thay đổi hay đồng đều. 21
2
iu
2
iu
Các bƣớc thực hiện kiểm định White:
Xét mô hình gốc: Yi = β1 + β2 X2i + β3 X3i + ui (5.5)
Bƣớc 1: Ước lượng mô hình hồi quy gốc => phần dư ei
Bƣớc 2: Ước lượng mô hình hồi quy phụ:
(**)
Bƣớc 3: Xét cặp giả thuyết:
hay H0 : Mô hình gốc có PSSS đồng đều
H1 : Mô hình gốc có PSSS thay đổi
iiii
iiii
vXXX
XXXe
326
2
35
2
2433221
2
22
II. PHƢƠNG SAI SAI SỐ THAY ĐỔI
9/20/2013
12
Có 2 cách kiểm định có thể thực hiện:
Kiểm định F:
Tính
Nếu Fqs > Fα (k(**) -1; n – k(**) ) thì bác bỏ H0; chấp nhận H1
Kiểm định X2 :
Tính:
Nếu thì bác bỏ H0 ; chấp nhận H1
1
.
1 (**)
(**)
2
(**)
2
(**)
k
kn
R
R
Fqs
23
2
(**)
2 .Rnqs
)1( (**)
22 kqs
II. PHƢƠNG SAI SAI SỐ THAY ĐỔI
Lưu ý:
Kiểm định trên được gọi là kiểm định White có tích chéo do
trong mô hình (**) có chứa thành phần tích chéo giữa các biến
độc lập ( X2i * X3i )
Trong nhiều trường hợp có thể bỏ đi số hạng chứa tích chéo
=> Kiểm định White không tích chéo.
Mô hình (**) nhất định phải có hệ số chặn.
Dạng thu gọn của kiểm định White là có thể hồi quy theo
từng thành phần X2i ; X3i ; riêng biệt mà không cần kết
hợp trong một phương trình.
24
2
ie
2
3
2
2 ; ii XX
II. PHƢƠNG SAI SAI SỐ THAY ĐỔI
9/20/2013
13
II. PHƢƠNG SAI SAI SỐ THAY ĐỔI
Kiểm định dựa trên biến phụ thuộc
Thay vì xét hàm hồi quy phụ (**) ta xét hàm hồi quy phụ sau:
(***)
và kiểm định cặp giả thuyết:
H0:
H1:
25
2 2
1 2 3
ˆ ˆ wi i i ie Y Y
2 3 0
2 2
2 3 0
II. PHƢƠNG SAI SAI SỐ THAY ĐỔI
4. Khắc phục phƣơng sai sai số thay đổi
PSSS thay đổi có thể do mô hình thiếu biến hoặc dạng
hàm sai => xem xét xem liệu mô hình có gặp phải hai
vấn đề này không?
Phương pháp bình phương bé nhất tổng quát (GLS –
generalized least squares)
Ước lượng sai số chuẩn vững (robut standard error)
26
9/20/2013
14
II. PHƢƠNG SAI SAI SỐ THAY ĐỔI
a) Phương pháp bình phương bé nhất tổng quát
Các bước thực hiện:
Bước 1: Nhận biết được dạng thay đổi của phương sai sai số
Bước 2: Biến đổi tương đương để đưa mô hình gốc về một mô
hình mới mà sai số ngẫu nhiên trong mô hình mới này có phương
sai sai số không đổi
(Tổng quát: nếu thì chia cả hai vế của mô hình gốc cho Ki)
Bước 3: Sử dụng phương pháp OLS để ước lượng mô hình mới.
Bước 4: Từ các hệ số ước lượng của mô hình mới suy ra các hệ số
ước lượng của mô hình gốc
27
222 . ii K
II. PHƢƠNG SAI SAI SỐ THAY ĐỔI
Ví dụ: Xét mô hình: (5.6)
Giả sử:
=> Chia cả hai vế của (5.6) cho X2i:
(5.7)
hay:
(5.8)
với:
Phương sai sai số ngẫu nhiên của mô hình mới:
28
1 2 2 .. k kY X X u
2 2 2
2i iX
31
2 3
2 2 2 2 2
..i i ki ik
i i i i i
Y X X u
X X X X X
* * * *
2
2 2 2 2
1
, , ,i ki ii i ki i
i i i i
Y X u
Y X X u
X X X X
constX
X
uVar
XX
u
VaruVar
i
i
i
ii
i
i
222
2
2
22
*
2
2
..
1
)(.)
1
()()(
***
33
*
221
* ... ikikiii uXXXY
9/20/2013
15
II. PHƢƠNG SAI SAI SỐ THAY ĐỔI
b) Ước lượng sai số chuẩn
Tư tưởng: vẫn sử dụng các hệ số ước lượng từ phương pháp OLS, tuy
nhiên phương sai các hệ số ước lượng thì được tính toán lại mà không
sử dụng đến giả thiết phương sai sai số không đổi.
Ví dụ: với mô hình hồi quy hai biến, ta có:
(5.9)
=> Thay công thức (5.9) bởi công thức sau:
(5.10)
=> Sai số chuẩn vững bằng căn bậc hai của (5.10). Khi n đủ lớn thì
(5.10) tiệm cận về giá trị đúng (5.9)
29
2 2
2
1
2 2
2
2
1
ˆar( )
n
i i
i
n
i
i
x
v
x
2 2
2
1
2 2
2
2
1
ˆar( )
n
i i
i
n
i
i
x e
v
x
III. SAI SỐ NGẪU NHIÊN KHÔNG TUÂN THEO
QUY LUẬT CHUẨN (*)
1. Hậu quả khi sai số ngẫu nhiên không tuân theo quy luật
chuẩn
Các ước lượng OLS vẫn là các ước lượng BLUE
Các thống kê T và F không tuân theo quy luật Student và quy luật
Fisher tương ứng. Khi đó:
Nếu kích thước mẫu nhỏ thì các suy diễn thống kê không
đáng tin cậy.
Với mẫu kích thước lớn thì các suy diễn thống kê vẫn có giá
trị. 30
9/20/2013
16
III. SAI SỐ NGẪU NHIÊN KHÔNG TUÂN THEO
QUY LUẬT CHUẨN (*)
2. Phát hiện sai số ngẫu nhiên không tuân theo quy
luật chuẩn
(1) Xem xét đồ thị phần dư
(2) Kiểm định Jacque – Bera (JB)
31
III. SAI SỐ NGẪU NHIÊN KHÔNG TUÂN THEO
QUY LUẬT CHUẨN (*)
Kiểm định Jacque – Bera (JB):
Kiểm định: H0: u tuân theo phân phối chuẩn
H1: u không tuân theo phân phối chuẩn
B1: Ước lượng mô hình gốc => ei
B2: Tính thống kê kiểm định: 𝐽𝐵 = 𝑛(
𝑆2
6
+
𝐾−3 2
24
)
Với S là hệ số bất đối xứng (Skewness); K là hệ số nhọn (Kurtosis) của chuỗi phần dư:
B3: Nếu JB > χ2α(2) thì bác bỏ H0; chấp nhận H1
Ngược lại, chưa đủ cơ sở bác bỏ H0
32
3
2 3/2
/
( / )
i
i
i
i
e n
S
e n
4
2 2
/
( / )
i
i
i
i
e n
K
e n
9/20/2013
17
1. Khái niệm đa cộng tuyến trong mô hình hồi quy
Khi giữa các biến độc lập không có quan hệ đa cộng
tuyến hoàn hảo nhưng có mối liên hệ tuyến tính khá chặt,
ta nói rằng mô hình có hiện tượng đa cộng tuyến
(multicollinearity).
Hiện tượng đa cộng tuyến trong mô hình hồi quy thể hiện
mối quan hệ tuyến tính giữa các biến độc lập trong mô
hình hồi quy chứ không quan tâm đến biến phụ thuộc
trong mô hình.
33
IV. VẤN ĐỀ ĐA CỘNG TUYẾN
Xét mô hình hồi quy bội:
(5.11)
Hồi quy biến độc lập Xj theo các biến độc lập còn lại:
(*)
Nếu : Có ĐCT hoàn hảo giữa các biến X2 ; X3 ; ;
Xk
Nếu : Có ĐCT cao (ĐCT không hoàn hảo) giữa các
biến X2 ; X3 ; ; Xk
uXXXY kk ...33221
vXXXXX kkjjjjj ...... 1111221
12* R
12* R
34
IV. VẤN ĐỀ ĐA CỘNG TUYẾN
9/20/2013
18
IV. VẤN ĐỀ ĐA CỘNG TUYẾN
2. Nguyên nhân của đa cộng tuyến
Do bản chất mối quan hệ giữa các biến số
Do mô hình có dạng đa thức
Do mẫu không mang tính đại diện
35
3. Hậu quả của đa cộng tuyến
ĐCT hoàn hảo: không ước lượng được mô hình
ĐCT cao (ĐCT không hoàn hảo): không vi phạm giả thiết
nào của định lý Gauss – Markov nên không ảnh hưởng gì
đến tính “tốt nhất” của các ước lượng OLS.
=> Nhƣ vậy mô hình có ĐCT cao thì các ƣớc lƣợng thu
đƣợc vẫn là các ƣớc lƣợng tuyến tính, không chệch và tốt
nhất (có phƣơng sai nhỏ nhất).
36
IV. VẤN ĐỀ ĐA CỘNG TUYẾN
9/20/2013
19
Hậu quả của ĐCT cao trong mô hình hồi quy:
Khoảng tin cậy của βj rộng, nghĩa là ước lượng trở nên
kém chính xác.
Hệ số ước lượng dễ mất ý nghĩa thống kê.
Dấu của hệ số ước lượng của Xj có thể ngược so với kỳ
vọng.
Một sự thay đổi dù bé trong mẫu cũng có thể gây ra một sự
thay đổi khá lớn trong kết quả ước lượng (do lớn) )ˆ( jVar
37
IV. VẤN ĐỀ ĐA CỘNG TUYẾN
IV. VẤN ĐỀ ĐA CỘNG TUYẾN
4. Phát hiện đa cộng tuyến
(1) Xem xét hệ số xác định của các mô hình hồi quy phụ
.
(j = 2,3,.., k) là hệ số xác định của mô hình hồi quy
phụ Xj theo các biến độc lập còn lại.
Nếu lớn thì có thể mô hình gốc có hiện tượng đa
cộng tuyến cao.
38
2
jR
2
jR
2
jR
9/20/2013
20
(2) Xem xét hệ số phóng đại phƣơng sai (VIF- variance
inflation factor):
Quy tắc chung: nếu VIF > = 10 thì đó là dấu hiệu có
ĐCT cao
21
1
jR
VIF
39
IV. VẤN ĐỀ ĐA CỘNG TUYẾN
(3) Tính hệ số tƣơng quan cặp giữa các biến độc lập Xj
Nếu hệ số tương quan cặp giữa hai biến độc lập nào đó
lớn (có trị tuyệt đối lớn hơn 0.8) thì có thể xem như mô
hình có ĐCT cao.
Tuy nhiên, hệ số tương quan cặp giữa các biến độc lập
không cao không có nghĩa là không có ĐCT.
40
IV. VẤN ĐỀ ĐA CỘNG TUYẾN
9/20/2013
21
5. Một số biện pháp khắc phục
Gia tăng kích thước mẫu (tăng n)
Sử dụng thông tin tiên nghiệm
Sử dụng kỹ thuật phân tích nhân tố để tách lọc thông tin
từ các biến độc lập.
Bỏ bớt biến
Lưu ý: Trong mô hình hồi quy luôn luôn xảy ra ĐCT, điều đáng
quan tâm là ĐCT ở mức cao hay thấp. Nếu hậu quả của ĐCT đối
với mô hình hồi quy là không quá nghiêm trọng thì ta chưa
cần quan tâm tới vấn đề khắc phục.
41
IV. VẤN ĐỀ ĐA CỘNG TUYẾN
V. MÔ HÌNH CHỨA BIẾN KHÔNG THÍCH HỢP
1. Hậu quả của việc chứa biến không thích hợp
Các ước lượng OLS vẫn là các ước lượng không chệch
Phương sai các hệ số ước lượng sẽ lớn. Do đó:
Khoảng tin cậy cho các hệ số hồi quy sẽ trở nên rộng hơn
Các tỷ số t trở nên bé hơn và dẫn đến làm mất ý nghĩa thống
kê của các hệ số ước lượng.
42
9/20/2013
22
V. MÔ HÌNH CHỨA BIẾN KHÔNG THÍCH HỢP
2. Phát hiện biến không thích hợp
Để phát hiện một biến là có thích hợp hay không: sử
dụng kiểm định t để kiểm định về sự bằng 0 của hệ số
của biến này.
Để phát hiện hai hay nhiều biến là có thích hợp hay
không: sử dụng kiểm định F – kiểm định nhiều ràng
buộc
43