Giới thiệu
• Giả sử Y là các biến chất:
– Chấp nhận hay không chấp nhận việc làm/ mức lương?
– Mua nhà hay thuê nhà/ thu nhập, số con, tình trạng gia đình
– Đi bằng phương tiện cá nhân hay xe buýt/ khoảng cách phải đi bộ, giá xăng,.
• Khi đó có thể “lượng hóa” các biến chất này như sau: (giả sử trong mỗi trường hợp chỉ có 2 loại lựa chọn)
– Chấp nhận việc (mua nhà, đi xe máy): Y =1
– Không nhận việc (thuê nhà, đi xe buýt): Y = 0
• Quan tâm đến xác suất p=P(Y = 1|X) = f(X) và tác động của X lên xác suất này
• 3 loại mô hình tương ứng với 3 dạng hàm của p
– Mô hình xác suất tuyến tính
– Mô hình logit
– Mô hình probit
18 trang |
Chia sẻ: thanhtuan.68 | Lượt xem: 1044 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Bài giảng Kinh tế lượng cho cao học - Mô hình với biến phụ thuộc là biến định tính, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Mô hình với biến phụ thuộc
là biến định tính
Giới thiệu
• Giả sử Y là các biến chất:
– Chấp nhận hay không chấp nhận việc làm/ mức lương?
– Mua nhà hay thuê nhà/ thu nhập, số con, tình trạng gia đình
– Đi bằng phương tiện cá nhân hay xe buýt/ khoảng cách
phải đi bộ, giá xăng,..
• Khi đó có thể “lượng hóa” các biến chất này như sau: (giả sử
trong mỗi trường hợp chỉ có 2 loại lựa chọn)
– Chấp nhận việc (mua nhà, đi xe máy): Y =1
– Không nhận việc (thuê nhà, đi xe buýt): Y = 0
• Quan tâm đến xác suất p=P(Y = 1|X) = f(X) và tác động của X
lên xác suất này
• 3 loại mô hình tương ứng với 3 dạng hàm của p
– Mô hình xác suất tuyến tính
– Mô hình logit
– Mô hình probit
Mô hình xác suất tuyến tính (LPM)
Ví dụ: Y = β1 + β2X + u (*)
Trong đó Y: = 1 nếu một người là có nhà riêng
= 0 nếu không có nhà riêng
X: thu nhập
Ký hiệu: pi = P(Y=1|Xi)
=> E(Y|Xi ) = 1*pi + (1-pi)*0 = pi
Với gỉa thiết E(u|Xi) =0
(*) ~ E(Y|Xi) = β1 + β2Xi
=> mô hình (*): mô hình xác suất tuyến tính
Yi
pi
1 0
1-pi
x/s
pi = β1 + β2Xi
Mô hình xác suất tuyến tính (LPM)
• Kiểm tra các giả thiết của OLS với mô hình LPM:
• Ngoài ra:
Yi
pi
1 0
1-pi
ui
x/s
1-(β1 + β2Xi ) -(β1 + β2Xi)
pi 1-pi
x/s
var(ui) = pi (1-pi); không đều ui không phân phối chuẩn
Các UL của E(Y|Xi) sẽ không
nhất thiết nằm trong đoạn [0,1]
ước lượng mô hình LPM
• Ví dụ 5.1 (mở eviews ch11.bt2 và thực hiện hồi quy)
• Bước 1: Dùng OLS, thu được ei
• Bước 2: Biến đổi biến số (giải quyết vấn đề PSSS thay
đổi)
Yi/sqrt(ei) = β1/sqrt(ei) + β2/sqrt(ei) Xi + ui/sqrt(ei)
Từ các ước lượng của mô hình cuối cùng này rút ra các
ước lượng cho mô hình gốc
• Các vấn đề đối với mô hình LPM
– phương sai của sai số không đều
– u không phân bố chuẩn,...
– pi tuyến tính theo X. !!!!!
Mô hình xác suất phi tuyến:
Mô hình logit
Mô hình probit
Mô hình logit- giới thiệu
• Trong mô hình logit, pi được giả định có dạng
• Nhận xét: pi không còn là hàm tuyến tính (theo X và β)
• => Không áp dụng trực tiếp phương pháp OLS được
• Tùy vào dạng của số liệu để có phương pháp UL phù
hợp
pi =
exp(β1+ β2X2i)
1+exp(β1+ β2X2i)
Phương pháp Goldberger
Nếu số liệu có dạng cá thể, không theo nhóm =>
phương pháp Goldberger: PP ước lượng hợp lý tối đa để
ước lượng β1 và β2 .
Ví dụ: ch11bt2 (chạy eviews minh họa):
Variable Coefficient Std. Error z-Statistic Prob.
C -6.55 1.95 -3.34 0.00
X 0.38 0.11 3.45 0.00
=>ước lượng của β1 = -6.55; ULcủa β2 = 0.38
Đọc kết quả ước lượng
• Từ các kết quả ước lượng tính được:
– Xác suất để Y = 1 khi X = X0 nào đó
ULpi = P(Y = 1| X=X0) =
– Ảnh hưởng biên của X đến P(Y = 1) bằng
• Ví dụ 5.2: ước lượng của β1 = -6.552181; của β2 =
0.38
)ˆˆexp(1
)ˆˆexp(
021
021
X
X
2
ˆ)1(/ iii ppXp
Đọc kết quả ước lượng (tiếp)
=> xác suất để một người là có nhà khi thu nhập = 20 là:
Exp(- 6.55+0.38x20)/[1+ Exp(- 6.55+0.38x20) ]= 0.74
Khi lương tăng lên từ 20 lên 21 đơn vị thì xác suất người
đó có nhà sẽ tăng lên:
= 0.74x(1-0.74)x0.38 = 0.073
Phương pháp Berkson
• Nếu số liệu là phân theo nhóm
• Khi đó ước lượng được pi cho mỗi nhóm để tính Li: Giả sử
trong mẫu, nhóm tương ứng với X = xi có Ni phần tử,
trong đó có ni phần tử có Y = 1=> UL của pi là ni/Ni => UL
của Li
• Mô hình (**) là tuyến tính, và L không bị chặn => có thể
dùng OLS để thu được các ước lượng cho β1 và β2 như
thông thường
pi =
exp(β1+ β2X2i)
1+exp(β1+ β2X2i)
ln(pi/(1-pi) = β1+ β2Xi
Li=: ln(pi/(1-pi)) +ui = β1+ β2Xi +ui (**)
Tiếp
• Tuy nhiên sai số ngẫu nhiên ui trong (**) có PSSS thay đổi
như sau:
• Khi Ni là khá lớn thì ui ~ N(0, (Nipi(1-pi))-1)
• Do đó nên trước khi ước lượng bằng OLS thì phải biến đổi
mô hình để giải quyết vấn đề này (phương pháp bình
phương bé nhất có trọng số WLS)
• Các bước thực hiện:
– tính: pi (=ni/Ni); Li =ln(pi/1-pi); w = (Nipi(1-pi))
– Đổi biến: Li* = Liw1/2; Xi* = Xi*w1/2
– Dùng OLS ước lượng: Li* =α*1w+ α*2 Xi*+vi
– Trong đó α*1= β1w0.5 ; α*2= β2
Đọc kết quả ước lượng
• Kết qủa ước lượng ch11bt3
• L* = - 0.47 w1/2 + 0.05 X*
• ước lượng của α*1 là: -0.47; của α*2 là: 0.05
• Tại X = 20: w = 17.49; X* = X .17.491/2 = 20x 4.18 = 86.3
• L*(X=20) = - 0.47 x 4.18 +0.05x86.3 =2.35
• L(X=20) = 2.35/4.18 = 0.56 => p/(1-p) = exp(0.56) = 1.75;
p = 1.75/2.75= 0.64
• Mức tác động biên tại X=20:
• p(1-p)β2 = 0.64(1-0.64)0.05 = 0.011
• Nếu thu nhập tăng từ 20 lên 21 đơn vị thì xác suất để
người đó có nhà tăng từ 0.64 lên (0.64+ 0.011)
thể hiện mức độ yêu thích,
cơ hội của Y =1 so với Y = 0
số liệu theo nhóm
• Mi Ni X p =M/N L=ln(p/1-p)
• 8.00 40.00 6.000 8/40 (0.2) -1.38
• 12.00 50.00 8.000 12/50(0.24) -1.15
• 18.00 60.00 10.00 18/60(0.3) -0.85
• 28.00 80.00 13.00 28/80(0.175) -1.55
• 45.00 100.0 15.00 45/100(0.45) -0.2
• 36.00 70.00 20.00 36/70(0.51) 0.04
• 39.00 65.00 25.00 39/65(0.6) 0.41
• 33.00 50.00 30.00 33/50(0.66) 0.66
• 30.00 40.00 35.00 30/40(0.75) 1.1
• 20.00 25.00 40.00 20/25(0.8) 1.39
•
X: thu nhập; Ni: số hộ có thu nhập Xi; Mi: số hộ có thu nhập Xi
mà có nhà riêng
Mô hình probit
• Giả sử dạng hàm của p là: pi = F( β1+ β2Xi)
F( β1+ β2Xi)= hàm phân phối tích lũy chuẩn hóa
PP ước lượng hợp lý tối đa để ước lượng β1 và β2 .
• Giải thích kết quả ước lượng:
– Dự báo xác suất pi khi X = X0: pi = F( β1+ β2X0)
– Tác động biên của X lên xác suất để Y = 1
∂pi/ ∂X = f(β1+ β2Xi) β2
Mô hình Probit
2
1 2Xi
/21
2
te dt
Mô hình Probit
• Ví dụ 5.4: dùng probit ước lượng số liệu ch11bt1 thu được
• Đọc kết quả: xác suất để một người là có nhà riêng khi thu nhập
=20:
• F(-3.57+0.21x20)=F(0.63) =0.7357
• Tác động biên khi X =20 là: ∂pi/ ∂X|(X = 20) =f((-3.57+0.21x20)*0.21
• =f(0.63)*0.21 =(2π)-0.5exp[(-0.63)2/2]*0.21
Variable Coeff S. Error z-St Prob.
C -3.57 0.94 -3.82 0.00
X 0.21 0.05 3.94 0.00
Mô hình Logit và Probit
• Khá giống nhau, chỉ khác ở các giá trị đầu, đuôi
• Hàm phân phối logistic (mô hình logit) và chuẩn hóa
(probit) có khác nhau ở phương sai: (π2/3) và 1 =>
• Hệ số UL từ logit sẽ lớn hơn từ probit khoang 1.8 lần