Tuy nhiên sai số ngẫu nhiên ui trong (**) có PSSS thay đổi như sau:
Khi Ni là khá lớn thì ui ~ N(0, (Nipi(1-pi))-1)
Do đó nên trước khi ước lượng bằng OLS thì phải biến đổi mô hình để giải quyết vấn đề này (phương pháp bình phương bé nhất có trọng số WLS)
Các bước thực hiện:
tính: pi (=ni/Ni); Li =ln(pi/1-pi); w = (Nipi(1-pi))
Đổi biến: Li* = Liw1/2; Xi* = Xi*w1/2
Dùng OLS ước lượng: Li* =α*1w+ α*2 Xi*+vi
Trong đó α*1= β1w0.5 ; α*2= β2
17 trang |
Chia sẻ: haohao89 | Lượt xem: 6144 | Lượt tải: 2
Bạn đang xem nội dung tài liệu Bài giảng Mô hình với biến phụ thuộc là biến định tính, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Mô hình với biến phụ thuộc là biến định tính Giới thiệu Giả sử Y là các biến chất: Chấp nhận hay không chấp nhận việc làm/ mức lương? Mua nhà hay thuê nhà/ thu nhập, số con, tình trạng gia đình Đi bằng phương tiện cá nhân hay xe buýt/ khoảng cách phải đi bộ, giá xăng,.. Khi đó có thể “lượng hóa” các biến chất này như sau: (giả sử trong mỗi trường hợp chỉ có 2 loại lựa chọn) Chấp nhận việc (mua nhà, đi xe máy): Y =1 Không nhận việc (thuê nhà, đi xe buýt): Y = 0 Quan tâm đến xác suất p=P(Y = 1|X) = f(X) và tác động của X lên xác suất này 3 loại mô hình tương ứng với 3 dạng hàm của p Mô hình xác suất tuyến tính Mô hình logit Mô hình probit Mô hình xác suất tuyến tính (LPM) Ví dụ: Y = β1 + β2X + u (*) Trong đó Y: = 1 nếu một người là có nhà riêng = 0 nếu không có nhà riêng X: thu nhập Ký hiệu: pi = P(Y=1|Xi) => E(Y|Xi ) = 1*pi + (1-pi)*0 = pi Với gỉa thiết E(u|Xi) =0 (*) ~ E(Y|Xi) = β1 + β2Xi => mô hình (*): mô hình xác suất tuyến tính Yi pi 1 0 1-pi x/s pi = β1 + β2Xi Mô hình xác suất tuyến tính (LPM) Kiểm tra các giả thiết của OLS với mô hình LPM: Ngoài ra: Yi pi 1 0 1-pi ui x/s 1-(β1 + β2Xi ) -(β1 + β2Xi) pi 1-pi x/s var(ui) = pi (1-pi); không đều ui không phân phối chuẩn Các UL của E(Y|Xi) sẽ không nhất thiết nằm trong đoạn [0,1] ước lượng mô hình LPM Ví dụ 5.1 (mở eviews ch11.bt2 và thực hiện hồi quy) Bước 1: Dùng OLS, thu được ei Bước 2: Biến đổi biến số (giải quyết vấn đề PSSS thay đổi) Yi/sqrt(ei) = β1/sqrt(ei) + β2/sqrt(ei) Xi + ui/sqrt(ei) Từ các ước lượng của mô hình cuối cùng này rút ra các ước lượng cho mô hình gốc Các vấn đề đối với mô hình LMP phương sai của sai số không đều u không phân bố chuẩn,... pi tuyến tính theo X. !!!!! Mô hình xác suất phi tuyến:Mô hình logitMô hình probit Mô hình logit- giới thiệu Trong mô hình logit, pi được giả định có dạng Nhận xét: pi không còn là hàm tuyến tính (theo X và β) => Không áp dụng trực tiếp phương pháp OLS được Tùy vào dạng của số liệu để có phương pháp UL phù hợp pi = exp(β1+ β2X2i) 1+exp(β1+ β2X2i) Phương pháp Goldberger Nếu số liệu có dạng cá thể, không theo nhóm => phương pháp Goldberger: ước lượng hợp lý tối đa Ví dụ: ch11bt2 (chạy eviews minh họa): Variable Coefficient Std. Error z-Statistic Prob. C -6.55 1.95 -3.34 0.00 X 0.38 0.11 3.45 0.00 =>ước lượng của β1 = -6.55; của β2 = 0.38 Đọc kết quả ước lượng Từ các kết quả ước lượng tính được: Xác suất để Y = 1 khi X = X0 nào đó pi = P(Y = 1| X=X0) = Ảnh hưởng biên của X đến P(Y = 1) bằng Ví dụ 5.2: ước lượng của β1 = -6.552181; của β2 = 0.38 Đọc kết quả ước lượng (tiếp) => xác suất để một người là có nhà khi thu nhập = 20 là: Exp(- 6.55+0.38x20)/[1+ Exp(- 6.55+0.38x20) ]= 0.74 Khi lương tăng lên từ 20 lên 21 đơn vị thì xác suất người đó có nhà sẽ tăng lên: = 0.74x(1-0.74)x0.38 = 0.073 Phương pháp Berkson Nếu số liệu là phân theo nhóm Khi đó ước lượng được pi cho mỗi nhóm để tính Li: Giả sử trong mẫu, nhóm tương ứng với X = xi có Ni phần tử, trong đó có ni phần tử có Y = 1=> UL của pi là ni/Ni => UL của Li Mô hình (**) là tuyến tính, và L không bị chặn => có thể dùng OLS để thu được các ước lượng cho β1 và β2 như thông thường pi = exp(β1+ β2X2i) 1+exp(β1+ β2X2i) ln(pi/(1-pi) = β1+ β2Xi Li=: ln(pi/(1-pi)) +ui = β1+ β2Xi +ui (**) Tiếp Tuy nhiên sai số ngẫu nhiên ui trong (**) có PSSS thay đổi như sau: Khi Ni là khá lớn thì ui ~ N(0, (Nipi(1-pi))-1) Do đó nên trước khi ước lượng bằng OLS thì phải biến đổi mô hình để giải quyết vấn đề này (phương pháp bình phương bé nhất có trọng số WLS) Các bước thực hiện: tính: pi (=ni/Ni); Li =ln(pi/1-pi); w = (Nipi(1-pi)) Đổi biến: Li* = Liw1/2; Xi* = Xi*w1/2 Dùng OLS ước lượng: Li* =α*1w+ α*2 Xi*+vi Trong đó α*1= β1w0.5 ; α*2= β2 Đọc kết quả ước lượng Kết qủa ước lượng ch11bt3 L* = - 0.47 w1/2 + 0.05 X* ước lượng của α*1 là: -0.47; của α*2 là: 0.05 Tại X = 20: w = 17.49; X* = X .17.491/2 = 20x 4.18 = 86.3 L*(X=20) = - 0.47 x 4.18 +0.05x86.3 =2.35 L(X=20) = 2.35/4.18 = 0.56 => p/(1-p) = exp(0.56) = 1.75; p = 1.75/2.75= 0.64 Mức tác động biên tại X=20: p(1-p)β2 = 0.64(1-0.64)0.05 = 0.011 Nếu thu nhập tăng từ 20 lên 21 đơn vị thì xác suất để người đó có nhà tăng từ 0.64 lên (0.64+ 0.011) thể hiện mức độ yêu thích, cơ hội của Y =1 so với Y = 0 Mô hình probit Mô hình Probit Giả sử dạng hàm của P là: Pi = F( β1+ β2Xi) F: hàm phân phối tích lũy chuẩn hóa Ví dụ 5.4: dùng probit ước lượng số liệu ch11bt1 thu được Đọc kết quả: xác suất để một người là có nhà riêng khi thu nhập =20: F(-3.57+0.21x20)=F(0.63) =0.7357 Tác động biên khi X =20 là: ∂pi/ ∂X|(X = 20) =f((-3.57+0.21x20)*0.21 =f(0.63)*0.21 =(2π)-0.5exp[(-0.63)2/2]*0.21 Giải thích kết quả ước lượng: Dự báo xác suất pi khi X = X0: Pi = F( β1+ β2X0) Tác động biên của X lên xác suất để Y = 1 ∂pi/ ∂X = f(β1+ β2Xi) β2 Mô hình Probit Mô hình Logit và Probit Khá giống nhau, chỉ khác ở các giá trị đầu, đuôi Hàm phân phối logistic (mô hình logit) và chuẩn hóa (probit) có khác nhau ở phương sai: (π2/3) và 1 => Hệ số UL từ logit sẽ lớn hơn từ probit khoang 1.8 lần số liệu theo nhóm Mi Ni X p =M/N L=ln(p/1-p) 8.00 40.00 6.000 8/40 (0.2) -1.38 12.00 50.00 8.000 12/50(0.24) -1.15 18.00 60.00 10.00 18/60(0.3) -0.85 28.00 80.00 13.00 28/80(0.175) -1.55 45.00 100.0 15.00 45/100(0.45) -0.2 36.00 70.00 20.00 36/70(0.51) 0.04 39.00 65.00 25.00 39/65(0.6) 0.41 33.00 50.00 30.00 33/50(0.66) 0.66 30.00 40.00 35.00 30/40(0.75) 1.1 20.00 25.00 40.00 20/25(0.8) 1.39 X: thu nhập; Ni: số hộ có thu nhập Xi; Mi: số hộ có thu nhập Xi mà có nhà riêng