Bài giảng Kinh tế lượng - Chương 1 Tương quan, hồi qui tuyến tính

I.TƯƠNG QUAN TUYẾN TÍNH 1. Hệ số tương quan đơn:  được gọi là đại lượng đo lường mối tương quan tuyến tính của 2 đại lượng ngẫu nhiên X và Y nếu:

pdf58 trang | Chia sẻ: thanhtuan.68 | Lượt xem: 1000 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Bài giảng Kinh tế lượng - Chương 1 Tương quan, hồi qui tuyến tính, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
4Chương 1 TƯƠNG QUAN, HỒI QUI TUYẾN TÍNH www.nguyenngoclam.com 5I.TƯƠNG QUAN TUYẾN TÍNH 1. Hệ số tương quan đơn:  được gọi là đại lượng đo lường mối tương quan tuyến tính của 2 đại lượng ngẫu nhiên X và Y nếu: • -1   1 •  < 0: X, Y có mối liên hệ nghịch •  > 0: X, Y có mối liên hệ thuận •  = 0: X, Y không có mối liên hệ. •: càng lớn thì X, Y có mối liên hệ càng chặt chẽ. • Ký hiệu: XY 6I.TƯƠNG QUAN TUYẾN TÍNH Mô hình (a) tuyến tính kém chặt chẽ hơn mô hình (b) 7I.TƯƠNG QUAN TUYẾN TÍNH 2. Hệ số tương quan mẫu Spearson : Chọn ngẫu nhiên n cặp quan sát (xi, yi) từ hai tổng thể X,Y. Ta có hệ số tương quan Spearson: YX XY YX n i n i ii n i ii XY SS S SS YXCov yyxx yyxx r           ),( )()( ))(( 1 1 22 1 • rXY = rYX • Trường hợp |r| ≥ 0,8 chúng ta có thể kết luận X, Y có mối tương quan tuyến tính chặt chẽ. 8I.TƯƠNG QUAN TUYẾN TÍNH 3. Kiểm định tương quan tuyến tính: Chọn ngẫu nhiên n cặp quan sát (xi, yi) từ hai tổng thể X,Y có phân phối chuẩn. Ta có hệ số tương quan Spearson: • Giả thuyết:      0: 0: 1 0   H H • Giả trị kiểm định: )2/()1( 2   nr r t • Bác bỏ giả thuyết H0: 2/,2  ntt 9I.TƯƠNG QUAN TUYẾN TÍNH Ví dụ: Xem tương quan tuyến tính giữa chi tiêu và thu nhập Code Chi tiêu Y Thu nhập X 1 5.305 9.094 2 5.320 9.229 3 5.320 9.347 4 5.492 9.098 5 5.507 9.282 6 5.538 9.525 7 5.540 9.138 8 5.692 9.756 9 5.871 10.282 10 5.907 11.307 11 6.124 11.432 12 6.157 10.662 13 6.186 11.449 14 6.224 11.697 15 6.342 11.019 10 I.TƯƠNG QUAN TUYẾN TÍNH Code Chi tiêu Y Thu nhập X Xi-E(X) Yi-E(Y) (Xi-E(X)).(Yi-E(Y)) (Xi-E(X))2 (Yi-E(Y))2 1 5.305 9.094 -1.060,5 -463,3 491.349,6 1.124.589,6 214.677,8 2 5.320 9.229 -925,5 -448,3 414.917,6 856.488,6 201.002,8 3 5.320 9.347 -807,5 -448,3 362.014,2 652.002,4 201.002,8 4 5.492 9.098 -1.056,5 -276,3 291.937,0 1.116.121,8 76.360,1 5 5.507 9.282 -872,5 -261,3 228.004,6 761.198,1 68.295,1 6 5.538 9.525 -629,5 -230,3 144.987,2 396.228,3 53.053,4 7 5.540 9.138 -1.016,5 -228,3 232.093,2 1.033.204,5 52.136,1 8 5.692 9.756 -398,5 -76,3 30.416,3 158.775,7 5.826,8 9 5.871 10.282 127,5 102,7 13.093,4 16.264,8 10.540,4 10 5.907 11.307 1.152,5 138,7 159.818,0 1.328.333,1 19.228,4 11 6.124 11.432 1.277,5 355,7 454.376,0 1.632.091,4 126.498,8 12 6.157 10.662 507,5 388,7 197.261,3 257.590,1 151.061,8 13 6.186 11.449 1.294,5 417,7 540.683,4 1.675.816,6 174.445,4 14 6.224 11.697 1.542,5 455,7 702.881,0 2.379.409,1 207.632,1 15 6.342 11.019 864,5 573,7 495.954,0 747.417,9 329.093,4 Tổng 86.525 152.317 4.759.787,7 14.135.532,7 1.890.855,3 E(X)=10.154,5 E(Y) = 5.768,3 r = 0,921 t = 8,524 11 I.TƯƠNG QUAN TUYẾN TÍNH 4. Kiểm định tương quan hạng Spearman: (X,Y không có phân phối chuẩn) • Giả thuyết:      0: 0: 1 0 s s H H   • Giá trị kiểm định: )1( 6 1 2 1 2     nn d r n i i s • Bác bỏ H0: .rn,α/2: Tra bảng phân phối Spearman • Nếu n ≥ 30: kiểm định phân phối chuẩn 2/,ns rr  Xếp hạng xi, yi theo thứ tự tăng dần, các giá trị bằng nhau nhận hạng trung bình của các hạn liên tiếp. di là chênh lệch hạng từng cặp của xi, yi. 1 nrz s 12 I.TƯƠNG QUAN TUYẾN TÍNH Ví dụ: Code Chi tiêu Y Rank(Y) Thu nhập X Rank(X) di=r(Y)-r(X) di2 1 5.305 1 9.094 1 0 0 2 5.320 2,5 9.229 4 -1,5 2,25 3 5.320 2,5 9.347 6 -3,5 12,25 4 5.492 4 9.098 2 2 4 5 5.507 5 9.282 5 0 0 6 5.538 6 9.525 7 -1 1 7 5.540 7 9.138 3 4 16 8 5.692 8 9.756 8 0 0 9 5.871 9 10.282 9 0 0 10 5.907 10 11.307 12 -2 4 11 6.124 11 11.432 13 -2 4 12 6.157 12 10.662 10 2 4 13 6.186 13 11.449 14 -1 1 14 6.224 14 11.697 15 -1 1 15 6.342 15 11.019 11 4 16 65,5 rs = 0,883 13 I.TƯƠNG QUAN TUYẾN TÍNH Sử dụng SPSS: file: Chi tieu va thu nhap 14 I.TƯƠNG QUAN TUYẾN TÍNH Sử dụng SPSS: file: Chi tieu va thu nhap Correlations 1 ,921 ,000 15 15 ,921 1 ,000 15 15 Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Chitieu Thunhap Chitieu Thunhap Correlations 1,000 ,883 . ,000 15 15 ,883 1,000 ,000 . 15 15 Correlation Coefficient Sig. (2-tailed) N Correlation Coefficient Sig. (2-tailed) N Chitieu Thunhap Spearman's rho Chitieu Thunhap 15 II.HỒI QUI TUYẾN TÍNH ĐƠN GIẢN 1. Khái niệm hồi qui: Ví dụ, Nghiên cứu mối liên hệ giữa chi tiêu Y và thu nhập X của hộ gia đình: X Y 80 100 120 140 160 180 200 220 240 260 55 65 79 80 102 110 120 135 137 150 60 70 84 93 107 115 136 137 145 152 65 74 90 95 110 120 140 140 155 175 70 80 94 103 116 130 144 152 165 178 75 85 98 108 118 135 145 157 175 180 88 113 125 140 160 189 185 115 162 191 E(Y/Xi) 65 77 89 101 113 125 137 149 161 173 16 II.HỒI QUI TUYẾN TÍNH ĐƠN GIẢN Đồ thị: 17 II.HỒI QUI TUYẾN TÍNH ĐƠN GIẢN • E(Y/X) = f(X) : Phương trình hồi qui • E(Y/X1) = β0 + 1X : Phương trình hồi qui tuyến tính • Y = β0 + 1X + U : Giá trị thực của Y Trong đó: • X: biến giải thích (độc lập); • Y: biến được giải thích (phụ thuộc) • β0: Tham số chặn • 1: Tham số của biến • U: Yếu tố ngẫu nhiên • X,Y không có mối quan hệ hàm số mà có mối quan hệ nhân quả và thống kê 18 II.HỒI QUI TUYẾN TÍNH ĐƠN GIẢN 2. Xây dựng mô hình hồi qui mẫu: Ta cần ước lượng , , giả sử đó là b0,b1. Chọn n cặp quan sát (xi,yi) từ X,Y: ii iii xbby exbby 10 10 ˆ   : Giá trị thực tế : Giá trị lý thuyết Ta cần tìm b0, b1 sao cho 2 giá trị trên càng gần càng tốt. Phương pháp bình phương bé nhất (OLS): min)()ˆ( 1 2 10 1 2 1 2     n i ii n i ii n i i xbbyyyeSSE 19 II.HỒI QUI TUYẾN TÍNH ĐƠN GIẢN              n i iiib n i iib xxbbyf xbbyf 1 10 1 10 0))((2 0)1)((2 1 0 min)(),( 1 2 1010    n i ii xbbybbf Xét hàm số 2 biến:             xbyb xx yyxx b i ii 0 21 )( ))(( XbbY XY 10 10 ˆ    : Hồi qui tuyến tính tổng thể PRF : Hồi qui tuyến tính mẫu SRF 20 II.HỒI QUI TUYẾN TÍNH ĐƠN GIẢN E(X)=10.154,5 E(Y) = 5.768,3 b1 = 0,34 b0 = 2.349,07 Code Chi tiêu Y Thu nhập X xi-X yi-Y (xi-X)(yi-Y) (xi-X) 2 (yi-Y) 2 ei ei 2 1 5.305 9.094 -1.060,5 -463,3 491.349,6 1.124.589,6 214.677,8 -106,2 11.288,6 2 5.320 9.229 -925,5 -448,3 414.917,6 856.488,6 201.002,8 -136,7 18.688,4 3 5.320 9.347 -807,5 -448,3 362.014,2 652.002,4 201.002,8 -176,4 31.130,8 4 5.492 9.098 -1.056,5 -276,3 291.937,0 1.116.121,8 76.360,1 79,4 6.305,2 5 5.507 9.282 -872,5 -261,3 228.004,6 761.198,1 68.295,1 32,4 1.052,9 6 5.538 9.525 -629,5 -230,3 144.987,2 396.228,3 53.053,4 -18,4 337,7 7 5.540 9.138 -1.016,5 -228,3 232.093,2 1.033.204,5 52.136,1 113,9 12.981,5 8 5.692 9.756 -398,5 -76,3 30.416,3 158.775,7 5.826,8 57,8 3.345,5 9 5.871 10.282 127,5 102,7 13.093,4 16.264,8 10.540,4 59,7 3.566,8 10 5.907 11.307 1.152,5 138,7 159.818,0 1.328.333,1 19.228,4 -249,4 62.210,4 11 6.124 11.432 1.277,5 355,7 454.376,0 1.632.091,4 126.498,8 -74,5 5.551,8 12 6.157 10.662 507,5 388,7 197.261,3 257.590,1 151.061,8 217,8 47.422,7 13 6.186 11.449 1.294,5 417,7 540.683,4 1.675.816,6 174.445,4 -18,2 332,5 14 6.224 11.697 1.542,5 455,7 702.881,0 2.379.409,1 207.632,1 -63,7 4.063,1 15 6.342 11.019 864,5 573,7 495.954,0 747.417,9 329.093,4 282,6 79.838,3 Tổng 86.525 152.317 4.759.786,7 14.135.531,7 1.890.855,3 0,0 288.116,3 134,007,349.2ˆ XY  21 II.HỒI QUI TUYẾN TÍNH ĐƠN GIẢN 134,007,349.2ˆ XY  Ý nghĩa của phương trình: • Trung bình của Y phụ thuộc vào X • b1 =0,34: Nếu X tăng lên 1 đơn vị thì Y tăng lên 0,34 đơn vị. • b0 =2.349,07: Nếu X=0 thì Y = 2.349,07 đơn vị. 22 II.HỒI QUI TUYẾN TÍNH ĐƠN GIẢN 3. Tính chất của phương pháp OLS: • bi: được xác định duy nhất với n cặp quan sát (xi,yi). • bi: là các ước lượng điểm của βi và là các đại lượng ngẫu nhiên, với các mẫu khác nhau thì giá trị khác nhau. Tính chất của SRF: • SRF đi qua trung bình mẫu: • Trung bình của bằng trung bình các quan sát • Trung bình phần dư bằng 0 • Các phần dư ei không tương quan với • Các phần dư không tương quan với XbbY 10  iyˆ iyˆ iyˆ YY ˆ   0ie   0ˆ iiey   0iiex 23 II.HỒI QUI TUYẾN TÍNH ĐƠN GIẢN 4. Các giả thuyết cơ bản của phương pháp OLS: Để ước lượng là ước lượng tuyến tính, không chệnh và có phương sai nhỏ nhất cần thỏa các điều kiện sau: Giả thuyết 1: Các biến giải thích là phi ngẫu nhiên. Điều này là đương nhiên vì Hồi qui là trung bình có điều kiện. Giả thuyết 2: Kỳ vọng của các yếu tố ngẫu nhiên bằng 0. XXYEXUE 10)/(0)/(   Điều này phương pháp OLS thỏa mãn. 24 II.HỒI QUI TUYẾN TÍNH ĐƠN GIẢN Giả thuyết 3: Phương sai của các ui bằng nhau. 2)/()/(  jjii xuVarxuVar Điều này có thể vi phạm do những người có thu nhập cao sẽ có nhiều sự lựa chọn khác nhau. Người có nhiều kinh nghiệm thì sai lầm càng ít. 25 II.HỒI QUI TUYẾN TÍNH ĐƠN GIẢN Đồ thị phương sai bằng nhau: 26 II.HỒI QUI TUYẾN TÍNH ĐƠN GIẢN Đồ thị phương sai không bằng nhau: 27 II.HỒI QUI TUYẾN TÍNH ĐƠN GIẢN Giả thuyết 4: Không có sự tương quan giữa các ui. jiuuCov ji ,,0),(  Tức là các giá trị yi độc lập với nhau. Điều này có nghĩa chi tiêu của nhóm người có thu nhập xi không ảnh hưởng đến chi tiêu của nhóm người có thu nhập xj. Giả thuyết 5: ui và xi không tương quan với nhau. Nếu phương pháp OLS thỏa mãn 5 giả thuyết trên thì bi là các ước lượng tuyến tính, không chệnh và phương sai nhỏ nhất của βi. Từ a,b có thể suy luận βi thì cần thỏa mãn giả thuyết 6. 28 II.HỒI QUI TUYẾN TÍNH ĐƠN GIẢN Giả thuyết 6: ui có phân phối N(0, 2). Các ước lượng có tính chất sau: 1. Chúng là các ước lượng không chệch. 2. Có phương sai nhỏ nhất. )1,0(~),(~ .3 2 002 00 0 0 N b ZNb b b      )1,0(~),(~ .4 2 112 11 1 1 N b ZNb b b      ),(~y .6 210i  ixN  2 22 2 ~ )2( .5   n Sn   Với các giả thuyết trên ta có thể tìm khoảng tin cậy và kiểm định giả thuyết về các tham số hồi qui. 29 II.HỒI QUI TUYẾN TÍNH ĐƠN GIẢN 5. Độ chính xác của ước lượng OLS: 212 2 2 1 )( )( )( )( 11       xx SbSe xx SbVar i b i b  2 2 2    n e S i Vì 2 chưa biết nhưng có thể dùng ước lượng không chệch của nó là:  2 2 0 2 2 2 2 0 )( 1 )( )( 1 )( 0              xx x n bSe xx x n SbVar ii b 30 II.HỒI QUI TUYẾN TÍNH ĐƠN GIẢN Ví dụ: 914,403 4,146.1638,168.22 7,513.135.14 5,154.10 15 1 )( 1 0 0 2 2 2 2 2                     b i b S xx x n S  8,162.22 215 7,116.288 2 2 2       n e S i 0396,0001568,0 7,531.135.14 8,162.22 )( 11 2 2 2     b i b S xx S  31 II.HỒI QUI TUYẾN TÍNH ĐƠN GIẢN 6. Ước lượng tham số hồi qui: Với khoảng tin cậy (1-α), )( 2/,2 ibnii Stb   Ví dụ, Với α = 10% => tn-2,α/2 = t13,5%=1,771 422,0251,0)0396,0.771,134,0( 11   Với độ tin cậy 95%, nếu X tăng lên 1 đơn vị thì Y tăng lên từ 0,251 – 0,422 đơn vị. 32 II.HỒI QUI TUYẾN TÍNH ĐƠN GIẢN 7. Kiểm định tham số hồi qui: Với mức ý nghĩa α, Ví dụ, Với α = 10% => tn-2,α/2 = t13,5%=2,160 Với mức ý nghĩa 10%, Y phụ thuộc vào X (Biến X có ý nghĩa thống kê) 02/,1 1 0 0: 0: BBHt S b t H H kn bi i i i          0%5,13 11 10 771,15,8 0396,0 34,0 0: 0: BBHtt H H         33 II.HỒI QUI TUYẾN TÍNH ĐƠN GIẢN 8. Hệ số xác định R2 : R2 là hệ số nhằm xác định sự biến động của Y phụ thuộc bao nhiêu % vào sự biến động của X      22222 )ˆ()ˆ()ˆ()( iiiiii eyyyyyyyy SST SSE SST SSR RSSESSRSST  12 Ví dụ: 848,0 3,855.890.1 3,166.288 12 R Sự biến động của Y phụ thuộc 84,8% vào sự biến động của X 34 II.HỒI QUI TUYẾN TÍNH ĐƠN GIẢN 9. Kiểm định sự phù hợp của hàm hồi qui: 02,1 11 10 , 2/ 1/ 0: 0: BBHF nSSE SSR F H H n            Ví dụ: 0%5,13,1 11 10 14,3317,72 317,72 3,116.288 1,739.602.1 3,116.288 3,116.2883,855.890.1 0: 0: BBHFF F H H            Với mức ý nghĩa 10%, mô hình hồi qui phù hợp (có ý nghĩa thống kê) 35 II.HỒI QUI TUYẾN TÍNH ĐƠN GIẢN 36 II.HỒI QUI TUYẾN TÍNH ĐƠN GIẢN Model Summaryb ,921a ,848 ,836 148,872 Model 1 R R Square Adjusted R Square Std. Error of the Estimate Predictors: (Constant), Thunhapa. Dependent Variable: Chitieub. ANOVAb 1602739 1 1602739,079 72,317 ,000a 288116,3 13 22162,789 1890855 14 Regression Residual Total Model 1 Sum of Squares df Mean Square F Sig. Predictors: (Constant), Thunhapa. Dependent Variable: Chitieub. Coefficientsa 2349,071 403,914 5,816 ,000 1476,468 3221,674 ,337 ,040 ,921 8,504 ,000 ,251 ,422 (Constant) Thunhap Model 1 B Std. Error Unstandardized Coefficients Beta Standardized Coefficients t Sig. Lower Bound Upper Bound 95% Confidence Interval for B Dependent Variable: Chitieua. 37 III.HỒI QUI TUYẾN TÍNH BỘI E(Y/X1,X2,, Xk) = β0 + 1X1 + 2X2 + + kXk Y = β0 + 1X1 + 2X2 + + kXk + U 1. Xây dựng mô hình hồi qui mẫu: Mục tiêu là ta cần ước lượng 0, 1, 2, k, giả sử đó là b0,b1,b2,bk,. Chọn n cặp quan sát (x1i, x2i, xki,yi) từ X và Y: : Giá trị thực tế : Giá trị lý thuyếtkikiii ikikiii xbxbxbby exbxbxbby   ...ˆ ... 22110 22110    n i kikii xbxbby 1 2 110 min)...( 38 III.HỒI QUI TUYẾN TÍNH BỘI Xét hàm số:    n i kikiik xbxbbybbbf 1 2 11010 min)...(),...,(                   0))(...(2 .......................................................................... 0))(...(2 0)1)(...(2 1 110 1 1110 1 110 1 0 n i kikikiib n i ikikiib n i kikiib xxbxbbyf xxbxbbyf xbxbbyf k Giải hệ phương trình tuyến tính Crame k+1 phương trình k+1 ẩn số. 39 III.HỒI QUI TUYẾN TÍNH BỘI Ví dụ, Tốc độ tăng nền kinh tế (KT) phụ thuộc vào tốc độ tăng của nông nghiệp (X1), tốc độ tăng trưởng của kim ngạch xuất khẩu (X2) và tỷ lệ lạm phát (X3) được thu thập ở 48 nước: KT(%) NN(%) XK(%) LP(%) Y(%) NN(%) XK(%) LP(%) Y(%) NN(%) XK(%) LP(%) 1,3 3,4 -2,7 13,0 8,0 3,1 10,9 37,3 5,6 3,9 6,4 13,9 1,0 1,4 -6,0 10,5 6,5 3,3 -0,6 8,9 6,9 1,3 11,6 6,4 0,4 0,1 -3,6 15,9 0,2 0,1 8,4 29,5 -4,6 0,8 -9,8 21,5 4,9 1,8 13,6 3,2 7,8 5,3 10,4 8,1 -2,6 1,7 -6,6 6,7 9,8 5,6 27,3 5,4 2,5 2,3 4,9 22,6 1,1 3,9 3,8 7,7 -2,1 2,2 2,6 5,2 -0,2 3,1 7,9 20,2 4,6 3,0 -3,5 8,6 2,0 2,3 -9,5 8,7 6,1 10,3 -19,0 -1,3 -0,6 2,5 2,0 11,5 5,8 3,0 4,4 1,4 2,9 -0,6 5,4 7,5 8,2 1,9 3,8 7,8 5,2 2,9 9,2 3,0 4,1 2,3 8,7 9,5 4,1 0,9 1,3 5,6 -1,1 -2,3 -6,3 14,9 -5,0 1,2 -2,0 1,1 12,6 7,9 11,7 3,8 0,2 0,3 12,0 20,3 2,1 2,7 5,6 11,2 4,1 2,8 -0,9 9,9 1,1 1,4 -7,2 19,8 7,7 3,0 2,0 8,9 0,6 2,8 -2,1 23,3 -12,0 4,8 -5,5 8,6 9,3 3,3 6,2 7,5 2,0 0,5 -3,1 33,5 -1,6 -0,4 -2,5 11,3 -1,7 2,0 -1,7 18,2 0,0 0,4 6,9 32,6 0,5 1,9 1,6 19,0 5,8 4,7 -0,2 2,1 -2,6 -1,3 3,4 7,7 2,2 -3,5 4,7 1,9 3,9 -3,9 -2,5 3,4 -3,4 7,9 -7,9 45,4 40 III.HỒI QUI TUYẾN TÍNH BỘI Model Summary ,609a ,371 ,328 3,6899 Model 1 R R Square Adjusted R Square Std. Error of the Estimate Predictors: (Constant), LP, NN, XKa. ANOVAb 352,861 3 117,620 8,639 ,000a 599,085 44 13,616 951,947 47 Regression Residual Total Model 1 Sum of Squares df Mean Square F Sig. Predictors : (Constant), LP, NN, XKa. Dependent Variable: KTb. Coefficientsa 2,033 ,993 2,047 ,047 ,032 4,035 ,501 ,206 ,291 2,435 ,019 ,086 ,915 ,268 ,069 ,466 3,888 ,000 ,129 ,407 -,105 ,053 -,236 -1,973 ,055 -,212 ,002 (Constant) NN XK LP Model 1 B Std. Error Unstandardized Coefficients Beta Standardized Coefficients t Sig. Lower Bound Upper Bound 95% Confidence Interval for B Dependent Variable: KTa. File: Tang truong kinh te 41 III.HỒI QUI TUYẾN TÍNH BỘI 3. Ước lượng βi: • 0,086<β1<0,915: Với độ tin cậy 90%, nếu NN tăng lên 1% thì tốc độ tăng trưởng KT tăng từ 0,086 – 0,915%. • 0,129<β2<0,407: Với độ tin cậy 90%, nếu XK tăng lên 1% thì tốc độ tăng trưởng KT tăng từ 0,129 – 0,407%. • -0,212<β3<0,002: Với độ tin cậy 90%, nếu LP tăng lên 1% thì tốc độ tăng trưởng KT từ giảm 0,212 đến tăng 0,002%. )( 2/,1 biknii Stb   42 III.HỒI QUI TUYẾN TÍNH BỘI 4. Kiểm định từng tham số hồi qui:      0: 0: 1 0 i i H H   02/,1 H BBtS b t kn bi i    Có thể dựa vào giá trị P = Sig. Bác bỏ H0 • P1=1,9% < 10%: Biến NN có ý nghĩa thống kê. • P2= 0% < 10%: Biến XK có ý nghĩa thống kê. • P3=5,5% < 10%: Biến LP có ý nghĩa thống kê. • P0=4,7% < 10%: Hồi qui không qua gốc tọa độ. 43 III.HỒI QUI TUYẾN TÍNH BỘI 5. Hệ số xác định: R2 là hệ số nhằm xác định sự biến động của Y phụ thuộc bao nhiêu % vào sự biến động của X1, X2, Xk.      22222 )ˆ()ˆ()ˆ()( iiiiii eyyyyyyyy SST SSE SST SSR RSSESSRSST  12 • R2=37,1%: sự biến động của KT phụ thuộc 37,1% vào sự biến động của NN,XK,LP. 44 III.HỒI QUI TUYẾN TÍNH BỘI 6. Hệ số xác định đã điều chỉnh: Do R2 càng tăng nếu đưa càng nhiều biến vào mô hình nên sự đo lường thường không chính xác. Để khắc phục nhược điểm ta có: ) 1 1 )(1(1 )1/( )1/( 22       kn n R nSST knSSR R • : sự biến động của KT phụ thuộc 37,1% vào sự biến động của NN,XK,LP. %8,322 R 45 III.HỒI QUI TUYẾN TÍNH BỘI 7. Kiểm định sự phù hợp của mô hình: 0),1(, 2 2 210 H 1 . )1( )1(/ / 0...: BBFF R R k kn knSSE kSSR MSE MSR F H knk k           0 210 %10%0. 0...: BBHFSig H k    Ví dụ: Với mức ý nghĩa 10%, mô hình có ý nghĩa 46 III.HỒI QUI TUYẾN TÍNH BỘI Tốc độ tăng kinh tế - Y(%) Biến độc lập ĐVT Dấu kỳ vọng Hệ số P Tốc độ tăng nông nghiệp (NN) % + 0,501 0,019 Tốc độ tăng xuất khẩu (XK) % + 0,268 0,000 Lạm phát (LP) % - -0,105 0,055 Hệ số tự do 2,033 0,047 R2=0,37; Sig.F=0,000127, n=48 Tóm tắt kết quả hồi qui 47 III.HỒI QUI TUYẾN TÍNH BỘI Trình tự giải thích kết quả Hồi qui: • Khẳng định mô hình có ý nghĩa. Thông qua giá trị Sig.F • Trình bày mức độ ảnh hưởng của các biến độc lập đến biến phụ thuộc • Kiểm tra mức ý nghĩa thống kê của từng biến độc lập, giải thích sự ảnh hưởng của từng biến độc lập đến biến phục thuộc. Chú ý đến dấu, dấu kỳ vọng và độ lớn của hệ số hồi qui. 48 IV.MỘT SỐ DẠNG HÀM Các trường hợp mở rộng: • Biến độc lập là biến định tính: Mô hình hồi qui với biến giả • Biến phụ thuộc là biến định tính: Phân tích nhân tố • Trường hợp phương trình hồi qui phi tuyến tính đối với biến. 49 IV.MỘT SỐ DẠNG HÀM 1. Một biến độc lập định tính: Hồi qui với biến giả. 1.1.Biến giả có 2 phạm trù: Xây dựng mô hình so sánh tiền lương của công nhân làm việc trong khu vực tư nhân và quốc doanh. E(Y/D) =  + D • Y: Tiền lương • D = 1: Công nhân khu vực tư nhân • D = 0: Công nhân khu vực quốc doanh E(Y/D=0) =  : Lương công nhân khu vực quốc doanh E(Y/D=1) = +: Lương công nhân khu vực tư nhân 50 IV.MỘT SỐ DẠNG HÀM Ví dụ: Lương (trđ/năm) 28 32 35 27 25 37 29 34 33 30 Khu vực 0 1 1 0 0 1 0 1 1 0 DY 4,68,27ˆ  51 IV.MỘT SỐ DẠNG HÀM 1.2.Biến giả có 3 phạm trù: Mô hình so sánh lương công nhân khu vực tư nhân, liên doanh và quốc doanh. E(Y/D1,D2) =  + 1D1 +2D2 • D1 = 1: Công nhân khu vực tư nhân D1 = 0: Công nhân khu vực khác • D2 = 1: Công nhân khu vực liên doanh D2 = 0: Công nhân khu vực khác E(Y/D1=1,D2=0) =  + 1: Lương CN khu vực TN E(Y/D1=0,D2=1) =  + 2: Lương CN khu vực LD E(Y/D1=0,D2=0) =  : Lương CN khu vực QD 52 IV.MỘT SỐ DẠNG HÀM Ví dụ: Model Summaryb ,952a ,906 ,896 410,643 1,338 Model 1 R R Square Adjusted R Square Std. Error of the Estimate Durbin- Watson Predictors: (Constant), D2, D1a. Dependent Variable: Thunhapb. ANOVAb 30882400 2 15441199,90 91,570 ,000a 3203919 19 168627,324 34086319 21 Regression Residual Total Model 1 Sum of Squares df Mean Square F Sig. Predictors: (Constant), D2, D1a. Dependent Variable: Thunhapb. Coefficientsa 9244,714 155,208 59,563 ,000

Các file đính kèm theo tài liệu này:

  • pdfchuong_1_hoi_qui_tuyen_tinh_5235.pdf
  • pdfchuong_0_gioi_thieu_mon_hoc_1678.pdf
Tài liệu liên quan