Bài giảng Kinh tế lượng Econometrics - Chương II: Mô hình hồi quy hai biến, ước lượng và kiểm định giả thiết

CHƯƠNG II: MÔ HÌNH HỒI QUY HAI BIẾN, ƯỚC LƯỢNG VÀ KIỂM ĐỊNH GIẢ THIẾT 2.1. Phương pháp bình phương nhỏ nhất (OLS) 2.2. Các giả thiết cơ bản của phương pháp OLS 2.3. Độ chính xác của các ước lượng OLS 2.4. Hệ số r2 đo độ phù hợp của hàm hồi quy mẫu 2.5. Phân bố xác suất của Ui 2.6. Khoảng tin cậy và kiểm định giả thiết về các hệ số hồi quy 2.7. Kiểm định sự phù hợp của hàm hồi quy, phân tích hồi quy và phân tích phương sai 2.8. Phân tích hồi quy và dự báo 2.9. Trình bày kết quả phân tích hồi quy 2.10. Thí dụ

pdf39 trang | Chia sẻ: thanhtuan.68 | Ngày: 10/03/2018 | Lượt xem: 108 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Bài giảng Kinh tế lượng Econometrics - Chương II: Mô hình hồi quy hai biến, ước lượng và kiểm định giả thiết, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
BÀI GIẢNG KINH TẾ LƯỢNG ECONOMETRICS Lê Anh Đức Khoa Toán kinh tế ĐH Kinh tế Quốc dân 1 CHƯƠNG II: MÔ HÌNH HỒI QUY HAI BIẾN, ƯỚC LƯỢNG VÀ KIỂM ĐỊNH GIẢ THIẾT 2.1. Phương pháp bình phương nhỏ nhất (OLS) 2.2. Các giả thiết cơ bản của phương pháp OLS 2.3. Độ chính xác của các ước lượng OLS 2.4. Hệ số r2 đo độ phù hợp của hàm hồi quy mẫu 2.5. Phân bố xác suất của Ui 2.6. Khoảng tin cậy và kiểm định giả thiết về các hệ số hồi quy 2.7. Kiểm định sự phù hợp của hàm hồi quy, phân tích hồi quy và phân tích phương sai 2.8. Phân tích hồi quy và dự báo 2.9. Trình bày kết quả phân tích hồi quy 2.10. Thí dụ 2 2.1. Phương pháp bình phương nhỏ nhất - OLS 1. Nội dung của phương pháp OLS • Xét mô hình hồi quy đơn dạng tuyến tính PRF: E(Y/Xi) = 1 + 2 Xi PRM: Yi = 1 + 2 Xi + Ui • Với mẫu W = {(Xi, Yi), i = 1÷ n} tìm được một ước lượng điểm của PRF SRF: SRM: 1 2 ˆ ˆ iˆ iY β β X  1 2 ˆ ˆ i i iY β β X e   3 • Đồ thị X1 X2 X3 X4 e4 e3 e2 e1 SRF Y X 4 • Nội dung của phương pháp OLS là tìm các ước lượng điểm sao cho tổng bình phương các phần dư là nhỏ nhất. Tức là sao cho càng gần với giá trị thực của Yi có thể được. • Tìm sao cho: 1 2 ˆ ˆ,β β iˆY  22 1 1 ˆ min n n i i i i i e Y Y       1 2 ˆ ˆ,β β 5 • Ta có • Ta cần tìm sao cho • Các hệ số là nghiệm của hệ phương trình sau 1 2 2 2 2 1 2 1 2 1 1 1 ˆ ˆˆ ˆ ˆ ˆ ˆˆ( ) ( ) ( , ) i i i i i n n n i i i i i i i i e Y Y Y X e Y Y Y X f                       1 2 ˆ ˆ,β β 1 2ˆ ˆ( , )f Min   1 2 1 2 1 2 1 1 11 21 2 1 2 1 2 1 1 1 12 ˆ ˆ( , ) ˆ ˆ ˆ ˆ0 2 ( ) 0ˆ ( ) ˆ ˆ( , ) ˆ ˆ ˆ ˆ2 ( ) 00ˆ n n n i i i i i i i n n n n i i i i i i i i i i i f Y X n X Y I f X Y X X X YX                                                         1 2 ˆ ˆ,β β 6 • Ký hiệu • Khi đó 1 1 1 1 n i i n i i X X n Y Y n       1 2 1 1 1 2 2 2 1 1 ˆ ˆ .( ) ˆ (?) ( ) n n n i i i i i i i n n i i i i Y X n Y X X YI n X X                         7 • Ký hiệu • Khi đó • Các hệ số là các ước lượng của được tính bằng phương pháp OLS - gọi là các ước lượng OLS i i i i x X X y Y Y     1 1 1 1 2 2 2 2 1 1 1 . ˆ (?) ( ) n n n n i i i i i i i i i i n n n i i i i i i n X Y X Y x y n X X x                    1 2 ˆ ˆ,  21 , 8 2. Các tính chất của các ước lượng OLS • Đối với Tính chất 1: với mỗi tệp số liệu mẫu thì xác định một duy nhất (?). Tính chất 2: là các ước lượng của và là các đại lượng ngẫu nhiên, với mỗi mẫu khác nhau thì chúng có giá trị khác nhau. 1 2 ˆ ˆ,  1 2 ˆ ˆ,  1 2 ˆ ˆ,  21, 9 • Đối với SRF Tính chất 1: SRF đi qua điểm trung bình mẫu Tính chất 2: Trung bình số học của các giá trị ước lượng bằng trung bình mẫu Tính chất 3: Tổng các phần dư bằng không Tính chất 4: Các phần dư không tương quan với các giá trị ước lượng được Tính chất 5: Các phần dư không tương quan với các giá trị của biến giải thích ( , )X Y 1 2 ˆ ˆ (?)Y X   1 1 ˆ ˆ (?) n i i i Y Y Y n    1 0(?) n i i e   1 ˆ ˆ( , ) 0(?) n i i i i i Cov e Y Ye    1 ( , ) 0(?) n i i i i i Cov e X X e    10 • Các hệ số là các ước lượng điểm của được tìm bằng phương pháp OLS. Chất lượng của chúng phụ thuộc vào các yếu tố sau: - Dạng hàm của mô hình lựa chọn - Kích thước mẫu - Biến độc lập Xi và sai số ngẫu nhiên Ui 1 2 ˆ ˆ,  21, 11 2.2. Các giả thiết cơ bản của phương pháp OLS • GT 1: Biến độc lập là phi ngẫu nhiên • GT 2: Kỳ vọng của các sai số ngẫu (SSNN) nhiên bằng 0 E(Ui) = 0  i • GT 3: Phương sai của các SSNN bằng nhau Var(Ui) = Var(Uj) =  2  i ≠ j • GtT 4: Các SSNN không tuơng quan với nhau Cov(Ui ,Uj) = 0  i ≠ j • GT 5: Các SSNN và biến độc lập không tương quan với nhau Cov(Ui , Xi) = 0  i 12 2.3. Độ chính xác của các ước lượng OLS • Đối với - Kỳ vọng toán - Phương sai - Độ lệch chuẩn (Standard Deviation) 1ˆ 1 1 ˆ( )E   2 2 21 1 2 1 ˆ( ) ; ( ) ( ) n i i in i i X Var Var U i n x          2 1 1 2 1 ˆ( ) n i i n i i X SD n x        13 - Do không xác định được nên nó được thay thế bằng một ước lượng điểm: gọi là sai số chuẩn của đường hồi quy (Standard Error of Regression) - Khi đó gọi là sai số chuẩn (Standard error) 2 2 2 2 1 1ˆ ˆ ( 2) ( 2) n n i i i i e e n n          ˆ 2 1 1 1 2 1 ˆ ˆ ˆ( ) ( ) n i i n i i X SD Se n x          1ˆ( )Se  14 • Đối với - Kỳ vọng toán - Phương sai - Độ lệch chuẩn (Standard Deviation) - Sai số tiêu chuẩn (Standard error) 2ˆ 2 2 ˆ( )E   2 2 2 1 ˆ( ) n i i Var x      2 2 1 ˆ( ) n i i SD x      2 2 1 ˆˆ( ) n i i Se x      15 Định lý Gauss – Markov Với các giả thiết 1-5 của phương pháp OLS, các ước lượng OLS là các ước lượng tuyến tính, không chệch và có phương sai nhỏ nhất trong lớp các ước lượng tuyến tính không chệch. là BLUE của 1 , 2 (Best Linear Unbiased Estimates) 1 2 ˆ ˆ,β β 16 2.4. Hệ số r2 đo độ phù hợp của SRF • Ta có 2 2 2 2 2 2 1 1 1 1 2 2 2 1 1 1 1 ˆ ˆ ˆ ˆ; ( 1 ) ˆ ˆ ˆ2 ˆ ˆ2 ˆ ˆ0 (?) i i i i i i i i i i i i i i i i n n n n i i i i i i i i i n n n n i i i i i i i i i Y Y e Y Y Y Y e Y Y y i n y y e y y e e y y y e e y e y y y e                                           17 • Ký hiệu TSS = ESS + RSS TSS = Total Sum of Squares ESS = Explained Sum of Squares RSS = Residual sum of squares 2 2 1 1 2 2 2 2 2 2 1 1 1 1 2 2 1 1 ( ) ˆˆ ˆ ˆˆ ( ) ( ) ˆ( ) n n i i i i n n n n i i i i i i i i n n i i i i i TSS y Y Y ESS y Y Y Y Y x RSS e Y Y                              18 • Ta có • Đây là hệ thức cơ bản của phương pháp phân tích phương sai (Analys of variance – ANOVA). • ANOVA là phân tích toàn bộ sự biến thiên của biến ngẫu nhiên thành các bộ phận khác nhau mà có thể giải thích được và khảo sát từng bộ phận đó. • Toàn bộ sự biến thiên của biến phụ thuộc Y xung quanh giá trị trung bình của nó (TSS) có thể tách thành hai bộ phận: - Các biến thiên của Y được giải thích thông qua hàm hồi quy (ESS), tức là thông qua các biến giải thích có mặt trong hàm hồi quy. - Các biến thiên của Y được giải thích bên ngoài mô hình (RSS), tức là không thông qua các biến giải thích có mặt trong hàm hồi quy. 1 ESS RSS TSS ESS RSS TSS TSS      19 • Ký hiệu gọi là hệ số xác định của mô hình (Determination coeffcient - r-Squares) • Ý nghĩa r2 đo tỷ lệ % sự biến thiên của Y được giải thích thông qua hàm hồi quy, tức là được giải thích thông qua biến độc lập của mô hình. Nó được sử dụng để đặc trưng cho mức độ thích hợp của hàm hồi quy 2 1 ESS RSS r TSS TSS    20 • Ta có - Nếu r2 = 0: Hàm hồi quy hoàn toàn không giải thích sự biến thiên của Y. - Nếu r2 = 1: Hàm hồi quy giải thích 100% sự biến thiên của Y. - Nếu r2 = 0,9: Hàm hồi quy giải thích 90% sự biến động của Y, tức là sự biến động của biến giải thích trong hàm hồi quy chi phối 90% sự biến động của Y. 2 2 2 2 2 21 2 2 2 2 1 ˆ ˆ (0 1) n i i X n Y i i x S r r Sy          21 • Ta có Gọi là hệ số tương quan của biến X và Y • Ý nghĩa: hệ số tương quan đo mức độ phụ thuộc tuyến tính giữa biến X và Y. • Tính chất của hệ số tương quan: - Nếu r > 0 tức là X và Y quan hệ cùng chiều; - Nếu r < 0 tức là X và Y quan hệ ngược chiều; - Nếu r = 0 tức là X và Y không phụ thuộc tương quan tuyến tính; - Nếu tức là X và Y có quan hệ phụ thuộc hàm số tuyến tính. 2r r 1 1r   1r   22 2.5. Phân phố xác suất của Ui • Để có thể phân tích về mặt thống kê đối với mô hình ta cần phải biết phân phối xác suất của các ước lượng thu được, các phân phối này tuỳ thuộc vào phân phối xác suất của các sai số ngẫu nhiên. • Giả thiết 6: Các sai số ngẫu nhiên có phân phối chuẩn i 2 ( ( ), ar(U ))( ) (0, ) i i i U N E U v i U N    23 • Các căn cứ để đưa ra giả thiết này: - Ui thường là tổng hợp của một số lớn các yếu tố ngẫu nhiên độc lập cùng tuân theo quy luật phân phối xác suất nào đó và mức độ ảnh hưởng đến Y là bé đều như nhau do đó Ui có phân phối chuẩn (định lý giới hạn trung tâm); - Quy luật phân phối chuẩn chỉ có hai tham số là kỳ vọng toán và phương sai nên dễ tính toán; - Quy luật phân phối chuẩn có tính chất là nếu Ui phân phối chuẩn thì một hàm tuyến tính của nó cũng có phân phối chuẩn. - Quy luật phân phối chuẩn có tính chất là tính độc lập và không tương quan là đồng nhất. 24 • Với các giả thiết 1-6 ( 2)1 1 1 1 1 1 1 1 1 1 1 ˆ ˆ ˆ ˆ( , ( )) (0,1) ˆ ˆ( ) ( ) nN Var Z N T T SD Se               ( 2)2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1 2 ˆ ˆ ˆ ˆ( , ( )) (0,1)ˆ ˆ( ) ( ) ˆ( 2) ( 2) ( , )( ) n i i N Var Z N T T SD Se n n Y N X i                           25 Nhận xét: là các ước lượng điểm của nên tính đại diện không cao do đó cần phải tìm các ước lượng khoảng tin cậy và kiểm định các giả thuyết thống kê của chúng. 2 1 2 ˆ ˆ ˆ, ,   2 1 2, ,   26 2.6. Khoảng tin cậy và kiểm định giả thiết về các hệ số hồi quy 1. Đối với Ước lượng khoảng tin cậy Kiểm định giả thiết 2. Đối với Ước lượng khoảng tin cậy Kiểm định giả thiết ( 1 2)j j   2 27 Ước lượng khoảng tin cậy đối với • Ta có do đó với độ tin cậy (1 - ) ta có - Khoảng tin cậy đối xứng - Khoảng tin cậy bên phải dùng để ước lượng giá trị tối thiểu. - Khoảng tin cậy bên trái dùng để ước lượng giá trị tối đa: ( 1 2)j j   ( 2) ( 2) 2 2 ˆ ˆ ˆ ˆ( ) ( ) 1n nj j j j jP Se T Se T                  ( 2)ˆ ˆ( ) 1nj j jP Se T          ( 2)ˆ ˆ( ) 1nj j jP Se T          ( 2) ˆ ˆ( ) j j n j T T Se     28 Kiểm định giả thiết đối với • Kiểm định các cặp giả thiết • Tiêu chuẩn kiểm định • Miền bác bỏ giả thiết H0 với mức ý nghĩa  cho trước của các cặp giả thiết - Với cặp giả thiết (1) - Với cặp giả thiết (2) - Với cặp giả thiết (3) ( 1 2)j j   * * * 0 0 0 * * * 1 1 1 : : : (1), (2), (3) : : : j j j j j j j j j j j j H H H H H H                                  ( 2) 2 ( 2) ( 2) : : : n n n W T T T W T T T W T T T                      *ˆ ˆ( ) j j j T Se      29 • Trường hợp đặc biệt • Có thể sử dụng phương pháp kiểm định bằng giá trị P- value (P-value là mức xác suất nhỏ nhất để bác bỏ giả thiết H0), thường ký hiệu là P. • Quy tắc kết luận với mức ý nghĩa  cho trước như sau: - Với cặp giả thiết (1) + Nếu  > P thì bác bỏ giả thiết H0 + Nếu  < P thì không có cơ sở bác bỏ giả thiết H0 - Với cặp giả thiết (2) và (3) + Nếu  > P/2 thì bác bỏ giả thiết H0 + Nếu  < P/2 thì không có cơ ơở bác bỏ giả thiết H0 0 0 0 1 1 1 : 0 : 0 : 0 (1), (2), (3) : 0 : 0 : 0 j j j j j j H H H H H H                        30 • Xét mô hình hồi đơn có dạng tuyến tính PRF: E(Y/Xi) = 1 + 2 Xi PRM: Yi = 1 + 2 Xi + Ui • Cặp giả thiết cơ bản • Nếu bác bỏ H0: hệ số hồi qui 2 có ý nghĩa thống kê (statistically significal), mô hình có ý nghĩa; ngược lại thì hệ số 2 gọi là không có ý nghĩa thống kê, mô hình không có ý nghĩa thống kê.      0:H 0:H 21 20   31 Ước lượng khoảng tin cậy đối với • Ta có do đó với độ tin cậy (1 - ) ta có - Khoảng tin cậy đối xứng: - Khoảng tin cậy bên phải dùng để ước lượng giá trị tối thiểu: - Khoảng tin cậy bên trai dùng để ước lượng tối đa: 2 2 2 2 2 2 1 2 2 ˆ ˆ( 2) ( 2) 1 ( 2) ( 2) n n P n n                      2 2 2 ˆ( 2) 1 ( 2) n P n            2 2 2 1 ˆ( 2) 1 ( 2) n P n             2 2 2 2 ˆ( 2) ( 2) n n        32 Kiểm định giả thiết đối với • Kiểm định các cặp giả thiết • Tiêu chuẩn kiểm định • Miền bác bỏ giả thiết H0 với mức ý nghĩa  cho trước của các cặp giả thiết - Với cặp giả thiết (1) - Với cặp giả thiết (2) - Với cặp giả thiết (3) 2 2 2 2 2 2 2 0 0 0 0 0 0 2 2 2 2 2 2 1 0 1 0 1 0 : : : (1), (2), (3) : : : H H H H H H                                  2 2 22 2 2 1 2 2 2 2 2 2 2 1 ( 2) : ( 2) : ( 2) : ( 2) n W n W n W n                                         2 2 2 0 ˆ( 2)n      33 2.7. Kiểm định sự phù hợp của hàm hồi quy • r2tổng thể = 0 : hàm hồi qui không phù hợp • Kiểm định cặp giả thiết • Ta có • Miền bác bỏ giả thiết H0 với mức ý nghĩa  cho trước • Sử dụng giá trị P-value + Nếu  > P thì bác bỏ giả thiết H0 + Nếu  < P thì không có cơ ơở bác bỏ giả thiết H0 2 0 2 0 2 1 2 1 : 0 : 0 : 0 : 0 H H r H H r           2 2 2 2 /1 * /1 /1 (1, 2) /( 2) (1 ) /( 2) (1 )/( 2) ESS TSS r r F F n RSS n r TSS n r n           : (1, 2)W F F F n    34 2.8. Phân tích hồi quy và dự báo • Vấn đề: sử dụng SRF ước lượng được để dự báo về biến phụ thuộc. - Dự báo giá trị trung bình của biến phụ thuộc (biết X = X0 cần dự báo giá trị E(Y/X0)). - Dự báo giá trị cá biệt của biến phụ thuộc (biết X = X0 cần dự báo giá trị (Y0 = Y/X0)) 35 Dự báo giá trị trung bình của biến phụ thuộc • SRF cho ta một ước lượng điểm của E(Y/X0) trên mẫu • Để dự báo E(Y/X0) cho tổng thể ta ƯL khoảng tin cậy của nó. • Ta có • Do đó với độ tin cậy (1-) cho trước 0 1 2 0 ˆ ˆYˆ X   ( 2)0 0 0 2 0 0 2 ˆ ( / ) ˆ( ) ( )1ˆ ˆ( ) n i Y E Y X T T Se Y X X Se Y n x       ( 2 ) ( 2 ) 0 0 0 0 0 2 2 ( 2 ) 0 0 0 ( 2 ) 0 0 0 ˆ ˆ ˆ ˆ( ) ( / ) ( ) ˆ ˆ( / ) ( ) ˆ ˆ( / ) ( ) n n n n Y Se Y T E Y X Y Se Y T E Y X Y Se Y T E Y X Y Se Y T                 36 Dự báo giá trị cá biệt của biến phụ thuộc • SRF cho ta một ước lượng điểm của Y0 = (Y/X0) trên mẫu • Để dự báo Y0 của tổng thể ta ƯL khoảng tin cậy của nó. • Ta có • Do đó với độ tin cậy (1-) cho trước 0 1 2 0 ˆ ˆYˆ X   ( 2 )0 0 0 0 2 0 0 0 2 1 ˆ ˆ( ) ( )1ˆ ˆ( ) 1 n n i i Y Y T T Se Y Y X X Se Y Y n x             ( 2 ) ( 2 ) 0 0 0 0 0 0 0 2 2 ( 2) 0 0 0 0 ( 2) 0 0 0 0 ˆ ˆ ˆ ˆ( ) ( ) ˆ ˆ( ) ˆ ˆ( ) n n n n Y Se Y Y T Y Y Se Y Y T Y Y Se Y Y T Y Y Se Y Y T                     37 2.9. Trình bày kết quả phân tích hồi quy r2 Bậc tự do n-2 Thống kê T Thống kê F iˆY 1ˆ 2ˆ iX 1ˆ( )Se  2 ˆ( )Se  1 1 ˆ ˆ/ ( )Se  2 2 ˆ ˆ/ ( )Se  2 2 2 (1 ) 1 r n F r    38 2.10. Thí dụ • Thí dụ 2.2 – trang 41 • Thí dụ 2.3 – trang 46 39