Do đó giữa Yi và giá trị trung bình E(Y/Xi) có sự sai lệch,ta ký hiệu sự sai lệch là Ui
Nên viết được : Yi = E(Y/Xi)+ Ui (2).
Vì một Xi cho nhiều Yi nên Yi là đại lượng ngẫu nhiên (ĐLNN).
Vì một Xi cho một E(Y/Xi) nên E(Y/Xi) là đại lượng xác định.Do đó từ (2) suy ra
Ui là ĐLNN và được gọi là sai số ngẫu nhiên.
(2) gọi là PRF ngẫu nhiên.
Lý do tồn tại sai số ngẫu nhiên
185 trang |
Chia sẻ: haohao89 | Lượt xem: 6692 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Bài giảng Kinh tế lượng: Các khái niệm, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Kinh tế lượngI-Các Khái niệm I.1. Kinh tế lượng là gì( Econometrics)?- là lượng hóa các quan hệ giữa các đại lượng kinh tế nhằm kiểm định các lý thuyết kinh tế I.2. Đường lối chung của kinh tế lượng khi giải quyết một vấn đề. Đăt vấn đề Nêu kết luận KT cơ sở Lập mô hình tóan Thu thập số liệu Ước lượng mô hình Kiểm định xem MH tốt Hay không Dự báo Tốt Ra quyết định Quay lại kiểm Tra các bước trên k. tôt I.3.Phân tích hồi quy –Quan hệ hàm số-Quan hệ thống kê. a) Phân tích hồi quy.Là nghiên cứu sự phụ thuộc của một biến gọi là biến phụ thuộc vào một hoặc nhiều biến khác gọi là biến giải thích với ý tưởng ước lượng giá trị trung bình của biến phụ thuộc dựa trên các giá trị đã biết của các biến giải thích. b) Quan hệ hàm số.Đại lượng Y được gọi là có quan hệ hàm số với đại lượng X nếu với mỗi giá trị cho trước của đại lượng X theo quy luật f ta có duy nhất một giá trị của đại lượng Y và khi đó ta viết : Y = f(X) c) Quan hệ thống kê.Đại lượng Y được gọi có quan hệ thống kê với đại lượng X nếu với mỗi giá trị cho trước của đại lượng X ta có nhiều giá trị tương ứng của đại lượng Y,Nói cách khác ta có một phân phối xác suất của đại lượng Y. I.4.Số liệu. a) Phân lọai. Số liệu theo thời gian : là dãy số liệu về một chỉ tiêu nào đó theo thời gian. Số liệu chéo: là dãy số liệu về một chỉ tiêu nào đó tại một thời điểm ở nhiều nơi khác nhau. Số liệu hỗn hợp : là dãy số liệu vừa theo thời gian vừa có tính chất chéo. b) Nguồn gốc của số liệu do cơ quan nhà nước thu thập ( ví dụ tổng cục thống kê) hoặc do từng cá nhân thu thập. c) Nhược điểm của số liệu: - Phi thực nghiệm. - sai số trong đo lường. - nhiều số liệu không có giá trị thực ,giá trị đúng. -Có những số liệu ta không thể có. II.Mô hình hồi quy tổng thể.Mô hình hồi quy mẫu II.1. Mô hình hồi quy tổng thể (PRF= Population Regression function)- Sai số ngẫu nhiên. Xét một tổng thể gồm 60 gia đình , ta nghiên cứu mối quan hệ giữa chi tiêu tiêu dùng hàng tuần , ký hiệu Y và thu nhập khả dụng hàng tuần , ký hiệu X. Bảng . Đồ thị 0 80 100 260 50 100 150 200 Đường hồi quy lý thuyết Đường hồi quy Thực nghiệm Đường hồi quy lý thuyết của hàm số f E(Y/X) = f(X) (1) (1) gọi là mô hình hồi quy tổng thể PRF. - với mỗi giá trị cho trước của biến giải thích Xi (X1=80,x2=100, . . . ,x10=260) thì (1) E(Y/Xi)=f(Xi) - mặt khác ở một lần quan sát tương ứng với xi thì chỉ có một giá trị Y, ký hiệu Yi. Do đó giữa Yi và giá trị trung bình E(Y/Xi) có sự sai lệch,ta ký hiệu sự sai lệch là Ui Nên viết được : Yi = E(Y/Xi)+ Ui (2). Vì một Xi cho nhiều Yi nên Yi là đại lượng ngẫu nhiên (ĐLNN). Vì một Xi cho một E(Y/Xi) nên E(Y/Xi) là đại lượng xác định.Do đó từ (2) suy ra Ui là ĐLNN và được gọi là sai số ngẫu nhiên. (2) gọi là PRF ngẫu nhiên. Lý do tồn tại sai số ngẫu nhiên - do nhược điểm của số liệu thu thập. -SSNN đại diện cho tất cả các yếu tố ảnh hưởng tới biến phụ thuộc mà không có mặt trong mô hình. Nói về dạng hàm f. - trong mô hình (1) , nếu chỉ có một biến giải thích , gọi là mô hình đơn (mô hình hồi quy hai biến).Nếu có nhiều hơn một biến giải thích gọi là mô hình hồi quy bội. Hàm f có thể là tuyến tính hoặc phi tuyến Xét trường hợp mô hình hồi quy đơn: E(Y/Xi)= (a) E(Y/Xi)= (b) E(Y/Xi) = (c) E(Y/Xi)= (d) (a) vừa tuyến tính theo biến giải thích vừa tuyến tính theo tham số. (b) tuyến tính theo tham số .phi tuyến theo biến giải thích. (c ) giống (b). (d) phi tuyến theo tham số và phi tuyến theo biến giải thích. Quy ước . Khi nói tới mô hình hồi quy tuyến tính là tuyến tính theo tham số và ta chỉ xét MHHQ tuyến tính ( Xét dạng (a),(b),(c)). II-2 Mô hình hồi quy mẫu (SRF- Sample regression function)-Phần dư (Residual) Xét MHHQ tổng thể đơn: E(Y/Xi) = (1) Hoặc viết theo lối Yi = +Ui (2) Chú ý: Mô hình tổng thể (1) coi như đã biết nếu như giá trị của các hệ số hồi quy , được xác định ,tuy nhiên do không có số liệu tổng thể nên các số , không xác định được.Vì lý do trên ta đi phải nghiên cứu tổng thể thông qua mẫu.Ví dụ từ tổng thể ta rút ra 1 mẫu và ứng với PRF dạng (1) ta đi ước lượng mô hình (3) (3) gọi là MHHQ mẫu ( SRF) ( thuật ngữ ước lượng MHHQ là đi tìm giá trị bằng số của các hệ số hồi quy , từ các số liệu của mẫu) Khi đó dùng MHHQ mẫu SRF để ước lượng MHHQ tổng thể PRF với ý ước lượng điểm cho E(Y/Xi) ước lượng điểm cho ước lượng điểm cho Với mỗi giá trị Xi cho trước theo (3) ta tính được giá trị trung bình theo mẫu là . Mặt khác ở một lần quan sát ứng với Xi ta có giá trị Yi và lại có sai lệch giữa Yi và -ký hiệu sự sai lệch này là ei nên ta viết Yi = + ei = + ei (4) (4) gọi là SRF ngẫu nhiên. Ei gọi là phần dư thứ i. Phần dư ei được dùng làm ước lượng điểm cho SSNN Ui Chương II: Mô hình hồi quy hai biến. I. Phương pháp bình phương bé nhất. Xét PRF hai biến E(Y/Xi) = (1) Ý nghĩa của hệ số hồi quy ( (2) ). Để ước lượng MH (1) từ mẫu gồm n quan sát (Xi,Yi) (i= 1, . . ,n) ta ước lượng SRF tương ứng (3) ( (4) ) Tính các hệ số hồi quy sao cho sai lệch giữa và Yi là bé nhất các phần tử ei bé nhất bé nhất. Nhưng vì các ei có thể >0 và cũng có thể 0 Quan hệ giữa AFC và Q (nghịch biến) Quan hệ Phillip giữa tỷ lệ tăng tăng lương và tỷ lệ thất nghiệp ( nghịch biến) Q AFC 0 Y X 0 Hàm tiêu dùng Engel giữa mức chi tiêu tiêu dùng loại hàng A (Y) và mức thu nhập X đồng ( đồng biến) Y X 0 Ngưỡng thu nhập Mô hình hồi quy k biến I. Mô hình hồi quy k- biến. Mô hình hồi quy k- biến là mô hình có dạng (2) – là PRF k biến & (1) là PRF k biến ngẫu nhiên. Từ mẫu gồm n quan sát (Yi ,X2i,X3i, . . ,Xki); i=1,2, . . .,n , tương ứng với (1) ta có Ký hiệu Khi đó (4) – Dạng ma trận của MHHQ tổng thể k biến ngẫu nhiên. : hệ số chặn ( gốc , tự do). hệ số hồi quy riêng. II. Các giả thiết . GT1: các giá trị của các biến giải thích là biết trước.Do đó ma trận X là xác định. GT2: Các biến giải thích X2i , X3i , . . .,Xki không cộng tuyến ( hay không có hiện tượng cộng tuyến giữa các biến giải thích ). GT3.Sai số ngẫu nhiên Ui có E(Ui) =0 GT4.Phương sai của các sai số ngẫu nhiên Ui đều bằng nhau (phương sai thuần nhất): GT5.Sai số ngẫu nhiên Ui, Uj ( i j) không tương quan , tức : cov(Ui,Uj) = 0 . GT6. III. Phương pháp bình phương bé nhất (OLS). Với 6 giả thiết trên ,bằng phương pháp OLS người ta chứng minh được rằng các hệ số hồi quy là tuyến tính không chệch và có phương sai nhỏ nhất và được tính IV Hệ số xác định R2 – Hệ số xác định có hiệu chỉnh 1)Hệ số xác định R2 . a)Định nghĩa: b) Tính chất: TC1: TC 2. R2 là hàm không giảm theo số biến giải thích trong MH. C) Cách dùng: Hai mẫu thỏa điều kiện : Cùng dạng của biến phụ thuộc. Cùng số quan sát. Cùng số biến giải thích.(biến giải thích ở dạng tùy ý). khi đó nếu R2 của MH nào lớn hơn thì MH đó tốt hơn. 2) Hệ số xác định có hiệu chỉnh ( hiệu chỉnh theo bậc tự do). a) công thức b) Tính chất. TC1: Khi k>1 thì ( khi số biến giải thích k càng lớn thì càng nhỏ so với R2 ) . TC2. R2 luôn không âm nhưng có thể âm.Trong trường hợp là số âm thì ta coi =0. c) Cách dùng: Ta dùng để giải quyết vấn đề : Có nên đưa thêm biến giải thích mới vào hay không? Ví dụ: So sánh hai mô hình Để chọn MH nào tốt hơn ta thực hiện theo quy tắc : Nếu hai điều kiện sau đây thỏa : ĐK1:Ở MH (b) ta kiểm định giả thiết và đi tới quyết định bác bỏ H0 , chấp nhận ( tức hệ số của biến giải thích mới đưa thêm vào là X3i khác 0 có ý nghĩa). ĐK2: Thì ta nói MH (b) tốt hơn MH (a) . V. Ma trận hệ số tương quan.-Correlation matrix Nhắc lại :hệ số tương quan của hai đại lượng X, Y : Ma trận hệ số tương quan V của các biến Yi , X2i , . . .,Xki là Ma trận hệ số tương quan có t/c sau: - Là ma trận vuông cấp k -là ma trận đối xứng. -Các phần tử trên đường chéo chính đều bằng 1. Chú ý .Nếu thì ta coi X,Y có quan hệ tuyến tính. VI. Ma trận hiệp phương sai của các hệ số hồi quy ( Coefficient covariance Matrix) Nhắc lại : Ma trận hiệp phương sai của các hệ số hồi quy là ma trận Ma trận có các tính chất sau: -là ma trận vuông Đối xứng Các phần tử trên đường chéo chính là phương sai của các hệ số hồi quy tương ứng. Công thức tính ma trận hiệp phương sai của các hệ số hồi quy: với , nhưng do chưa biết nên thay bằng ước lượng không chệch của nó là với n – số quan sát k – số hệ số hồi quy. VII.Khoảng tin cậy. Tương tự như phần MHHQ hai biến ở đây ta cũng có với ( với Cjj là phần tử nằm trên giao của dòng j cột j của ma trận (XTX) -1 ) . Lại do chưa biết nên được thay bằng ước lượng không chệch của nó là nên ĐLNN Từ đây ta dễ dàng (như trường hợp k=2) tìm được KTC với ĐTC cho hệ số hồi quy là : với là giá trị tới hạn của ĐLNN T tuân theo quy luật Student với bậc tư do là (n-k) thỏa VIII.Kiểm định. 1) Kiểm định riêng biệt về các hệ số hồi quy. - là bài toán KĐGT tương tự như trong TH hai biến - ở đây ta cũng có ba phương pháp để KĐ:- Ý nghĩa , KTC , p- value. a) Phương pháp ý nghĩa. Với MÝN (tra bảng) tìm gía trị tới hạn với n – số quan sát ; k – số biến. Từ mẫu ta tính giá trị thống kê t: Khi đó Nếu thì bác bỏ H0 , chấp nhận H1 . Nếu thì chấp nhận H0 . ( Chú ý :Đúng ra ta phải nói : có thể chấp nhận H0 hay chưa có đủ cơ sở để bác bỏ H0 ). B) Phương pháp KTC. Với MÝN , từ mẫu ta tìm miền chấp nhận của giả thiết H0: = KTC với ĐTC cho hệ số hồi quy . Khi đó : Nếu thì ta (có thể) chấp nhận H0. Nếu thì ta bác bỏ H0 , ( có thể ) chấp nhận H1 . C) Phương pháp p- value. (Chỉ dùng để KĐGT ) Khi đó Nếu p- value thì bác bỏ H0 , chấp nhận H1 . 2) Kiểm định đồng thời các hệ số hồi quy-KĐ sư phù hợp của MHHQ – KĐF . Kiểm định đồng thời về các hệ số hồi quy là KĐGT: Điều này có nghĩa trong MHHQ k biến , tất cả (k-1) biến giải thích X2i ,X3i , . . . ,Xki đều không ảnh hưởng tới biến phụ thuộc Yi MHHQ không phù hợp H0 : R2 = 0 - tương tự như trong TH 2 biến ta KĐGT này theo thống kê F ( nên gọi là KĐF) . Vậy nội dung của bài toán KĐ đồng thời các hệ số hồi quy hay còn gọi là kiểm định sự phù hợp của MHHQ k- biến. Với MÝN ( tra bảng ) tìm giá trị tới hạn - là giá trị tới hạn của ĐLNN tuân theo quy luật F với bậc tự do thứ nhất là (k-1) và bậc tự do thứ hai là (n-k) thỏa Từ mẫu tính giá trị thống kê F: Nếu thì bác bỏ H0 , chấp nhận H1 . Nếu thì chấp nhận Ho . IX. Dự báo. Dựa vào các giá trị cho trước của các biến độc lập ta lập mô hình để dự báo cho giá trị trung bình và giá trị cá biệt của biến phụ thuộc. Dùng ngôn ngữ ma trận ta kí hiệu Ta dự báo giá trị trung bình của biến phụ thuộc và giá trị cá biệt Từ SRF ta tính được thì là ƯL điểm cho giá trị TB E(Y/X0) với ĐTC thì dự báo khoảng cho giá trị TB E(Y/X0 ) là với còn X Một số dạng hàm. 1) Hàm sản xuất Cobb-Douglas . Trong KTL hàm sản xuất Cobb-Douglas dạng: Với Yi - sản lượng X2i – lượng lao động. X3i – lượng vốn. Ui – sai số ngẫu nhiên. là các tham số . Để ước lượng được MH trên bằng PP ( bình phương bé nhất- MH tuyến tính) lấy ln hai vế (2) là MH có dạng tuyến tính log . Chú ý. Với hàm số dạng thì hệ số co giãn riêng Hệ số co giãn riêng theo X3 là Như vậy với những hàm dạng tuyến tính log có TC: Hệ số co giãn riêng theo các biến là không đổi . Hệ số nói rằng khi lao động tăng tương đối 1% , còn vốn không đổi thì sản lượng tăng %. Hệ số nói rằng khi vốn tăng 1% còn lao đông không đổi thì sản lượng tăng %. Như vậy khi cả vốn và lao động đồng thời tăng 1% thì sản lượng tăng %. Vậy nên : - Trường hợp =1 . Trong trường hợp này, khi tất cả các đầu vào tăng lên bao nhiêu lần thì đầu ra cũng tăng bấy nhiêu lần.Trong Kinh tế gọi là hiệu qủa không đổi theo quy mô sản xuất ( constant return to scale ). Trường hợp >1 .Trong trường hợp này khi đầu vào cùng tăng k lần thì đầu ra tăng hơn k lần .Trong kinh tế gọi là hiệu qủa tăng theo quy mô sản xuất ( increasing return to scale). Trường hợp 10 thì ta coi có dấu hiệu cộng tuyến. 4.Các biện pháp khác phục. a- Sử dụng thông tin tiên nghiệm. b- Thu thập thêm số liệu hoặc lấy mẫu mới Vấn đề đa cộng tuyến là đặc trưng của mẫu do đó nhiều khi tăng cỡ mẫu hoặc lấy mẫu khác có thể làm giảm tính nghiêm trọng của đa c. tuyến. c- loại trừ biến cộng tuyến khỏi mô hình. Cách làm như sau: V.D. Xét MHHQ và thấy trong các biến giả thích thì biến X2 và X3 có tương quan chặt chẽ . Khi đó ƯLMHHQ mà Kg có X2 – ký hiệu (a) có và kg có X3 - ký hiệu (b) có Nếu thì bỏ X2 . Chú ý : Hạn chế bỏ biến cộng tuyến. + làm mất thông tin về Y ( X2 chứa thông tin về Y mà những thông tin này không chứa trong các biến khác.), + Sử dụng sai phân cấp 1: Xét dãy số thời gian { xt } ( t = 1,2 , . . ) . Khi đó được gọi là sai phân cấp 1.( tương tự ). II.Phương sai thay đổi . 1.Hiện tượng phương sai thay đổi . Một trong các GT của MHHQ là các SSNNUi ; Uj có cùng p/sai tức - Gọi là GT về PS thuần nhất ( kg thay đổi ). Nếu xảy ra hiện tượng : Tức GT trên bị vi phạm và khi đó ta nói đã xảy ra hiện tượng PS không thuần nhất hay còn gọi là PS thay đổi . VarU1= . . .=Var Un X1 Xn X1 Xn 2) Hậu qủa . Các hệ số hồi qui được ước lượng OLS vẫn là không chệch nhưng không hiệu qủa ( tức không nhỏ nhất ). Phương sai được ước lượng là ƯL chệch , do đó các kiểm định theo thống kê t và F không còn đáng tin cậy. 3) các cách phát hiện. Chú ý : Các cách “ chuẩn đoán” đều nhằm xem VarUi bằng hay khác VarUj mà từ mẫu ta dùng ei ƯL cho SSNN Ui nên mọi biện pháp ở đây đều nhằm xem giá trị phần dư ei và Xi có q/hệ không? Nếu phần dư ei không ảnh hưởng bởi Xi thì k/luận P/S TN. Nếu phần dư ei bị ảnh hưởng bởi Xi thì k/luận PS không TN. Sau đây là một số cách “chuẩn đoán”. 3.1.Do bản chất h/tiợng nghiên cứu . Trong các biện pháp còn lại ta luôn xuất phát từ giả thiết : -Từ mẫu ƯL MHHQ mẫu , từ đó có phần dư 3.2 Phương pháp đồ thị. Vẽ đồ thị của ei theo Xi. ei Xi ei Xi (a) PS T.nhất PS thay đổi PS thay đổi PS thay đổi Chú ý : Trong MH k biến thì Xi được chọn là biến giải thích có ảnh hưởng nhiều nhất tới biến phụ thuộc. Vì mà ei là ƯL cho Ui nên thực ra để xét sự thay đổi của VarUi ta phải xét tới Ui2 tức ei2 .Do đó trên đồ thị thay vì phải xét q/hệ giữa ei2 với Xi ta lại chỉ xét q/hệ giữa ei với Xi . 6.3 Kiểm định Park. Park cho rằng là hàm của các biến giải thích ở dạng mũ: Vì chưa biết nên Park đã dùng thay thế , tức : (a) Với . Dựa vào MH trên ta đi kiểm định xem phần dư ei có phụ thuộc vào Xi không?Do đó nội dung của kiểm định Park là: Bước 1: Từ mẫu ƯL SRF để thu được phần dư ei. Bước 2:ƯLMHHQ phụ : Bước 3. Đối với MHHQ phụ ta KĐGT (lnei2 không phụ thuộc lnXi PSTN). 6.4.Kiểm định Glejser. Glejser lại cho rằng phần dư ei có quan hệ với biến giải thích Xi theo các dạng sau: Với các MHHQ phụ như kiểu trên ta lại đi KĐGT: Chú ý : Kiểm định Glejser cho kết qủa tốt đối với mẫu lớn. 6.5.Kiểm định White. Đây là phép kiểm định có ý nghĩa nhất. Nôi dung kiểm định White. Minh họa cho MHHQ 3 biến. Bước 1. Từ mẫu ƯL SRF để thu được phần dư ei. Bước 2.ƯL MHHQ phụ dạng: (no Cross terms) hay : ( cross terms). Với MHHQ phụ ta đi kiểm định xem MH có phù hợp hay không? Tức KĐGT: Theo thống kê (k là số biến của MHHQ phụ) Nếu thì bác bỏ , Nếu thì Chấp nhận . Chú ý : 1.MHHQ phụ nhất thiết phải có hệ số chặn . 2.Thống kê nR2 với R2 của MHHQ phụ. 3.Vì GT tương đương với Ho:R 2 =0 nên còn được KĐ theo thống kê F. 4.Các biện pháp khắc phục.(xem giáo trình). III. Tự tương quan. III.1. Hiện tượng tự tương quan. Một trong các giả thiết của MHHQ TT cổ điển là : Các SSNN Ui ; Uj không tương quan tức Cov(Ui,Uj) =0 khi i j . Nếu giả thiết này bị vi phạm , tức các SSNN Ui,Uj có tương quan với nhau , ta sẽ nói đã xảy ra hiện tượng tự tương quan. Nguyên nhân : 1. Quán tính : Nhiều hiện tương kinh tế có quán tính – thể hiện nhiều chuỗi số thời gian _ VD chi tiêu mua sắm quần áo thường tăng cao trong các dịp khai giảng , nghỉ Tết. 2. Hiện tượng mạng nhện :Kết quả thời kỳ trước ảnh hưởng đến kết qu3a thời kỳ sau- VD đơn giá của thời kỳ t (Pt) thường bị ảnh hưởng bởi đơn giá thời kỳ trước (Pt-1) tức Pt = f(Pt-1). 3. Do bỏ sót biến giải thích quan trọng-VD qb – nhu cầu về thịt bò . Pb,Ph,I – giá thịt bò , giá thịt heo, thu nhập. Lý thuyết KT chỉ rõ : qb = f(Pb.Ph,I) Tức ta có MHHQ : qb = Song vì lý do nào đó ta lại U7L MHHQ Do đó điều này có nghĩa SSNN Vi đã chứa đựng ảnh hưởng hệ thống của giá heo tới lượng cầu về thịt bò và tạo nên tự tương quan. 4. Xử lý số liệu không tốt : ta hay làm trơn số liệu theo kiểu : muốn có số liệu của quí ta thường lấy số liệu của ba tháng rồi chia 3. Việc lấy trung bình này làm trơn số liệu và làm giảm sự dao động trong số liệu tháng có thể dẫn đến sai số hệ thống và gây ra tự tương quan. III.2. Hậu quả. + Các hệ số hồi quy được Ư.L. theo OLS vẫn là tuyến tính , không chệch nhưng không hiệu quả. + Kiểm định t,F không còn đáng tin cậy. + R2 cũng không còn đáng tin cậy . III.3. Các biện pháp phát hiện. Vì phần dư ei được dùng để U7L cho SSNN Ui nên thay vì xét xemUi,Uj có tương quan với nhau không ta đi xét xem ei , ej có tương quan với nhau không . Nói cách khác , ta xét dãy phần dư e1,e2, . . , có tương quan hay không . ( ta gọi là chuỗi phần dư theo thời gian).Nếu dãy này là ngẫu nhiên thì ta kết luận không tự tương quan.Nếu dãy này không ngẫu nhiên ( có quan hệ với nhau ) thì ta nói có hiện tượng tự tương quan. * Khái niệm về bậc tự tương quan. + Nếu xảy ra quan hệ: với (a) với - ĐLNN thỏa E( ) =0 ; Cov ( , ) = 0 ; Var( )= Cho mọi I thì ta nói , các phần dư ei tự tương quan bậc nhất Maskov. gọi là hệ số tư rương quan bậc nhất. (a) – Mô hình tư tương quan bậc nhất ( tự hồi quy bậc nhất ). Ký hiệu AR (1) ( Auto regressive scheme). Tổng quát nếu xảy ra : Với với d/kiện ĐLNN thỏa : Thì ta nói p/dư có tự tương quan bậc p .Maskov ; (b) là mô hình hồi quy bậc p – ký hiệu AR(p). 3.1.Phương pháp đồ thị . Vẽ đồ thị của phần dư theo thời gan t không tự t/quan tự t/quan 3.2. Kiểm định Dusbin –Watson Ư L SRF để thu được phần dư ei . - Tính thống kê Dusbin – Watson Với Do hệ số tương quan thỏa nên Nếu thì ei , e i-1 có q/hệ tuyến tính dương thì d =0 . Nếu thì ei , e i-1 có q/hệ tuyến tính âm thì d =4 . Nếu thì ei , e i-1 không có q/hệ tuyến tính thì d =2 . Dựa vào sự phân tích trên : - số quan sát n - số biến giải thích của MH k’=k-1. MY1N Tra bảng 2 giá trị tới hạn . Nội dung của K Đ Dusbin –Watson được thể hiện trên sơ đồ sau: Có tự t/quan k0 tự t/quan có tự t/quan (bậc nhất)dương (bậc nhất) âm không kết luận. Trong thực hành có quy tắc đơn giản. d (1,3) – không tương quan. có tự tương quan. 3.3. Kiểm định Breusch-godfrey (B-G). - Từ mẫu ƯL SRF thu được phần dư ei (VD gọi là MH gốc ). Ư L MHHQ phụ của phần dư ei theo : các biến giải thích của MHHQ gốc gồm X2 , X3 – và các biến ei-1 , ei-2, . . . ,ei-p ( p biến mới ) tức có MH: ( tự hồi quy bậc p ) Ở MHHQ phụ ta K Đ GT : Bằng thống kê -với M Ý N tra bảng có giá trị tới hạn Nếu bác bỏ H0 , chấp nhận H1. Nếu chấp nhận H0 tức có hiện tượng tự tương quan – (Đ/ K áp dụng cho mẫu lớn) Chương 7. Chọn mô hình và kiểm định việc chọn mô hình. i.Các thuộc tính của một mô hình tốt. 1. Tính giản đơn ( Tiết kiệm ).] - Mô hình đơn giản và phản ánh tốt thực tế thì được coi là tốt . 2. Tính đồng nhất Với cùng 1 tập mẫu cho trước , nếu giá trị của các hệ số hồi quy của MH được xác định một cách duy nhất thì ta nói MH có tính đồng nhất 3. Tính phù hợp. Nếu càng gần 1 thì mô hình càng phù hợp. 4. Tính ổn định về mặt lý thuyết. MH được coi là ổn định về mặt lý thuyết nếu dấu của các hệ số h/quy phù hợp với kết luận của lý thuyết. 5. Có tính dự báo tốt . MH cho kết quả càng gần với thực tế được coi là MH có tính dự báo tốt. II. Các sai lầm khi chọn mô hình. 1. Sai lầm do MH chứa biến không quan trọng.( thừa biến). VD ,Xét MHHQ Ở đây ta phân biệt 2 TH. TH1.Nếu lý thuyết cơ sở khẳng định biến X3 có ảnh hưởng tới biến phụ thuộc Y thì cho dù khi K Đ GT ta chấp nhận giả thiết này thì ta vẫn giữ biến X3 trong MH . TH2. Nếu lý thuyết cơ sở không khẳng định rõ biến X3 có ảnh hưởng tới biến phụ thuộc Y. hay không thì lúc này ta mới coi X3 là biến “cần kiểm tra” .Khi K Đ GT , nếu chấp nhận H0 thì ta nó MH trên đã mắc sai lầm thừa biến. 2.Sai lầm do MH bỏ sót biến (thiếu biến) 3.Sai lầm do lựa chọn dạng hàm sai – VD- III. Các biện pháp phát hiện sai lầm. Phát hiện MH thừa biến – K Đ Wald. + từ mẫu Ư L SRF : Với (k-m) biến là biến “cần kiểm tra”. Việc kiểm tra xem MH trên (cũ) có thừa biến không được thực hiện qua K Đ Wald với nội dung là : + Ư L MHHQ mới ( Không chứa biến “cần kiểm tra” ) + K Đ GT Tương đương với MH cũ mắc sai lầm thừa biến. Theo thống kê F: n –số biến quan sát . k- số biến của MH cũ. k-m số biến “ c