Mô hình hồi qui tuyến tính bội : Giới thiệu và ước lượng

Trong mô hình hồi qui đơn những hiện tượng mà chúng ta chưa giải thích được nằm ở đâu? Chúng ta đã nghiên cứu mô hình hồi qui đơn. Trong lý thuyết cũng nhưtrong thực tế, có nhiều trường hợp mà biến kinh tếcho không thểgiải thích bằng các mô hình hồi qui đơn nhưvậy. Chúng ta có thểnêu ra các ví dụsau đây Lượng cầu phụthuộc vào giá, thu nhập, giá các hàng hoá khác v.v Nhớlại lý thuyết vềhành vi người tiêu dùng. Q D = f(P, I, Ps, Pc,Market size,P f (giá kỳvọng), T (thịhiếu)) Sản lượng phụthuộc vào giá, các nhập lượng ban đầu, các nhập lượng trung gian, công nghệv.v Nhớlại lý thuyết vềhàm sản xuất. Q S =f(K,L, TECH)

pdf15 trang | Chia sẻ: haohao89 | Lượt xem: 2704 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Mô hình hồi qui tuyến tính bội : Giới thiệu và ước lượng, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Chương Trình Giảng Dạy Kinh Tế Fulbright Niên Khóa 2007 - 2008 Các phương pháp phân tích Mô hình hồi qui tuyến tính bội : Giới thiệu và Ước lượng Nguyễn Trọng Hoài 1 1 Mô hình hồi qui tuyến tính bội : Giới thiệu và Ước lượng 1) Giới thiệu mô hình hồi qui tuyến tính bội Trong mô hình hồi qui đơn những hiện tượng mà chúng ta chưa giải thích được nằm ở đâu? Chúng ta đã nghiên cứu mô hình hồi qui đơn. Trong lý thuyết cũng như trong thực tế, có nhiều trường hợp mà biến kinh tế cho không thể giải thích bằng các mô hình hồi qui đơn như vậy. Chúng ta có thể nêu ra các ví dụ sau đây Lượng cầu phụ thuộc vào giá, thu nhập, giá các hàng hoá khác v.v… Nhớ lại lý thuyết về hành vi người tiêu dùng. QD = f(P, I, Ps, Pc,Market size,Pf (giá kỳ vọng), T (thị hiếu)) Sản lượng phụ thuộc vào giá, các nhập lượng ban đầu, các nhập lượng trung gian, công nghệ v.v… Nhớ lại lý thuyết về hàm sản xuất. QS=f(K,L, TECH) Tốc độ tăng trưởng của nền kinh tế phụ thuộc vào chi tiêu đầu tư, lượng lao động, thay đổi công nghệ. Nhớ lại lý thuyết về hàm tổng sản xuất. Lương phụ thuộc vào trình độ giáo dục, kinh nghiệm, giới tính, độ tuổi . . . Chương Trình Giảng Dạy Kinh Tế Fulbright Niên Khóa 2007 - 2008 Các phương pháp phân tích Mô hình hồi qui tuyến tính bội : Giới thiệu và Ước lượng Nguyễn Trọng Hoài 2 2 Giá nhà ở phụ thuộc vào diện tích nhà, số phòng ngủ và số phòng tắm . . . Chương Trình Giảng Dạy Kinh Tế Fulbright Niên Khóa 2007 - 2008 Các phương pháp phân tích Mô hình hồi qui tuyến tính bội : Giới thiệu và Ước lượng Nguyễn Trọng Hoài 3 3 Chi tiêu của hộ gia đình về thực phẩm phụ thuộc vào qui mô hộ gia đình, thu nhập, vị trí địa lý . . . Chương Trình Giảng Dạy Kinh Tế Fulbright Niên Khóa 2007 - 2008 Các phương pháp phân tích Mô hình hồi qui tuyến tính bội : Giới thiệu và Ước lượng Nguyễn Trọng Hoài 4 4 Tỷ lệ từ vong trẻ em của quốc gia phụ thuộc vào thu nhập bình quân đầu người, trình độ giáo dục . . . Chương Trình Giảng Dạy Kinh Tế Fulbright Niên Khóa 2007 - 2008 Các phương pháp phân tích Mô hình hồi qui tuyến tính bội : Giới thiệu và Ước lượng Nguyễn Trọng Hoài 5 5 Cầu tiền phụ thuộc vào lãi suất, mức giá, GDP trong nền kinh tế. Khi chúng ta có tập hợp dữ liệu về một biến kinh tế nào đó (biến này được gọi là biến phụ thuộc) và các nhân tố ảnh hưởng đến nó (các nhân tố sảnh hưởng này được gọi là các biến giải thích) thì việc xét đến các ảnh hưởng riêng biệt (hoặc trực tiếp, ròng) của nhiều nhân tố đến một biến kinh tế có thể được giải thích bằng mô hình hồi qui bội. 2) Yêu cầu dữ liệu Một số dữ liệu được mô tả dưới dạng spreadsheet như đã mô tả ở trên 3) Hàm hồi qui tổng thể (Population Regression Function-PRF) Mô hình : iK33221 εββββ +++++= Kiiii XXXY L PRF [ ] [ ] sX' | E sX' | E iK33221 εββββ +++++= Kiiii XXXY L Chương Trình Giảng Dạy Kinh Tế Fulbright Niên Khóa 2007 - 2008 Các phương pháp phân tích Mô hình hồi qui tuyến tính bội : Giới thiệu và Ước lượng Nguyễn Trọng Hoài 6 6 Các hệ số β được gọi là các hệ số hồi qui riêng; mỗi hệ số được giải thích như sau: [ ] k i sX' | Y β=∂ ∂ kX E 4) Các giả định quan trọng của mô hình hồi qui tuyến tính bội PRF bao gồm hai phần: phần kiểm soát và phần nhiễu ngẫu nhiên (trong tài liệu gốc có nhiều tên gọi khác nhau như stochastic disturbance, random disturbance). εi là biến ngẫu nhiên và tuân theo phân phối chuẩn εi ≈ N(0, σ2), X’s là biến kiểm soát hay còn gọi là biến cho trước. Do Yi là tổng hợp của hai phần như vậy nên Yi cũng là một biến ngẫu nhiên. 4.1 Các giả định OLS cho mô hình hồi qui tuyến tính đơn được giải thích trong mô hình hồi qui bội: các giả định này liên quan đến thành phần nhiễu ngẫu nhiên (εi) a) Giá trị kỳ vọng của εi bằng không => E(εi | X’s) = 0 b) Không có tương quan chuỗi (không có tự tương quan) => cov(εi, εj| X’s ) = 0 với i # j c) Phương sai đồng nhất => var(εi) = σ2 d) Nhiễu ngẫu nhiên không có tương quan với các X => cov(εi, Xki ) = 0 (k:số biến giải thích trong mô hình) e) Không nhận dạng sai mô hình 4.2 Giả định bổ sung của OLS cho mô hình hồi qui bội Các biến hồi qui này không có hiện tượng đa cộng tuyến hoàn hảo (perfect multicollinearity hoặc exact linear relationship). Tức là, không tồn tại tập hợp các hệ số thỏa mãn biểu thức sau với mọi i: 0 1 K3322 =++++ Kiii XXX λλλ L Chúng ta sẽ giải thích điều kiện này rõ hơn trong mô hình hồi qui có hai biến giải thích. Tạm thời chúng ta chấp nhận giải định này ở đây. 5) Hàm hồi qui mẫu (Sample Regression Function-SRF) Chúng ta đề cập tới vấn đề ước lượng bằng cách nhận dạng hàm hồi qui mẫu (SRF): ˆ ˆ ˆ ˆ ˆ K33221 Kiiii XXXY ββββ ++++= L Các phần dư được định nghĩa giống như chúng được xác định trong phương pháp hồi qui đơn: Chương Trình Giảng Dạy Kinh Tế Fulbright Niên Khóa 2007 - 2008 Các phương pháp phân tích Mô hình hồi qui tuyến tính bội : Giới thiệu và Ước lượng Nguyễn Trọng Hoài 7 7 ii Yˆ - Y =ie 6) Ước lượng bình phương tối thiểu (Ordinary Least Squares Estimators- OLS ) Bằng định nghĩa này, chúng ta có thể nhớ lại nguyên tắc bình phương tối thiểu để tìm các ước lượng của các hệ số hồi qui riêng. Chọn ˆ , , ˆ , ˆ 21 Kβββ L sao cho ∑ 2ie là tối thiểu. Lưu ý là ( )∑∑ = 2K33221i2 ˆ - - ˆ - ˆ - ˆ - Y Kiiii XXXe ββββ L Chúng ta có thiết lập các điều kiện bậc nhất cho phép tính tối thiểu này như sau : ( ) ( ) ( )∑∑ ∑∑ ∑∑ ==∂ ∂ ==∂ ∂ ==∂ ∂ 0 X ˆ - - ˆ - ˆ - ˆ - Y 2- ˆ 0 X ˆ - - ˆ - ˆ - ˆ - Y 2- ˆ 0 ˆ - - ˆ - ˆ - ˆ - Y 2- ˆ KiK33221i 2 2iK33221i 2 2 K33221i 1 2 Kiii K i Kiii i Kiii i XXX e XXX e XXX e βββββ βββββ βββββ L M L L Hệ phương trình mà chúng ta có được gọi là hệ phương trình chuẩn. Chúng ta có thể giải K phương trình chuẩn này để tìm K hệ số beta chưa biết. Sự trình bày đơn giản nhất của lời giải này ở dưới dạng đại số ma trận. Tuy nhiên vì mục đích ứng dụng là chủ yếu và chúng ta đã có phần mềm EViews và các phần mềm phân tích dữ liệu khác do đó chúng ta có thể tìm dễ dàng các hệ số hồi qui mà không cần phải nhớ công thức. 7) Trường hợp hàm hồi qui có hai biến giải thích Chúng ta có thể tìm lời giải cho mô hình có chứa hai biến hồi qui: i33221 εβββ +++= iii XXY Trước hết chúng ta viết ra hệ phương trình chuẩn cho trường hợp này và sau đó sừ dụng phương pháp ma trận tìm ra các ước lượng. Các ước lượng tìm được từ phương pháp bình phương tối thiểu là : Chương Trình Giảng Dạy Kinh Tế Fulbright Niên Khóa 2007 - 2008 Các phương pháp phân tích Mô hình hồi qui tuyến tính bội : Giới thiệu và Ước lượng Nguyễn Trọng Hoài 8 8 33221 ˆ - ˆ - Y ˆ XX βββ = ( )( ) ( )( ) ( )( ) ( )232i23i22 32i3i 2 3i2i 2 x - x x y- x y ˆ ∑∑∑ ∑∑∑∑= ii iii xx xxxβ ( )( ) ( )( ) ( )( ) ( )232i23i22 32i2i 2 2i3i 3 x - x x y- x y ˆ ∑∑∑ ∑∑∑∑= ii iii xx xxxβ Chúng ta không cần nhớ các biểu thức này, nhưng chúng sẽ được sừ dụng chúng để minh họa các kết quả nào đó. Việc tính toán các ước lượng sẽ càng trở nên khó khăn nếu mô hình hồi qui của chúng ta càng có nhiều biến giải thích. Tuy nhiên với sự trợ giúp của phần mềm Eviews và các phần mềm xừ lý dữ liệu khác chúng ta hoàn toàn có thể tìm được giá trị các ước lượng của mô hình hồi qui bội một cách nhanh chóng. Giải thích khi có hiện tượng đa cộng tuyến hoàn hảo chúng ta không có nghiệm xác định cho các hệ số hồi qui. 8) Phân tích ý nghĩa của hệ số ước lượng trong mô hình hồi qui bội Tên gọi: Hệ số độ dốc riêng (partial slope coefficient) hoặc hệ số hồi qui riêng (partial regression coefficient) Ý nghĩa: hệ số độ dốc riêng của một biến hồi qui nào đó trong mô hình hồi qui bội mô tả số đơn vị thay đổi của biến phụ thuộc khi biến giải thích thay đổi một đơn vị nhưng giữ cho các biến giải thích khác không đổi. Nói cách khác hệ số độ dốc riêng phản ảnh ảnh hưởng ròng (net effect) hoặc ảnh hưởng trực tiếp (direct effect) lên khi biến phụ thuộc khi biến giải thích thay đổi một đơn vị sau khi đã loại trừ ảnh hưởng của các biến hồi qui khác. Hiệu quả của mô hình hồi qui bội: trực tiếp ước lượng ảnh hưởng trực tiếp của một biến hồi qui lên một biến phụ thuộc. Nếu chúng ta sừ dụng hồi qui đơn để ước lượng ảnh hưởng trực tiếp của một biến hồi qui lên biến biến phụ thuộc (ví dụ trong trường hợp biến phụ thuộc chịu ảnh hưởng bởi hai biến hồi qui X2 và X3). Chúng ta muốn tìm ảnh hưởng trực tiếp của X2 lên biến phụ thuộc Y Trong trường hợp này chúng ta phải thực hiện 3 phép hồi qui đơn. Chương Trình Giảng Dạy Kinh Tế Fulbright Niên Khóa 2007 - 2008 Các phương pháp phân tích Mô hình hồi qui tuyến tính bội : Giới thiệu và Ước lượng Nguyễn Trọng Hoài 9 9 Ví dụ: chúng ta có dữ liệu về tỉ lệ từ vong trẻ em (CM) phụ thuộc vào GNP / đầu người (PGNP) và tỉ lệ mù chữ phụ nữ (FLR). Chúng ta muốn tìm ảnh hưởng trực tiếp của PGNP lên CM nhưng phải loại bỏ ảnh hưởng của FLR lên CM và PGNP. Coi ví dụ trong bài đọc trong trang 206 và 214 bản tiếng Anh. - Hồi qui CM theo FLR = CMi = 263.8635 – 2.3905.FLRi + e1i Chương Trình Giảng Dạy Kinh Tế Fulbright Niên Khóa 2007 - 2008 Các phương pháp phân tích Mô hình hồi qui tuyến tính bội : Giới thiệu và Ước lượng Nguyễn Trọng Hoài 10 10 - Hồi qui PGNP theo FLR = PGNP = - 39.3033 + 28.1427 FLRi + e2i Chương Trình Giảng Dạy Kinh Tế Fulbright Niên Khóa 2007 - 2008 Các phương pháp phân tích Mô hình hồi qui tuyến tính bội : Giới thiệu và Ước lượng Nguyễn Trọng Hoài 11 11 - Hồi qui phần dư của hàm thứ nhất cho phần dư hàm thứ hai = e1i^= -0.0056 e2i Trong khi đó: hồi qui bội cho chúng ta biết ngay ảnh hưởng trực tiếp của PGNP lên CM với cùng một giá trị đã tính được ở bước hồi qui đơn thứ ba. Chương Trình Giảng Dạy Kinh Tế Fulbright Niên Khóa 2007 - 2008 Các phương pháp phân tích Mô hình hồi qui tuyến tính bội : Giới thiệu và Ước lượng Nguyễn Trọng Hoài 12 12 CM^ = 263.6416 – 0.0056 PGNPi – 2.2326 FLRi Giải thích thêm bằng sơ đồ và đồ thị. 9) Phương sai (VAR) và độ lệch chuẩn (SE) của các ước lượng SE (ước lượng) = Căn bậc hai của VAR (ước lượng) Các phương sai của hồi qui bội cũng trở nên phức tạp hơn. Chúng ta chỉ trình bày phương sai của 2βˆ và coi đó là một ví dụ: [ ] ( )( ) ( ) 2232i23i22 2 3i 2 x - x x ˆ σβ ∑∑∑ ∑= ii xx VAR Hãy nhớ lại định nghĩa của bình phương hệ số tương quan giữa X2 và X3: ( )( )( )∑∑∑= 23i22 2 32i2 23 x x i i x x r Chương Trình Giảng Dạy Kinh Tế Fulbright Niên Khóa 2007 - 2008 Các phương pháp phân tích Mô hình hồi qui tuyến tính bội : Giới thiệu và Ước lượng Nguyễn Trọng Hoài 13 13 Biến đổi một chút chúng ta có phương sai của 2βˆ như sau: ( ) ( ) 22 22 2 22 23 1ˆ 1 - r Ki VAR x β β σ σ∧ =   = =  ∑ Một lần nữa, nếu hai biến hồi qui này không tương quan với nhau, thì phương sai này đơn giản chỉ là phương sai của hồi qui đơn. Phân phối xác suất chọn mẫu của ước lượng bình phương tối thiểu Để có khả năng xây dựng các khoảng tin cậy đối với các tham số chưa biết và kiểm định giả thiết về chúng , chúng ta cần biết các phân phối xác suất chọn mẫu của những ước lượng này. Khi đề cập về phân phối chọn mẫu của các ước lượng, chúng ta cần biết ba nội dung sau đây: Kỳ vọng toán học Phương sai Dạng hàm của phân phối chọn mẫu Đầu tiên, hãy xét kỳ vọng của ước lượng 2βˆ : ( )( ) ( )( ) ( )( ) ( )232i23i22 32i3i 2 3i2i 2 x - x x Y- x Y ˆ ∑∑∑ ∑∑∑∑= ii iii xx xxxβ Bây giờ hãy thế i33221 εβββ +++= iii XXY vào trong biểu thức ước lượng và thực hiện vài biến đổi đại số chúng ta sẽ có: Chương Trình Giảng Dạy Kinh Tế Fulbright Niên Khóa 2007 - 2008 Các phương pháp phân tích Mô hình hồi qui tuyến tính bội : Giới thiệu và Ước lượng Nguyễn Trọng Hoài 14 14 ( )( ) ( )( ) ( )( ) ( ) ( )( ) ( )( ) ( )( ) ( )232i23i22 32i3i 2 3i2i 2 2 32i 2 3i 2 2 32i3i 2 3i2i 2 x - x x - x x - x x Y- x Y ˆ ∑∑∑ ∑∑∑∑ ∑∑∑ ∑∑∑∑ += = ii iii ii iii xx xxx xx xxx εεβ β Khi chúng ta lấy giá trị kỳ vọng của biểu thức thứ hai, chúng ta thấy ước lượng của tham số là không chệch bởi vì chúng ta có kết quả sau đây: [ ] 22 ˆ ββ =E Chúng ta hầu như đã quen với cách trình bày phương sai của ước lượng. Cuối cùng, rõ ràng từ biểu thức trên là mỗi ước lượng đều là một tổ hợp tuyến tính của của các biến ngẫu nhiên có phân phối chuẩn, vì thế mỗi ước lượng cũng đều có phân phối chuẩn. Những kết quả suy luận nêu trên cũng đúng đối với hàm hồi qui bội có K biến. Những ước lượng tham số là không chệch, và các phương sai của ước lượng tham số đã biết, và chúng tuân theo phân phối chuẩn. Tuy vậy, trên thực tế không thể biểu diễn được những kết quả này nếu không sừ dụng công cụ đại số ma trận. Chúng ta tóm tắt kết quả điển hình dưới dạng sau: ( )2ˆk , N ~ ˆ kk βσββ 10) Các tính chất của ước lượng OLS trong mô hình hồi qui bội 10.1 BLUE - Ước lượng không chệch tuyến tính tốt nhất . Tính chất này cũng giống như mô hình hồi qui đơn. Khi chúng ta đã hiểu 3 tính chất nằm trong BLUE là: - Hệ số ước lượng tuyến tính (chúng ta thấy ngay tuyến tính ở các hệ số hồi qui, hãy cho một vài ví dụ) - Hệ số ước lượng là không chệch (căn cứ vào công thức ước lượng chúng ta có thể lấy kỳ vọng hai vế). - Phương sai của hệ số ước lượng là nhỏ nhất (muốn chứng minh phải sừ dụng định lý Gauss-Markov, tuy nhiên chúng ta có thể lý giải hệ số ước lượng có VAR nhỏ nhất trực tiếp khi liên hệ hệ số tương quan giữa các biến hồi qui với giả định không có hiện tượng cộng tuyến hoàn hảo) . Chương Trình Giảng Dạy Kinh Tế Fulbright Niên Khóa 2007 - 2008 Các phương pháp phân tích Mô hình hồi qui tuyến tính bội : Giới thiệu và Ước lượng Nguyễn Trọng Hoài 15 15 10.2 Khi có hiện tượng cộng tuyến hoàn hảo (có nghĩa là không thoả giả định OLS cho mô hình hồi qui bội) thì VAR của hệ số ước lượng không còn nhỏ nhất và chúng ta cũng không thể tìm ra giá trị ước lượng của các hệ số. 10.3 Khi biến đổi của giá trị biến hồi qui càng lớn so với giá trị trung bình của nó thì phương sai hệ số ước lượng càng nhỏ, tham số ước lượng càng chính xác. Thông thường biến đổi của biến hồi qui càng lớn khi cỡ mẫu (số quan sát) của chuỗi dữ liệu càng lớn. Có thể giải thích điều này bằng đồ thị hàm mật độ xác xuất. Như vậy số quan sát nào là đủ lớn cho một bộ dữ liệu?