Hồi qui sử dụng biến giả

Trước đây chúng ta chỉsừdụng biến giải thích định lượng. Trong bài giảng này chúng ta đềcập trong mô hình biến giải thích định tính nhằm giải quyết các tình huống như: tìm hiểu sựkhác biệt vềgiới tính trong việc thanh tóan lương, sưkhác biệc vềdoanh sốgiữa các mùa trong năm, và sự khác biệt giữa hai giai đọan chính sách khác nhau . . . Công cụxừlý đó chính là biến giả(dummy). Chúng ta giải thích trong nhiếu trường hợp khác nhau từ đơn giản đến phức tạp. Biến giảthểhiện các biến định tính. 1) Mô hình chỉcó biến giải thích là biến giả 2) Mô hình có biến giải thích định lượng và biến giả. Trong mô hình này lại có nhiều trường hợp khác nhau mà chúng ta sẽ đềcập sau.

pdf14 trang | Chia sẻ: haohao89 | Lượt xem: 2053 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Hồi qui sử dụng biến giả, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Chương Trình Giảng Dạy Kinh Tế Fulbright Niên Khóa 2007 - 2008 Các phương pháp phân tích Hồi qui sừ dụng biến giả Nguyễn Trọng Hoài 1 Hồi qui sừ dụng biến giả Trước đây chúng ta chỉ sừ dụng biến giải thích định lượng. Trong bài giảng này chúng ta đề cập trong mô hình biến giải thích định tính nhằm giải quyết các tình huống như: tìm hiểu sự khác biệt về giới tính trong việc thanh tóan lương, sư khác biệc về doanh số giữa các mùa trong năm, và sự khác biệt giữa hai giai đọan chính sách khác nhau . . . Công cụ xừ lý đó chính là biến giả (dummy). Chúng ta giải thích trong nhiếu trường hợp khác nhau từ đơn giản đến phức tạp. Biến giả thể hiện các biến định tính. 1) Mô hình chỉ có biến giải thích là biến giả 2) Mô hình có biến giải thích định lượng và biến giả. Trong mô hình này lại có nhiều trường hợp khác nhau mà chúng ta sẽ đề cập sau. Trường hợp 1: Hồi qui với một biến giả duy nhất là biến độc lập Yi = β1 + β2 Di + iε (11.1) Nam: E(Yi|D = 1) = β1 + β2 Nữ: E(Yi|D = 0) = β1 Ý nghĩa của α là lương trung bình của nhóm D= 0 và β là khác biệt kỳ vọng của lương trung bình của hai nhóm trong tổng thể. Dựa vào mô hình hồi qui đơn chúng có ∑Yi = nβ^ 1+ β^ 2∑Dt (11.2) ∑YiDi = β^ 1∑Di + β^ 2∑Di2 = β^ 1∑Di + β^ 2∑Di (11.3) Lưu ý rằng do D là biến giả và chỉ nhận giá trị 1 và 0, D2 cũng có giá trị giống D. Trong Phương trình (11.3), ∑Dt ở vế bên phải bằng số nam nhân viên (gọi là nm) và ∑YiDi ở vế bên trái bằng tổng lương của họ. Chia hai vế cho nm ta có β^ 1+ β^ 2 = Y−m (11.4) với Y−m là lương trung bình của nam nhân viên. Vì vậy, tổng các hệ số hồi qui là một ước lượng của E(Yi|D = 1), trung bình tổng thể lương của nam nhân viên. Vì ∑Di = nm, Phương trình (11.2) và (11.3) có thể viết lại thành ∑Yi = nβ^ 1 + nmβ^ 2 ∑YiDi = nm(β^ 1+ β^ 2) (11.5) Lấy phương trình thứ nhất trừ phương trình thứ hai và bỏ đi những số hạng chung ở vế bên phải, ta có ∑Yi − ∑YiDi = (n − nm) β^ 1 = nfβ^ 1 (11.6) Chương Trình Giảng Dạy Kinh Tế Fulbright Các phương pháp phân tích Hồi qui sừ dụng biến giả Nguyễn Trọng Hoài 2 2 với nf là số nhân viên nữ. Lưu ý là vế bên trái của phương trình đơn giản là tổng lương của nữ nhân viên (tổng của toàn bộ lương trừ tổng lương của nam nhân viên). Vì vậy, chia hai vế cho nf , chúng ta có β^ 1 = Y−f, trung bình mẫu của lương nữ nhân viên, đây là một ước lượng của trung bình tổng thể E(Yi|D = 0). Sừ dụng dữ liệu và ứng dụng EViews chúng ta có: Trong đó WAGE: tiền lương, DUMMY (= 0 nếu quan sát là nữ và = 1 nếu quan sát là nam) Kiểm tra lại bằng cách tìm giá trị lương trung bình của nữ trong tập hợp nữ Chương Trình Giảng Dạy Kinh Tế Fulbright Các phương pháp phân tích Hồi qui sừ dụng biến giả Nguyễn Trọng Hoài 3 3 Ở đây do mẫu bao gồm cả nam và nữ nên ta dùng lệnh sample với if như sau Kiểm tra lại bằng cách tìm giá trị lương trung bình của nam trong tập hợp nam Chương Trình Giảng Dạy Kinh Tế Fulbright Các phương pháp phân tích Hồi qui sừ dụng biến giả Nguyễn Trọng Hoài 4 4 Như vậy thì dữ liệu chúng ta kiểm tra phù hợp với giải thích về lý thuyết ở trên Trường hợp 2: Hồi qui với một biến giả và một biến định lượng Giả sừ rằng chúng ta phải ước lượng mối quan hệ giữa tiền lương của các giáo sư và số năm công tác của họ. ii21i ε Xβ β Y ++= (11.7) Yi = tiền lương hàng năm của giáo sư i. Xi = số năm công tác của giáo sư i. Ở đây chúng ta hòan tòan chưa nói là giáo sư là nam hay nữ. Bây giờ giả sừ rằng chúng ta muốn tìm hiểu xem xem liệu có phải các giáo sư nữ bị phân biệt đối xừ về việc trả lương của họ không. Chúng ta có hai cách để làm việc này: Cách 1:ước hai hàm hồi qui riêng biệt, có nghĩa là một hàm hồi qui cho các giáo sư nam có trong mẫu nM và một hàm hồi qui cho các giáo sư nữ có trong mẫu nF) Có hai khó khăn trong cách giải quyết này. Một là, mỗi phép hồi qui là kém hiệu quả hơn so với phép hồi qui sừ dụng toàn bộ dữ liệu. Hai là , tương đối không thuận tiện khi kiểm định liệu rằng hai phép hồi qui này là khác nhau. Chương Trình Giảng Dạy Kinh Tế Fulbright Các phương pháp phân tích Hồi qui sừ dụng biến giả Nguyễn Trọng Hoài 5 5 Cách 2: ước lượng chung cho cả giáo sư nam và nữ bằng cách xác định một biến mới ghi nhận sự có mặt hay vắng mặt của thuộc tính "nữ " Di = 0 nếu quan sát i thuộc về một giáo sư nam Di = 1 nếu quan sát i thuộc về một giáo sư nữ Như vậy phương trình 11.1 trở thành mô hình sau: iii21i ε Dδ Xβ β Y +++= 11.8 Hãy ghi nhận rằng bậc tự do của mô hình này là nM + nF - 3. Sự có mặt của biến giả này làm có thể thể hiện cả hai mô hình hồi qui riêng biệt nói trên (ở cách 1) trong một mô hình (theo cách 2). Xét các giá trị kỳ vọng có điều kiện sau: [ ] Xβ β 0 D | Y E i21ii +== nữ 11.9 [ ] ( ) Xβ δ β 1 D | Y E i21ii ++== nam 11.10 Chúng ta thấy rằng nếu δ là dương thì các giáo sư nữ có một hàm hồi qui tổng thể có tung độ gốc cao hơn sovới các giáo sư nam. Hệ số δ là chênh lệch tung độ gốc và nó cho thấy chênh lệch của các tung độ gốc đối với hai mẫu phụ. Dễ dàng kiểm định xem liệu chênh lệch này có ý nghĩa thống kê hay không: đơn giản là tính giá trị thống kê tc cho δˆ rồi so với giá trị tới hạn tra bảng t* như chúng ta đã làm như thường lệ khi kiểm định ý nghĩa thống kê của các hệ số hồi qui. Chúng ta có thể sừ dụng dữ liệu và minh họa khi hồi qui lương theo kinh nghiệm EXPER và GENDER như sau Chương Trình Giảng Dạy Kinh Tế Fulbright Các phương pháp phân tích Hồi qui sừ dụng biến giả Nguyễn Trọng Hoài 6 6 Giải thích sự khác biệt này bằng đồ thị. Lưu ý: tuy nhiên sự khác biệt này mới chỉ được kiểm sóat bởi biến giải thích duy nhất là EXPER. Do đó các hệ số ước lượng sẽ có sự hiện tượng chệch do bỏ sót biến. Chúng ta có thể minh họa điều này bằng cách hồi qui WAGE theo EXPER cho GENDER=1 Chương Trình Giảng Dạy Kinh Tế Fulbright Các phương pháp phân tích Hồi qui sừ dụng biến giả Nguyễn Trọng Hoài 7 7 Chúng ta thấy kết quả bảng trên khác biệt rất nhiều so với kết quả đầu tiên về hệ số trục tung cũng như hệ số độ dốc. Tóm lại chúng ta có các trường hợp sau đây: a) Thay đổi hệ số trục tung (có sự phân biệt giữa hai tính chất của biến định tính nhưng không liên quan đến biến định lượng) b) Thay đổi hệ số độ dốc (có sự phân biệt giữa hai tính chất trong biến định lượng) c) Bao gồm cả hai trường hợp trên. Ghi chú: chúng ta có thể mô tả đồ thị giải thích các trường hợp này một cách dễ dàng Điều này cho chúng ta một suy nghĩ rằng biến định tính có thể làm thay đổi cả hệ số trục tung lẫn hệ số độ dốc Bổ xung trường hợp 2: sừ dụng biến tương tác Chúng ta có thể đưa khả năng này vào bằng cách xác định một biến tương tác như sau : DXi = Di x Xi Bổ sung biến này vào hồi qui chúng ta có: ii2i1i21i ε DXδ Dδ Xβ β Y ++++= Các kỳ vọng có điều kiện giờ đây trở thành Chương Trình Giảng Dạy Kinh Tế Fulbright Các phương pháp phân tích Hồi qui sừ dụng biến giả Nguyễn Trọng Hoài 8 8 [ ] Xβ β 0 D | Y E i21ii +== nữ [ ] ( ) ( ) X δ β δ β 1 D | Y E i2211ii +++== nam Hệ số 2δ được gọi là chênh lệch độ dốc vì nó là chênh lệch giữa các độ dốc của hai mô hồi qui đối với hai mẫu phụ của chúng ta. Dễ dàng kiểm định rằng liệu chênh lệch này có ý nghĩa thống kê hay không. Chúng ta chỉ cần đánh giá mức độ ý nghĩa của trị thống kê t tính cho ước lượng của 2δ . Các biến giả với trường hợp nhiều thuộc tính Giả sừ rằng chúng ta quyết định mở rộng nghiên cứu của mình và ước lượng xem có sự khác biệt bao nhiêu trong tiền lương khi có sự khác nhau về trình độ học vấn và mẫu của chúng ta có nhiều thuộc tính học vấn khác nhau như đại học, thạc sĩ và tiến sĩ . Chúng ta có thể mã hoá các lạoi thuộc tính học vấn này như thế nào khi sừ dụng biến giả? Cách 1: Có gợi ý là nên làm như sau: Di = 0 đối với bằng đại học Di = 1 đối với bằng thạc sĩ Di = 2 đối với bằng tiến sĩ Khó khăn cho dạng mô hình này là chênh lệch giữa bằng đại học và bằng tiến sĩ lớn đúng gấp đôi chênh lệch giữa bằng đại học và bằng thạc sĩ; còn chênh lệch giữa bằng thạc sĩ và bằng tiến sĩ đúng bằng chênh lệch giữa bằng đại học và bằng thạc sĩ . Để thấy được điều này, chúng ta cần tìm các kỳ vọng có điều kiện như chúng ta đã làm trước đây. Giới hạn này có thể không phù hợp với dữ liệu của chúng ta và nó không cần thiết. Cách 2: hãy chỉ ra một cặp biến giả. Chúng ta thấy rằng chúng có ba cơ cấu xác định một cách duy nhất ba thuộc tính học vấn này. D1i D2i 0 0 Đại học 1 0 Thạc sĩ 0 1 Tiến sĩ Với một biến có ba tính chất, đôi khi chúng ta thừ sừ dụng ba biến giả sau: D1i D2i D3i 1 0 0 Đại học 0 1 0 Thạc sĩ Chương Trình Giảng Dạy Kinh Tế Fulbright Các phương pháp phân tích Hồi qui sừ dụng biến giả Nguyễn Trọng Hoài 9 9 0 0 1 Tiến sĩ Khó khăn với chiến lược này là nó tạo ra tính đa cộng tuyến hoàn hảo giữa ba biến giả và biến X1 = 1 đại diện cho hằng số : D1i + D2i + D3i - X1i = 0 đối với mọi i. Điều này được gọi là "bẫy biến giả" và nó cung cấp một ví dụ cho nội dung được nêu trước đây rằng sự đa cộng tuyến hoàn hảo thường được tạo ra một cách ngẫu nhiên bởi nhà kinh tế lượng. Làm thế nào tạo ra biến giả d1 trong dữ liệu. Chương Trình Giảng Dạy Kinh Tế Fulbright Các phương pháp phân tích Hồi qui sừ dụng biến giả Nguyễn Trọng Hoài 10 10 Chương Trình Giảng Dạy Kinh Tế Fulbright Các phương pháp phân tích Hồi qui sừ dụng biến giả Nguyễn Trọng Hoài 11 11 Chương Trình Giảng Dạy Kinh Tế Fulbright Các phương pháp phân tích Hồi qui sừ dụng biến giả Nguyễn Trọng Hoài 12 12 Chương Trình Giảng Dạy Kinh Tế Fulbright Các phương pháp phân tích Hồi qui sừ dụng biến giả Nguyễn Trọng Hoài 13 13 Chương Trình Giảng Dạy Kinh Tế Fulbright Các phương pháp phân tích Hồi qui sừ dụng biến giả Nguyễn Trọng Hoài 14 14
Tài liệu liên quan