- Phân tích hồi qui là nghiên cứu sự phụ thuộc của một biến (biến phụ thuộc hay còn gọi là biến được giải thích) vào một hay nhiều biến khác (biến độc lập hay còn gọi là biến giải thích) với ý tưởng cơ bản là ước lượng (hay dự đoán) giá trị trung bình của biến phụ thuộc trên cơ sở các giá trị đã biết của biến độc lập.
Biến phụ thuộc: là đại lượng ngẫu nhiên tuân theo các quy luật phân bố xác suất.
Biến độc lập: có giá trị xác định trước
31 trang |
Chia sẻ: lylyngoc | Lượt xem: 3030 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Mô hình hồi qui 2 biến, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ĐÌNH THÔNG * MÔ HÌNH HỒI QUI 2 BIẾN ĐÌNH THÔNG * MÔ HÌNH HỒI QUI HAI BIẾN Nội dung của chương này: Bản chất của phân tích hồi qui Cách xử lí số liệu đầu vào Hàm hồi qui tổng thể (PRF) và hàm hồi qui mẫu (SRF) trong mô hình hồi qui tuyến tính hai biến. ĐÌNH THÔNG ĐÌNH THÔNG * I. Bản chất của phân tích hồi qui Khái niệm - Phân tích hồi qui là nghiên cứu sự phụ thuộc của một biến (biến phụ thuộc hay còn gọi là biến được giải thích) vào một hay nhiều biến khác (biến độc lập hay còn gọi là biến giải thích) với ý tưởng cơ bản là ước lượng (hay dự đoán) giá trị trung bình của biến phụ thuộc trên cơ sở các giá trị đã biết của biến độc lập. Biến phụ thuộc: là đại lượng ngẫu nhiên tuân theo các quy luật phân bố xác suất. Biến độc lập: có giá trị xác định trước ĐÌNH THÔNG ĐÌNH THÔNG * I. Bản chất của phân tích hồi qui Khái niệm Một số ví dụ: VD1: Việc hút thuốc lá là nguyên nhân chính gây tử vong do ung thư phổi. Một mô hình hồi qui tuyến tính đơn cho vấn đề này là: DEATHS = + SMOKING + u ĐÌNH THÔNG ĐÌNH THÔNG * I. Bản chất của phân tích hồi qui Khái niệm VD2: Xem xét đồ thị phân tán sau đây mô tả phân phối về chiều cao của học sinh nam tính theo những độ tuổi cố định. ĐÌNH THÔNG ĐÌNH THÔNG * I. Bản chất của phân tích hồi qui Khái niệm VD3: Một nhà kinh tế lao động nghiên cứu tỷ lệ thay đổi tiền lương trong mối quan hệ với tỷ lệ thất nghiệp. Đường cong này cho phép nhà kinh tế lao động dự đoán được mức thay đổi trung bình về tiền lương tại 1 tỷ lệ thất nghiệp cho trước. Ty le that nghiep ĐÌNH THÔNG ĐÌNH THÔNG * I. Bản chất của phân tích hồi qui Khái niệm VD4: Gám đốc tiếp thị của một công ty có thể muốn biết mức cầu đối với sản phẩm của công ty có quan hệ như thế nào với chi phí quảng cáo. Một nghiên cứu như thế sẽ rất có ích cho việc xác định độ co dãn của cầu đối với chi phí quảng cáo. Tức là tỷ lệ phần trăm thay đổi về mức cầu khi ngân sách quảng cáo thay đổi 1%. Kiến thức này rất có ích cho việc xác định ngân sách quảng cáo tối ưu. Vd5: Một nhà nông học có thể quan tâm tới việc nghiên cứu sự phụ thuộc của sản lượng lúa vào nhiệt độ, lượng mưa, nắng, phân bón,... ĐÌNH THÔNG ĐÌNH THÔNG * Chúng ta có thể đưa ra vô số ví dụ như trên về sự phụ thuộc của một biến vào một hay nhiều biến khác. Các kỹ thuật phân tích hồi qui thảo luận trong Chương này nhằm nghiên cứu sự phụ thuộc như thế giữa các biến số. Ký hiệu: Y - biến phụ thuộc (hay biến được giải thích) Xj - biến độc lập(hay biến giải thích) thứ j Trong đó, biến phụ thuộc Y là đại lượng ngẫu nhiên, có quy luật phân phối xác suất. Các biến độc lập Xj không phải là ngẫu nhiên, giá trị của chúng đã được biết trước. Khái niệm I. Bản chất của phân tích hồi qui ĐÌNH THÔNG ĐÌNH THÔNG * I. Bản chất của phân tích hồi qui 2. Phân tích hồi quy giải quyết các vấn đề sau: Ước lượng giá trị trung bình của biến phụ thuộc với giá trị đã cho của biến độc lập. Kiểm định giả thiết về bản chất của sự phụ thuộc. Dự đoán giá trị trung bình của biến phụ thuộc khi biết giá trị của các biến độc lập. Kết hợp các vấn đề trên. ĐÌNH THÔNG ĐÌNH THÔNG * I. Bản chất của phân tích hồi qui 3. Phân biệt các quan hệ trong phân tích hồi qui: Quan hệ thống kê và quan hệ hàm số Phân tích hồi qui là sự phụ thuộc thống kê của biến phụ thuộc 1 hay nhiều biến giải thích, biến phụ thuộc là ngẫu nhiên, vì có rất nhiều yếu tố tác động đến nó mà ta không thể đưa vào mô hình được, mỗi giá trị biến độc lập có thể có nhiều giá trị khác nhau của biến phụ thuộc. Trong quan hệ hàm số, các biến không phải ngẫu nhiên, ứng với giá trị mỗi biến độc lập có duy nhất giá trị biến phụ thuộc. Phân tích hồi qui không nghiên cứu các quan hệ hàm số. ĐÌNH THÔNG ĐÌNH THÔNG * I. Bản chất của phân tích hồi qui Hàm hồi qui và quan hệ nhân quả: Phân tích hồi qui nghiên cứu 1 biến phụ thuộc với 1 hoặc nhiều biến độc lập và điều này không đòi hỏi biến phụ thuộc và biến độc lập có quan hệ nhân quả. Nếu quan hệ nhân quả tồn tại thì nó phải được xác lập dựa trên các lý thuyết kinh tế khác. Ví dụ, luật cầu nói rằng các yếu tố không đổi thì nhu cầu của 1 loại hàng hóa tỷ lệ nghịch với giá của hàng hóa này. 3. Phân biệt các quan hệ trong phân tích hồi qui: ĐÌNH THÔNG ĐÌNH THÔNG * I. Bản chất của phân tích hồi qui Hồi qui và tương quan: khác về mục đích và kỹ thuật 3. Phân biệt các quan hệ trong phân tích hồi qui: Hồi qui Ước lượng hoặc dự báo một biến trên cơ sở giá trị đã cho của biến khác. Các biến không có tính chất đối xứng. Biến phụ thuộc là đại lượng ngẫu nhiên và các biến độc lập thì giá trị đã được xác định. Tương quan Đo lường mức độ kết hợp tuyến tính giữa 2 biến. Ví dụ quan hệ giữa kết quả thi môn lý và môn toán. Không có sự phân biệt giữa các biến, chúng có tính chất đối xứng. ĐÌNH THÔNG ĐÌNH THÔNG * II. Bản chất và nguồn số liệu cho phân tích hồi qui 1. Các loại số liệu: 3 loại Số liệu theo thời gian (chuỗi thời gian) là các số liệu thu thập trong 1 thời kỳ nhất định. Ví dụ, số liệu về GDP , GO... của Việt Nam từ năm 2000 đến nay. Số liệu chéo (theo không gian), số liệu về 1 hoặc nhiều biến thu thập tại 1 thời điểm ở nhiều địa phương đơn vị khác nhau. Ví dụ, các số liệu tổng điều tra dân số 01/4/2009 vừa qua. Số liệu hỗn hợp theo thời gian và không gian, ví dụ số liệu giá vàng hàng ngày tại Tiền Giang, TPHCM, Cần Thơ... ĐÌNH THÔNG ĐÌNH THÔNG * II. Bản chất và nguồn số liệu cho phân tích hồi qui 2. Nguồn số liệu: Các cơ quan nhà nước Các tổ chức quốc tế Các đơn vị sản xuất kinh doanh Các cá nhân Trong khoa học xã hội, các số liệu thường là phi thực nghiệm. ĐÌNH THÔNG ĐÌNH THÔNG * II. Bản chất và nguồn số liệu cho phân tích hồi qui 3. Nhược điểm của số liệu: yêu cầu thu thập số liệu đảm bảo tính chính xác, kịp thời, đầy đủ. Tuy nhiên thực tế khó đảm bảo yêu cầu này, do: Có thể sai số hoặc bỏ sót hoặc cả hai khi quan sát . Trong điều tra bằng câu hỏi, thường gặp tình trạng không trả lời hoặc không trả lời hết câu hỏi. Các mẫu số liệu trong các cuộc điều tra thường không giống nhau về kích thước nên rất khó so sánh giữa các đợt điều tra. Các số liệu kinh tế thường ở mức tổng hợp cao nên không cho phép đi sâu vào các đơn vị nhỏ. Bí mật quốc gia. ĐÌNH THÔNG ĐÌNH THÔNG * III. HÀM HỒI QUI HAI BIẾN 1. Hàm hồi qui tổng thể (Population Regression Function-PRF) Trong quan hệ hồi qui, một biến phụ thuộc có thể được giải thích bởi nhiều biến độc lập. Nếu chỉ nghiên cứu một biến phụ thuộc bị ảnh hưởng bởi một biến độc lập => Mô hình hồi qui hai biến. Nếu mối quan hệ giữa hai biến này là tuyến tính => Mô hình hồi qui hai biến. ĐÌNH THÔNG ĐÌNH THÔNG * III. HÀM HỒI QUI HAI BIẾN 1.Hàm hồi qui tổng thể: Xét ví dụ giả định sau: Giả sử ở một địa phương có tất cả 60 gia đình và chúng ta nghiên cứu mối quan hệ giữa: Y - Tiêu dùng hàng tuần của các gia đình X - Thu nhập khả dụng hàng tuần của các hộ gia đình. Các số liệu giả thuyết cho ở bảng sau: ĐÌNH THÔNG ĐÌNH THÔNG * III. HÀM HỒI QUI HAI BIẾN 1.Hàm hồi qui tổng thể: ĐÌNH THÔNG Thu nhập và chi tiêu trong một tuần của tổng thể ĐÌNH THÔNG * III. HÀM HỒI QUI HAI BIẾN 1.Hàm hồi qui tổng thể: ĐÌNH THÔNG Các số liệu ở bảng trên được giải thích như sau: Với thu nhập trong một tuần, chẳng hạn X=120 $ thì có 5 gia đình mà chi tiêu trong tuần của các gia đình trong nhóm này lần lượt là 79; 84; 90; 94 và 98. Tổng chi tiêu trong tuần của nhóm này là 445 $. Như vậy mỗi cột của bảng cho ta một phân phối của chi tiêu trong tuần Y với mức thu nhập đã cho X. ĐÌNH THÔNG * III. HÀM HỒI QUI HAI BIẾN 1.Hàm hồi qui tổng thể: ĐÌNH THÔNG Từ số liệu ở bảng trên, ta tính được các xác suất có điều kiện: Chẳng hạn: P(Y=70/X=100)=1/6; P(Y=94/X=120)=1/5; P(Y=103/X=140)=1/7... Từ đó, ta có bảng các xác suất có điều kiện và kỳ vọng toán có điều kiện của Y điều kiện là X=Xi. Kỳ vọng toán có điều kiện (trung bình có điều kiện) của Y với điều kiện là X=Xi được tính theo công thức: ĐÌNH THÔNG * III. HÀM HỒI QUI HAI BIẾN 1.Hàm hồi qui tổng thể: ĐÌNH THÔNG Xác suất có điều kiện P(Y/X) và kỳ vọng có điều kiện E(Y/Xi) ĐÌNH THÔNG * ĐÌNH THÔNG * III. HÀM HỒI QUI HAI BIẾN 1.Hàm hồi qui tổng thể: ĐÌNH THÔNG Biểu diễn các điểm (Xi;Yj) và các điểm (Xi; E(Y/Xi)) ta được đồ thị như hình bên. Theo đồ thị bên ta thấy trung bình có điều kiện của mức chi tiêu trong tuần nằm trên đường thẳng có hệ số góc dương. Khi thu nhập tăng thì mức chi tiêu cũng tăng. Một cách tổng quát, E(Y/Xi) là một hàm của Xi. E(Y/Xi) = f(Xi) (1) ĐÌNH THÔNG * III. HÀM HỒI QUI HAI BIẾN 1.Hàm hồi qui tổng thể: ĐÌNH THÔNG Hàm (1) được gọi là hàm hồi qui tổng thể (PRF). PRF có 1 biến độc lập thì họi là hồi qui đơn, nếu có từ 2 biến độc lập trở lên gọi là hồi qui bội. Ý nghĩa của hàm PRF: Hàm hồi qui tổng thể (PRF) cho ta biết giá trị trung bình của biến Y sẽ thay đổi như thế nào khi biến X nhận các giá trị khác nhau. Để xác định dạng hàm của PRF người ta thường dựa vào đồ thị biểu diễn sự biến thiên của dãy các số liệu quan sát về X và Y kết hợp với việc phân tích bản chất vấn đề nghiên cứu. ĐÌNH THÔNG * III. HÀM HỒI QUI HAI BIẾN 1.Hàm hồi qui tổng thể: ĐÌNH THÔNG Ý nghĩa của hàm PRF: Xét trường hợp đơn giản nhất là PRF có dạng tuyến tính: E(Y/Xi) = β1 + β2Xi. Trong đó: β1, β2 là các tham số chưa biết nhưng cố định và được gọi là các hệ số hồi qui. β1: là hệ số tự do (hệ số tung độ góc). Nó cho biết giá trị trung bình của biến phụ thuộc Y khi biến độc lập X nhận giá trị 0. Trong thực tế hệ số này không có nhiều ý nghĩa. β2: là hệ số góc (hệ số độ dốc), cho biết giá trị trung bình của biến phụ thuộc Y khi giá trị của biến độc lập X thay đổi. ĐÌNH THÔNG * III. HÀM HỒI QUI HAI BIẾN 1.Hàm hồi qui tổng thể: ĐÌNH THÔNG Hàm hồi qui tuyến tính luôn được hiểu là tuyến tính với các tham số, nó có thể không tuyến tính đối với biến. Thuật ngữ “tuyến tính” ở đây được hiểu theo hai nghĩa: Tuyến tính đối với tham số và tuyến tính đối với các biến. Thí dụ: E(Y/Xi) = β1 + β2Xi2 là hàm tuyến tính đối với tham số nhưng phi tuyến đối với biến. E(Y/Xi) = β1 + β23 Xi là hàm tuyến tính đối với biến nhưng không tuyến tính với tham số. Ý nghĩa của hàm PRF: E(Y/Xi) là trung bình có điều kiện của Y với điều kiện X nhận giá trị Xi. ĐÌNH THÔNG * III. HÀM HỒI QUI HAI BIẾN 1.Hàm hồi qui tổng thể: ĐÌNH THÔNG Sai số ngẫu nhiên: Gía trị quan sát thứ i của biến phụ thuộc Y được kí hiệu là Yi. Ký hiệu Ui là chênh lệch giữa Yi và E(Y/Xi): Ui = Yi - E(Y/Xi) hay Yi = E(Y/Xi) +Ui (2) Ui là đại lượng ngẫu nhiên, Ui có thể nhận giá trị âm hoặc dương; người ta gọi Ui là sai số ngẫu nhiên (hoặc nhiễu) và hàm (2) được gọi là hàm hồi qui tổng thể ngẫu nhiên. Được viết: Yi = β1 + β2Xi + Ui ĐÌNH THÔNG * III. HÀM HỒI QUI HAI BIẾN 1.Hàm hồi qui tổng thể: ĐÌNH THÔNG Sai số ngẫu nhiên: Đồ thị minh họa Yi 2 Ngoài các biến giải thích đã có trong mô hình, còn có một số biến khác ảnh hưởng đến Y rất nhỏ. Trong ví dụ trên, ta thấy ngoài yếu tố thu nhập tác động đến chi tiêu của hộ gia đình như: số con trong gia đình, tôn giáo, giới tính...và Ui sẽ đại diện cho ảnh hưởng của các yếu tố đó. ĐÌNH THÔNG * III. HÀM HỒI QUI HAI BIẾN 1.Hàm hồi qui mẫu (Sample Regression Function-SRF) ĐÌNH THÔNG Trong thực tế nhiều khi ta không có điều kiện để điều tra toàn bộ tổng thể. Khi đó ta chỉ có thể ước lượng giá trị trung bình của biến phụ thuộc Y từ số liệu của một mẫu. Hàm hồi quy được xây dựng trên cơ sở của một mẫu được gọi là hàm hồi quy mẫu (SRF). Nếu hàm hồi qui tổng thể có dạng tuyến tính thì hàm hồi qui mẫu có dạng: Trong đó : Ŷi là ước lượng điểm của E(Y/Xi) ĐÌNH THÔNG * III. HÀM HỒI QUI HAI BIẾN 1.Hàm hồi qui mẫu (SRF) ĐÌNH THÔNG Dạng ngẫu nhiên của (3) là: Là tung độ gốc của SRF, là ước lượng điểm của 1 Là độ dốc của SRF, là ước lượng điểm của 2 ei là sai số ngẫu nhiên, là ước lượng điểm Ui còn gọi là phần dư. ĐÌNH THÔNG * TÓM TẮT CHƯƠNG I Bản chất của hồi qui là nghiên cứu sự phụ thuộc của một biến (biến phụ thuộc) vào một hay nhiều biến khác (biến giải thích), với ý tưởng là ước lượng (hay dự đoán) giá trị trung bình của biến phụ thuộc trên cơ sở các giá trị biết trước của các biến giải thích. Nhiệm vụ của phân tích hồi qui là ước lượng giá trị trung bình của phụ thuộc với giá trị đã cho của biến độc lập; kiểm định giả thuyết về bản chất sự phụ thuộc; dự báo giá trị của biến phụ thuộc khi biết giá trị của các biến độc lập và kết hợp các vấn đề trên. Để có kết quả sát với thực tế cần phân biệt các loại số liệu, ưu nhược điểm và cách xử lí nguồn số liệu. ĐÌNH THÔNG ĐÌNH THÔNG * TÓM TẮT CHƯƠNG I Hàm hồi qui tuyến tính luôn được hiểu là tuyến tính đối với tham số, nó có thể không tuyến tính đối với biến. Hàm hồi qui tổng thể là hàm được nghiên cứu trên toàn bộ tổng thể. Hàm hồi qui mẫu là hàm được xây dựng trên cơ sở một mẫu. Sử dụng hàm hồi qui mẫu ta ước lượng được giá trị trung bình của biến phụ thuộc từ số liệu của một mẫu. Hàm hồi qui tổng thể: Yi = β1 + β2Xi + Ui Hàm hồi qui mẫu: ĐÌNH THÔNG