Câu 1 (25 điểm): Các khẳng định sau đây có chính xác không? Hãy cẩn thận suy xét và giải thích các câu trả lời của Anh/Chị.
a. Các ước lượng bình phương nhỏ nhất thông thường (OLS) cho hệ số gốc được ước tính chính xác hơn nếu như các giá trị của X gần với các giá trị trung bình mẫu hơn.
Trước khi trả lời câu này, nhắc lại sự khác nhau giữa "đúng" và "chính xác" là hữu ích. Đúng nghĩa là không chệch; chính xác nghĩa là phương sai thấp. Do đó, câu hỏi này là về phương sai của các hàm ước lượng bình phương thông thường nhỏ nhất (OLS).
9 trang |
Chia sẻ: lylyngoc | Lượt xem: 2270 | Lượt tải: 6
Bạn đang xem nội dung tài liệu Kinh tế lượng Đáp án bài tập số 2, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
ĐẠI HỌC HOA SEN
KINH TẾ LƯỢNG
ĐÁP ÁN Bài tập SỐ 2
MÔ HÌNH HỒI QUY ĐƠN
Người soạn: GV. Phạm Văn Minh
Câu 1 (25 điểm): Các khẳng định sau đây có chính xác không? Hãy cẩn thận suy xét và giải thích các câu trả lời của Anh/Chị.
Các ước lượng bình phương nhỏ nhất thông thường (OLS) cho hệ số gốc được ước tính chính xác hơn nếu như các giá trị của X gần với các giá trị trung bình mẫu hơn.
Trước khi trả lời câu này, nhắc lại sự khác nhau giữa "đúng" và "chính xác" là hữu ích. Đúng nghĩa là không chệch; chính xác nghĩa là phương sai thấp. Do đó, câu hỏi này là về phương sai của các hàm ước lượng bình phương thông thường nhỏ nhất (OLS).
Phương sai của các hàm ước lượng độ dốc OLS trong mô hình hồi qui đơn giản là:
Từ biểu thức này chúng ta thấy rằng phương sai là nhỏ hơn (hàm ước lượng này chính xác hơn) nếu các giá trị của X cách xa giá trị trung bình mẫu hơn. Vậy khẳng định trên là sai.
Nếu Xi và ui tương quan với nhau, thì các hàm ước lượng (OLS) vẫn là không chệch.
Điều này không đúng. Để thấy tại sao, hãy viết biểu thức sau đối với hàm ước lượng độ dốc :
Nếu Xi và ui có tương quan với nhau, thì số hạng sau cùng trong biểu thức này không phải là zero và hàm ước lượng này là chệch.
Các hàm ước lượng không thể là ước lượng không chệch tuyến tính tốt nhất (BLUE) trừ khi các ui đều có phân phối chuẩn.
BLUE nghĩa là "Hàm ước lượng không chệch tuyến tính tốt nhất." Trong bối cảnh này, "tuyến tính " chỉ một hàm ước lượng là một hàm tuyến tính của số hạng sai số ngẫu nhiên trong mô hình này, hoặc là một hàm tuyến tính của biến phụ thuộc của mô hình này. Kiểm tra các hàm ước lượng OLS cho độ dốc và tung độ gốc là đủ để xác lập rằng chúng là tuyến tính. Không yêu cầu tính chuẩn.
Không chệch được thiết lập bằng cách lấy kỳ vọng của hàm ước lượng OLS, là điều mà chúng ta đã làm nhiều lần. Không cần tới tính chuẩn khi chứng minh rằng kỳ vọng này bằng với giá trị thực (nhưng chưa biết) của thông số.
Tốt nhất là dùng Định lý Gauss-Markov. Phép chứng minh định lý này không cần tới tính chuẩn.
Chúng ta thấy rằng phát biểu này là sai.
Nếu phương sai của ui lớn thì các khoảng tin cậy đối với các hệ số sẽ rộng hơn.
Điều này là đúng. Chiều rộng của một khoảng tin cậy liên quan trực tiếp tới độ lớn của độ lệch chuẩn của hàm ước lượng và độ lệch chuẩn của hàm ước lượng liên quan trực tiếp tới độ lệch chuẩn của số hạng sai số. Anh/Chị cần viết được các biểu thức có liên quan này dựa vào trí nhớ.
Nếu các giá trị của X có một phương sai lớn thì các khoảng tin cậy sẽ hẹp hơn.
Điều này là đúng. Xem các câu trả lời cho phần 4a và 4d.
Một giá trị p cao có nghĩa là hệ số này khác không ở mức độ có ý nghĩa về mặt thống kê.
Điều này là sai. Câu hỏi này nói tới kiểm định thống kê của giả thuyết cho là hệ số hồi qui bằng không.
Giá trị p là xác suất của việc trị thống kê kiểm định này có thể vượt quá giá trị tuyệt đối của trị thống kê kiểm định được tính toán cho một mẫu cụ thể, cho trước rằng giả thuyết không là đúng. Giá trị tuyệt đối của trị thống kê kiểm định càng lớn thì giá trị p sẽ càng nhỏ. Trị thống kê kiểm định càng lớn thì hệ số càng có ý nghĩa thống kê hơn.
Nếu Anh/Chị chọn một mức độ ý nghĩa cao hơn thì một hệ số hồi qui có khả năng có ý nghĩa nhiều hơn.
Điều này đúng. Câu hỏi này nói tới kiểm định thống kê của giả thuyết cho là hệ số hồi qui bằng không.
Một mức độ ý nghĩa cao thu được một giá trị tới hạn nhỏ hơn nếu xét về giá trị tuyệt đối. Bác bỏ giả thuyết không khi giá trị tuyệt đối của giá trị tới hạn nhỏ hơn là điều dễ hơn.
Giá trị p là xác suất để giả thuyết không (H0) là đúng.
Đây là một giải thích không chính xác (nhưng thường gặp) đối với giá trị p.
Xem câu trả lời cho phần 4f.
Câu 2 (25 điểm):
Một số liệu thống kê về lãi suất ngân hàng (X, % năm) và tổng vốn đầu tư (Y, tỉ đồng) trên địa bàn tỉnh Bình Dương qua 10 năm liên tiếp như sau:
Năm
1
2
3
4
5
6
7
8
9
10
Xi
7.0
6.5
6.5
6.0
6.0
6.0
5.5
5.5
5.0
4.5
Yi
29
32
31
34
32
35
40
43
48
50
Hãy lập mô hình hồi quy tuyến tính mô tả quan hệ giữa tổng vốn đầu tư và lãi suất ngân hàng (mô hình hồi quy đơn). Nêu ý nghĩa của các hệ số hồi quy ước lượng được. Đánh giá mức độ phù hợp của mô hình.
Mô hình hồi quy tuyến tính mô tả quan hệ giữa tổng vốn đầu tư và lãi suất ngân hàng được cho như sau:
Trong đó:
là tung độ gốc của hàm hồi quy trên, được tính bằng lệnh Intercept trong Excel với cú pháp như sau: Intercept (Tập hợp các dữ liệu của biến phụ thuộc, Tập hợp các dữ liệu của biến độc lập) = 93.164. Giá trị này nói lên rằng khi lãi suất ngân hàng bằng 0% (điều này hiếm xảy ra trên thực tế), thì tổng vốn đầu tư trung bình một năm sẽ là 93.164 tỉ đồng.
là hệ số góc của hàm hồi quy trên, được tính bằng lệnh Slope trong Excel với cú pháp như sau: Slope (Tập hợp các dữ liệu của biến phụ thuộc, Tập hợp các dữ liệu của biến độc lập) = -9.532. Giá trị này nói lên rằng: xét các giá trị của X nằm trong khoảng (4.5, 7)%, khi lãi suất ngân hàng tăng thêm 1% một năm thì tổng vốn đầu tư một năm sẽ giảm trung bình 9.532 tỉ đồng/năm.
Kiểm định giả thiết: Hệ số hồi quy của X trong hàm hồi quy tổng thể bằng 0 với mức ý nghĩa 2% và nêu ý nghĩa của kết quả.
Để kiểm định b2 = 0 với mức ý nghĩa 2%, ta làm các bước sau:
Đặt giả thiết không và giả thiết đối:
H0: b2 = 0 với H1: b2 ¹ 0
Chúng ta biết rằng trong mô hình hồi quy hai biến kiểm định b2 = 0 cũng chính là kiểm định sự phù hợp của mô hình hồi quy (X thật sự có tác động đến Y?)
Để kiểm định giả thiết trên ta áp dụng quy tắc kiểm định sau:
Tính : Nếu F > Fa(1, n-2) thì ta bác bỏ giả thiết H0
Dựa vào bảng số liệu trên, ta tính được = 5.025; = 4.975. Cụ thể hơn,
Xin tham khảo bảng tính sau (double click vào để xem cách tính):
Từ kết quả trên,
Tra cứu ta có: Fa(1, n-2) =F0.02(1, 8) = 8.389 (dùng hàm FINV trong Excel)
Ta thấy rằng: F > Fa(1, n-2) nên ta bác bỏ giả thiết H0, tức là b2 ¹ 0.
Ý nghĩa của kết quả: Với tập dữ liệu mẫu đã cho, bác bỏ giả thuyết H0 (b2=0) có nghĩa rằng biến lãi suất ngân hàng (X, % năm) thực sự có tác động đến tổng vốn đầu tư (Y, tỉ đồng).
Cách khác để kiểm định giả thiết H0 ở trên là dùng giá trị p (p-value): ta dùng hàm FDIST để tìm giá trị P-value trong Excel ứng với giá trị F đã tính được bằng công thức ở trên, cú pháp:
FDIST(F, bậc tự do tử số, bậc tự do mẫu số)
= FDIST(91.776,1,8) = 0.000011683 = P-value (được gọi là mức ý nghĩa quan sát hay mức ý nghĩa chính xác hay xác suất phạm sai lầm loại I, mức ý nghĩa thấp nhất mà H0 có thể bị bác bỏ)
Nguyên tắc kiểm định như sau:
P-value < α thì bác bỏ H0, chấp nhận H1
P-value ≥ α thì chưa có cơ sở để bác bỏ H0.
Vậy từ kết quả P-value tính được ở trên, ta so sánh nó với mức ý nghĩa a của đề bài, ta có: P-value (0.000011683) < a (0.02). P-value rất thấp, có nghĩa là xác suất phạm phải sai lầm bác bỏ giả thiết H0 khi nó đúng là rất thấp.
Dự báo tổng vốn đầu tư trung bình khi lãi suất là 4,8% năm với độ tin cậy 98%.
Ta tính: (*) trong đó:
= 4.975; = 5.025; = 5.85; X0=4,8; n=10.
(*) è è
t0,01 (8) = 2,896
Khoảng tin cậy 98% của vốn đầu tư trung bình khi lãi suất là 4,8% năm:
47.4092,896 *1.261 Hay: 43.757 < E(Y/X=4.8) < 51.061
Câu 3 (25 điểm):
Bảng dưới đây cho biết số liệu về tiền lương trung bình 1 giờ (mean hourly wage, đặt tên biến là Meanwage) và số năm được đào tạo (years of schooling, đặt tên biến là Education) như sau:
Quan sát
(n)
Số năm được đào tạo
(Education - năm)
Lương trung bình một giờ
(Meanwage - $)
1
6
4.4567
2
7
5.7700
3
8
5.9787
4
9
7.3317
5
10
7.3182
6
11
6.5844
7
12
7.8182
8
13
7.8351
9
14
11.0223
10
15
10.6738
11
16
10.8361
12
17
13.6150
13
18
13.5310
Từ số liệu trên, chúng ta có kết quả hồi quy sau:
se = (0.874624) ( A )
t = ( B ) (10.40648) r2 = 0.9078 n = 13
Bạn hãy điền vào chỗ trống ( ) các giá trị thích hợp.
Do à ; ;
Giải thích ý nghĩa của hệ số góc.
= - 0.014453 là tung độ gốc của đường hồi quy mẫu, không thể giải thích một cách máy móc là khi số năm được đào tạo bằng 0 thì tiền lương một giờ trung bình bằng -0.014453$ (số âm không có ý nghĩa ở đây).
= 0.729097. Giá trị này nói lên rằng: xét các giá trị của Education nằm trong khoảng (6, 18) năm, khi số năm được đào tạo tăng thêm một năm thì tiền lương một giờ trung bình sẽ tăng lên 0.729097$.
Education có ảnh hưởng đến Meanwage không? Tại sao? (Gợi ý: Kiểm định giả thiết).
Kiểm định giả thiết: H0: β2=0, H1: β2≠0 với mức ý nghĩa 5%
t = 10.40648 (đề cho)
ta/2(n-2) = t0.025 (11) = 2.201
> t0.025 (11) nên bác bỏ giả thiết H0 (với mức ý nghĩa 5%).
Vậy β2≠0 đáng kể về mặt thống kê, hay Education (số năm được đào tạo) thực sự có ảnh hưởng đến Meanwage (tiền lương một giờ).
R2 = 0.9078 khá gần 1. Vậy mô hình có mức độ phù hợp cao.
Đánh giá mức độ phù hợp của mô hình.
Với kết quả trong câu c (β2≠0) và R2 = 0.9078 khá gần 1. Ta có thể kết luận rằng mô hình có mức độ phù hợp cao với tập dữ liệu mẫu đã cho.
Câu 4 (25 điểm):
Xem kết quả của phân tích hồi quy sau:
Se = (0.0976) (0.1961)
r2 = 0.397 RSS = 0.0544 ESS = 0.0358
Trong đó: Y là tỷ lệ tham gia lực lượng lao động của nữ năm 1972
X là tỷ lệ tham gia lực lượng lao động của nữ năm 1968
Kết quả phân tích hồi quy này có được từ một mẫu gồm 19 thành phố của Mỹ.
Giải thích ý nghĩa của các hệ số hồi quy ước lượng được.
= 0.2033 là tung độ gốc của đường hồi quy mẫu, nói lên rằng khi tỷ lệ tham gia lực lượng lao động của nữ năm 1968 (X) bằng 0, thì tỷ lệ tham gia lực lượng lao động trung bình của nữ năm 1972 (Y) bằng 0.2033.
= 0.6560 là hệ số góc của đường hồi quy mẫu, nói lên rằng khi tỷ lệ tham gia lực lượng lao động của nữ năm 1968 (X) tăng (giảm) 1 đơn vị, thì tỷ lệ tham gia lực lượng lao động trung bình của nữ năm 1972 (Y) sẽ tăng (giảm) 0.6560 đơn vị.
Kiểm định giả thiết: H0: β2=1; H1: β2>1 với mức ý nghĩa 5%.
t0,05 (17) = 1.740
t < t0,05 (17) nên không bác bỏ giả thiết H0 (với mức ý nghĩa 5%).
Từ kết quả phân tích hồi quy trên, chứng minh rằng:
= 0.0032; = 0.0832; = 0.4932
Ta có:
è (đpcm)
(đpcm)
è
Ta còn có: è
è(đpcm)
Giả sử rằng tỷ lệ tham gia lực lượng lao động của nữ năm 1968 là 0,58 (hay 58%). Trên cơ sở kết quả của phân tích hồi quy ở trên, giá trị trung bình của tỷ lệ tham gia lực lượng lao động của nữ năm 1972 là bao nhiêu? Thiết lập khoảng tin cậy 95% cho giá trị dự báo trung bình này.
= 0.2033 + 0.6560 * 0.58 = 0.58378
è = 0,02141
t0,025 (17) = 2.110
Khoảng tin cậy 95% của dự báo trung bình của tỷ lệ tham gia lực lượng lao động của nữ năm 1972 khi tỷ lệ tham gia lực lượng lao động của nữ năm 1968 là 0.58, là:
0.583782.110* 0,002141 Hay: 0.5386 < E(Y/X=0.58) < 0.6289
HẾT