CHƯƠNG I: MÔ HÌNH HỒI QUY HAI BIẾN , MỘT VÀI TƯ TƯỞNG CƠ BẢN
1.1. Phân tích hồi quy
a. Bản chất của phân tích hồi quy
b. Phân tích hồi quy và các quan hệ khác
1.2. Bản chất nguồn số liệu cho phân tích hồi quy
a. Các loại số liệu
b. Nguồn gốc các số liệu
c. Bản chất chung của số liệu kinh tế – xã hội
1.3. Mô hình hồi quy tổng thể
1.4. Sai số ngẫu nhiên và bản chất của nó
1.5. Hàm hồi quy mẫu
28 trang |
Chia sẻ: thanhtuan.68 | Lượt xem: 1217 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Bài giảng Kinh tế lượng Econometrics - Chương I: Mô hình hồi quy hai biến, một vài tư tưởng cơ bản, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
BÀI GIẢNG
KINH TẾ LƯỢNG
ECONOMETRICS
Lê Anh Đức
Khoa Toán kinh tế
ĐH Kinh tế Quốc dân
CHƯƠNG I: MÔ HÌNH HỒI QUY HAI
BIẾN , MỘT VÀI TƯ TƯỞNG CƠ BẢN
1.1. Phân tích hồi quy
a. Bản chất của phân tích hồi quy
b. Phân tích hồi quy và các quan hệ khác
1.2. Bản chất nguồn số liệu cho phân tích hồi quy
a. Các loại số liệu
b. Nguồn gốc các số liệu
c. Bản chất chung của số liệu kinh tế – xã hội
1.3. Mô hình hồi quy tổng thể
1.4. Sai số ngẫu nhiên và bản chất của nó
1.5. Hàm hồi quy mẫu
1.1. Phân tích hồi quy
(regression analysis)
a. Bản chất của phân tích hồi quy
• Thuật ngữ “hồi quy” được Francis Galton sử dụng vào
năm 1886.
• Là phân tích mối liên hệ phụ thuộc giữa một biến gọi
là biến phụ thuộc (dependent variable) vào một hoặc
một số biến khác gọi là biến giải thích (explanatory
variable)
Biến phụ thuộc, ký hiệu là Y
Biến giải thích, ký hiệu là X hoặc X1 , X2,
• Hồi quy là một công cụ cơ bản của Kinh tế lượng
Thí dụ: “Luật Francis Galton - Karl Pearson”
• Vấn đề: nghiên cứu mối liên hệ phụ thuộc
giữa chiều cao của các cháu trai vào chiều
cao của các ông bố.
Y = chiều cao của các cháu trai (inches)
X = chiều cao của các ông bố (inches)
• Đồ thị (tham khảo giáo trình trang 10). Đồ
thị này được vẽ với một tổng thể giả định.
• Kết quả nghiên cứu của F.Galton – K.Pearson :
- Với chiều cao đã biết của người bố thì chiều cao của
các cháu trai sẽ là một khoảng, dao động quanh giá trị
trung bình;
- Chiều cao của người bố tăng thì chiều cao của các
cháu trai cũng tăng (hệ số góc lớn hơn 0);
- Với nhóm các ông bố có chiều cao nhỏ (thấp) thì
chiều cao trung bình của các cháu trai cao hơn bố.
Ngược lại, với nhóm các ông bố có chiều cao lớn
(cao) thì chiều cao trung bình của các cháu trai thấp
hơn bố (hệ số góc nhỏ hơn 1).
Các thí dụ khác
• Chi cho tiêu dùng cá nhân – thu nhập khả dụng
• Mức cầu – giá
• Tỷ lệ thay đổi của tiền lương – tỷ lệ thất nghiệp
• Tỷ lệ tiền mặt nắm giữ trong tổng thu nhập – tỷ lệ
lạm phát
• Mức cầu – mức chi cho quảng cáo
• Sản lượng của một loại nông sản – lượng phân
bón, lượng mưa, nhiệt độ, v.v
Mục đích của phân tích hồi qui
• Ước lượng giá trị trung bình của biến phụ thuộc khi biết
giá trị của biến độc lập, tức là phải ước lượng các tham
số của mô hình.
• Kiểm định các giả thuyết về bản chất của mối quan hệ
giữa biến phụ thuộc và biến độc lập mà lý thuyết kinh tế
đưa ra. Trong trường hợp này phải trả lời hai câu hỏi:
- Có tồn tại quan hệ giữa biến phụ thuộc và biến độc lập
hay không?
- Nếu tồn tại quan hệ thì mức độ chặt chẽ như thế nào?
• Dự báo giá trị trung bình của biến phụ thuộc khi biết giá
trị của biến độc lập.
b. Phân tích hồi quy và các quan hệ khác
Phân tích hồi quy nghiên cứu quan hệ thống kê
(statistical relationship)
Ta phân biệt với các quan hệ sau:
• Phân tích hồi quy và quan hệ hàm số (functional
relationship)
• Phân tích hồi quy và phân tích tương quan
(correlation analysis)
• Phân tích hồi quy và quan hệ nhân quả (causation
relationship)
• Phân tích hồi quy và quan hệ hàm số
- Trong quan hệ hàm số:
+ Ứng với mỗi giá trị của biến độc lập cho duy nhất
một giá trị của biến phụ thuộc.
+ Các biến không phải là các biến ngẫu nhiên.
- Trong phân tích hồi quy
+ Ứng với mỗi giá trị cho trước của biến độc lập có
thể có nhiều giá trị khác nhau của biến phụ thuộc.
+ Các biến là các biến ngẫu nhiên.
• Phân tích hồi quy và phân tích tương quan
- Phân tích tương quan
+ Đo mức độ kết hợp tuyến tính giữa hai biến
bằng hệ số tương quan.
+ Các biến có tính chất đối xứng.
- Trong phân tích hồi quy
+ Ước lượng và dự báo một biến trên cơ sở giá trị
đã cho của các biến khác.
+ Các biến không có tính chất đối xứng.
• Phân tích hồi quy và quan hệ nhân quả
- Quan hệ nhân quả là hệ hai chiều giữa hai đối
tượng trong đó vai trò của các đối tượng được xác
định rõ đâu là nguyên nhân và đâu là kết quả.
- Trong phân tích hồi quy biến giải thích không
nhất thiết là nguyên nhân gây lên biến phụ thuộc,
mối quan hệ giữa các biến được xác lập tuỳ thuộc
vào mục đích nghiên cứu.
1.2. Bản chất nguồn số liệu cho phân tích
hồi quy
a. Các loại số liệu
• Số liệu theo thời gian (Time series data)
Ví dụ: CPI, GDP,
• Số liệu chéo (Undate – Cross section data)
Ví dụ: Doanh thu, lợi nhuận (của các DN)
• Số liệu kết hợp (Pooled data)
• Số liệu bảng (Panel data)
b. Nguồn gốc các số liệu
• Số liệu từ các nguồn được phát hành như:
Niên giám thống kê, tạp chí,
• Số liệu từ các cuộc điều tra thực tế hoặc đi
mua.
c. Bản chất chung của số liệu KT – XH
• Phần lớn là các số liệu phi thực nghiệm,
mang tính ngẫu nhiên, kém tin cậy.
• Có sẵn để thu thập, tính toán phù hợp với
mục đích nghiên cứu.
Ghi nhớ: Kết quả của nghiên cứu sẽ
không chỉ phụ thuộc vào mô hình được
lựa chọn mà còn phụ thuộc rất nhiều vào
chất lượng của số liệu.
1.3. Mô hình hồi qui tổng thể
• Tổng thể (Population) là toàn bộ tập hợp các
phần tử đồng nhất theo một dấu hiệu nghiên
cứu định tính hoặc định lượng nào đó .
• Giả sử có một tổng thể nghiên cứu gồm N
phần tử với hai dấu hiệu nghiên cứu X, Y tạo
thành một biến ngẫu nhiên hai chiều (X, Y).
• Để nghiên cứu BNN (X, Y) ta lập các bảng
phân phối xác suất.
• Tham khảo thí dụ 1.3 trang 14, sách bài giảng
• Bảng phân phối xác suất đồng thời của X và Y
X1 X2 Xk
Y1 P(Y1, X1) P(Y1, X2) P(Y1, Xk)
Y2 P(Y2, X1) P(Y2, X2) . P(Y2, Xk)
Yh P(Yh, X1) P(Yh, X2) P(Yh, Xk)
1 1
( , ) 1
h k
j i
j i
P Y X
• Các bảng phân phối xác suất có điều kiện của Y
theo Xi (i = 1, 2, , k)
• Kỳ vọng toán của Y với điều kiện của Xi:
• E(Y/Xi) là một hàm số và gọi là hàm hồi quy tổng
thể của Y đối với Xi (Population Regression
Function – PRF). Nó cho biết giá trị trung bình của
Y thay đổi như thế nào theo Xi.
(Y/Xi) Y1 Y2 Yh
P(Y/Xi) P(Y1, Xi) P(Y2, Xi) P(Yh, Xi)
1
( / ) ( / ) ( / ) ( )( 1 )
X = (Y/ ) ! E(Y/ )
h
i j j i i i
j
i i i
E Y X Y P Y X E Y X f X i k
X X X
• Nếu hàm hồi quy tổng thể có một biến độc
lập thì gọi là hàm hồi quy đơn - Simple
regression.
E(Y/Xi) = f(Xi)
• Nếu hàm hồi quy tổng thể có hơn một biến
độc lập thì gọi là hàm hồi quy bội - Multiple
regression.
E(Y/X1i, X2i,) = f(X1i, X2i, )
)
• Giả sử PRF có dạng tuyến tính:
hoặc
• Hàm này gọi là hàm hồi quy tuyến tính đơn
• Trong đó:
gọi là hệ số chặn (intercept coefficient)
gọi là hệ số góc (slope coefficient)
1 2( / ) ( 1 )i iE Y X X i k
1 2( / )E Y X X
1 ( / 0)iE Y X
2
( / )dE Y X
dX
• Tại một giá trị cá biệt của Yi ta có:
gọi là mô hình hồi quy tổng thể (Population Regression
Model – PRM)
• Thuật ngữ “tuyến tính” được hiểu theo hai nghĩa
+ Tuyến tính đối với các tham số
+ Tuyến tính đối với các biến số (X, Y)
• Khi nói đến “hàm hồi quy tuyến tính” tức là hàm hồi
quy tuyến tính đối với các tham số, nó có thể là tuyến
tính hoặc phi tuyến đối với các biến số.
E(Y/X) = 1 + 2X2
E(Y/X) = 1 + 2lnX
E(Y/X) = 1X2
1 2 ( 1 )i i iY X U i N
1 2( , )
1.4. Sai số ngẫu nhiên và bản chất của nó
• Đặt Ui = Yi – E(Y/Xi) gọi là sai số ngẫu nhiên (random
errors)
• Sai số ngẫu nhiên đại diện cho tất cả những yếu tố không
phải biến độc lập nhưng cũng tác động đến biến phụ thuộc.
+ Những yếu tố không biết
+ Những yếu tố không có số liệu
+ Những yếu tố mà tác động của nó quá nhỏ không mang tính hệ thống
• Sự tồn tại của SSNN là tất yếu khách quan và nó có vai trò
đặc biệt quan trọng trong phân tích hồi quy, nó phải thoả
mãn những điều kiện nhất định thì thì việc phân tích trên mô
hình hồi quy mới có ý nghĩa.
1.5. Hàm hồi qui mẫu
• Trong thực tế chúng ta không có được tổng thể hoặc
có nhưng không thể (không cần thiết) nghiên cứu toàn
bộ tổng thể vì vậy không thể tìm được PRF mặc dù
dạng của PRF có thể biết.
• Mẫu ngẫu nhiên là một bộ phận mang thông tin của
tổng thể được lấy ra từ tổng thể theo những nguyên
tắc nhất định.
• Giả sử từ tổng thể lập một mẫu ngẫu nhiên (mẫu cụ
thể) kích thước n: W = {(Xi ,Yi) ; i =1÷n}
• Trong mẫu tồn tại một hàm số gọi là hàm hồi quy mẫu
(Sample Regression Function - SRF) có dạng giống như
PRF mô tả xu thế biến động của trung bình biến phụ
thuộc theo biến độc lập.
• Thực chất nó là một ước lượng điểm của PRF
Nếu PRF có dạng: E(Y/Xi) = 1 + 2Xi
SRF có dạng:
Trong đó:
(Estimated regression coefficients) là các ước
lượng điểm của .
(Fitted value) là ước điểm của E(Y/Xi).
1 2
ˆ ˆ
iˆ iY X
1 2
ˆ ˆ,
1 2,
iˆY
• Mẫu ngẫu nhiên là ngẫu nhiên
Ước lượng ngẫu nhiên (estimates) của
tham số 1,2
• Với mẫu cụ thể, là con số cụ thể
Ước lượng cụ thể (estimators) của tham
số 1,2
1 2
ˆ ˆ,β β
1 2
ˆ ˆ,β β
• Tại một giá trị cá biệt của Y ta có
gọi là mô hình hồi quy mẫu (Sample Regression
Model – SRM)
• Đặt gọi là phần dư (Residual)
• Phần dư ei là sai số ngẫu nhiên của mẫu, thực
chất chúng là các ước lượng điểm của các sai số
ngẫu nhiên Ui trong tổng thể.
• Bản chất của ei giống như các sai số ngẫu nhiên
Ui
ˆ
i i ie Y Y
1 2
ˆ ˆ ( 1 )i i iY X e i n
Tổng thể
(Population)
Mẫu
(Sample)
Sai số ngẫu nhiên Ui Phần dư ei
1 2: ( / )i iPRF E Y X X 1 2ˆ ˆˆ: i iSRF Y X
1 2:
( 1 )
i i iPRM Y X U
i N
1 2
ˆ ˆ:
( 1 )
i i iSRM Y X e
i n
Các thuật ngữ cơ bản
Tiếng Anh Tiếng Việt
Regression analysis Phân tích hồi quy
Dependent variable Biến phụ thuộc
Explanatory variable/ Independent variable Biến giải thích/ biến độc lập
Time series data Số liệu theo thời gian
Cross section data Số liệu chéo
Pooled data Số liệu kết hợp
Panel data Số liệu bảng
Population Tổng thể
PRF – Population Regression Function Hàm hồi quy tổng thể
PRM - Population Regression Model Mô hình hồi quy tổng thể
27
Các thuật ngữ cơ bản
Tiếng Anh Tiếng Việt
Simple regression Hồi quy đơn
Multiple regression Hồi quy bội
Intercept coefficient Hệ số chặn hoặc hệ số tự do
Slope coefficient Hệ số góc
Random error Sai số ngẫu nhiên
SRF – Sample Regression Function Hàm hồi quy mẫu
SRM - Sample Regression Model Mô hình hồi quy mẫu
Estimated regression coefficients Các hệ số hồi quy ước lượng được
Residual Phần dư
28