Tương quan và hồi quy Correlation & Regression
NỘI DUNG Tương quan tuyến tính Hồi quy tuyến tính Kiểm tra các điều kiện áp dụng mô hình Số liệu sai lệch Hồi quy với biến giả (dummy) Phương pháp stepwise
Bạn đang xem trước 20 trang tài liệu Tương quan và hồi quy Correlation & Regression, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
TƯƠNG QUAN VÀ HỒI QUY
CORRELATION & REGRESSION
TS. LÊ VĂN HUY
Email: levanhuy@vnn.vn
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
NỘI DUNG
Tương quan tuyến tính
Hồi quy tuyến tính
Kiểm tra các điều kiện áp dụng mô hình
Số liệu sai lệch
Hồi quy với biến giả (dummy)
Phương pháp stepwise
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
TƯƠNG QUAN (CORRELATION)
Xem xét mối quan hệ giữa hai hay nhiều biến
Tương quan có:
Tương quan 2 biến – Bivariate Correlations
Tương quan riêng phần – Partial Correlations
Điều kiện:
2 hoặc nhiều biến định lượng
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
TƯƠNG QUAN (CORRELATION)
Mục tiêu nghiên cứu: Giả định nhà nghiên cứu
muốn tìm hiểu có mối quan hệ như thế nào giữa
độ tuổi và thu nhập.
Câu hỏi nghiên cứu: Độ tuổi và thu nhập có mối
quan hệ với nhau hay không ?
Hai biến được chọn: Độ tuổi và thu nhập (2 biến
định lượng).
Giả thuyết H0: Trình độ học vấn và thu nhập
không có liên hệ với nhau.
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
TƯƠNG QUAN (CORRELATION)
Vì Pearson = 0,075 và Sig =
0,291 nên chưa có cơ sở để
bác bỏ H0 nghĩa là.
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
TƯƠNG QUAN RIÊNG TỪNG PHÂN
(PARTIAL CORRELATION)
Nghiên cứu mối quan hệ tuyến tính của hai biến
có loại trừ ảnh hưởng của các yếu tố khác.
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
TƯƠNG QUAN RIÊNG TỪNG PHÂN
(PARTIAL CORRELATION)
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
HỒI QUY ĐƠN
Mục đích:
Tìm mối quan hệ giữa hai biến (mối quan hệ nhân quả)
Điều kiện
Hai biến định lượng
Hai biến phải tuân theo quy luật phân phối chuẩn
Mô hình lý thuyết:
Yi = B0 + B1*Xi + ε
Xi: trị quan sát thứ i của biến độc lập
Yi : giá trị dự đoán thứ i của biến phụ thuộc
B0 và B1: hệ số hồi quy
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
DIỄN GIẢI DỮ LIỆU
Các hệ số góc (bj)
Sự biến đổi của giá trị trung bình của các Y khi Xj tăng
thêm 1 đơn vị, mọi yếu tố khác không đổi.
Kiểm định: tương tự như hồi qui đơn với (n-p-1) bậc tự
do
Hệ số chặn - hằng số (b0)
Giá trị trung bình của Y khi Xj = 0
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
HỒI QUY ĐƠN
Mục tiêu nghiên cứu: Nên tác động thế nào đến
phong cách lãnh đạo để tạo ra sự trung thành của
nhân viên.
Câu hỏi nghiên cứu: Lòng trung thành của nhân
viên có phụ thuộc và phong cách lãnh đạo?
Hai biến được chọn: Lãnh đạo là biến độc lập và
Lòng trung thành là biến phụ thuộc.
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
HỒI QUY ĐƠN
Vì F= 75,549 và
Sig = 0,000 <0,05
bác bỏ H0 nghĩa là
2 biến có mối
quan hệ
MQH thể hiện:
LTTi = 0,957
+0,667*lãnh đạo +ε
R2=0,276 MQH
giữa 2 biến là
R2= 0,276
nên biến
lãnh đạo giải
thích 27,6%
LTT
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
HỆ SỐ XÁC ĐỊNH R2
Tỉ lệ biến đổi của biến phụ thuộc được giải thích
bằng tất cả các biến độc lập
R2 = Biến đổi được giải thích = SCR
Tổng biến đổi SCT
Không bao giờ giảm khi các đại lượng được thêm
vào
Vấn đề khi ta so sánh các mô hình
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
HỆ SỐ XÁC ĐỊNH ĐIỀU CHỈNH R2a
R2 điều chỉnh (R2a)R2
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
KIỂM ĐỊNH MỨC Ý NGHĨA (DÙNG F)
ANOVA
dl SC MC F
Regression p SCR MCR =SCR/p MCR/MCE
Residue n-p-1 SCE MCE =SCE/(n-p-1)
Total n-1 SCT
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
MÔ HÌNH HỒI QUY (BỘI)
Mối liên hệ giữa một biến phụ thuộc với ít nhất hai
biến độc lập là một hàm tuyến tính
Mô hình:
Y X X Xi i i p pi i= + + + + +β β β β ε0 1 1 2 2
Biến phụ thuộc Các biến
độc lập
Các hệ số
hồi qui của
tổng thểHệ số chặn
(hằng số)
Sai số
ngẫu
nhiên
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
MÔ HÌNH HỒI QUY BỘI (2 BIẾN) – TRÊN TỔNG THẾ
Yi=β0+ β1X1i+ β2X2i + εi
Kết quả
β0
Y
X1
X2
εi
E(Y)=β0+ β1X1+ β2X2
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
MÔ HÌNH HỒI QUY BỘI (2 BIẾN) – TRÊN MẪU
Y
Đáp số
X1
X2
b0 ei
Yi=b0+ b1X1i+ b2X2i + ei
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
ĐIỀU KIỆN VẬN DỤNG MÔ HÌNH
Các điều kiện về dạng mô hình :
MQH tuyến tính giữa các biến độc lập với biến phụ
thuộc
Các điều kiện về sai số mô hình (error):
Các sai số mô hình là độc lập (không tự tương quan)
Các sai số phân phối theo phân phối chuẩn
Các điều kiện về các số dự đoán:
Các biến độc lập không ngẫu nhiên
Các giá trị của các biến độc lập được đo lường không
có sai số
Các số dự đoán là độc lập theo đường thẳng, (không
có bội tương quan giữa các biến độc lập -
multicollinearity)
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
MÔ HÌNH NGHIÊN CỨU VÀ CÁC KHÁI NIỆM
Items 1.1
Items 1.2
Items 1.3
Items 1.n
Items 2.1
Items 2.2
Items 2.3
Items 2.n
LÃNH ĐẠO
CƠ HỘI ĐTẠO VÀ
TTIẾN
LƯƠNG, THƯỞNG
ĐỒNG NGHIỆP
PHÚC LỢI
BẢN CHẤT CVIỆC
MÔI TRƯỜNG LV
LÒNG TRUNG
THÀNH
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
VÍ DỤ VỀ HỒI QUY BỘI (PP. ENTER)
Phát triển mô hình để giải
thích mối quan hệ F1,,F7
với lòng trung thành (LTT)
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
HÃY GIẢI THÍCH KẾT QUẢ
Phương trình
hồi quy bội
LTT = -0,745
+ 0,245 F1
+ 0,220 F2
+ 0,476 F3
- 0,105 F4
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
VẤN ĐỀ ĐA CỘNG TUYẾN VÀ TỰ TƯƠNG QUAN
Đa cộng tuyến là trạng thái các biến độc lập trong
mô hình có tương quan chặt chẽ với nhau.
Để kiểm tra hiện tượng đa cộng tuyến, có thể sử
dụng bảng ma trận tương quan hoặc kiểm tra
bằng lựa chọn Collinearity Diagnostic.
Kiểm tra tự tương quan, kích vào Durbin-Watson
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
VẤN ĐỀ ĐA CỘNG TUYẾN VÀ TỰ TƯƠNG QUAN
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
VẤN ĐỀ ĐA CỘNG TUYẾN VÀ TỰ TƯƠNG QUAN
ĐK không
tự tương
quan:
VIF < 10
Đối với biến Xi, tolerance bằng 1-Ri2 với Ri là
hệ số xác định của biến Xi được hồi qui bởi tất
cả các biến độc lập khác
Nếu Di>4/(n-p-1), quan
sát được xem như có
ảnh hưởng
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
HỒI QUY BỘI VỚI PHƯƠNG PHÁP STEPWISE
Phương pháp này là kết hợp đưa vào dần và loại
trừ dần.
Biến nào có tương quan riêng cao nhất sẽ được
xem xét đưa vào mô hình trước với xác suất là
0,05
Để ngăn chặn hiện tượng 1 biến được chọn vào
rồi chọn ra lặp lại thì SPSS mặc định xác suất F
vào nhỏ hơn F ra.
Thủ tục chọn biến sẽ kết thúc khi không còn biến
nào thỏa tiêu chuẩn chọn vào, chọn ra nữa.
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
HỒI QUY BỘI VỚI PHƯƠNG PHÁP STEPWISE
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
HỒI QUY BỘI VỚI PHƯƠNG PHÁP STEPWISE
Mô hình
chọn luôn là
mô hình
cuối cùng
Mô hình
chọn luôn là
mô hình
cuối cùng
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
HỒI QUY BỘI VỚI PHƯƠNG PHÁP STEPWISE
Câu hỏi:
Kết quả này có khác gì với kết quả của
phương pháp ENTER
Mô hình:
LTT = -0,247 + 0,459 Lương và thưởng + 0,282 CH Đào tạo
và thăng tiến + 0,260 Lãnh đạo
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
ĐIỀU KIỆN VẬN DỤNG MÔ HÌNH
Các điều kiện về dạng mô hình :
MQH tuyến tính giữa các biến độc lập với biến phụ
thuộc
Các điều kiện về sai số mô hình (error):
Các sai số mô hình là độc lập (không tự tương quan)
Các sai số phân phối theo phân phối chuẩn
Các điều kiện về các số dự đoán:
Các biến độc lập không ngẫu nhiên
Các giá trị của các biến độc lập được đo lường không
có sai số
Các số dự đoán là độc lập theo đường thẳng, (không
có bội tương quan giữa các biến độc lập -
multicollinearity)
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
CÂU HỎI
Nếu có một biến (độc lập) không thỏa các điều
kiện để thực hiện một phân tích tương quan thì
thế nào?
Æ Có khả năng chuyển về biến đính tính không?
Nếu muốn phân tích tương quan, trong cac biến
độc lập có một biến định tính (biến 2 hoặc nhiều
lựa chọn) thì có thể thực hiện được không?
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
BIẾN GIẢ (DUMMY)
Các ví dụ:
Biến giới tính: nam-nữ,
có mặt – vắng mặt
miền Bắc, Trung, Nam
Được mã hóa 0 hoặc 1
Về mặt lý thuyết,
các hằng số (hệ số chặn) phải khác nhau
Số các biến giả cần thiết bằng số lựa chọn (của
biến định tính) - 1
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
BIẾN GIẢ (DUMMY)
0 1 1 2 0 1 1
ˆ (0)i i iY b b X b b b X= + + = +
0 1 1 2 0 2 1 1
ˆ (1) ( )i i iY b bX b b b bX= + + = + +
Y = tiền lương
X1,7 = Lãnh đạo, Cơ hội đào tạo và thăng tiến
X8 = Giới tính =
Nam (X8 = 1)
Nữ (X8 = 0)
0 nữ
1 nam
0 1 1 2 2iˆ i iY b b X b X= + +
Cùng
hệ số
hồi qui
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
BIẾN GIẢ (dummy)
Y (Lòng trung thành)
N ữ
N a m
X8 (giới tính)
b0 + b2
b0
Cùng hệ số
gốc
Hệ số chặn
(hằng số) khác
nhau
1b
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
MÃ HÓA BIẾN DUMMY
Biến cũ
Giới tính 1: Nam, 2: Nữ
Chúng ta phải chuyển thành
Giới tính 1: Nam, 0: Nữ
trước khi thực hiện phân tích!!!
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
TRÌNH TỰ THỰC HIỆN
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
TRÌNH TỰ THỰC HIỆN
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
KẾT QUẢ
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
KẾT QUẢ
Mô hình:
LTT = -0,247 + 0,459 Lương và thưởng + 0,282 CH Đào tạo
và thăng tiến + 0,260 Lãnh đạo + 0,396 Danh hiệu thi đua
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
CÂU HỎI: MÃ HÓA BIẾN VÀ PHÂN TÍCH (DUMMY)
Biến cũ: ĐIAĐIEM
Miền Bắc 1
Miền Trung 2
Miền Nam 3
Chúng ta phải chuyển thành
ĐIAĐIEM1 Miền Bắc 1 Khác 0
ĐIAĐIEM2 Miền Trung 1 Khác 0
Æ Diễn giải dữ liệu cho phù hợp!!!
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
TÁC ĐỘNG CỦA MÃ HÓA BIẾN
Sự mã hóa riêng biệt các biến giả cốt là thay thế
các dòng lấy giá trị 0 đối với tất cả các biến giả
liên quan đến một biến cụ thể bằng một giá trị -1.
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
TÁC ĐỘNG CỦA MÃ HÓA BIẾN
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
TÁC ĐỘNG CỦA MÃ HÓA BIẾN
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
ĐIỀU KIỆN VẬN DỤNG MÔ HÌNH
Các điều kiện về dạng mô hình :
MQH tuyến tính giữa các biến độc lập với biến phụ
thuộc
Các điều kiện về sai số mô hình (error):
Các sai số mô hình là độc lập (không tự tương quan)
Các sai số phân phối theo phân phối chuẩn
Các điều kiện về các số dự đoán:
Các biến độc lập không ngẫu nhiên
Các giá trị của các biến độc lập được đo lường không
có sai số
Các số dự đoán là độc lập theo đường thẳng, (không
có bội tương quan giữa các biến độc lập -
multicollinearity)
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
4000003000002000001000000
R
e
g
r
e
s
s
i
o
n
S
t
u
d
e
n
t
i
z
e
d
R
e
s
i
d
u
a
l
4
2
0
-2
-4
KIỂM TRA 1
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
KIỂM TRA 2
Regression Standardized Residual
3,25
2,75
2,25
1,75
1,25
,75,25-,25
-,75
-1,25
-1,75
-2,25
-2,75
-3,25
-3,75
F
r
e
q
u
e
n
c
y
60
50
40
30
20
10
0
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
HAI KIỂM ĐỊNH PHÂN PHỐI CHUẨN
Nhờ vào hệ số mất cấn đối (Skewness)
Nhờ vào Kurtose
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
ĐIỀU KIỆN VẬN DỤNG MÔ HÌNH
Câu hỏi: Nếu các điều kiện không đạt thì thế
nào?
Các điều kiện vận dụng mô hình thường xuyên
không đạt được:
Tuyến tính
Phương sai không đổi của các sai số (errors) của mô
hình
Một mô hình là tuyến tính nếu các tham số hiện
diện trong mô hình là tuyến tính, ngay cả khi các
biến độc lập không tuyến tính
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
BIẾN ĐỔI BIẾN
Các ví dụ của các mô hình tuyến tính:
Ví dụ mô hình không tuyến tính:
ε+β+β= XY 10
ε+β+β+β= 2210 XXY
ε+β+β= XlogY 10
ε+β+β= XY 10
ε++β= β X0 1eY
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
BIẾN ĐỔI MÔ HÌNH
Hàm
Phép biến đổi
Dạng tuyến tính
βα= XY
Xlog'X,Ylog'Y ==
'Xlog'Y β+α=
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
BIẾN ĐỔI MÔ HÌNH
Hàm
Phép biến đổi
Dạng tuyến tính
X
eY
βα=
Yln'Y =
Xln'Y β+α=
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
BiẾN ĐỔI MÔ HÌNH
Hàm
Phép biến đổi
Dạng tuyến tính
XlogY β+α=
Xlog'X =
'XY β+α=
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
BIẾN ĐỔI MÔ HÌNH
β−α= X
XY
X
1'X,
Y
1'Y ==
Hàm
Phép biến đổi
Dạng tuyến tính 'X'Y β−α=
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics
BIẾN ĐỔI MÔ HÌNH
X
X
e1
eY β+α
β+α
+
=
Y1
Yln'Y −=
Hàm
Phép biến đổi
Dạng tuyến tính X'Y β+α=