8.1 Tính độc lập và quan hệ phụ thuộc ngẫu nhiên
• Nếu X và Y phụ thuộc hàm với nhau, khi đó có thể biểu diễn:
Y = f(X) hoặc X = g(Y)
• Điều đó có nghĩa là nếu X nhận giá trị x nào đó thì tương ứng Y
nhận giá trị y=f(x), hoặc khi Y nhận giá trị y nào đó thì X nhận giá
trị tương ứng x=g(y)
• Tuy nhiên, trong thực tế các đại lượng ngẫu nhiên thường phụ
thuộc lẫn nhau phức tạp hơn nhiều
• Ví dụ:
– Quan hệ giữa nhiệt độ và độ ẩm tương đối không khí trong
ngày: Qui luật chung là nhiệt độ tăng thì độ ẩm giảm, nhưng đó
là mối quan hệ không đơn trị và không phải là quan hệ hàm
– Quan hệ giữa chiều cao và cân nặng của cơ thể người
61 trang |
Chia sẻ: thanhle95 | Lượt xem: 325 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Bài giảng Lý thuyết xác suất và thống kê toán học - Chương 8: Lý thuyết tương quan và hồi qui - Phan Văn Tân, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
LÝ THUYẾT
XÁC SUẤT VÀ THỐNG KÊ TOÁN HỌC
Phan Văn Tân
Bộ mô Khí tượng
CHƯƠNG 8. LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUI
8.1 Tính độc lập và quan hệ phụ thuộc ngẫu nhiên
• Xét hai đại lượng ngẫu nhiên X, Y
• Giả sử f(x,y) là phân bố đồng thời của hệ (X,Y)
• Khi đó có thể biểu diễn: f(x,y)=f(y/x).f1(x)=f(x/y).f2(y)
• Trong đó f(y/x), f(x/y) là các phân bố có điều kiện còn f1(x), f2(y)
là các phân bố riêng
),(),(,),(),(
2
yYxXPyxF
yx
yxFyxf <<=
∂∂
∂
=
∫∫
+∞
∞−
+∞
∞−
== dxyxfyfdyyxfxf ),()(,),()( 21
∫∫
∞+
∞−
∞+
∞−
==
dxyxf
yxfyxf
dyyxf
yxfxyf
),(
),()/(,
),(
),()/(
CHƯƠNG 8. LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUI
8.1 Tính độc lập và quan hệ phụ thuộc ngẫu nhiên
• Nếu X và Y độc lập với nhau:
• f(y/x)=f2(y), f(x/y)=f1(x) è f(x,y)=f1(x).f2(y)
• Tức là sự biến thiên của đại lượng này không ảnh hưởng đến sự
biến thiên của đại lượng kia và ngược lại
• Nói chính xác hơn, xác suất để Y nhận giá trị nào đó không bị ảnh
hưởng bởi việc cho trước giá trị x của X, và ngược lại
• Nếu X và Y không độc lập với nhau, khi đó ta nói X và Y phụ
thuộc lẫn nhau
• Có hai khái niệm phụ thuộc giữa X và Y:
– Phụ thuộc hàm
– Phụ thuộc tương quan
CHƯƠNG 8. LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUI
8.1 Tính độc lập và quan hệ phụ thuộc ngẫu nhiên
• Nếu X và Y phụ thuộc hàm với nhau, khi đó có thể biểu diễn:
Y = f(X) hoặc X = g(Y)
• Điều đó có nghĩa là nếu X nhận giá trị x nào đó thì tương ứng Y
nhận giá trị y=f(x), hoặc khi Y nhận giá trị y nào đó thì X nhận giá
trị tương ứng x=g(y)
• Tuy nhiên, trong thực tế các đại lượng ngẫu nhiên thường phụ
thuộc lẫn nhau phức tạp hơn nhiều
• Ví dụ:
– Quan hệ giữa nhiệt độ và độ ẩm tương đối không khí trong
ngày: Qui luật chung là nhiệt độ tăng thì độ ẩm giảm, nhưng đó
là mối quan hệ không đơn trị và không phải là quan hệ hàm
– Quan hệ giữa chiều cao và cân nặng của cơ thể người
–
CHƯƠNG 8. LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUI
8.1 Tính độc lập và quan hệ phụ thuộc ngẫu nhiên
Minh họa sự phụ thuộc
giữa Y và X: Ứng với một
giá trị x∈X có thể có
nhiều giá trị của Y, và
ngược lại – Không phải là
quan hệ hàm
X
Y
Tập giá trị Y/X=x (hoặc
X/Y=y) sẽ tuân theo luật
phân bố nào đó mà ta gọi
là phân bố có điều kiện:
f(y/x) (hoặc f(x/y)
Sự phụ thuộc giữa Y và X trong trường hợp này được gọi là phụ thuộc
ngẫu nhiên. Quan hệ giữa Y và X được gọi là quan hệ tương quan
CHƯƠNG 8. LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUI
8.2 Hệ số tương quan
• Một trong những đặc trưng quan trọng để nghiên cứu mối quan hệ
tương quan giữa hai biến ngẫu nhiên là hệ số tương quan
• Theo định nghĩa, hệ số tương quan giữa hai đại lượng ngẫu nhiên
X, Y là số vô thứ nguyên được xác định bởi:
yxyx
xy
yx
yx
xy
DD
YX
DDmYMmXM
mYmXM
YMYMXMXM
YMYXMXM
),cov(
])[(].)[(
)])([(
]])[[(].])[[(
])][])([[(
22
22
≡=
−−
−−
=
=
−−
−−
=≡
µ
ρρ
• Một số ký hiệu thường gặp ),(),( XYYXxy ρρρρ =≡≡
),cov(),cov( XYYXxy =≡µ )var(22 XD xx ≡≡≡ σσ
CHƯƠNG 8. LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUI
8.2 Hệ số tương quan
Một số tính chất của hệ số tương quan
1) Nếu Z1=aX+b, Z2=cY+d (a,b,c,d là các hằng số, a>0, c>0) thì
ρ(Z1,Z2) = ρ(X,Y)
2) Trị số của hệ số tương quan nằm trong khoảng [–1,1]: |ρ| ≤ 1
3) Điều kiện cần và đủ để |ρxy| = 1 là Y và X thực sự có quan hệ hàm
tuyến tính, tức Y=aX+b, hoặc X=cY+d.
ρxy = 1 khi và chỉ khi a>0, hoặc c>0, ρxy=–1 khi a<0 (c<0)
4) Nếu X và Y độc lập với nhau thì ρxy=0. Điều ngược lại không đúng
CHƯƠNG 8. LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUI
8.2 Hệ số tương quan
Ý nghĩa của hệ số tương quan
• Từ các tính chất của hệ số tương quan suy ra rằng
– Hệ số tương quan là đại lượng đặc trưng cho mối quan hệ
tuyến tính giữa hai biến ngẫu nhiên X và Y
– Hệ số tương quan bằng 0 thì hai biến không có quan hệ tương
quan tuyến tính nhưng chưa chắc chúng độc lập với nhau (trừ
chúng có phân bố chuẩn)
– Hệ số tương quan dương thì hai biến quan hệ đồng biến với
nhau, hệ số tương quan âm hai biến quan hệ nghịch biến với
nhau
CHƯƠNG 8. LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUI
8.3 Hệ số tương quan mẫu
• Hệ số tương quan ρ đã xét trên đây là hệ số tương quan lý thuyết
giữa hai biến ngẫu nhiên. Nó là một hằng số chưa biết
• Xét hai biến ngẫu nhiên (X,Y) và mẫu (X1,Y1),,(Xn,Yn)
• Hệ số tương quan mẫu giữa hai đại lượng ngẫu nhiên X, Y là đại
lượng được xác định bởi:
yx
xy
yx
xy
n
i
i
n
i
i
n
i
ii
xy ss
R
DDYY
n
XX
n
YYXX
nrr ≡=
−−
−−
=≡
∑∑
∑
==
=
~~
~
)(1)(1
))((1
1
2
1
2
1 µ
• Khác với hệ số tương quan lý thuyết ρ, hệ số tương quan mẫu
r là một đại lượng thống kê nên nó là một biến ngẫu nhiên
CHƯƠNG 8. LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUI
Ví dụ: Tính hệ số tương quan
TT x y x-xtb y-ytb (x-xtb)^2 (y-ytb)^2 (x-xtb)(y-ytb)
1 26 0 1.4 -4.6 1.96 21.16 -6.44
2 25 3 0.4 -1.6 0.16 2.56 -0.64
3 19 9 -5.6 4.4 31.36 19.36 -24.64
4 24 10 -0.6 5.4 0.36 29.16 -3.24
5 24 4 -0.6 -0.6 0.36 0.36 0.36
6 28 2 3.4 -2.6 11.56 6.76 -8.84
7 20 9 -4.6 4.4 21.16 19.36 -20.24
8 29 0 4.4 -4.6 19.36 21.16 -20.24
9 22 4 -2.6 -0.6 6.76 0.36 1.56
10 29 5 4.4 0.4 19.36 0.16 1.76
24.6 4.6 112.4 120.4 -80.6
S2x=11.24; S2y=12.04; Rxy=-8.06; rxy=Rxy/(S2x*S2y)1/2 =-0.6929
CHƯƠNG 8. LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUI
8.3 Hệ số tương quan mẫu
• Mật độ phân bố của r có dạng:
• Phân bố của r chỉ phụ thuộc vào dung lượng mẫu n và hệ số tương
quan tổng thể ρ
• Khi n = 2 thì fn(r) = 0, phù hợp với sự kiện hệ số tương quan được
tính từ tập mẫu chỉ có 2 quan trắc phải bằng ±1
• Kỳ vọng của hệ số tương quan mẫu r: M[r]=ρ
• Phương sai của hệ số tương quan mẫu r:
∑
∞
=
−−− −+
−−
−
=
0
22
4
22
1
2
3
!
)2())
2
1(()1()1(
)2(
2)(
i
innn
n i
rinr
n
rf ρΓρ
Γπ
∫
−−
−−
−
= −
−−− 1
0
21
2
2
4
22
1
2
1)1(
)1()1(2)(
x
dx
rx
xrnrf n
nnn
n ρ
ρ
π
hoặc dạng khác
)4442(
4
][
0211
13
2011
31
2
11
22
2020
22
2
02
04
2
20
40
2
µµ
µ
µµ
µ
µ
µ
µµ
µ
µ
µ
µ
µρ
−−+++=
n
rD
CHƯƠNG 8. LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUI
8.3 Hệ số tương quan mẫu
• Ước lượng khoảng của hệ số tương quan:
Khi đó biến z có phân bố xấp xỉ chuẩn với trung bình và phương sai:
Sử dụng phép biến đổi của Fisher:
r
rz
−
+
=
1
1log
2
1
ρ
ρ
ζ
−
+
=
1
1log
2
1
)1(2
][
−
+=
n
zM ρζ
3
1][
−
=
n
zD
Và khoảng tin cậy của ζ với độ tin cậy 1-α là:
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
−
+
−
−
−
−
−
−=
3
1
)1(2
,
3
1
)1(2
)ˆ,ˆ( 21 n
u
n
rz
n
u
n
rz ααζζ
trong đó uα nhận được từ phân bố chuẩn N(0,1): αα =≥ )( uuP
• Cách xác định:
– Cho α tính được uα; từ r tính được z;
– Từ uα, r, z tính được )ˆ,ˆ( 21 ζζ )ˆˆ()ˆ,ˆ( 2121 ρρρρρ <<⇒⇒
CHƯƠNG 8. LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUI
8.3 Hệ số tương quan mẫu
• Kiểm nghiệm độ rõ rệt của hệ số tương quan:
– Trong thực tế, do độ lớn của mẫu (dung lượng mẫu) bị hạn chế
nên có thể xảy ra tình huống mặc dù ρ=0 nhưng r≠0, và ngược lại
– Nói cách khác, trong tính toán thực hành nếu nhận được r = 0 thì
điều đó không có nghĩa là ρ bằng 0.
– Ngược lại, nếu r≠0 thì cũng không hẳn là ρ khác 0
– Khi dung lượng mẫu nhỏ thì mặc dù ρ=0 nhưng giá trị của r lại
có thể có ý nghĩa (lớn đáng kể)
– Để xác minh xem ρ=0 hay ρ≠0 cần phải kiệm nghiệm độ rõ rệt
của r (là ước lượng của ρ)
CHƯƠNG 8. LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUI
8.3 Hệ số tương quan mẫu
• Kiểm nghiệm độ rõ rệt của hệ số tương quan:
– Để kiểm nghiệm, ta đặt giả thiết H0: ρ = 0
– Thay ρ ≈ r, với giới hạn tin cậy ban đầu d thì khi H0 đúng, xác
suất phạm sai lầm loại 1 là α=≥ )( drP
2/1 2 −−
=
nr
rt
2/1 2 −−
=
nr
dtαĐặt
Khi H0 đúng, t có phân bố Student với n–2 bậc tự do: t∈St(n–2)
αα =≥=≥⇒ )()( ttPdrP
Từ đó, với α được chọn ta tính được tα từ St(n–2)
Và kết luận:
• Nếu |t| ≥ tα thì bác bỏ H0 và đưa ra kết luật r lớn rõ rệt
• Nếu |t| < tα thì chấp nhận H0 và kết luận r không lớn rõ rệt
CHƯƠNG 8. LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUI
8.3 Hệ số tương quan mẫu
• Kiểm nghiệm độ rõ rệt của hệ số tương quan:
– Ví dụ: Từ tập mẫu {(xt, yt), t=1..11} ta tính được hệ số tương
quan rxy=0.76. Hãy cho biết với giá trị nhận được như vậy thì hệ
số tương quan có lớn rõ rệt không nếu chọn xác suất phạm sai
lầm loại 1 là α=0.01?
• Với α=0.01, từ St(11-2) xác định được tα=3.25 < t nên bác bỏ giả
thiết Ho và kết luận rxy lớn rõ rệt
=
−−
=
2/1 2 nr
r
t xy 51.3
211/76.01
76.0
2
=
−−
Giải: Ta có
CHƯƠNG 8. LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUI
8.4 Khái niệm về hồi qui
• Xét hai biến ngẫu nhiên (X,Y)
• Quan hệ giữa X và Y có thể là:
– Quan hệ hàm
– Quan hệ tương quan
• Khi X và Y có quan hệ tương quan:
– Mỗi giá trị x ∈ X tương ứng với một hàm phân bố (hoặc hàm
mật độ) có điều kiện F(y/x) (hoặc f(y/x)) của Y, và ngược lại
– Nghiên cứu mối phụ thuộc tương quan cần xác định được các
phân bố có điều kiện
)(
),()/(
1 xf
yxfxyf =
)(
),()/(
2 yf
yxfyxf =
Rất khó, phức
tạp, và hầu như
không thể thực hiện
được
CHƯƠNG 8. LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUI
8.4 Khái niệm về hồi qui
• Một cách làm khác: Chỉ giới hạn xét mối quan hệ phụ thuộc giữa
X với một số đặc trưng có điều kiện của Y, như kỳ vọng, trung vị,
mốt,..
• Phổ biến hơn cả là xét mối quan hệ giữa X và kỳ vọng có điều kiện
của Y: my(x) = M[Y/X=x]
• Người ta gọi đây là sự phụ thuộc hồi qui: Hồi qui của Y lên X
Y=my(X) hay y = my(x)
• Hồi qui này được gọi là hồi qui I: y = my(x) có thể là hàm tuyến
tính hoặc phi tuyến
• Nói chung, y = my(x) là một hàm bất kỳ, phức tạp, và hầu như
không biết được dạng giải tích
∫
+∞
∞−
=== dyxyyfxXYMxmy )/(]/[)(
CHƯƠNG 8. LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUI
8.4 Khái niệm về hồi qui
y=my(x)
(xt,yt)
CHƯƠNG 8. LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUI
8.5 Hồi qui bình phương trung bình tuyến tính một biến
• Trong thực tế, để nghiên cứu mối quan hệ tương quan giữa Y và X,
người ta thường xấp xỉ my(x) bởi một lớp hàm f(x) nào đó đã biết
trước dạng giải tích (Chú ý: f(x) là một hàm nào đó, không phải là
hàm mật độ của X)
• Trong trường hợp này hàm hồi qui được gọi là hồi qui II
• Nguyên tắc xác định hàm f(x) là cực tiểu hóa hệ thức:
• Điều đó có nghĩa là tìm trong các hàm φ(X) thuộc lớp hàm Φ một
hàm f(X) nào đó thỏa mãn
)(~)()( xfyyxfxmy =≈⇒≈
)(~ XfYYHay =≈
]))([( 2XfYM −
]))([(]))([( 22 XYMXfYM ϕ
φϕ
−=−
∈(X)
min
• Hàm hồi qui II được xác định bằng phương pháp này gọi là hồi qui
bình phương trung bình
CHƯƠNG 8. LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUI
8.5 Hồi qui bình phương trung bình tuyến tính một biến
y=my(x)
(xt,yt)
=f(x) y~
CHƯƠNG 8. LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUI
8.5 Hồi qui bình phương trung bình tuyến tính một biến
y=my(x)
(xt,yt)
=f(x)=α+βx y~
CHƯƠNG 8. LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUI
8.5 Hồi qui bình phương trung bình tuyến tính một biến
• Trường hợp đơn giản nhất của hồi qui bình phương trung bình là hồi
qui bình phương trung bình tuyến tính - f(x) là hàm bậc nhất:
Y = f(X) = α + βX
Hay y = f(x) = α + βx
α, β là các hằng số. (Để đơn giản ta bỏ
ký hiệu dấu “ngã” phía trên Y và y)
• Các hằng số α, β được gọi là các hệ số hồi qui
• Từ phương pháp bình phương tối thiểu ta có:
]])[][][][[(
])[(]))([(
2
222
XMXMXYMYMYM
XYMXfYMR
βββα
βα
−+−−+−=
=−−=−=
( )[ ]2])[][(])[(])[( XMYMXMXYMYM βαβ −−+−−−=
[
]])[][])([(2
])[][])([(2])[])([(2
])[][(])[(])[( 2222
XMYMXMX
XMYMYMYXMXYMY
XMYMXMXYMYM
βαβ
βαβ
βαβ
−−−−
−−−−+−−−
−−−+−+−=
CHƯƠNG 8. LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUI
8.5 Hồi qui bình phương trung bình tuyến tính một biến
[
]])[][])([(2
])[][])([(2])[])([(2
])[][(])[(])[( 22222
XMYMXMX
XMYMYMYXMXYMY
XMYMXMXYMYMR
βαβ
βαβ
βαβ
−−−−
−−−−+−−−
−−−+−+−=
[
]][][][][][
][.][.][][
][][][][.][.[2
),cov(2])[][(][][
2
2
222
XMXMXMYMXM
XMXXYMXYMXM
YMYMYMXMYYYMYM
YXXMYMXDYDR
ββαβ
ββαββ
αβα
ββαβ
−−+
+++−+
++−−−+
+−−−++=
2222
22
222
(2
),cov(2)(
xxyxxxyx
yxyyyxyy
xyxy
mmmmmmmm
mmmmmmmm
YXmmDDR
βαβββαββ
βαβα
ββαβ
−−+++−
−++−−−+
+−−−++=
xyxyxy mmDDR βµβαβ 2)(
222 −−−++=
CHƯƠNG 8. LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUI
8.5 Hồi qui bình phương trung bình tuyến tính một biến
xyxyxy mmDDR βµβαβ 2)(
222 −−−++=
022)(2
0)(2
2
2
=−+−−−=
∂
∂
=−−−=
∂
∂
xyxxxy
xy
DmmmR
mmR
µββα
β
βα
α
0)(2 =−−− xy mm βα
xy mm βα −=⇒
0))((
022)(2
=−+−−−⇒
=−+−−−
xyxxxxyy
xyxxxy
Dmmmmm
Dmmm
µβββ
µββα
x
xy
xyx D
D
µ
βµβ =⇒=− 0
xy
x
xy mm
D
βα
µ
β −== , ][][,
)var(
),cov( XMYM
X
YX
βαβ −==
X
DD
mmXfY
x
xy
x
xy
xy
µµ
+−== )()( x
DD
mmy
x
xy
x
xy
xy
µµ
+−= )(hay
CHƯƠNG 8. LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUI
8.5 Hồi qui bình phương trung bình tuyến tính một biến
xy
x
xy mm
D
βα
µ
β −== ,
x
DD
mmyX
DD
mmXfY
x
xy
x
xy
xy
x
xy
x
xy
xy
µµµµ
+−=+−== )(,)()(
x
y
x
y
xy
x
y
yx
xy
y
y
x
xy
x
xy
x
xy
D σ
σ
ρ
σ
σ
ρ
σ
σ
σσ
µ
σ
σ
σ
µ
σ
µµ
β ≡===== 22
• Hệ số góc của đường thẳng hồi qui cùng dấu với hệ số tương quan
– Hệ số tương quan dương: Đường thẳng hồi qui có hướng “đi
lên” từ trái sang phải
– Hệ số tương quan âm: Đường thẳng hồi qui có hướng “đi
xuống” từ trái sang phải
Đây là phương trình đường thẳng
hồi qui với hệ số góc β
CHƯƠNG 8. LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUI
8.5 Hồi qui bình phương trung bình tuyến tính một biến
x
y
x
y
CHƯƠNG 8. LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUI
8.5 Hồi qui bình phương trung bình tuyến tính một biến
xyxyxy mmDD
XYMXfYMR
βµβαβ
βα
2)(
]))([(]))([(
22
222
−−−++=
+−=−=
xy
x
xy mm
D
βα
µ
β −== ,
• Sai số của phương pháp
)1(12
2)(
22
22
2
2
2
2
2
2
2
2
2
2
2
22
4
2
22
ρσ
σσ
µ
σ
σ
µ
σ
σ
µ
σ
µ
σ
µ
σ
µ
ββσ
σ
µ
σ
−=⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
−=−=−+=
−−+−++=
y
yx
xy
y
x
xy
y
x
xy
x
xy
y
xy
x
xy
xxyyx
x
xy
y mmmmR
• Vì |ρ|≤1 nên sai số R2 càng nhỏ khi |ρ| càng gần 1
• Nói cách khác, nếu Y và X quan hệ tuyến tính với nhau càng chặt
chẽ thì sai số của phép xấp xỉ my(x) ≈ f(x) càng chính xác
• Khi hệ số tương quan |ρ|=1, ứng với trường hợp Y và X có quan hệ
hàm tuyến tính, thì R2=0
CHƯƠNG 8. LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUI
8.6 Hồi qui bình phương trung bình tuyến tính nhiều biến (hồi qui bội)
• Xét mối quan hệ tương quan giữa biến ngẫu nhiên Y với m biến
ngẫu nhiên (X1,...,Xm)
• Quan hệ giữa Y và (X1,...,Xm) có thể được mô tả bởi các phân bố
đồng thời f(y, x1,...,xm) hoặc phân bố có điều kiện f(y/x1,...,xm)
• Tuy nhiên, điều đó thường không thực hiện được, và thay cho điều
đó người ta xét quan hệ giữa Y với (X1,...,Xm) thông qua các đặc
trưng có điều kiện
• Ở đây ta xét kỳ vọng có điều kiện:
my(x1,...,xm)=M[Y/X1=x1,...,Xm=xm]
∫
+∞
∞−
== dyxxyyfxxmy mmy ),...,/(),...,( 11 ),...,( 1 my XXmY =
• Đây được gọi là mặt hồi qui I giữa Y và (X1,...,Xm)
• Tương tự như trường hợp một biến, mặt hồi qui I my(x1,...,xm) là một
hàm phức tạp và nói chung không thể xác định được
CHƯƠNG 8. LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUI
8.6 Hồi qui bình phương trung bình tuyến tính nhiều biến (hồi qui bội)
• Do đó, thay cho hàm hồi qui I người ta xét hồi qui II là một hàm m
biến nào đó f(x1,...,xm) được chọn làm xấp xỉ cho kỳ vọng có điều
kiện my(x1,...,xm)=M[Y/X1=x1,...,Xm=xm]
),...,(),...,(),...,( 111 mmmy XXfYxxfxxmy ≈≈= hay
• Trong trường hợp f(x1,...,xm) thuộc lớp hàm tuyến tính ta có:
• Trong đó các βj, j=0..m là các hệ số hằng số, được xác định sao cho
∑
=
+=≈
m
1j
j jm xxxfy ββ01 ),...,(
∑
=
+=≈
m
1j
jhay jm XXXfY ββ01 ),...,(
min])),...,([(
2
0
2
1 →
⎥
⎥
⎦
⎤
⎢
⎢
⎣
⎡
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
+−=−= ∑
=
m
1j
j
2 MR jm XYMXXfY ββ
CHƯƠNG 8. LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUI
8.6 Hồi qui bình phương trung bình tuyến tính nhiều biến (hồi qui bội)
• Phương trình hồi qui tìm được trong trường hợp này gọi là hồi qui
bình phương trung bình tuyến tính nhiều biến
• Xác định các hệ số hồi qui:
• Từ hệ thức:
⎥
⎥
⎦
⎤
⎢
⎢
⎣
⎡
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
+−= ∑
=
2
0
m
1j
j
2R jXYM ββ
• Lần lượt lấy đạo hàm theo βk và cho bằng 0, ta được hệ:
mkXXYM
XYM
kj
k
j
,..,1,02
02
0
==
⎥
⎥
⎦
⎤
⎢
⎢
⎣
⎡
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
−−−=
∂
∂
=⎥
⎦
⎤
⎢
⎣
⎡
−−−=
∂
∂
∑
∑
=
=
m
1j
j0
2
m
1j
j0
2
R
R
ββ
β
ββ
β
CHƯƠNG 8. LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUI
8.6 Hồi qui bình phương trung bình tuyến tính nhiều biến (hồi qui bội)
mkXXYM
XYM
kj
k
j
,..,1,02
02
0
==
⎥
⎥
⎦
⎤
⎢
⎢
⎣
⎡
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
−−−=
∂
∂
=⎥
⎦
⎤
⎢
⎣
⎡
−−−=
∂
∂
∑
∑
=
=
m
1j
j0
2
m
1j
j0
2
R
R
ββ
β
ββ
β
),..,1(
0][][][0
0][][0
mk
XXMXMYXMXXYM
XMYMXYM
kjkkkj
jj
=
=−−⇒=
⎥
⎥
⎦
⎤
⎢
⎢
⎣
⎡
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
−−
=−−⇒=⎥
⎦
⎤
⎢
⎣
⎡
−−
∑∑
∑∑
==
==
m
1j
j0
m
1j
j0
m
1j
j0
m
1j
j0
ββββ
ββββ
⇒=−− ∑
=
0][][
m
1j
j0 jXMYM ββ ∑
=
−=
m
1j
j0 ][][ jXMYM ββ
CHƯƠNG 8. LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUI
8.6 Hồi qui bình phương trung bình tuyến tính nhiều biến (hồi qui bội)
),..,1(,0][][][ mkXXMXMYXM kjkk ==−− ∑
=
m
1j
j0 ββ ∑
=
−=
m
1j
j0 ][][ jXMYM ββ
),..,1(
0][][][][][][
mk
XXMXMXMXMYMYXM kjkjkk
=
=−+− ∑∑
==
m
1j
j
m
1j
j ββ
),..,1(
0])[][][(][][][
mk
XMXMXXMXMYMYXM kjkjkk
=
=−−− ∑
=
m
1j
jβ
),..,1(,0 mk
kjk xxyx
==−∑
=
m
1j
jµβµ
Ký hiệu:
jkxx
ykyx
kj
k
µµ
µµ
≡
≡
),..,1(, mkykjk ==∑
=
µµβ
m
1j
j
• Đây là một hệ phương trình đại số tuyến tính m phương trình, m ẩn
số è Có nhiều cách giải: Khử Gauss, Crame, nghịch đảo MT,...
CHƯƠNG 8. LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUI
8.6 Hồi qui bình phương trung bình tuyến tính nhiều biến (hồi qui bội)
∑
=
−=
m
1j
j0 ][][ jXMYM ββ),..,1(, mkykjk ==∑
=
µµβ
m
1j
j
⎪
⎪
⎪
⎩
⎪
⎪
⎪
⎨
⎧
−−−=
=+++
=+++
=+++
mmy
ymmmmm
ym
ym
mmm βββ
µβµβµβµ
µβµβµβµ
µβµβµβµ
...
...
...
...
...
110
21
222221
111211
m21
m21
m21
jj
y
mXM
mYM
≡
≡
][
][
Ký hiệu:
Có thể kết hợp lại thành hệ đầy đủ
CHƯƠNG 8. LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUI
8.6 Hồi qui bình phương trung bình tuyến tính nhiều biến (hồi qui bội)
⎟
⎟
⎟
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎜
⎜
⎜
⎝
⎛
=
⎟
⎟
⎟
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎜
⎜
⎜
⎝
⎛
⎟
⎟
⎟
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎜
⎜
⎜
⎝
⎛
ym
y
y
y
mm
m
m
m
mm
mmmm
µ
µ
µ
β
β
β
β
µ
µ
µ
µµ
µµ
µµ
.........
...0
............
...0
...
...
0
1
2
1
0
2
1
21
2221
12
2
11
1
m
2
1
µβ =Σ
µβ 1−Σ=
• Dưới dạng ma
trận
CHƯƠNG 8. LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUI
8.6 Hồi qui bình phương trung bình tuyến tính nhiều biến (hồi qui bội)
⎟
⎟
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎜
⎜
⎝
⎛
=
⎟⎟
⎟
⎟
⎟
⎠
⎞
⎜⎜
⎜
⎜
⎜
⎝
⎛
⎟⎟
⎟
⎟
⎟
⎠
⎞
⎜⎜
⎜
⎜
⎜
⎝
⎛
ym
y
y
mmmm
m
m
µ
µ
µ
β
β
β
µµµ
µµµ
µµµ
......
...
............
...
...
2
1
21
22221
11211
m
2
1
yxxx B ∑=∑
yxxxB ∑∑=
−1
x
T
y mBm −=0β
• Cách biểu
diễn khác
CHƯƠNG 8. LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUI
8.6 Hồi qui bình phương trung bình tuyến tính nhiều biến (hồi qui bội)
mmmm
m
m
xx
µµµ
µµµ
µµµ
...
............
...
...
det
21
22221
11211
=∑=Δ
mm
m
m
mj
j
j
ym
y
y
mj
j
j
m
j
µ
µ
µ
µ
µ
µ
µ
µ
µ
µ
µ
µ
µ
µ
µ
...
...
...
...
...
.........
...
...
...
...
...
2
1
1
12
11
2
1
1
12
11
1
21
11
+
+
+
−
−
−
=Δ
mjjj ,...,2,1, =Δ
Δ
=β
∑
=
−=
m
j
jjy mm
1
0 ββ
• Tìm nghiệm theo phương pháp Crame
CHƯƠNG 8. LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUI
8.6 Hồi qui bình phương trung bình tuyến tính nhiều biến (hồi qui bội)
yxxxB ∑∑=
−1
j
m
j
jy mm ∑
=
−=
1
0 ββ
⎥
⎥
⎦
⎤
⎢
⎢
⎣
⎡
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
+−= ∑
=
2
0
m
1j
j
2R jXY