HỆ SỐ TƯƠNG QUAN SPEARMAN
Khi tuyển dụng, một công ty đánh giá các ứng viên thông
qua phỏng vấn và bài kiểm tra. Khi phỏng vấn, các ứng
viên được đánh giá từ A (xuất sắc) đến E (không phù hợp)
và bài kiểm tra được tính theo thang điểm 100. Kết quả
của 5 ứng viên như sau:
Tính hệ số tương quan hạng Spearman và cho nhận xét
HỆ SỐ TƯƠNG QUAN SPEARMAN
Khi tuyển dụng, một công ty đánh giá các ứng viên thông
qua phỏng vấn và bài kiểm tra. Khi phỏng vấn, các ứng
viên được đánh giá từ A (xuất sắc) đến E (không phù hợp)
và bài kiểm tra được tính theo thang điểm 100. Kết quả
của 5 ứng viên như sau:
Tính hệ số tương quan hạng Spearman và cho nhận xét
• Hãy tính hệ số tương quan hạng Spearman và cho
kết luận
75 trang |
Chia sẻ: thanhle95 | Lượt xem: 378 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Bài giảng Toán tài chính - Chương 5c: Hồi qui và tương quan, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
HỒI QUI VÀ
TƯƠNG QUAN
CHƯƠNG
5C
1
TƯƠNG QUAN
Hai biến (đại lượng) được nói là có tương quan nếu chúng có
quan hệ với nhau, chính xác hơn, sự thay đổi của biến này có
ảnh hưởng đến thay đổi của biến còn lại.
Ký hiệu (x,y) là cặp giá trị quan sát được của hai biến X, Y.
Ta có thể vẽ đồ thị của các quan sát thông qua biểu đồ phân
tán (scatter diagram)
2
VÍ DỤ
Một công ty nghiên cứu ảnh hưởng của quảng cáo
tới doanh số bán hàng. Dữ liệu quảng cáo và doanh
thu từng tháng được thu thập như sau:
Hãy vẽ biểu đồ phân tán.
Chi phí quảng cáo 1,3 0,9 1,8 2,1 1,5
Tổng doanh số tháng
tới
151,6 100,1 199,3 221,2 170,0
3
BIỂU ĐỒ PHÂN TÁN
Biến độc lập: chi
phí quảng cáo
Biến phụ thuộc:
doanh số bán
hàng
4
HỆ SỐ TƯƠNG QUAN PEARSON
Ký hiệu: r hay rX,Y
Công thức:
Trong đó n là số lượng quan sát
1
2 2
2 21 1
, ; cov ,
cov ,
. 1
;
1 1
n
i i
i
n n
i i
i
X Y
X Y
X
i
Y
x x y y
x y
n
x y
r
x x y y
n n
1
,
2 2
1 1
.
n
i i
i
X Y n n
i i
i i
x x y y
r
x x y y
5
HỆ SỐ TƯƠNG QUAN PEARSON
Ký hiệu: r hay rX,Y
Công thức:
Trong đó n là số lượng quan sát
,
2 2 2 22 2 2 2
. .
. .
X Y
n xy x y xy x y
r
n x x n y y x x y y
1
,
2 2
1 1
.
n
i i
i
X Y n n
i i
i i
x x y y
r
x x y y
6
TRUNG BÌNH; PHƯƠNG SAI VÀ HIỆP PHƯƠNG SAI
Đối với quan sát mẫu
Ta có:
1 2 1 1 2 1
2 2
2 2 2 2 2 2
2 21 2 1 1 2 1
1 1 1
... ...
;
... ...
;
...
n n
i i
n i n i
n n
i i
n i n i
n
i i
n n i
x y
x x x y y y
x y
n n n n
x y
x x x y y y
x y
n n n n
x y
x y x y
xy
n n
7
ĐÁNH GIÁ HỆ SỐ TƯƠNG QUAN
Miền giá trị: −1 ≤ ≤1
Nếu −1 ≤ ≤ 0 thì tương quan âm. rXY càng gần -1
thì mối liên hệ tuyến tính nghịch giữa X, Y càng mạnh
Nếu 0 ≤ ≤ 1 thì tương quan dương. rXY càng gần 1
thì mối liên hệ tuyến tính thuận giữa X, Y càng mạnh
rXY càng gần 0 thì quan hệ tuyến tính càng yếu.
8
ĐÁNH GIÁ HỆ SỐ TƯƠNG QUAN
9
VÍ DỤ
Hãy tính hệ số tương quan Pearson giữa chi phí quảng
cáo và doanh số trong ví dụ sau.
Chi phí quảng cáo 1,3 0,9 1,8 2,1 1,5
Tổng doanh số tháng
tới
151,6 100,1 199,3 221,2 170,0
10
VÍ DỤ
X Y X2 Y2 XY
1,3 151,6 1,69 22.982,56 197,08
0,9 100,1 0,81 10.020,01 90,09
1,8 199,3 3,24 39.720,49 358,74
2,1 221,2 4,41 48.929,44 464,52
1,5 170,0 2,25 28.900,00 255,00
7,6 842,2 12,40 150.552,50 1.365,43
Σ Σ Σ 2 Σ 2 Σ
5 5
1 1
5 5 5
2 2
1 1 1
5 7,6 842,2
12,40 150.552,50 1365,43
i i
i i
i i i i
i i i
n x y
x y x y
11
VÍ DỤ
Ta có:
Hệ số tương quan:
Hoặc:
2
2
1,52 2,48 168,44
30110,5 273,086
x x y
y xy
2 2
273,086 1,52.168,44
2, 48 1,52 30110,5 168
0
,44
,993371434XYr
1 1 1
2 2
1 1 1 1
2 2 2 2
5.1365, 43 7,6*842, 2
0,993371434
5.12,4 7,6 5.150552,5 842, 2
.
.
n n n
i i i i
i i i
XY
n n n n
i i i i
i i i i
n x y x y
r
x x y yn n
12
VÍ DỤ
Các giá trị trung bình
Độ lệch chuẩn:
Hệ số tương quan
2 212, 4 150552,5 1365, 432, 48; 30110,5; 273,086
5 5 5
x y xy
2 212, 4 150552,5 1365,432, 48; 30110,5; 273,086
5 5 5
0,460435 46,61634X Y
x y xy
0,993371r
13
VÍ DỤ
Số liệu về thời gian quảng cáo trên truyền hình và lượng
sản phẩm tiêu thụ ở một công ty sản xuất đồ chơi trẻ em
như sau:
Thời gian: phút/tuần
Lượng tiêu thụ: 1000sp/tuần
Hãy tính hệ số tương quan mẫu và cho kết luận
Thời gian 28 37 44 36 47 35 26 29 33 32 31 28
Lượng tiêu thụ 41 32 49 42 38 33 27 24 35 30 34 25
14
HỆ SỐ TƯƠNG QUAN SPEARMAN
Hệ số tương quan hạng
Ký hiệu R
Công thức:
Trong đó n là cỡ mẫu và d là hiệu số của các hạng.
( )
2
2
6
1
1
d
R
n n
= -
-
å
15
HỆ SỐ TƯƠNG QUAN SPEARMAN
Khi tuyển dụng, một công ty đánh giá các ứng viên thông
qua phỏng vấn và bài kiểm tra. Khi phỏng vấn, các ứng
viên được đánh giá từ A (xuất sắc) đến E (không phù hợp)
và bài kiểm tra được tính theo thang điểm 100. Kết quả
của 5 ứng viên như sau:
Tính hệ số tương quan hạng Spearman và cho nhận xét
Ứng viên 1 2 3 4 5
Điểm phỏng vấn A B A C D
Điểm bài thi 60 61 50 72 70
16
VÍ DỤ
Ta lập bảng sau:
Ứng viên
Hạng
phỏng vấn
Hạng
kiểm tra
Hiệu
số
Hiệu số bình
phương
1 1,5 4 -2,5 6,25
2 3 3 0 0
3 1,5 5 -3,5 12,25
4 4 1 3 9
5 5 2 3 9
0 36,50
( ) ( )
2
2
6 6 * 36, 50
1 1 0, 825
5. 25 11
d
R
n n
= - = - = -
--
å
17
VÍ DỤ
Một chuyên gia được
yêu cầu nếm thử 8 loại
rượu có giá dưới 4 $.
Hương vị các loại rượu
được xếp hạng từ 1 (dở
nhất) đến 8 (ngon
nhất). Bảng tổng hợp
xếp hạng và giá cả các
loại rượu như sau:
Loại
rượu
Hương vị Giá tiền
A 1 2,49
B 2 2,99
C 3 3,49
D 4 2,99
E 5 3,59
F 6 3,99
G 7 3,99
H 8 2,99
• Hãy tính hệ số tương quan hạng Spearman và cho
kết luận
18
VÍ DỤ
Ta lập bảng sau:
Loại rượu
Hạng
hương vị
Hạng
giá tiền
Hiệu
số
Hiệu số bình
phương
A
B
C
D
E
F
G
H
19
PHÂN TÍCH HỒI QUY
Phân tích hồi quy được sử dụng để xác định mối liên hệ
giữa:
Một biến phụ thuộc Y (biến được giải thích)
Một hay nhiều biến độc lập X1, X2, ,Xn (còn được gọi là biến giải
thích)
Biến phụ thuộc Y phải là biến liên tục
Các biến độc lập X1, X2, , Xn có thể là biến liên tục, rời
rạc hay phân loại.
20
LIÊN HỆ HÀM SỐ VÀ LIÊN HỆ THỐNG KÊ
Liên hệ hàm số: Y=aX+b
Với một giá trị của X, có 1 giá trị duy nhất của Y
Liên hệ thống kê: Y=aX+b
Ví dụ: X: thời gian tự học; Y: điểm cuối kỳ
Một giá trị của X có thể có nhiều giá trị của Y
Dữ liệu X: dữ liệu mẫu
Dữ liệu mẫu tìm đường hồi quy mẫu dự đoán cho
đường hồi quy tổng thể.
21
VÍ DỤ
Một công ty muốn ước lượng hàm chi phí cho một sản
phẩm. Giá trị của hàm chi phí được xác định tại một vài
mức sản xuất như sau.
22
VÍ DỤ
Mặc dù những điểm quan sát
không cùng nằm trên một đường
thẳng nhưng tương quan tuyến
tính rất mạnh
Công ty muốn xấp xỉ hàm chi phí
bằng một hàm tuyến tính:
.y a x b= +
• Ta cần xác định các hệ số a, b sao cho đường thẳng
trên xấp xỉ tốt nhất cho hàm chi phí.
23
THẶNG DƯ (RESIDUAL)
Ta cần xác định a, b sao cho tổng bình phương thặng dư nhỏ
nhất.
24
VÍ DỤ
Số liệu về doanh số và số lượng nhân viên kinh doanh
trong các khu vực của công ty X như sau:
Hãy tìm mô hình tuyến tính dự đoán doanh số theo số
nhân viên kinh doanh
Khu vực Doanh số Số nhân viên kinh doanh
A 236 11
B 234 12
C 298 18
D 250 15
E 246 13
F 202 10
25
TỔNG QUÁT
Giả sử có n quan sát (x1,y1), (x2,y2),,(xn,yn)
Ta cần xác định đường thẳng y=a.x+b sao cho tổng
bình phương của các thặng dư là nhỏ nhất.
Hay cần cực tiểu hóa hàm số sau:
Chú ý:
a, b: là hai ẩn cần tìm
xk; yk là các giá trị đã biết.
( ) ( )
2
1
, .
n
k k
i
F a b y a x b
=
= - -å
26
TỔNG QUÁT
Ta có:
Đường hồi quy luôn đi qua điểm ( ; )
( )( )
( ) ( )
1
22
2
1
.
.
n
k k
k
n
k
k
a y b x
x x y y
xy x y
b
x xx x
=
=
ìï = -ïïïïï - -ïí -ï = =ïïï --ïïïî
å
å
27
VÍ DỤ
Số liệu về doanh số và số lượng nhân viên kinh doanh
trong các khu vực của công ty X như sau:
Hãy tìm mô hình tuyến tính dự đoán doanh số theo số
nhân viên kinh doanh
Khu vực Doanh số Số nhân viên kinh doanh
A 236 11
B 234 12
C 298 18
D 250 15
E 246 13
F 202 10
28
ỨNG DỤNG KINH TẾ
Nhu cầu sử dụng dầu nhiên liệu để sưởi ấm nhà ở
Hoa Kỳ đã giảm đều đặn trong nhiều thập kỷ. Bảng
sau liệt kê tỷ lệ hộ gia đình ở Hoa Kỳ sưởi ấm bằng
dầu nhiên liệu từ 1960 đến 2009. Sử dụng hồi quy
tuyến tính để ước lượng tỷ lệ hộ gia đình sử dụng
dầu nhiên liệu vào năm 1995
Đáp số: 12,44%
29
HỒI QUY TUYẾN TÍNH TỔNG QUÁT
Vấn đề: có hai biến quan sát X và Y
Ta cần tìm phương trình thể hiện mối liên hệ giá trị giữa Y
và X
Y: biến phụ thuộc; X: biến độc lập
Dùng mô hình hồi quy đơn giản nhất: hồi quy tuyến tính
Có thể sử dụng các mô hình khác: phi tuyến; bậc 2; bậc 3;
mũ; logarit
30
HỒI QUY TUYẾN TÍNH
X và Y có tương quan tuyến tính mạnh
Ta giả sử X và Y có mối quan hệ tuyến tính với nhau.
Mô hình như sau:
β1 ∶ hệ số chặn (intercept)
β2: hệ số góc (slope)
u: sai số ngẫu nhiên (nhiễu ngẫu nhiên, nhiễu trắng)
1 2y x ub b
31
HỒI QUY TUYẾN TÍNH
Với giá trị quan sát được ta có:
yi : giá trị quan sát được của Y khi X nhận giá trị là xi.
xi: giá trị quan sát thứ i của X.
ui: sai số ngẫu nhiên khi X nhận giá trị xi.
1 2i i iy x ub b
32
HÀM HỒI QUY TỔNG THỂ
Hàm hồi quy tổng thể
Đối với một quan sát cụ thể ta có:
Mô hình chỉ có một biến phụ thuộc Y và một biến giải
thích X.
và gọi là hệ số chặn (intercept) và hệ số góc (slope)
của đường thẳng hồi quy.
( ) 1 2
1 2
|
i
E Y X X X
Y X
b b
b b
= = +
= +
1 2i i i
Y X ub b= + +
33
HÀM HỒI QUY MẪU SRF
Ta ít khi có số liệu của cả tổng thể mà chỉ có số liệu của mẫu
(số liệu quan sát được)
Ta dùng số liệu mẫu để ước lượng tổng thể
Hàm hồi quy mẫu:
Đối với quan sát thứ i:
µ µ µ
1 2i i
Y Xb b= +
µ µ µ
1 2i i i
Y X ub b= + +
34
YX
35
1b
2bˆ
1bˆ
PRF
2b
SRF
Hệ số hồi quy trong hàm hồi quy PRF và SRF
PRF và SRF
PRF VÀ SRF
Trong đó
là ước lượng cho b1.
là ước lượng cho b2.
là ước lượng cho Y hay E(Y|Xi)
Ta sử dụng phương pháp bình phương nhỏ nhất thông
thường (OLS) để tìm ;
36
HỒI QUY TỔNG THỂ VÀ HỒI QUY MẪU
37
CHÚ Ý
Tình trạng Biện pháp
Hệ số β1 Tham số
Không xác định được
chính xác giá trị
Ước lượng
Kiểm địnhHệ số β
Phương sai sai số 2
Hệ số Biến ngẫu nhiên
Có thể tính được giá trị trên mẫu đã
chọn
Dùng để ước lượng cho các tham số
tổng thể
Hệ số
Phương sai thặng dư
mẫu 2
38
ƯỚC LƯỢNG OLS
Tìm giá trị của β1; β2 sao cho:
Đạt giá trị nhỏ nhất (pp bình phương tối thiểu)
Dễ thấy:
( )
2
2
1 2
1 1
n n
i i i
i i
u y xb b
= =
= - -å å
( ) ( )
µ
( )( )
( )
µ1
2
2
1 22 2
2 2
1 2
2
1
. . .
;
n
i i
i
n
i
i
x y x xy xy x y
x x x x
x x y y
y x
x x
b b
b b
b=
=
- -
= =
- -
=
-
-
-
-
=
å
å
39
HỆ SỐ HỒI QUY MẪU
Là các ước lượng của β1; β2
Dạng biểu diễn khác:
µ
( )
( )
( )
( )
µ µ
1
2
2 2
1
1 1
1 2
;
n
ni i
ii
i i in n
i
i i
i i
x x y x x
c y c
x x x x
y x
b
b b
=
=
= =
- -
= = =
- -
= -
å
å
å å
40
MỘT SỐ TÍNH CHẤT
Giá trị trung bình các hệ số hồi quy mẫu:
Phương sai các hệ số hồi quy mẫu:
Ta dùng các kết quả trên để ước lượng giá trị của các hệ số
hồi quy tổng thể β1; β2
Nhưng giá trị của 2 chưa xác định.
µ( ) µ( )1 21 2;E Eb b b b= =
µ( )
( )
( )
µ( )
( )
2
2
2
1 22 2
1 1
1
n n
i i
i i
x
V V
n
x x x x
s
b s b
= =
æ ö÷ç ÷ç ÷ç ÷ç ÷ç= + =÷ç ÷ç ÷÷ç - -÷ç ÷çè ø
å å
41
MỘT VÀI TÍNH CHẤT
42
MỘT VÀI TÍNH CHẤT
Ta có:
1 1 1 1
0
n n n n
i i i ii i i
i i i i
u y y y y y y
43
KÝ HIỆU
Ta có:
44
TÁCH NHÓM BIẾN THIÊN: KHÁI NIỆM
TSS = tổng của các mức độ khác biệt bình phương giữa
từng giá trị yi và trị số trung bình của y.
ESS = tổng của các mức độ khác biệt bình phương giữa
các giá trị quan sát và giá trị dự đoán của y.
RSS = tổng của các mức độ khác biệt bình phương giữa
giá trị dự đoán của y và trị số trung bình của y.
45
ĐO SỰ BIẾN THIÊN CỦA DỮ LIỆU
Tổng bình phương toàn phần (Total Sum of Squares)
Tổng bình phương hồi quy (Regression Sum of Squares)
Tổng bình phương sai số (Residual Sum of Squares)
( )
2
1
n
i
i
R SS y y
=
= -å $
( )
2
1
n
i
i
T SS y y
=
= -å
( )
2
1
n
ii
i
E SS y y
=
= -å $
46
RSS
Tổng chênh lệch
47
ESS
SRF
Y
X
yi
Xi
iy
Ý nghĩa hình học của TSS, RSS và ESS
Các tổng bình phương độ lệch
( )
2
1
n
i
i
R SS y y
=
= -å $
( )
2
1
n
i
i
T SS y y
=
= -å
( )
2
1
n
ii
i
ESS y y
=
= -å $
y y= $
CÁC TỔNG BÌNH PHƯƠNG ĐỘ LỆCH
Khi điểm quan sát càng gần đường thẳng ước lượng thì “độ
thích hợp” càng cao, có nghĩa là ESS càng nhỏ và RSS càng
lớn.
Tham số đo độ thích hợp:
R2 càng lớn càng tốt
ESS: biến thiên không giải thích được
RSS: biến thiên giải thích được
R2 nhỏ nghĩa là nhiều biến thiên của Y không giải thích được
bằng X. Cần phải thêm nhiều biến khác vào mô hình.
20 1R£ £ =
48
HỆ SỐ XÁC ĐỊNH
Coefficient of determination
Là tỷ lệ của tổng sự biến thiên trong biến phụ thuộc gây ra
bởi sự biến thiên của các biến độc lập (biến giải thích) so với
tổng sự biến thiên toàn phần.
Tên gọi: R_bình phương (R squared)
Ký hiệu:
Dễ thấy:
2 R SSR
T SS
=
20 1R£ £
49
HỆ SỐ XÁC ĐỊNH
Đánh giá mô hình tìm được có giải thích tốt cho mối liên
hệ giữa biến phụ thuộc Y và biến độc lập X hay không.
Là bình phương của hệ số tương quan mẫu
µ ( )
( )
µ ( )
( )
( )
2 2
2
2 2
2
2 22 2
2
2
2
i
i
X Y
x x x xR SS
R
T SS
y y y y
R r
b b
- -
= = =
- -
=
å
å
50
Tính chất của hệ số xác định R2
51
• 0≤ R2≤1
• Cho biết % sự biến động của Y được giải thích bởi
các biến số X trong mô hình.
• R2 =1: đường hồi quy phù hợp hoàn hảo
• R2 =0: X và Y không có quan hệ
• R2 càng lớn càng tốt
• Đối với dữ liệu chuỗi thời gian thì R2 thường lớn hơn
0,9. Nếu thấp hơn 0,6 hay 0,7 thì xem là thấp
• Với dữ liệu chéo thì R2 khoảng 0,6 hay 0,7 cũng
chưa hẳn thấp
ƯỚC LƯỢNG CHO PHƯƠNG SAI SAI SỐ 2
52
ƯỚC LƯỢNG VÀ DỰ BÁO
1. Ước lượng hệ số góc
2. Ước lượng hệ số chặn
3. Ước lượng phương sai sai số
4. Dự báo giá trị trung bình
5. Dự báo điểm
53
PHÂN PHỐI XÁC SUẤT CỦA 1
Nhớ
Với độ tin cậy 95% thì:
µ
µ( )
( )1 1
1
~ 2t n
Se
b b
b
-
-
2,5%2,5% 95%
0,025 2t n 0,025 2t n
( )
µ
µ( )
( )1 10,025 0,025
1
2 2t n t n
Se
b b
b
-
- - £ £ -
µ ( ) µ( ) µ ( ) µ( )1 10,025 1 1 0,025 12 2t n Se t n Seb b b b b- - £ £ + -
54
2
2
1
2
2t n
2
2t n
ƯỚC LƯỢNG CHO 1
Tổng quát với độ tin cậy (1 − )
µ( ) µ( )
( )
2
2
1 1
1
xx
x
Se V
n S
b b s
æ ö÷ç ÷ç ÷ç ÷ç= = + ÷ç ÷ç ÷ç ÷÷çè ø
( )
µ
µ( )
( )1 1
2 2
1
2 2t n t n
Se
a a
b b
b
-
- - £ £ -
µ ( ) µ( ) µ ( ) µ( )1 11 1 1
2 2
2 2t n Se t n Se
a a
b b b b b- - £ £ + -
2
2
ESS
n
s »
-
55
CÔNG THỨC ƯỚC LƯỢNG 1
Khoảng tin cậy (1 − ) của hệ số b1
Trong đó:
µ µ( )1 11 1;b e b e- +
=
− 2
= ⁄ − 2 .
.
1
+
̅
56
PHÂN PHỐI XÁC SUẤT CỦA
Nhớ
Với độ tin cậy (1- ) thì:
µ
µ( )
( )2 2
2
~ 2t n
Se
b b
b
-
-
/ 2/ 2 1
/2 2t n /2 2t n
( )
µ
µ( )
( )2 2/ 2 / 2
2
2 2t n t n
Se
a a
b b
b
-
- - £ £ -
µ ( ) µ( ) µ ( ) µ( )2 2/ 2 2 2 / 2 22 2t n Se t n Sea ab b b b b- - £ £ + -
µ( ) µ( )
2
2 2
xx
S e V
S
s
b b= =
57
CÔNG THỨC ƯỚC LƯỢNG
Khoảng tin cậy (1 − ) của hệ số b2
Trong đó:
µ µ( )2 22 2;b e b e- +
= ⁄ − 2 .
.
1
=
− 2
58
CÔNG THỨC ƯỚC LƯỢNG 2
• Khoảng tin cậy của phương sai sai số tổng thể:
2
2 2
/2 1 /2
;
2 2
ESS ESS
n n
59
DỰ BÁO
Cho X nhận giá trị là x0. Ta tiến hành dự báo:
Trung bình của Y khi X = x0. Ký hiệu: E(Y0|X0)
Giá trị cụ thể của Y khi X = x0. Ký hiệu: 0
Công thức chung:
Giá trị ước lượng ± Sai số
60
DỰ BÁO GIÁ TRỊ Y0
61
DỰ BÁO GIÁ TRỊ E(Y/X0)
62
BỔ SUNG KIẾN THỨC VỀ PHÂN PHỐI XÁC SUẤT
Phân phối chuẩn
Phân phối Student
Phân phối Khi bình phương
63
GIÁ TRỊ TỚI HẠN 2 (n; α)
Giá trị tới hạn mức α (0 ≤ ≤ 1) là số thực ký hiệu
2(n; ) sao cho với Z~ 2(n) thì:
64
2 ;nP Z
2 ;n
BẢNG GIÁ TRỊ TỚI HẠN KHI BÌNH PHƯƠNG
65
GIÁ TRỊ TỚI HẠN ( , )
Giá trị tới hạn mức α (0 ≤ ≤ 1) là số thực ký hiệu
( , ) sao cho với Z~ (n) thì:
66
;nZ tP
;0 ;1
;0,5 ;1 ;
;
0
n n
n n n
n
n
t t
t t t
t Z
BẢNG GIÁ TRỊ TỚI HẠN STUDENT
67
VÍ DỤ
Quan sát sự biến động của nhu cầu gạo Y (tấn/tháng) vào
đơn giá X (ngàn đồng/kg) ta được các số liệu cho ở bảng.
Hãy lập mô hình hôi quy mẫu biễu diễn mối phụ thuộc về
nhu cầu vào đơn giá gạo
Xi 1 4 2 5 5 7
Yi 10 6 9 5 4 2
68
VÍ DỤ
Ta lập bảng sau:
Ta có:
Stt Xi Yi XiYi X^ 2
1 1 10 10 1
2 4 6 24 16
3 2 9 18 4
4 5 5 25 25
5 5 4 20 25
6 7 2 14 49
sum 24 36 111 120
24 36
4 6
6 6
X Y
69
VÍ DỤ
Ta có:
1
2 2
2 2
1
. .
111 6.4.6ˆ 1,375
120 6.(4)
.( )
n
i i
i
n
i
i
Y X n X Y
X n X
b
1 2
ˆ ˆ 6 ( 1,375).4 11,5Y Xb b
ii XY .375,15,11
ˆ
70
71
Giải hồi quy bằng máy tính
1. Bật tần số: Shift+Mode+↓ +4+1 (Freq On
2. Chọn Mode Regression: Mode+3+2(chọn
A+Bx)
3. Nhập dữ liệu theo cột
4. Kiểm tra và nhấn AC thoát
5. Xem kết quả: Shift +1+ 3,4,5 (tùy theo Sum,
Var hay Reg)
72
Bài tập 1
Thu thập số liệu về điểm học tập của học sinh và
mức thu nhập hàng năm của bố mẹ ta có bảng số
liệu sau:
Hãy tìm hàm hồi quy mẫu và tính các đặc trưng
của nó
Xi: thu nhập (triệu/năm)
Yi: điểm trung bình
Xi 45 60 30 90 75 45 105 60
Yi 8,75 7,5 6,25 8,75 7,5 5,0 9,5 6,5
73
Bài tập 1
b) Với độ tin cậy 95% hãy ước lượng hệ số chặn,
hệ số góc và phương sai sai số.
c) Với độ tin cậy 90%, dự đoán điểm và điểm
trung bình khi thu nhập là 80
Xi 45 60 30 90 75 45 105 60
Yi 8,75 7,5 6,25 8,75 7,5 5,0 9,5 6,5
74
Bài tập 2
Số liệu về tỷ lệ lạm phát và lãi suất trong năm
2011 của 6 quốc gia như sau:
a) Ước lượng và viết phương trình hồi quy tuyến
tính = 1 + 2 +
b) Tìm hệ số xác định và giải thích ý nghĩa
c) Dự đoán lãi suất trung bình khi lạm phát là
10%.
Lãi suất Y (%) 7 11 20 10 16 14
Lạm phát X (%) 3 8 17 8 12 12
75
Bài tập 3
Cho bảng số liệu sau:
a) Tìm hệ số tương quan mẫu
b) Tìm phương trình hồi quy mẫu
c) Tính Sxx, Sxy, Syy
d) Tính TSS, RSS, ESS.
e) Tính các giá trị hồi quy và từ đó tìm ESS
f) Ước lượng cho 1; 2; 2 với độ tin cậy 90%
g) Dự đoán giá trị của Y khi X là 18.
X 4 7 8 15 8 12 14 20 16 9
Y 9 13 17 29 17 23 27 45 34 20