Các hiện tượng thuỷ văn chịu sự tác động của nhiều nhân tố, trong thực tế không
thể xem xét đầy đủ. Nhiều trường hợp cũng không cần xem xét tất cả mà chỉ xét những
nhân tố chính ảnh hưởng đến hiện tượng cần phân tích.
Quan hệ giữa hiện tượng thuỷ văn với các nhân tố ảnh hưởng chỉ đưa ra được dạng
chung nhất, mang tính tất định, còn sự phân tán do tác động của các nhân tố chưa
được xét đến, mang tính ngẫu nhiên.
38 trang |
Chia sẻ: lylyngoc | Lượt xem: 2672 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Chương 4 Phân tích tương quan, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
97
Chương 4
Phân tích tương quan
4.1. Khái niệm
Các hiện tượng thuỷ văn chịu sự tác động của nhiều nhân tố, trong thực tế không
thể xem xét đầy đủ. Nhiều trường hợp cũng không cần xem xét tất cả mà chỉ xét những
nhân tố chính ảnh hưởng đến hiện tượng cần phân tích.
Quan hệ giữa hiện tượng thuỷ văn với các nhân tố ảnh hưởng chỉ đưa ra được dạng
chung nhất, mang tính tất định, còn sự phân tán do tác động của các nhân tố chưa
được xét đến, mang tính ngẫu nhiên.
Tuy nhiên khái niệm chung hơn là quan hệ ngẫu nhiên, tương ứng với tập hợp
thống kê đầy đủ khi dung lượng tiến tới vô cùng. Mối quan hệ ngẫu nhiên được mô tả
đầy đủ nhất bằng hàm mật độ nhiều chiều, giữa hai biến là hàm mật độ 2 chiều.
Nhưng như vậy lại cần lượng thông tin rất lớn, nhiều khi không thực hiện được.
Trong thực tế chúng ta chỉ có một số mẫu hữu hạn các số liệu, do đó mối quan hệ
này chỉ là quan hệ thống kê. Ví dụ quan hệ giữa mưa-dòng chảy, giữa mực nước tuyến
trên và tuyến dưới. Khả năng ứng dụng các mối quan hệ này dựa vào lý thuyết ước
lượng thông số và đánh giá dao động ngẫu nhiên của chúng.
Mối quan hệ giữa các biến lượng biểu hiện trong 3 dạng sau:
1). Quan hệ hàm số (hình 4.1). Một giá trị của biến lượng này sẽ xác định giá trị
tương ứng của biến lượng kia. Đó là đối tượng nghiên cứu của toán học.
Hình 4.1: Quan hệ hàm số giữa các đại lượng
2). Quan hệ độc lập hay không quan hệ (hình 4.2), biểu hiện sự tản mạn rời rạc, sự
thay đổi của biến lượng này không ảnh hưởng đến biến lượng kia.
3). Quan hệ tương quan (hình 4.3). Với mỗi giá trị của biến lượng x thì biến số y là
không xác định vì y không chỉ phụ thuộc x mà còn bị chi phối của nhiều biến lượng
khác. Tuy nhiên qua nhiều quan trắc có thể tìm thấy giữa chúng tồn tại một quan hệ
nhất định, có tính trung bình, đó chính là quan hệ tương quan.
98
Hình 4.2: Quan hệ độc lập giữa các đại lượng
Hình 4.3: Quan hệ tương quan giữa các đại lượng
Thực tế trong thuỷ văn thường sử dụng mối quan hệ tương quan, đó là quan hệ
giữa giá trị của đại lượng x (đối số) với trung bình có điều kiện của đại lượng y (hàm
số), ký hiệu là yx. Phân tích tương quan nhằm nghiên cứu quy luật trung bình về tính
chất của đại lượng này tuỳ thuộc vào đại lượng kia và số đo sự phụ thuộc đó. Thông
qua phân tích tương quan có thể đánh giá vai trò của các nhân tố ảnh hưởng, xác định
xem chúng cần xem xét hay có thể bỏ qua. Trên cơ sở đánh giá mức độ tương quan giữa
các biến lượng mà ta có thể bổ sung kéo dài tài liệu cho các khu vực thiếu số liệu quan
trắc dựa vào các nhân tố ảnh hưởng.
Mối quan hệ tương quan được biểu diễn bằng các phương trình tương quan hoặc
hồi quy, nó có thể là tuyến tính hoặc phi tuyến. Để thuận lợi trong nhiều trường hợp có
thể biến đổi biến số để đưa về dạng tuyến tính. Khi đó dạng phân bố gốc được chuyển
về dạng chuẩn.
Tương quan có thể chia thành tương quan đơn và tương quan bội. Tương quan đơn
là tương quan giữa 2 biến. Tương quan bội là tương quan của nhiều biến.
4.2. Tương quan tuyến tính 2 biến
4.2.1. Khái niệm
Đây là mối tương quan thường hay sử dụng khi một nhân tố có vai trò quyết định
đối với hiện tượng cần nghiên cứu.
Khi chấm các điểm quan hệ lên đồ thị, ta thấy hình thành các nhóm điểm có xu
thế đường thẳng như hình (4.3a). Tương quan tuyến tính có thể biểu thị bằng đường
hồi quy (phương pháp giải tích) hay đường tương quan (phương pháp đồ giải).
4.2.2. Đường hồi quy
99
Đường thể hiện tốt nhất, phù hợp nhất với sự phân bố nhóm điểm gọi là đường hồi
quy (mỗi giá trị của đại lượng này tương ứng với giá trị trung bình của các giá trị của
đại lượng kia). Nói cách khác ứng với mỗi giá trị biến lượng x ta có một tập hợp các giá
trị của biến lượng y, và các giá trị này tuân theo một hàm phân bố nào đó (thường cho
là có phân bố chuẩn). Đường hồi quy sẽ đi qua giá trị trung bình hay kỳ vọng của phân
bố này, chúng ta gọi đó là trung bình có điều kiện. Nếu đường hồi quy có dạng đường
thẳng thì hồi quy là tuyến tính.
Đường hồi quy mà y là hàm số (biến phụ thuộc) còn x là đối số (biến độc lập) gọi là
hồi quy y theo x và ký hiệu là y = f1(x), còn ngược lại là đường hồi quy của x theo y, tức
là x = f2(y). Nói chung 2 đường này không trùng nhau (hình 4.4).
50
70
90
110
130
150
170
190
210
50 70 90 110 130 150
x
y
Hình 4.4: Đường hồi quy tuyến tính
a.Phương trình đường thẳng hồi quy
Phương trình chung của đường thẳng hồi quy thường có dạng như hình 4.5:
y = ax+b, (4.1)
trong đó: a là hệ số góc của đường hồi quy, a=tg, với là góc nghiêng của đường hồi
quy với trụ x; b là hệ số tự do, là giá trị điểm cắt của đường hồi quy với trục y.
50
70
90
110
130
150
170
190
210
50 70 90 110 130 150
x
y
Hình 4.5. Đường hồi quy tuyến tính giữa 2 biến (Qnam KonTum-Trung Nghĩa)
Như chỉ ra trên hình 4.5, giữa điểm thực đo với điểm lấy trên đường hồi quy có một
khoảng chênh lệch:
Y=f(X)
X=f(Y)
100
)(' baxyyyy iiiii , (4.2)
trong đó: 'iy là giá trị tính theo đường hồi quy; yi là giá trị thực đo.
Đường thẳng được coi là phù hợp nhất khi tổng bình phương độ lệch giữa thực đo
và tính toán theo đường hồi quy là nhỏ nhất.
n n
iiii baxyyyS
1
2
1
2 min])([)( ' , (4.3)
Phương pháp để xác định 2 thông số a và b theo nguyên tắc trên gọi là phương
pháp bình phương tối thiểu (hay bình phương nhỏ nhất). Đây cũng là phương pháp
thường dùng cho các quan hệ tương quan.
b. Xác định các thông số của đường hồi quy
Muốn có S nhỏ nhất thì phải có đạo hàm S theo từng thông số bằng 0, tức là:
- Đạo hàm theo a
02
1
2
11
2
)()(
)()( '
i
n
i
ii
n
i
ii
n
i
ii
xbaxy
a
baxy
a
yy
a
S
(4.4)
Từ đó được:
n
i
n
i
n
i
iiii xbxayx
1 1 1
2 0 (4.5)
- Đạo hàm theo b
n
i
ii baxy
b
S
1
020 )( (4.6)
Từ đó có:
n
i
n
i
ii nbxay
1 1
0 (4.7)
Đặt:
n
i
ix
n
x
1
1
và
n
i
iy
n
y
1
1
(4.8)
Giải phương trình (4.5) và (4.7) đối với a và b nhận được:
22
1
xnx
yxnyx
a
i
n
i
ii )(
(4.9)
n
i
i
n
i
n
i
iii
xnx
yxxxy
xayb
1
22
1 1
2
(4.10)
Thay a, b vào phương trình (4.1) ta được:
101
)(
)(
))((
xx
xx
yyxx
yy
n
i
i
n
i
2
(4.11)
Ví dụ 4.1: Cho số liệu mưa năm 2 trạm Đồng Hới và Tám Lu (Quảng Bình) từ
1989-1998. Tính các hệ số và viết phương trình hồi quy.
Chấm các điểm quan hệ tương ứng giữa 2 trạm ta được hình 4.6
Hình 4.6: Tương quan mưa năm Đồng Hới-Tám Lu
Ta lập bảng tính như bảng 4.1
Bảng 4.1: Tính các hệ số hồi quy mưa năm 2 trạm Đồng Hới và Tám Lu
TT Năm xi yi xi
2 xi.yi
1 1989 2636,1 2776,6 7709508 7319395
2 1990 2451,9 2917,1 8509472 7152437
3 1991 2731,5 2535,0 6426225 6924353
..... .......... ................... .................... ........................ ......................
8 1996 2358,0 3026,7 9160913 7136959
9 1997 1721,7 1973,1 3893124 3397086
10 1998 1905,7 2559,2 6549505 4877067
Tổng 22144,3 25085,7 50932712,60 58076704,67
Trung bình x = 2214,4 y = 2508,6 5093271,26 5807670,47
Từ bảng 3.1 nhận được:
x = 2214,4; y = 2508,6;
Theo (4.9) ta có:
22
1
xnx
yxnyx
a
i
n
i
ii )(
24221410650932712
6250842214106758076704
,..
,.,.,
=1,33.
Theo (4.10) nhận được: xayb 2508,6-1,33.2214,4=-436,6.
1000
1500
2000
2500
3000
3500
1200 1400 1600 1800 2000 2200 2400 2600 2800 3000
x(mm)
y(mm)
102
Vậy phương trình hồi quy là:
y=1,33.x-436,6.
c. Hệ số tương quan
Đường hồi quy có thể biểu thị quan hệ tương quan giữa 2 biến nhưng không thể
đánh giá mức độ chặt chẽ của quan hệ tương quan. Để biểu thị mức độ chặt chẽ của
quan hệ này ta dùng hệ số tương quan r:
1aar , (4.12)
trong đó: a là hệ số hồi quy của y theo x; a1 là hệ số hồi quy của x theo y.
Điều đó có nghĩa là hệ số tương quan là trung bình nhân của 2 hệ số hồi quy của y
theo x và x theo y. Góc hợp giữa 2 đường hồi quy này càng nhỏ thì tương quan càng
chặt chẽ, khi giảm tới 0 thì ta có quan hệ hàm số.
Khi r >0, ta có tương quan dương, tức là quan hệ có xu thế đồng biến. Đường thẳng
hồi quy đi qua tâm phân bố ),( yxM tạo thành một góc nhọn so với trục x. Đại lượng y
tăng theo sự tăng của đại lượng x.
Khi r <0, ta có tương quan âm, tức là quan hệ có xu thế nghịch biến. Đường thẳng
hồi quy đi qua tâm phân bố ),( yxM tạo thành một góc tù so với trục x. Đại lượng y
giảm khi đại lượng x tăng.
Khi r = 0, không có tương quan., hai biến lượng x và y là độc lập.
Khi r = 1, ta có quan hệ hàm số, 2 đường hồi quy trùng vào làm một.
Vì vậy r ≤ 1 và càng gần 1 chứng tỏ quan hệ càng chặt chẽ.
Thay các giá trị a và a1 vào biểu thức (4.12) thu được:
n
i
n
i
ii
n
i
ii
yyxx
yyxx
r
1 1
22
1
)()(
))((
(4.13)
Ví dụ 4.2: Từ số liệu cho trong bảng (4.1). Tính hệ số tương quan. Ta lập bảng tính
tiếp theo của ví dụ (4.1)(bảng 4.2).
Bảng 4.2: Tính các hệ số tương quan mưa năm 2 trạm Đồng Hới và Tám Lu
TT xi- x yi- y
2)( xx 2)( yy (yi- y )( xi- x )
1 421,7 268,0 177830,89 71824,0 113015,6
2 231,5 408,5 56406,25 166872,25 97018,75
3 517,1 26,4 267392,41 696,96 13651,44
..... ............... ................... ..................... .................... ......................
8 143,6 518,1 20620,96 268427,61 74399,16
9 -492,7 -535,5 242753,29 286760,25 263840,85
10 -308,7 50,6 95295,69 2560,36 -15620,22
Tổng 1895710,35 4687947,25 2526178,01
x = 2214,4 y = 2508,6 x =458,9 y =721,7
103
áp dụng công thức (4.13) tính được hệ số tương quan:
n
i
n
i
ii
n
i
ii
yyxx
yyxx
r
1 1
22
1
)()(
))((
351895710254687947
012526178
,.,
,
=0,847.
d. Hệ số hồi quy
Từ đó hệ số hồi quy có thể tính theo công thức:
x
y
ra
, (4.14)
y
xra
1 , (4.15)
trong đó: x , y là khoảng lệch chuẩn của các biến lượng x và y.
Như vậy, phương trình hồi quy của y theo x là:
)()( xxrxxayy
x
y
(4.16)
và của x theo y là:
)()( yyryyaxx
y
x
1 (4.17)
Hai phương trình trên sẽ cho 2 giá trị khác nhau, nên khi sử dụng để kéo dài số liệu cần lưu ý
đâu là biến số, đâu là hàm số. Sự khác nhau giữa 2 phương trình này là đặc tính vốn có của các liên
hệ thống kê, không liên quan đến độ dài hữu hạn của chuỗi quan trắc.
Trong thống kê thuỷ văn còn biểu thị hệ số tương quan r dưới dạng:
yx
yx
r
),cov(
, (4.18)
trong đó: cov(x,y) là covarian (mômen tương quan hay hiệp phương sai) của x và y.
n
yyxx
yx
ii
))((
),cov( (4.19)
Khi n không lớn (n <30) có xét đến thông số thống kê mẫu thì (4.19) trở thành:
1
n
yyxx
yx
ii ))((
),cov( (4.19’)
Để đơn giản hoá việc tính toán, cũng có thể tính các hệ số hồi quy và tương quan
theo dạng sau:
22 )(
.
xx
yxxy
a
, (4.20)
22
1
)(
.
yy
yxxy
a
, (4.21)
yx
yxxy
r
.
(4.22)
104
Lưu ý rằng: r = 0 chỉ biểu thị không có tương quan tuyến tính, nhưng có thể có
tương quan phi tuyến, thậm chí là hàm không tuyến tính.
Trong thực tế thường coi là tương quan chặt và sử dụng để tính toán nếu r ≥0,8.
Tuy nhiên khi r 0,80 cũng có thể coi là quan hệ chặt nếu nó có thể giải thích bằng
nguyên nhân vật lý.
Ví dụ 4.3: Từ ví dụ (4.1) và (4.2) ở trên tính lại các hệ số hồi quy và tương quan
theo các công thức (4.20), (4.26) ta được:
22 )(
.
xx
yxxy
a
242214265093271
62508422146555550526
,,
,.,,
=1,33.
yx
yxxy
r
.
94587721
62508422146555550526
,.,
,.,,
=0,847.
Phương trình hồi quy viết theo (4.16):
),(,, 4221433162508 xy
Hay: y=1,33.x-436,6
nghĩa là hoàn toàn như phương trình đã xác định trong ví dụ (4.1).
e. Sai số phân tích tương quan
Sai số phân tích tương quan được đánh giá bằng sai số phương trình hồi quy và sai
số hệ số tương quan cũng như hệ số hồi quy.
- Sai số phương trình hồi quy
Sai số của phương trình hồi quy biểu thị bằng giá trị trung bình khoảng lệch quân
phương giữa các điểm thực đo và các điểm tính theo phương trình hồi quy, và được gọi
là sai số chuẩn. Vì đường hồi quy có 2 thông số là a và b nên số ràng buộc là 2 và số bậc
tự do là =n-2.
Sai số chuẩn của hồi quy y theo x sẽ là:
22
1 1
222
1
2
n
yyxxayy
n
yy
n
i
n
i
iii
n
i
ii
xy
)()()()( '
/ (4.24)
Tương tự sai số chuẩn của hồi quy x theo y là:
22
1 1
222
1
2
n
xxyyaxx
n
xx
n
i
n
i
iii
n
i
ii
yx
)()()()( '
/ (4.25)
Theo lý thuyết thống kê toán học các sai số chuẩn này có liên hệ với hệ số tương
quan như sau:
21 ryxy / , (4.26)
21 rxyx / . (4.27)
Nếu sai số phân tích tương quan có phân bố chuẩn thì các điểm nằm trong phạm
vi xyy /, 6740 hoặc yxx /, 6740 sẽ chiếm 1/2 (50%) tổng số điểm. Còn trong phạm vi
xyy /3 hoặc yxx /3 thì có tới 97,3% số điểm nằm trong đó.
105
- Sai số của giá trị trung bình có điều kiện xy
Sai số chuẩn của giá trị xy cho bởi biểu thức:
n
xy
y
/
(4.28)
Giá trị thực của xy nằm trong giới hạn xy y với mức ý nghĩa .
- Sai số hệ số tương quan và hệ số hồi quy
Sai số hệ số hồi quy a được tính:
n
r
x
y
a
21
(4.29a)
hoặc:
n
i
i
n
i
ii
x
xy
a
xx
n
yy
1
2
1
2
2
)(
)( '
/
(4.29b)
Và sai số hệ số tự do b là:
n
r
n
yy
b
21
(4.30a)
hoặc:
n
i
i
xyb
xx
x
n
1
2
21
)(
/ (4.30b)
Sai số hệ số tương quan theo Romanovski là:
2
222
2
1375
2
11
1
1
1
n
r
n
r
n
r
r
(4.31)
Khi dung lượng mẫu đủ lớn (n>25) thì ta có:
1
1 2
n
r
r (4.32)
Hệ số tương quan mẫu khi n đủ lớn có phân bố gần chuẩn, còn khi n hữu hạn
thì chệch âm, độ chệch này giảm đi khi tăng dung lượng n.
- Đánh giá sự phù hợp của mô hình
Để kiểm tra sự phù hợp của mô hình người ta sử dụng hệ số xác định R2, là độ đo
phương sai chung của 2 biến lượng. Trong hồi quy 2 biến, nó tỷ lệ với phương sai của y’
được giải thích (xác định) theo phương trình hồi quy. Nó cũng là độ đo sự phù hợp của
đường hồi quy với số liệu kinh nghiệm. Hệ số xác định được tính theo công thức [24]:
n
i
i
n
i
ii
yy
yy
R
1
2
1
2
2 1
)(
)( '
, (4.33)
trong đó: 'iy là giá trị tính theo phương trình hồi quy vừa xác lập.
106
Ví dụ 4.4: Xác định sai số phân tích tương quan theo số liệu ví dụ (4.1).
Sai số đường hồi quy tính theo (4.26):
21 ryxy /
2847017721 ,, =383,6.
Sai số hệ số tương quan tính theo (4.31):
2
222
2
1375
2
11
1
1
1
n
r
n
r
n
r
r
2
222
102
13847075
102
847011
1
110
84701
.
,.
.
,.,
=0,1191.
Sai số hệ số a theo (4.29):
n
r
x
y
a
21
10
84701
9458
7721 2,
,
,
=0,140.
Sai số hệ số b theo (4.30):
n
r
n
yy
b
21
10
847017721
10
7721 2,,,
=105,7.
Hệ số xác định tính theo (4.33): Để việc tính toán thuận lợi ta lập bảng (4.3), tiếp
theo của bảng (4.1).
Trong bảng (4.3) y’ là giá trị tính theo phương trình hồi quy vừa thiết lập ở trên: y’=1,33x-
436,6.
n
i
i
n
i
ii
yy
yy
R
1
2
1
2
2 1
)(
)( '
254687947
741321635
1
,
,
=0,718,
nghĩa là 71,8% phương sai được giải thích bởi đường hồi quy, còn lại 28,2% là do dao
động ngẫu nhiên.
Bảng 4.3: Đánh giá sai số tương quan mưa năm Đồng Hới và Tám Lu
TT xi yi yi’ yi-yi’
(yi-yi’)
2
1 2636,1 2776,6 3069,41 -292,81 85739,45
2 2451,9 2917,1 2824,43 92,67 8588,28
3 2731,5 2535,0 3196,30 -661,30 437311,08
.... .............. .................. ................... .................. ....................
8 2358,0 3026,7 2699,54 327,16 107033,67
9 1721,7 1973,1 1853,26 119,84 14361,39
10 1905,7 2559,2 2097,98 461,22 212722,97
22144,3 25085,7 25085,92 1321635,74
x = 2214,4 y = 2508,6
f. ước lượng khoảng tin cậy
- Khoảng tin cậy của các hệ số
Khoảng tin cậy đối với hệ số hồi quy bj với độ tin cậy (1-) là:
107
jj bnjjbnj
stbstb 2222 /,/, . , (4.34)
trong đó: j là giá trị đúng của hệ số hồi quy; là mức ý nghĩa; n-2 là số bậc tự do; n là
dung lượng mẫu;
jb
s là phương sai của các hệ số bj.
Khoảng tin cậy của hệ số tương quan rất ít được thực hiện vì tính toán cồng kềnh. Lưu ý rằng
hệ số tương quan tính theo mẫu là ước lượng vững nhưng chệch của hệ số tương quan lý thuyết với
độ chệch là :
)/()( n21 2 (4.35)
- Khoảng tin cậy của đường hồi quy
Khoảng tin cậy của đường hồi quy được xác định từ biểu thức:
,
)(
)*(
)*(/
)(
)*(
)*( //,//,
n
i
i
xynn
i
i
xyn
xx
xx
n
tbaxxy
xx
xx
n
tbax
1
2
2
22
1
2
2
22
11
(4.36)
trong đó: x* là giá trị tại một điểm cụ thể của biến x=x*; y/x là trung bình có điều kiện
đúng của y theo x; ax*+b là giá trị tính theo phương trình hồi quy; y/x là khoảng lệch
chuẩn của y theo x.
Phân tích khoảng tin cậy ta thấy rằng khi x= x thì khoảng tin cậy hẹp nhất, còn
khi x* càng xa x thì khoảng tin cậy càng mở rộng. Đồng thời khi n thì khoảng tin
cậy cũng co lại và tiến dần tới 0.
g. Kiểm định các hệ số
Để kiểm định ý nghĩa thống kê của các hệ số trên, sử dụng tiêu chuẩn Student.
- Kiểm định hệ số hồi quy
Kiểm định hệ số a
Tính chỉ tiêu:
a
a
s
a
t , (4.37)
trong đó: sa tính theo (4.29b) với mức ý nghĩa (1, 2, 5%) và số bậc tự do =n-2.
Nếu tha tt thì hệ số hồi quy a có ý nghĩa và được dùng trong phương trình tương
quan.
Kiểm định hệ số b
Tương tự có thể tính chỉ tiêu:
b
b
s
b
t , (4.38)
trong đó: sb tính theo (4.30b).
Tuy nhiên trong thực tế người ta thường không kiểm định hệ số b.
- Kiểm định hệ số tương quan:
21
2
r
n
rtr
, (4.39)
với mức ý nghĩa (1, 2, 5%) và số bậc tự do =n-2.
Nếu thr tt thì các hệ số tương quan r có ý nghĩa thống kê.
108
Ví dụ 4.5: Kiểm định các hệ số tương quan và hồi quy theo số liệu ví dụ (4.1).
Kiểm định hệ số a. Chỉ tiêu Student theo (4.37):
n
i
i
xya
xx
s
1
2
1
)(
/
351895710
1
6383
,
, =0,276.
a
a
s
a
t
2760
331
,
,
=4,81.
Với mức ý nghĩa 5% và số bậc tự do =n-2=8 tra bảng Student được tth=1,96. Như
vậy ta=4,81> tth=1,96. Do đó hệ số hồi quy a có ý nghĩa thống kê.
Kiểm định hệ số tương quan theo (4.39):
21
2
r
n
rtr
284701
210
8470
,
,
=4,506.
Như vậy thấy rằng tr=4,506>tth=1,96, điều đó có nghĩa là hệ số tương quan có ý
nghĩa.
h. Kiểm định tính chất tuyến tính của đường hồi quy
Về lý thuyết thì đường thẳng hồi quy của y theo x theo phương pháp bình phương
tối thiểu là xấp xỉ tuyến tính tốt nhất.Nhưng nói chung chưa thể cho rằng mọi giá trị
trung bình có điều kiện yx ứng với mỗi x nằm trên một đường thẳng.
Để kiểm định giả thiết này, ta chia toàn bộ phạm vi biến thiên của x thành l
khoảng (l8-10). Với mỗi khoảng thứ j có tâm tại điểm xj, tính giá trị trung bình có điều
kiện yxj và phương sai thực nghiệm y/x theo các công thức sau:
i
j
m
i
ijx y
m
y
1
1
, (4.40)
i
jj
m
i
xijxy yy
m 1
22
1
1
)(/ , (4.41)
trong đó: mi là số các điểm (xij, yij) có hoành độ rơi vào khoảng thứ j.
Tính tỷ số:
l
j
xyi
l
j
j
x
y
xi
j
j
m
n
xxryym
l
F
1
2
1
2
1
1
1
2
1
/)(
)(
(4.42)
So sánh với Fth tra từ bảng Fisher (phụ lục 3.3) với mức tin cậy =1-, số bậc tự do
1=l-1 và 2=n-1. Nếu FFth thì giả thiết tuyến tính được chấp nhận. Ngược lại tính
tuyến tính bị bác bỏ.
Có thể dùng chỉ tiêu F sau đây để biểu thị sự phù hợp của đường hồi quy tuyến
tính:
109
11
1