5.1.2. Liên hệ hàm số và liên hệ tương quan
Liên hệ hàm số
Khái niệm: Là mối liên hệ hoàn toàn chặt chẽ, tức là khi hiện tượng này thay đổi thì
hoàn toàn quyết định sự thay đổi của hiện tượng có liên quan theo một tỷ lệ xác định.
Liên hệ hàm số được viết dưới dạng y = f(x)
Đặc điểm: Liên hệ hàm số không những được biểu hiện ở tổng thể mà còn được biểu
hiện trên từng đơn vị cá biệt
Mối liên hệ này thường có trong tự nhiên. Ví dụ trong vật lý: S = v.t
Liên hệ tương quan
Khái niệm: Là mối liên hệ không hoàn toàn chặt chẽ, tức là khi hiện tượng này thay đổi
thì có thể làm cho hiện tượng có liên quan thay đổi nhưng không hoàn toàn quyết định.
Đặc điểm: Liên hệ tương quan không được biểu hiện trên từng đơn vị cá biệt mà phải
thông qua hiện tuợng số lớn.
Mối liên hệ này rất phổ biến và thường gặp trong các hiện tượng kinh tế – xã hội. Ví
dụ: Mối liên hệ giữa tuổi nghề và năng suất lao động. Tuổi nghề có ảnh hưởng đến
năng suất lao động nhưng năng suất lao động không chỉ chịu ảnh hưởng của tuổi nghề
mà còn chịu ảnh huởng của các nhân tố khác như tay nghề, bậc thợ.
12 trang |
Chia sẻ: thanhle95 | Lượt xem: 1343 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Bài giảng Lý thuyết thống kê - Bài 5: Phân tích hồi quy – tương quan, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Bài 5: Phân tích hồi quy – tương quan
STA302_Bai5_v1.0013109210 67
BÀI 5 PHÂN TÍCH HỒI QUY – TƯƠNG QUAN
Hướng dẫn học
Bài này giới thiệu phương pháp phân tích hồi quy – tương quan, là phương pháp phân
tích mối liên hệ, tác động qua lại giữa hiện tượng kinh tế xã hội. Trong đó, bài học giới
thiệu nhiệm vụ phương pháp phân tích hồi quy tương quan, đưa ra một số mô hình hồi
quy và cách xác định các tham số trong mô hình.
Để học tốt bài này, sinh viên cần tham khảo các phương pháp học sau:
Học đúng lịch trình của môn học theo tuần, làm các bài luyện tập đầy đủ và tham gia
thảo luận trên diễn đàn.
Đọc tài liệu: Giáo trình Lý thuyết Thống kê, PGS. TS. Trần Thị Kim Thu chủ biên,
NXB Đại học KTQD.
Sinh viên làm việc theo nhóm và trao đổi với giảng viên trực tiếp tại lớp học hoặc qua email.
Tham khảo các thông tin từ trang Web môn học.
Nội dung
Bài này sẽ trình bày những vấn đề chung về phương pháp hồi quy – tương quan, đặc biệt
giới thiệu hồi quy – tương quan đơn giữa hai tiêu thức số lượng, đề cập tới cách xây dựng
phương trình hồi quy và xác định trình độ chặt chẽ của mối liên hệ.
Mục tiêu
Sau khi học xong bài này, sinh viên cần thực hiện được các việc sau:
Phân biệt mối liên hệ hàm số và mối liên hệ tương quan.
Trình bày được khái niệm, nhiệm vụ của phương pháp hồi quy – tương quan.
Xây dựng được phương trình hồi quy tương quan tuyến tính giữa hai tiêu thức số lượng.
Xác định được trình độ chặt chẽ của mối liên hệ tương quan giữa hai tiêu thức số lượng.
Bài 5: Phân tích hồi quy – tương quan
68 STA302_Bai5_v1.0013109210
Tình huống dẫn nhập
Phân tích kết quả kinh doanh
Giả sử bạn là nhân viên phòng kế hoạch của doanh nghiệp sản xuất bánh kẹo. Bạn nhận thấy
doanh thu từ sản phẩm bánh kem của doanh nghiệp đang giảm dần. Từ thực tế đó, phòng bạn đề
xuất tăng thêm chi phí quảng cáo để có thể tăng doanh thu của doanh nghiệp. Bạn với tư cách là
nhân viên phòng kế hoạch, thực hiện tổng hợp dữ liệu về doanh thu và chi phí quảng cáo từ các
cơ sở kinh doanh bánh kẹo của doanh nghiệp để tìm hiểu mối liên hệ giữa chi phí quảng cáo tới
doanh thu.
1. Làm thế nào để xác định mối liên hệ giữa chi phí quảng cáo tới doanh thu?
2. Mối liên hệ giữa chi phí quảng cáo và doanh thu có chặt chẽ hay không?
Bài 5: Phân tích hồi quy – tương quan
STA302_Bai5_v1.0013109210 69
5.1. Những vấn đề chung về phương pháp hồi quy – tương quan
5.1.1. Khái niệm hồi quy – tương quan
Hồi quy - tương quan là phương pháp phân tích dựa trên mối liên hệ phụ thuộc của
một biến kết quả (biến phụ thuộc) vào một hay nhiều biến nguyên nhân (biến độc lập).
Ví dụ: Phân tích mối liên hệ phụ thuộc giữa vốn tới doanh thu của doanh nghiệp A
năm 2012.
5.1.2. Liên hệ hàm số và liên hệ tương quan
Liên hệ hàm số
Khái niệm: Là mối liên hệ hoàn toàn chặt chẽ, tức là khi hiện tượng này thay đổi thì
hoàn toàn quyết định sự thay đổi của hiện tượng có liên quan theo một tỷ lệ xác định.
Liên hệ hàm số được viết dưới dạng y = f(x)
Đặc điểm: Liên hệ hàm số không những được biểu hiện ở tổng thể mà còn được biểu
hiện trên từng đơn vị cá biệt
Mối liên hệ này thường có trong tự nhiên. Ví dụ trong vật lý: S = v.t
Liên hệ tương quan
Khái niệm: Là mối liên hệ không hoàn toàn chặt chẽ, tức là khi hiện tượng này thay đổi
thì có thể làm cho hiện tượng có liên quan thay đổi nhưng không hoàn toàn quyết định.
Đặc điểm: Liên hệ tương quan không được biểu hiện trên từng đơn vị cá biệt mà phải
thông qua hiện tuợng số lớn.
Mối liên hệ này rất phổ biến và thường gặp trong các hiện tượng kinh tế – xã hội. Ví
dụ: Mối liên hệ giữa tuổi nghề và năng suất lao động. Tuổi nghề có ảnh hưởng đến
năng suất lao động nhưng năng suất lao động không chỉ chịu ảnh hưởng của tuổi nghề
mà còn chịu ảnh huởng của các nhân tố khác như tay nghề, bậc thợ...
5.1.3. Một số dạng liên hệ
Dựa theo phân tích đặc điểm của mối quan hệ hay từ số liệu được điều tra thực tế mà
xây dựng được các phương trình biểu diễn mối liên hệ một cách phù hợp nhất. Một số
dạng liên hệ có thể là:
a. Liên hệ hypebol
Bài 5: Phân tích hồi quy – tương quan
70 STA302_Bai5_v1.0013109210
5.1.4. Nhiệm vụ của phương pháp hồi quy – tương quan
Phương pháp hồi quy – tương quan giải quyết hai nhiệm vụ chủ yếu sau:
Xây dựng phương trình hồi quy và giải thích ý nghĩa các tham số trong phương
trình hồi quy.
Đánh giá mức độ chặt chẽ của mối liên hệ tương quan thông qua hệ số tương quan
(tuyến tính) và tỷ số tương quan (phi tuyến).
5.2. Hồi quy – tương quan tuyến tính đơn giữa hai tiêu thức số lượng
5.2.1. Phương trình hồi quy
Truớc khi đi vào xây dựng phương trình hồi quy, chúng ta hãy xem xét một số khái
niệm có liên quan.
Ðường hồi quy thực nghiệm: là đường được hình thành bởi các tài liệu thực tế.
Ðường hồi quy lý thuyết: là đường
điều chỉnh, bù trừ các chênh lệch
ngẫu nhiên, vạch ra xu hướng cơ bản
của hiện tuợng.
Phương trình hồi quy là phương
trình xác định vị trí của đường hồi
quy lý thuyết sao cho mô tả tốt nhất
mối liên hệ thực tế.
Phương trình hồi quy tuyến tính biểu diễn mối liên hệ giữa 2 tiêu thức số lượng có
dạng: i 0 1 iyˆ b b x
Trong đó: xi – giá trị tiêu thức gây ảnh hưởng (nguyên nhân).
iyˆ - trị số điều chỉnh của tiêu thức chịu ảnh hưởng (kết quả) theo quan hệ
với x.
5.2.2. Phương pháp bình phương nhỏ nhất
Các hệ số b0, b1 ở phương trình hồi quy tuyến tính trên phải được xác định sao cho
đường hồi quy lý thuyết mô tả tốt nhất mối liên hệ thực tế. Trên hình vẽ, khoảng cách
từ điểm thực tế đến điểm thuộc đường hồi quy lý thuyết nhỏ nhất sẽ là tốt nhất. Vì thế,
Bài 5: Phân tích hồi quy – tương quan
STA302_Bai5_v1.0013109210 71
sử dụng phương pháp bình phương nhỏ nhất (OLS - Ordinary Least Square) với nội dung:
tổng bình phương các độ lệch giữa giá trị thực tế và giá trị lý thuyết của biến phụ thuộc
(tiêu thức kết quả) là nhỏ nhất.
S = (yi − iy )2 = min
Hay: S = ( yi – bo – b1xi)2 = min
Để thỏa mãn điều kiện trên, cần tìm đạo hàm riêng theo 2 tham số cần tìm. Từ đó, b0
và b1 phải thỏa mãn hệ phương trình:
i 0 1 i
2
i i 0 i 1 i
y nb b x
x y b x b x
Từ hệ phương trình trên, sau khi biến đổi, b0 và b1 có thể được tính theo công thức:
1 2
x
xy xyb và b0 = 1y b x
Trong đó: i xx
n
iyy
n
i ix yxy
n
22
i i2 2 2
x
x x
x (x)
n n
5.2.3. Ý nghĩa các hệ số trong phương trình hồi quy
Sử dụng phương pháp bình phương nhỏ nhất sẽ xác định được giá trị của b0 và b1. Ý
nghĩa của hai tham số này lần lượt như sau:
b0 là hệ số tự do (hệ số chặn), là điểm xuất phát của đường hồi quy lý thuyết, nêu
lên ảnh hưởng của các nhân tố khác (tiêu thức nguyên nhân khác) ngoài x tới sự
biến động của tiêu thức kết quả y.
b1 là hệ số hồi quy nói lên ảnh hưởng trực tiếp của tiêu thức nguyên nhân x tới tiêu
thức kết quả y. Cụ thể, khi x tăng một đơn vị thì làm cho y thay đổi trung bình là
b1 đơn vị.
Giá trị b1 có thể âm, dương hay bằng 0, tùy thuộc vào mối liên hệ giữa x và y. Hệ số hồi
quy b1 nêu lên chiều hướng của mối liên hệ. Cụ thể: b1 > 0, mối liên hệ thuận; b1< 0, mối
liên hệ nghịch.
Ví dụ, có tài liệu về doanh thu và chi phí quảng cáo của 5 cửa hàng giới thiệu sản
phẩm A như sau:
Bài 5: Phân tích hồi quy – tương quan
72 STA302_Bai5_v1.0013109210
`
Cửa hàng Doanh thu
(triệu đồng) yi
Chi phí quảng cáo
(triệu đồng) xi
xiyi
2xi
2yi
A 850 2 1700 4 722500
B 870 5 4350 25 756900
C 880 6 5280 36 774400
D 900 9 8100 81 810000
E 910 13 11830 169 828100
Tổng 4410 35 31260 315 3891900
Yêu cầu: Xây dựng phương trình hồi quy biểu diễn mối liên hệ tương quan tuyến tính
giữa chi phí quảng cáo tới doanh thu của 5 cửa hàng trên.
Theo yêu cầu trên, xác định được tiêu thức nguyên nhân là chi phí quảng cáo (x) và
doanh thu là tiêu thức kết quả (y). Phương trình hồi quy có dạng: i 0 1 iyˆ b b x
Có 2 cách xác định các tham số:
Cách 1: Giải hệ phương trình
i 0 1 i 0 1
2
0 1i i 0 i 1 i
0
1
y nb b x 4410 5b 35b
31260 35b 315bx y b x b x
b 843,01
b 5,57
Cách 2: Xác định từ các công thức
i x 35x 7
n 5
iy 4410y 882
n 5
i ix y 31260xy 6252
n 5
22
i i2 2
x
x x 315 7 14
n n 5
Từ đó, 1 2
x
xy xy 6252 7 882b 5,57
14
Bài 5: Phân tích hồi quy – tương quan
STA302_Bai5_v1.0013109210 73
0 1b y b x 882 5,57 7 843,01
Hai cách tính đều cho kết quả b0 và b1 như nhau. Vậy phương trình hồi qui biểu diễn
mối liên hệ tương quan giữa chi phí quảng cáo tới doanh thu là: i iyˆ 843,01 5,57x
Ý nghĩa các hệ số trong phương trình hồi qui tuyến tính:
b0 = 843,01: nói lên ảnh hưởng của tất cả các tiêu thức nguyên nhân trong đó
không có chi phí quảng cáo tới doanh thu của 5 cửa hàng.
b1 = 5,57: nói lên ảnh hưởng trực tiếp của chi phí quảng cáo tới doanh thu. Cụ thể,
khi chi phí quảng cáo tăng lên 1 triệu đồng thì doanh thu tăng trung bình là 5,57
triệu đồng.
Sau khi xây dựng được phương trình hồi quy phản ánh mối liên hệ giữa các hiện
tuợng kinh tế – xã hội, nhiệm vụ tiếp theo của phân tích hồi quy - tương quan là phải
đánh giá trình độ chặt chẽ của mối liên hệ đó.
5.2.4. Hệ số tương quan
Hệ số tương quan là số tương đối sử dụng để đánh giá trình độ chặt chẽ (chiều hướng
và cường độ) của mối liên hệ tương quan tuyến tính.
Công thức tính:
x
1
x y y
xy x.yr b
Các tính chất:
Miền xác định: -1 ≤ r ≤ 1
r > 0: mối liên hệ tương quan tuyến tính thuận (cùng chiều).
r < 0: mối liên hệ tương quan tuyến tính nghịch (ngược chiều).
r = ± 1: mối liên hệ hàm số - hoàn toàn chặt chẽ.
r = 0: không có mối liên hệ tương quan tuyến tính giữa x và y.
r càng gần 1: mối liên hệ càng chặt chẽ.
Trở lại ví dụ trên, tính hệ số tương quan. Ta có:
22 2 2
y
3891900y y 882 456
5
x
1
y
14r b 5,57 0,976
456
Như vậy, mối liên hệ giữa chi phí quảng cáo tới doanh thu là mối liên hệ tương quan
tuyến tính thuận và rất chặt chẽ.
Bài 5: Phân tích hồi quy – tương quan
74 STA302_Bai5_v1.0013109210
5.3. Hồi quy - tương quan phi tuyến giữa hai tiêu thức số lượng
5.3.1. Phương trình hồi quy
Mối liên hệ tương quan phi tuyến là mối liên hệ tương quan giữa các tiêu thức không
được biểu hiện bằng một đường thẳng mà bằng các đường cong có hình dáng khác
nhau. Một số dạng đường cong thường gặp:
Phương trình parabol (bậc 2)
o Vận dụng khi tiêu thức nguyên nhân tăng hay giảm với 1 lượng đều nhau thì tiêu
thức kết quả biến động vơi 1 lượng không đều nhau (nhanh hơn hoặc chậm hơn).
Ví dụ: tuổi nghề và năng suất lao động.
o Phương trình hồi quy:
2
i 0 1 i 2 iyˆ b b x b x
b0, b1, b2 là các tham số của phương trình hồi quy, được xác định bằng phương
pháp bình phương nhỏ nhất và phải thỏa mãn hệ phương trình:
2
i 0 1 i 2 i
2 3
i i 0 i 1 i 2 i
2 2 3 4
i 0 i 1 i 2 i
y nb b x b x
x y b x b x b x
x y b x b x b x
Phương trình hypebol
o Vận dụng khi tiêu thức nguyên nhân tăng thì tiêu thức kết quả giảm với tốc độ
không đều.
o Phương trình hồi quy:
1
i 0
i
byˆ b
x
b0, b1 là tham số của phương trình hồi quy, được xác định bằng phương pháp bình
phương nhỏ nhất và phải thỏa mãn hệ phương trình:
i 0 1
i
i 0 1 2
i i i
1y nb b
x
1 1 1y b b
x x x
5.3.2. Tỷ số tương quan
Tỷ số tương quan là chỉ tiêu đánh giá mức độ chặt chẽ của mối liên hệ tương quan phi tuyến.
Công thức tính:
2
i i
2
i
ˆy y
1
y y
Bài 5: Phân tích hồi quy – tương quan
STA302_Bai5_v1.0013109210 75
Tính chất:
0 1
η = 0: không có mối liên hệ tương quan phi tuyến.
η = 1: mối liên hệ tương quan phi tuyến hoàn toàn chặt chẽ.
η càng gần 1: mối liên hệ càng chặt chẽ.
Nhận xét:
η luôn ≥ 0 nên tỷ số tương quan chỉ có thể đánh giá trình độ chặt chẽ của mối liên
hệ chứ không nói được chiều hướng của mối liên hệ.
η có thể dùng cho cả phi tuyến và tuyến tính (khi r 0).
Bài 5: Phân tích hồi quy – tương quan
76 STA302_Bai5_v1.0013109210
Tóm lược cuối bài
Các hiện tượng kinh tế – xã hội luôn tồn tại trong mối liên hệ ràng buộc lẫn nhau. Tuỳ theo
mức độ chặt chẽ của mối liên hệ mà có thể phân ra thành hai loại: liên hệ hàm số và liên hệ
tương quan.
Phân tích hồi quy - tương quan thực chất là phương pháp phân tích mối liên hệ phụ thuộc với
hai nhiệm vụ chủ yếu: xây dựng phương trình hồi quy biểu diễn mối liên hệ và đánh giá mức
độ chặt chẽ của mối liên hệ.
Với mối liên hệ đơn giản nhất giữa hai tiêu thức số luợng, tuỳ theo việc thăm dò dạng của
phương trình hồi quy mà có thể xây dựng phương trình tuyến tính hoặc phi tuyến. Các hệ số
của mô hình hồi quy được xác định theo phương pháp bình phương nhỏ nhất. Hệ số tương
quan và tỷ số tương quan được sử dụng để đánh giá mức độ chặt chẽ của mối liên hệ tương
quan giữa hai tiêu thức số lượng.
Bài 5: Phân tích hồi quy – tương quan
STA302_Bai5_v1.0013109210 77
Câu hỏi ôn tập
1. Phân tích sự khác biệt giữa liên hệ hàm số và liên hệ tương quan? Cho ví dụ minh họa.
2. Trình bày nhiệm vụ của phương pháp phân tích hồi quy - tương quan.
3. Trình bày nội dung của phương pháp bình phương nhỏ nhất.
4. Nêu ý nghĩa các tham số trong phương trình hồi quy.
5. Trình bày khái niệm, công thức tính, tính chất của hệ số tương quan.
6. Trình bày khái niệm, công thức tính, tính chất của tỷ số tương quan.
Bài tập
Bài 1.
Có tài liệu về thu nhập và vốn của 10 trang trại ở một địa phương như sau:
Thu nhập (triệu đồng) Vốn (triệu đồng)
46,8 93,6
30,3 54,5
25,6 38,7
36,5 65,4
50,7 104,5
89,4 196,0
42,5 85,0
75,2 157,4
80,5 176,8
61,8 120,5
Yêu cầu:
a. Xây dựng phương trình hồi quy tuyến tính phản ánh ảnh hưởng của vốn tới thu nhập. Giải
thích ý nghĩa các hệ số trong phương trình.
b. Một trang trại có vốn là 78 triệu đồng. Dựa vào phương trình hồi quy, xác định thu nhập
trang trại đó đạt khoảng bao nhiêu triệu đồng?
c. Đánh giá trình độ chặt chẽ của mối liên hệ trên.
Bài 5: Phân tích hồi quy – tương quan
78 STA302_Bai5_v1.0013109210
Bài 2.
Có tài liệu về 8 doanh nghiệp công nghiệp cùng sản xuất một loại sản phẩm như sau:
Sản lượng (100 tấn) Nhiên liệu tiêu hao (10 tấn)
5 4,6
12 7,0
2 3,3
7 4,5
16 7,8
11 5,7
9 5,1
20 9,2
Yêu cầu:
a. Xây dựng phương trình hồi quy tuyến tính phản ánh ảnh hưởng của sản lượng tới nhiên liệu
tiêu hao. Giải thích ý nghĩa các hệ số.
b. Đánh giá trình độ chặt chẽ của mối liên hệ nói trên.
Bài 3.
Có tài liệu về chiều cao và cân nặng của 11 phụ nữ trong độ tuổi 18 – 24 được lựa chọn ngẫu
nhiêu như sau:
Chiều cao (cm) Cân nặng (kg)
175 65
133 67
185 71
163 71
126 66
198 75
153 67
163 70
159 71
151 69
155 69
Yêu cầu:
a. Khi chiều cao tăng thêm 1 cm thì cân nặng thay đổi như thế nào?
b. Ðánh giá trình độ chặt chẽ giữa cân nặng và chiều cao của nhóm nguời trên.