Bài giảng Lý thuyết thống kê - Bài 5: Phân tích hồi quy – tương quan

5.1.2. Liên hệ hàm số và liên hệ tương quan Liên hệ hàm số Khái niệm: Là mối liên hệ hoàn toàn chặt chẽ, tức là khi hiện tượng này thay đổi thì hoàn toàn quyết định sự thay đổi của hiện tượng có liên quan theo một tỷ lệ xác định. Liên hệ hàm số được viết dưới dạng y = f(x) Đặc điểm: Liên hệ hàm số không những được biểu hiện ở tổng thể mà còn được biểu hiện trên từng đơn vị cá biệt Mối liên hệ này thường có trong tự nhiên. Ví dụ trong vật lý: S = v.t Liên hệ tương quan Khái niệm: Là mối liên hệ không hoàn toàn chặt chẽ, tức là khi hiện tượng này thay đổi thì có thể làm cho hiện tượng có liên quan thay đổi nhưng không hoàn toàn quyết định. Đặc điểm: Liên hệ tương quan không được biểu hiện trên từng đơn vị cá biệt mà phải thông qua hiện tuợng số lớn. Mối liên hệ này rất phổ biến và thường gặp trong các hiện tượng kinh tế – xã hội. Ví dụ: Mối liên hệ giữa tuổi nghề và năng suất lao động. Tuổi nghề có ảnh hưởng đến năng suất lao động nhưng năng suất lao động không chỉ chịu ảnh hưởng của tuổi nghề mà còn chịu ảnh huởng của các nhân tố khác như tay nghề, bậc thợ.

pdf12 trang | Chia sẻ: thanhle95 | Lượt xem: 1343 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Bài giảng Lý thuyết thống kê - Bài 5: Phân tích hồi quy – tương quan, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Bài 5: Phân tích hồi quy – tương quan STA302_Bai5_v1.0013109210 67 BÀI 5 PHÂN TÍCH HỒI QUY – TƯƠNG QUAN Hướng dẫn học Bài này giới thiệu phương pháp phân tích hồi quy – tương quan, là phương pháp phân tích mối liên hệ, tác động qua lại giữa hiện tượng kinh tế xã hội. Trong đó, bài học giới thiệu nhiệm vụ phương pháp phân tích hồi quy tương quan, đưa ra một số mô hình hồi quy và cách xác định các tham số trong mô hình. Để học tốt bài này, sinh viên cần tham khảo các phương pháp học sau:  Học đúng lịch trình của môn học theo tuần, làm các bài luyện tập đầy đủ và tham gia thảo luận trên diễn đàn.  Đọc tài liệu: Giáo trình Lý thuyết Thống kê, PGS. TS. Trần Thị Kim Thu chủ biên, NXB Đại học KTQD.  Sinh viên làm việc theo nhóm và trao đổi với giảng viên trực tiếp tại lớp học hoặc qua email.  Tham khảo các thông tin từ trang Web môn học. Nội dung Bài này sẽ trình bày những vấn đề chung về phương pháp hồi quy – tương quan, đặc biệt giới thiệu hồi quy – tương quan đơn giữa hai tiêu thức số lượng, đề cập tới cách xây dựng phương trình hồi quy và xác định trình độ chặt chẽ của mối liên hệ. Mục tiêu Sau khi học xong bài này, sinh viên cần thực hiện được các việc sau:  Phân biệt mối liên hệ hàm số và mối liên hệ tương quan.  Trình bày được khái niệm, nhiệm vụ của phương pháp hồi quy – tương quan.  Xây dựng được phương trình hồi quy tương quan tuyến tính giữa hai tiêu thức số lượng.  Xác định được trình độ chặt chẽ của mối liên hệ tương quan giữa hai tiêu thức số lượng. Bài 5: Phân tích hồi quy – tương quan 68 STA302_Bai5_v1.0013109210 Tình huống dẫn nhập Phân tích kết quả kinh doanh Giả sử bạn là nhân viên phòng kế hoạch của doanh nghiệp sản xuất bánh kẹo. Bạn nhận thấy doanh thu từ sản phẩm bánh kem của doanh nghiệp đang giảm dần. Từ thực tế đó, phòng bạn đề xuất tăng thêm chi phí quảng cáo để có thể tăng doanh thu của doanh nghiệp. Bạn với tư cách là nhân viên phòng kế hoạch, thực hiện tổng hợp dữ liệu về doanh thu và chi phí quảng cáo từ các cơ sở kinh doanh bánh kẹo của doanh nghiệp để tìm hiểu mối liên hệ giữa chi phí quảng cáo tới doanh thu. 1. Làm thế nào để xác định mối liên hệ giữa chi phí quảng cáo tới doanh thu? 2. Mối liên hệ giữa chi phí quảng cáo và doanh thu có chặt chẽ hay không? Bài 5: Phân tích hồi quy – tương quan STA302_Bai5_v1.0013109210 69 5.1. Những vấn đề chung về phương pháp hồi quy – tương quan 5.1.1. Khái niệm hồi quy – tương quan Hồi quy - tương quan là phương pháp phân tích dựa trên mối liên hệ phụ thuộc của một biến kết quả (biến phụ thuộc) vào một hay nhiều biến nguyên nhân (biến độc lập). Ví dụ: Phân tích mối liên hệ phụ thuộc giữa vốn tới doanh thu của doanh nghiệp A năm 2012. 5.1.2. Liên hệ hàm số và liên hệ tương quan Liên hệ hàm số Khái niệm: Là mối liên hệ hoàn toàn chặt chẽ, tức là khi hiện tượng này thay đổi thì hoàn toàn quyết định sự thay đổi của hiện tượng có liên quan theo một tỷ lệ xác định. Liên hệ hàm số được viết dưới dạng y = f(x) Đặc điểm: Liên hệ hàm số không những được biểu hiện ở tổng thể mà còn được biểu hiện trên từng đơn vị cá biệt Mối liên hệ này thường có trong tự nhiên. Ví dụ trong vật lý: S = v.t Liên hệ tương quan Khái niệm: Là mối liên hệ không hoàn toàn chặt chẽ, tức là khi hiện tượng này thay đổi thì có thể làm cho hiện tượng có liên quan thay đổi nhưng không hoàn toàn quyết định. Đặc điểm: Liên hệ tương quan không được biểu hiện trên từng đơn vị cá biệt mà phải thông qua hiện tuợng số lớn. Mối liên hệ này rất phổ biến và thường gặp trong các hiện tượng kinh tế – xã hội. Ví dụ: Mối liên hệ giữa tuổi nghề và năng suất lao động. Tuổi nghề có ảnh hưởng đến năng suất lao động nhưng năng suất lao động không chỉ chịu ảnh hưởng của tuổi nghề mà còn chịu ảnh huởng của các nhân tố khác như tay nghề, bậc thợ... 5.1.3. Một số dạng liên hệ Dựa theo phân tích đặc điểm của mối quan hệ hay từ số liệu được điều tra thực tế mà xây dựng được các phương trình biểu diễn mối liên hệ một cách phù hợp nhất. Một số dạng liên hệ có thể là: a. Liên hệ hypebol Bài 5: Phân tích hồi quy – tương quan 70 STA302_Bai5_v1.0013109210 5.1.4. Nhiệm vụ của phương pháp hồi quy – tương quan Phương pháp hồi quy – tương quan giải quyết hai nhiệm vụ chủ yếu sau:  Xây dựng phương trình hồi quy và giải thích ý nghĩa các tham số trong phương trình hồi quy.  Đánh giá mức độ chặt chẽ của mối liên hệ tương quan thông qua hệ số tương quan (tuyến tính) và tỷ số tương quan (phi tuyến). 5.2. Hồi quy – tương quan tuyến tính đơn giữa hai tiêu thức số lượng 5.2.1. Phương trình hồi quy Truớc khi đi vào xây dựng phương trình hồi quy, chúng ta hãy xem xét một số khái niệm có liên quan. Ðường hồi quy thực nghiệm: là đường được hình thành bởi các tài liệu thực tế. Ðường hồi quy lý thuyết: là đường điều chỉnh, bù trừ các chênh lệch ngẫu nhiên, vạch ra xu hướng cơ bản của hiện tuợng. Phương trình hồi quy là phương trình xác định vị trí của đường hồi quy lý thuyết sao cho mô tả tốt nhất mối liên hệ thực tế. Phương trình hồi quy tuyến tính biểu diễn mối liên hệ giữa 2 tiêu thức số lượng có dạng: i 0 1 iyˆ b b x  Trong đó: xi – giá trị tiêu thức gây ảnh hưởng (nguyên nhân). iyˆ - trị số điều chỉnh của tiêu thức chịu ảnh hưởng (kết quả) theo quan hệ với x. 5.2.2. Phương pháp bình phương nhỏ nhất Các hệ số b0, b1 ở phương trình hồi quy tuyến tính trên phải được xác định sao cho đường hồi quy lý thuyết mô tả tốt nhất mối liên hệ thực tế. Trên hình vẽ, khoảng cách từ điểm thực tế đến điểm thuộc đường hồi quy lý thuyết nhỏ nhất sẽ là tốt nhất. Vì thế, Bài 5: Phân tích hồi quy – tương quan STA302_Bai5_v1.0013109210 71 sử dụng phương pháp bình phương nhỏ nhất (OLS - Ordinary Least Square) với nội dung: tổng bình phương các độ lệch giữa giá trị thực tế và giá trị lý thuyết của biến phụ thuộc (tiêu thức kết quả) là nhỏ nhất. S = (yi −  iy )2 = min Hay: S = ( yi – bo – b1xi)2 = min Để thỏa mãn điều kiện trên, cần tìm đạo hàm riêng theo 2 tham số cần tìm. Từ đó, b0 và b1 phải thỏa mãn hệ phương trình: i 0 1 i 2 i i 0 i 1 i y nb b x x y b x b x           Từ hệ phương trình trên, sau khi biến đổi, b0 và b1 có thể được tính theo công thức: 1 2 x xy xyb   và b0 = 1y b x Trong đó: i xx n   iyy n   i ix yxy n   22 i i2 2 2 x x x x (x) n n            5.2.3. Ý nghĩa các hệ số trong phương trình hồi quy Sử dụng phương pháp bình phương nhỏ nhất sẽ xác định được giá trị của b0 và b1. Ý nghĩa của hai tham số này lần lượt như sau:  b0 là hệ số tự do (hệ số chặn), là điểm xuất phát của đường hồi quy lý thuyết, nêu lên ảnh hưởng của các nhân tố khác (tiêu thức nguyên nhân khác) ngoài x tới sự biến động của tiêu thức kết quả y.  b1 là hệ số hồi quy nói lên ảnh hưởng trực tiếp của tiêu thức nguyên nhân x tới tiêu thức kết quả y. Cụ thể, khi x tăng một đơn vị thì làm cho y thay đổi trung bình là b1 đơn vị. Giá trị b1 có thể âm, dương hay bằng 0, tùy thuộc vào mối liên hệ giữa x và y. Hệ số hồi quy b1 nêu lên chiều hướng của mối liên hệ. Cụ thể: b1 > 0, mối liên hệ thuận; b1< 0, mối liên hệ nghịch. Ví dụ, có tài liệu về doanh thu và chi phí quảng cáo của 5 cửa hàng giới thiệu sản phẩm A như sau: Bài 5: Phân tích hồi quy – tương quan 72 STA302_Bai5_v1.0013109210 ` Cửa hàng Doanh thu (triệu đồng) yi Chi phí quảng cáo (triệu đồng) xi xiyi 2xi 2yi A 850 2 1700 4 722500 B 870 5 4350 25 756900 C 880 6 5280 36 774400 D 900 9 8100 81 810000 E 910 13 11830 169 828100 Tổng 4410 35 31260 315 3891900 Yêu cầu: Xây dựng phương trình hồi quy biểu diễn mối liên hệ tương quan tuyến tính giữa chi phí quảng cáo tới doanh thu của 5 cửa hàng trên. Theo yêu cầu trên, xác định được tiêu thức nguyên nhân là chi phí quảng cáo (x) và doanh thu là tiêu thức kết quả (y). Phương trình hồi quy có dạng: i 0 1 iyˆ b b x  Có 2 cách xác định các tham số:  Cách 1: Giải hệ phương trình i 0 1 i 0 1 2 0 1i i 0 i 1 i 0 1 y nb b x 4410 5b 35b 31260 35b 315bx y b x b x b 843,01 b 5,57                      Cách 2: Xác định từ các công thức i x 35x 7 n 5    iy 4410y 882 n 5    i ix y 31260xy 6252 n 5    22 i i2 2 x x x 315 7 14 n n 5             Từ đó, 1 2 x xy xy 6252 7 882b 5,57 14      Bài 5: Phân tích hồi quy – tương quan STA302_Bai5_v1.0013109210 73 0 1b y b x 882 5,57 7 843,01      Hai cách tính đều cho kết quả b0 và b1 như nhau. Vậy phương trình hồi qui biểu diễn mối liên hệ tương quan giữa chi phí quảng cáo tới doanh thu là: i iyˆ 843,01 5,57x  Ý nghĩa các hệ số trong phương trình hồi qui tuyến tính:  b0 = 843,01: nói lên ảnh hưởng của tất cả các tiêu thức nguyên nhân trong đó không có chi phí quảng cáo tới doanh thu của 5 cửa hàng.  b1 = 5,57: nói lên ảnh hưởng trực tiếp của chi phí quảng cáo tới doanh thu. Cụ thể, khi chi phí quảng cáo tăng lên 1 triệu đồng thì doanh thu tăng trung bình là 5,57 triệu đồng. Sau khi xây dựng được phương trình hồi quy phản ánh mối liên hệ giữa các hiện tuợng kinh tế – xã hội, nhiệm vụ tiếp theo của phân tích hồi quy - tương quan là phải đánh giá trình độ chặt chẽ của mối liên hệ đó. 5.2.4. Hệ số tương quan Hệ số tương quan là số tương đối sử dụng để đánh giá trình độ chặt chẽ (chiều hướng và cường độ) của mối liên hệ tương quan tuyến tính. Công thức tính: x 1 x y y xy x.yr b     Các tính chất:  Miền xác định: -1 ≤ r ≤ 1  r > 0: mối liên hệ tương quan tuyến tính thuận (cùng chiều).  r < 0: mối liên hệ tương quan tuyến tính nghịch (ngược chiều).  r = ± 1: mối liên hệ hàm số - hoàn toàn chặt chẽ.  r = 0: không có mối liên hệ tương quan tuyến tính giữa x và y.  r càng gần 1: mối liên hệ càng chặt chẽ. Trở lại ví dụ trên, tính hệ số tương quan. Ta có: 22 2 2 y 3891900y y 882 456 5       x 1 y 14r b 5,57 0,976 456    Như vậy, mối liên hệ giữa chi phí quảng cáo tới doanh thu là mối liên hệ tương quan tuyến tính thuận và rất chặt chẽ. Bài 5: Phân tích hồi quy – tương quan 74 STA302_Bai5_v1.0013109210 5.3. Hồi quy - tương quan phi tuyến giữa hai tiêu thức số lượng 5.3.1. Phương trình hồi quy Mối liên hệ tương quan phi tuyến là mối liên hệ tương quan giữa các tiêu thức không được biểu hiện bằng một đường thẳng mà bằng các đường cong có hình dáng khác nhau. Một số dạng đường cong thường gặp:  Phương trình parabol (bậc 2) o Vận dụng khi tiêu thức nguyên nhân tăng hay giảm với 1 lượng đều nhau thì tiêu thức kết quả biến động vơi 1 lượng không đều nhau (nhanh hơn hoặc chậm hơn). Ví dụ: tuổi nghề và năng suất lao động. o Phương trình hồi quy: 2 i 0 1 i 2 iyˆ b b x b x   b0, b1, b2 là các tham số của phương trình hồi quy, được xác định bằng phương pháp bình phương nhỏ nhất và phải thỏa mãn hệ phương trình: 2 i 0 1 i 2 i 2 3 i i 0 i 1 i 2 i 2 2 3 4 i 0 i 1 i 2 i y nb b x b x x y b x b x b x x y b x b x b x                     Phương trình hypebol o Vận dụng khi tiêu thức nguyên nhân tăng thì tiêu thức kết quả giảm với tốc độ không đều. o Phương trình hồi quy: 1 i 0 i byˆ b x   b0, b1 là tham số của phương trình hồi quy, được xác định bằng phương pháp bình phương nhỏ nhất và phải thỏa mãn hệ phương trình: i 0 1 i i 0 1 2 i i i 1y nb b x 1 1 1y b b x x x           5.3.2. Tỷ số tương quan Tỷ số tương quan là chỉ tiêu đánh giá mức độ chặt chẽ của mối liên hệ tương quan phi tuyến. Công thức tính:     2 i i 2 i ˆy y 1 y y       Bài 5: Phân tích hồi quy – tương quan STA302_Bai5_v1.0013109210 75 Tính chất:  0 1   η = 0: không có mối liên hệ tương quan phi tuyến.  η = 1: mối liên hệ tương quan phi tuyến hoàn toàn chặt chẽ.  η càng gần 1: mối liên hệ càng chặt chẽ. Nhận xét:  η luôn ≥ 0 nên tỷ số tương quan chỉ có thể đánh giá trình độ chặt chẽ của mối liên hệ chứ không nói được chiều hướng của mối liên hệ.  η có thể dùng cho cả phi tuyến và tuyến tính (khi r 0). Bài 5: Phân tích hồi quy – tương quan 76 STA302_Bai5_v1.0013109210 Tóm lược cuối bài  Các hiện tượng kinh tế – xã hội luôn tồn tại trong mối liên hệ ràng buộc lẫn nhau. Tuỳ theo mức độ chặt chẽ của mối liên hệ mà có thể phân ra thành hai loại: liên hệ hàm số và liên hệ tương quan.  Phân tích hồi quy - tương quan thực chất là phương pháp phân tích mối liên hệ phụ thuộc với hai nhiệm vụ chủ yếu: xây dựng phương trình hồi quy biểu diễn mối liên hệ và đánh giá mức độ chặt chẽ của mối liên hệ.  Với mối liên hệ đơn giản nhất giữa hai tiêu thức số luợng, tuỳ theo việc thăm dò dạng của phương trình hồi quy mà có thể xây dựng phương trình tuyến tính hoặc phi tuyến. Các hệ số của mô hình hồi quy được xác định theo phương pháp bình phương nhỏ nhất. Hệ số tương quan và tỷ số tương quan được sử dụng để đánh giá mức độ chặt chẽ của mối liên hệ tương quan giữa hai tiêu thức số lượng. Bài 5: Phân tích hồi quy – tương quan STA302_Bai5_v1.0013109210 77 Câu hỏi ôn tập 1. Phân tích sự khác biệt giữa liên hệ hàm số và liên hệ tương quan? Cho ví dụ minh họa. 2. Trình bày nhiệm vụ của phương pháp phân tích hồi quy - tương quan. 3. Trình bày nội dung của phương pháp bình phương nhỏ nhất. 4. Nêu ý nghĩa các tham số trong phương trình hồi quy. 5. Trình bày khái niệm, công thức tính, tính chất của hệ số tương quan. 6. Trình bày khái niệm, công thức tính, tính chất của tỷ số tương quan. Bài tập Bài 1. Có tài liệu về thu nhập và vốn của 10 trang trại ở một địa phương như sau: Thu nhập (triệu đồng) Vốn (triệu đồng) 46,8 93,6 30,3 54,5 25,6 38,7 36,5 65,4 50,7 104,5 89,4 196,0 42,5 85,0 75,2 157,4 80,5 176,8 61,8 120,5 Yêu cầu: a. Xây dựng phương trình hồi quy tuyến tính phản ánh ảnh hưởng của vốn tới thu nhập. Giải thích ý nghĩa các hệ số trong phương trình. b. Một trang trại có vốn là 78 triệu đồng. Dựa vào phương trình hồi quy, xác định thu nhập trang trại đó đạt khoảng bao nhiêu triệu đồng? c. Đánh giá trình độ chặt chẽ của mối liên hệ trên. Bài 5: Phân tích hồi quy – tương quan 78 STA302_Bai5_v1.0013109210 Bài 2. Có tài liệu về 8 doanh nghiệp công nghiệp cùng sản xuất một loại sản phẩm như sau: Sản lượng (100 tấn) Nhiên liệu tiêu hao (10 tấn) 5 4,6 12 7,0 2 3,3 7 4,5 16 7,8 11 5,7 9 5,1 20 9,2 Yêu cầu: a. Xây dựng phương trình hồi quy tuyến tính phản ánh ảnh hưởng của sản lượng tới nhiên liệu tiêu hao. Giải thích ý nghĩa các hệ số. b. Đánh giá trình độ chặt chẽ của mối liên hệ nói trên. Bài 3. Có tài liệu về chiều cao và cân nặng của 11 phụ nữ trong độ tuổi 18 – 24 được lựa chọn ngẫu nhiêu như sau: Chiều cao (cm) Cân nặng (kg) 175 65 133 67 185 71 163 71 126 66 198 75 153 67 163 70 159 71 151 69 155 69 Yêu cầu: a. Khi chiều cao tăng thêm 1 cm thì cân nặng thay đổi như thế nào? b. Ðánh giá trình độ chặt chẽ giữa cân nặng và chiều cao của nhóm nguời trên.