Bài giảng Lý thuyết xác suất và thống kê - Bài 8: Tương quan và hồi quy - Nguyễn Mạnh Thế

2. ĐƯỜNG HỒI QUY TRUNG BÌNH TUYẾN TÍNH THỰC NGHIỆM (tiếp theo) Phương trình y = ax + b được gọi là phương trình hồi quy tuyến tính của Y theo X. Trong đó: • Y được gọi là biến được giải thích hay biến phụ thuộc, được gọi là biến giải thích; • X được gọi là biến giải thích;  là sai số hồi quy; • a được gọi là độ dốc (slope), cho biết khi biến X tăng một đơn vị thì giá trị của biến Y • b được gọi là hệ số chẵn hoặc hệ số cắt (intercept), cho biết phương trình hồi quy có đi qua gốc toạ độ hay không và điểm xuất phát của Y khi X bằng 0 sẽ là bao nhiêu; à b ũ đượ i là hệ ố hồi v1.0012107210

pdf13 trang | Chia sẻ: thanhle95 | Lượt xem: 437 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Bài giảng Lý thuyết xác suất và thống kê - Bài 8: Tương quan và hồi quy - Nguyễn Mạnh Thế, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
BÀI 8 TƯƠNG QUAN VÀ HỒI QUY TS N ễ M h Thế. guy n ạn v1.0012107210 1 TÌNH HUỐNG KHỞI ĐỘNG BÀI Tình huống: • Siêu thị ABC muốn mở 01 siêu thị tại khu dân cư Vạn Phúc. Để xác định được quy mô siêu thị, doanh nghiệp cần biết được chi phí nhu yếu phẩm ủ ười dâ t ù Biết hi hí h ế hẩ ủ 01 á hâ hc a ng n rong v ng. c p n u y u p m c a c n n p ụ thuộc chính vào mức thu nhập của cá nhân đó. Siêu thị tiến hành điều tra mức thu nhập (X) và chi tiêu (Y) cho những nhu yếu phẩm của cá nhân. • Kết quả cho bảng số liệu sau (Đơn vị: Triệu đồng): 1,00,80,5X\Y 2522 5 1262,0 0341,5 4113,0 , Câu hỏi gợi mở: Câu 1: Tính hệ số tương quan mẫu. Câu 2: Viết phương trình hồi quy tuyến tính mẫu. â Ướ ố ồ v1.0012107210 2 C u 3: c lượng sai s h i quy. Câu 4: Dự báo giá trị của Y khi mức thu nhập X là 4,0 triệu đồng. 2 TÌNH HUỐNG KHỞI ĐỘNG BÀI (tiếp theo) Kết luận: Với mẫu ngẫu nhiên (x1, y1), (x2, y2),, (xn,yn) ta xây dựng hàm hồi quy mẫu (hàm hồi quy thực nghiệm) có dạng: Với:    y ax b   b y a.x       f f f 1 n n y x y (x)(y) s a r 1 Trong đó:   2 2f f 1 xsx (x) n xy (x)(y)r s s Phương trình hồi quy mẫu (đường hồi quy trung bình tuyến tính thực x y nghiệm) có dạng:       y y x x s s y r x y r x ax b s s Trong đó:  x y xy (x)(y) r s s v1.0012107210 3 2 NỘI DUNG • Hệ số tương quan mẫu; • Đường hồi quy bình phương trung bì h t ế tí h thự hiệ ủn uy n n c ng m c a hai biến ngẫu nhiên. v1.0012107210 4 1. HỆ SỐ TƯƠNG QUAN MẪU • Hệ số tương quan của hai biến ngẫu nhiên X Y được xác, , định bởi công thức:   Cov(X, Y) E(XY) (EX)E(Y) • Hệ số tương quan đo mức độ phụ thuộc tuyến tính giữa hai biế ẫ hiê X à Y    X Y X Y n ng u n n v . Giả sử ta có mẫu ngẫu nhiên (X1, Y1), (X2, Y2), , (Xn, Yn) rút ra từ ẫ ẫ . véc tơ ng u nhiên (X, Y) với giá trị m u (x1, y1), (x2, y2),, (xn, yn ). Hệ số tương quan mẫu:  XY (X)(Y)R Trong đó thống kê: x yS S n1 R là ước lượng của hệ số tương quan lý thuyết    k k k 1 XY X Y n  v1.0012107210 5 2. ĐƯỜNG HỒI QUY TRUNG BÌNH TUYẾN TÍNH THỰC NGHIỆM Với mẫu cụ thể giá trị của R là:  X Y xy (x)(y) r s s càng gần 1 thì mức độ phụ thuộc tuyến tính giữa X và Y càng chặt chẽ, tức là ta có thể xấp xỉ Y theo X | | dưới dạng f(x) = ax + b; Thô thườ khi thì ấ ỉ đượ i là hặt| | 0 8ng ng x p x c gọ c chẽ, và quan hệ giữa X và Y được thể hiện:    y ax b ,  là sai số ngẫu nhiên. v1.0012107210 6 2. ĐƯỜNG HỒI QUY TRUNG BÌNH TUYẾN TÍNH THỰC NGHIỆM (tiếp theo) Phương trình y = ax + b được gọi là phương trình hồi quy tuyến tính của Y theo X. Trong đó: • Y được gọi là biến được giải thích hay biến phụ thuộc được gọi là biến giải thích;, • X được gọi là biến giải thích; là sai số hồi quy; • a được gọi là độ dốc (slope), cho biết khi biến X tăng một đơn vị thì giá trị của biến Y ẽ tă h iả b hiê đơ ịs ng ay g m ao n u n v ; • b được gọi là hệ số chẵn hoặc hệ số cắt (intercept), cho biết phương trình hồi quy có đi qua gốc toạ độ hay không và điểm xuất phát của Y khi X bằng 0 sẽ là bao nhiêu; à b ũ đượ i là hệ ố hồi v1.0012107210 7 • a v c ng c gọ s quy. 2. ĐƯỜNG HỒI QUY TRUNG BÌNH TUYẾN TÍNH THỰC NGHIỆM (tiếp theo) Với mẫu ngẫu nhiên (x1, y1), (x2, y2), , (xn, yn) ta xây dựng hàm hồi quy mẫu (hàm hồi quy thực nghiệm) có dạng: ˆˆˆ b Tại quan sát thứ i ta có:  y ax   i iyˆ ax b  giá trị của tại quan sát thứ i; i i i i i ˆˆˆy y a.x b       i  là các ước lượng của a và b; Xác định các hệ số sao cho: n n n  a,b  a,b             2 2 2i i i i i i 1 i 1 i 1 ˆˆˆ ˆL (y y ) (y a.x b) min  ˆ ˆb      n i i yi 1 y a .x x y ( x ) ( y ) s ˆ v1.0012107210 8       n 2 2 x i i 1 a r 1 sx ( x ) n 2. ĐƯỜNG HỒI QUY TRUNG BÌNH TUYẾN TÍNH THỰC NGHIỆM (tiếp theo) Tính chất: • Hàm hồi quy mẫu đi qua điểm ; á ớ l đ á đ h d hấ (x, y) ˆˆ• C c ư c ượng ược x c ịn uy n t; • Giá trị trung bình các sai số: a, b    n i1 0n • Giá trị trung bình của bằng giá trị các quan sát ; • Sai số cũng được gọi là phần dư (residual) biểu thị sự sai khác i 1 iyˆ yˆ yiy   i i iˆy y giữa quan sát yi và giá trị Đặt được gọi là tổng bình phương các phần dư iyˆ 2 2RSS ns (1 r )n 2RSS Ký hiệu là ước lượng của sai số  y  2y / x   i i 1 n1 RSS  • Ứng dụng quan trọng của hồi quy là dự báo giá trị của biến Y khi biến X         2 2 2 2y / x i y i 1 ( ) s (1 r ) n n v1.0012107210 9 nhận giá trị mới. Nếu biến X nhận giá trị mới là x0 khi đó ta có: là ước lượng điểm tương ứng cho giá trị y0 của Y.  0 0 ˆˆyˆ ax b 0yˆ 2. ĐƯỜNG HỒI QUY TRUNG BÌNH TUYẾN TÍNH THỰC NGHIỆM (tiếp theo) Ví dụ 1: Theo dõi mức lãi suất (Y) và tỷ lệ lạm phát (X) ở một số nước ta có số liệu sau: Y 17,5 15,6 9,8 5,3 7,9 10,0 19,2 13,1 X 14,2 11,7 6,4 2,1 4,8 8,1 15,4 9,8 a Tính hệ số tương quan mẫu; Lời giải: x 9,0625; y 12,3; xy 130,9813;   Lời giải: b) T óƯớ lượ i ố hồi là i i i d) ế ỷ lệ l há hì ứ lã ấ â hà ẽ là. b. Xây dựng phương trình hồi quy mẫu; c. Ước lượng sai số hồi quy; a) Với số liệu mẫu ta tính được: 2 x x 2 y y s 18,59; s 4,312 s 20,76; s 4,56     a c : y x s 4,56 aˆ r 0,99. 1,045 s 4,312 ˆ    c c ng sa s quy : 2 2 2 2s (1 r ) 20 76(1 0 99 ) 0 413    N u t ạ p t x0 = 22,5 t m c i su t ng n ng s : y = 1 045 2 5 + 2 83 = 26 343 d. Dự báo giá trị của mức lãi suất nếu tỷ lệ lạm phát là 22,5.Vậy ta có hệ số tương quan mẫu: 130,9813 9,0625.12,3 r 0 99  Vậy ta có phương trình hồi quy mẫu: ˆb y a.x 12,3 1,045.9,0625 2,83     yˆ 1,045.x 2,83  y / x y , , , 0 , . , , , , . 4,56.4,312 v1.0012107210 10 í ề ứ ậ à ê ữ ầ ế 2. ĐƯỜNG HỒI QUY TRUNG BÌNH TUYẾN TÍNH THỰC NGHIỆM (tiếp theo) V dụ 2: Đi u tra m c thu nh p (X) v chi ti u (Y) cho nh ng nhu c u y u phẩm của cá nhân ta có bảng số liệu sau (Đơn vị: Triệu đồng): Y 0341 5 1,00,80,5 X 2522,5 1262,0 , a Tính hệ số tương quan mẫu;Lời giải: 2 23 0 2 69 4113,0 . b. Viết phương trình hồi quy tuyến tính mẫu; c Ước lượng sai số hồi quy; a. Với số liệu đã cho ta có: 2 x x 2 x , ; y ,7 ; xy 1, 5; s 0,27; s 0,52. 0 04 0 2     b Ta có: ys 0,2aˆ r 0,86. 0.33 s 0 5    c Ư lượng sai số hồi quy:d Dự báo giá trị ủa Y khi X =x0 = 4,0 ta có: y0 = 0,33.4,0 - 0,016 = 1,3 . d. Dự báo giá trị của Y khi mức thu nhập X là 4,0 triệu đồng. Vậy ta có hệ số tương quan mẫu: y ys , ; s ,  x , ˆ ˆb y a.x 0,72 0,33.2,23 0,016      2 2 2 2 y / x ys (1 r ) 0,04(1 0,86 ) 0,01      v1.0012107210 11 1, 695 2, 23.0 , 72 r 0 , 86. 0 ,52.0 , 2  Phương trình hồi quy mẫu: yˆ 0,33.x 0,016  PROPERTIES Allow user to leave interaction: Anytime Show ‘Next Slide’ Button: Don't show Completion Button Label: Next Slide