Phân tích chuỗi tuần tự theo thời gian và dự báo

Định nghĩa: - Chuỗi tuần tựtheo thời gian là một chuỗi các gía trịcủa một đại lượng nào đó được ghi nhận tuần tựtheo thời gian. Ví dụ: • Sốlượng hàng bán được trong 12 tháng của một công ty. - Các gía trịcủa chuỗi tuần tựtheo thời gian của đại lượng X được ký hiệu X1, X2, , Xt, . Xn, với Xt, là gía trịquan sát của X ởthời điểm t. 8.1.2 Các thành phần của chuỗi tuần tựtheo thời gian: (Components of time series) Các nhà thống kê thường chia chuỗi tuần tựtheo thời gian ra làm 4 thành phần: - Thành phần xu hướng dài hạn (long-term trend component) - Thành phần mùa (Seasonal component) - Thành phần chu kỳ(Cyclical component) - Thành phần bất thường (irregular component)

pdf14 trang | Chia sẻ: haohao89 | Lượt xem: 2298 | Lượt tải: 3download
Bạn đang xem nội dung tài liệu Phân tích chuỗi tuần tự theo thời gian và dự báo, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Cao Hào Thi 1 Chương 10 PHÂN TÍCH CHUỖI TUẦN TỰ THEO THỜI GIAN VÀ DỰ BÁO ( Time seties Analysis and Forecoasting) 8.1 Chuỗi tuần tự theo thời gian ( Time series) 8.1.1 Định nghĩa: - Chuỗi tuần tự theo thời gian là một chuỗi các gía trị của một đại lượng nào đó được ghi nhận tuần tự theo thời gian. Ví dụ: • Số lượng hàng bán được trong 12 tháng của một công ty. - Các gía trị của chuỗi tuần tự theo thời gian của đại lượng X được ký hiệu X1, X2, ………, Xt, …. Xn, với Xt, là gía trị quan sát của X ở thời điểm t. 8.1.2 Các thành phần của chuỗi tuần tự theo thời gian: (Components of time series) Các nhà thống kê thường chia chuỗi tuần tự theo thời gian ra làm 4 thành phần: - Thành phần xu hướng dài hạn (long-term trend component) - Thành phần mùa (Seasonal component) - Thành phần chu kỳ (Cyclical component) - Thành phần bất thường (irregular component) 8.1.2.1 Thành phần xu hướng dài hạn: Thành phần này dùng để chỉ xu hướng tăng giảm của đại lượng X trong khoảng thời gian dài. Về mặt đồ thị thành phần này có thể diễn tả bằng một đường thẳng hay bằng một đường cong tròn (Smooth curve) 8.1.2.2 Thành phần mùa: Thành phần này chỉ sự thay đổi của đại lượng X theo các mùa trong năm (có thể theo các tháng trong năm) t Xt X t Xu hướng giảm theo thời gian Cao Hào Thi 2 Ví dụ: - Lượng tiêu thụ chất đốt sẽ tăng vào mùa đông và sẽ giảm vào mùa hè. Ngược lại lượng tiêu thụ xăng sẽ tăng vào mùa hè và giảm vào mùa đông - Lượng tiêu thụ đồ dùng học tập sẽ tăng vào mùa khai trường 8.1.2.3 Thành phần chu kỳ: Thành phần này chỉ thay đổi của đại lượng X theo chu kỳ. Sự khác biệt của thành phần này so với thành phần mùa là chu kỳ của nó dài hơn một năm. Để đánh gía thành phần chu kỳ các gía trị của chuỗi tuần tự theo thời gian sẽ được quan sát hằng năm Ví dụ: Lượng dòng chảy đến hồ chứa Trị An từ năm 1959 đến 1985 8.1.2.4 Thành phần bất thường: Thành phần này dùng để chỉ những sự thay đổi bất thường của các gía trị trong chuỗi tuần tự theo thời gian. Sự thay đổi này không thể dự đoán bằng các số liệu kinh nghiệm trong qúa khứ, về mặt bản chất này không có tính chu kỳ. t Chất đốt Xu hướng tăng theo thời gian Thay đổi theo mùa 6 12 6 12 6 12 t (năm) 1985 Q (m3/s) 1959 1960 Cao Hào Thi 3 8.1.3 Mô hình hóa việc dự báo gía trị của đại lượng X 8.1.3.1 Mô hình nhân: ( Multiplicative model) Xt: Gía tị của đại lượng X ở thời điểm t Tt: Gía trị của thành phần xu hướng ở thời điểm t. Tt có cùng đơn vị với Xt St, Ct, It: là các hệ số đánh gía ảnh hưởng của các thành phần mùa, thành phần chu kỳ và thành phần bất kỳ đến gía trị của X ở thời điểm t. Trong thực tế việc xác định It rất khó khăn nên thường được bỏ qua, khi đó: 8.1.3.2 Mô hình cộng: (Additive model) Xt: gía trị của đại lượng X ở thời điểm t Tt, St, Ct, It: Gía trị của thành phần xu hướng, mùa, chu kỳ và bất thường ở thời điểm t. Trong thực tế, để dự báo gía trị của đại lượng X ta có thể phối hợp cả 2 loại mô hình trên. 8.2. Các phương pháp làm trơn: (Smoothing methods) Trong một số chuỡi tuần tự theo thời gian thành phần mùa và thành phần bất thường thay đổi quá lớn làm cho việc xác định thành phần xu hướng và thành phần chu kỳ gặp nhiều khó khăn. Sự thay đổi lớn này có thể được giảm nhỏ bằng các phương pháp làm trơn. Các phương pháp làm trơn được đề cập trong chương này gồm phương pháp trung bình dịch chuyển và phương pháp làm trơn bằng hàm số mũ. (Moving average and exponential smoothing methods) 8.2.1 Phương pháp trung bình dịch chuyển: (Trung bình trượt – Moving average) Nội dung của phương pháp này là thay thế gía trị quan sát Xt bằng gía trị trung bình của chính nó với m gía trị trước nó và m gía trị sau nó. Nghĩa là thay Xt bằng X*t, với: Xt* = ∑ −= ++ m mj jtX1m2 1 Xt = Tt * St * Ct * It Xt = Tt * St *Ct Xt = Tt + St + Ct + It Xt* = 1m2 XX...X...XX mt1mtt1mtmt + ++++++ +−++−− Cao Hào Thi 4 X*t : là gía trị trung bình dịch chuyển của (2m+1) điểm Ví dụ: Nếu m =2, ta có gía trị trung bình trượt của 5 điểm được tính theo công thức: Xt* = 5 XXXXX 2t1tt2t 1t ++− ++++ − Nếu t = 3 X*3 = 5 XXXXX 54321 ++++ 8.2.2 Phương pháp làm trơn bằng hàm số mũ đơn giản: (Simple exponential smoothing method) Phương pháp làm trơn hàm số mũ tiến hành dựa trên việc xem xét một cách liên tục các gía trị của quá khứ, dựa trên trung bình có trọng số của chuỗi dữ liệu. Trong phương pháp này trọng số có gía trị càng nhỏ khi nó càng cách xa thời điểm dự báo. Với ý nghĩa trên ta có: tX = α Xt + (1-α) α Xt-1 + (1-α)2 α Xt-2 + (1-α)3 α Xt-3 +…+(1-α)t-1 α X1 Tương Tự 1 2t 4t 3 3t 2 2t1t1t X)1(......X)1(X)1(X)1(XX αα−++αα−+αα−+αα−+α= −−−−−− 1 1 3 3 2 2 11 )1(....)1()1()1()1( XXXXX t tttt ααααααααα −−−−− −++−+−+−=− Từ các phương trình trên ta có: Trong tóm tắt ta lấy 122 )1( XXX αα −+= 233 )1( XXX αα −+= . . . . . . . . . . . . . 1ttt X)1(XX −α−+α= . . . . . . . . . . . . . . 1nnn X)1(XX −α−+α= Ví dụ: Bảng số liệu sau đây cho thấy số lượng máy tính được bán ra của cửa hàng trong 24 tháng vừa qua. a) Tìm chuỗi thời gian trung bình trượt 5 tháng b) Tìm các gía trị trung bình bằng phương pháp làm trơn hàm mũ với hệ số làm trơn 1ttt X)1(XX −α−+α= Với 10 ≤α≤ α: hằng số làm trơn (Smoothing Constant) 1XX = Và các trị số Xt được lấy từ số liệu quan sát Hàm 2 Cho (1-α) Cao Hào Thi 5 c) STT t Tháng Số liệu quan sát Xt Số trung bình trượt 5 tháng X*t Số trung bình bằng PP làm trơn hàm mũ Xt 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 2 năm trước Một Hai Ba Tư Năm Sáu Bảy Tám Chín Mười Mười Một Mười Hai 1 năm trước Môt Hai Ba Tư Năm Sáu Bảy Tám Chín Mười Mười một Mười hai 21 20 19 18 14 15 22 28 25 25 25 20 25 25 24 28 36 32 25 23 22 23 22 27 18,4 17,2 17,6 19,4 20,8 23,0 25,0 24,6 24,0 24,0 23,8 24,4 27,6 29,0 29,0 28,8 27,6 25,0 23,0 23,4 21,0 20,0 19,8 18,9 16,5 15,8 18,9 23,5 24,3 24,7 24,9 22,5 23,8 24,4 24,2 26,1 31,0 31,5 28,3 25,7 23,8 23,4 22,7 24,9 8.3 Dự báo: 8.3.1 Khái niệm chung : Dự báo là khả năng nhận thức được sự vận động của các đối tượng nghiên cứu trong tương lai dựa trên sự phân tích chuỗi thông tin quá khứ và hiện tại. Cho đến nay, nhu cầu dự báo đã trở nên hết sức cần thiết ở mỗi lĩnh vực. 8.3.1.1 Bản chất các khái niệm liên quan đến dự báo: 8.3.1.1.1 Tiên đoán (Predicting) Đoán trước sự vận động của đối tượng nghiên cứu trong tương lai. Đó là kết quả nhận thức chủ quan của con người dựa trên một số cơ sở nhất định. Có thể nêu mức độ tiên đoán ở 3 khía cạnh. Cao Hào Thi 6 a) Tiên đoán không tưởng: Đó là những tiên đoán không có cơ sở khoa học, chỉ dựa trên những mối liên hệ không tưởng thiếu căn cứ. b) Tiên đoán kinh nghiệm: Đó là những tiên đoán dựa trên chuỗi thông tin lịch sử. Mức độ ít nhiều có cơ sở khách quan, tuy nhiên có nhược điểm là loại tiên đoán này không giải thích được xu thế vận động của đối tượng nghiên cứu và đa số dừng lại ở bước định tính. c) Tiên đoán khoa học: Đó là tiên đoán dựa trên phân tích mối liên hệ qua lại giữa các đối tượng nghiên cứu và phương pháp xử lý thông tin khoa học nhằm phát hiện tính quy luật của đối tượng . 8.3.1.1.2 Dự báo (Forecasting) Dự báo là tiên đoán khoa học mang tính xác suất và tính phương án trong khoảng thời gian hữu hạn về tương lai phát triển của đối tượng nghiên cứu. a) Tính xác suất : Do dự báo dựa trên việc xử lý chuỗi thông tin bao gồm cả 2 yếu tố xu thế phát triển và yếu tố ngẫu nhiên, vì vậy kết quả dự báo so với thực tế có sự chên lệch mang tính xác suất. b) Tính chất phương án: Dự báo được thể hiện bằng nhiều dạng kết quả có thể xảy ra trong tương lai (dạng định tính, dạng định lượng, dạng khoảng, dạng điểm, …) c) Tính chất thời gian hữu hạn: Sự chênh lệch giữa thời điểm dự báo và thời điểm hiện tại được gọi là khoảng cách dự báo (tầm xa dự báo l), khoảng cách này không thể tùy tiện mà nó phụ thuộc vào mức độ ổn định của đối tượng nghiên cứu trong quá trình phát triển . Vì vậy dự báo được tiến hành với khoảng cách dự báo thích hợp tương ứng một khoảng thời gian hữu hạn nào đó. 8.3.1.2 Phân loại dự báo : a) Dựa vào thời gian : Căn cứ vào khoảng cách dự báo, người ta chia dự báo thành 2 loại chính: - Dự báo ngắn hạn : Khoảng cách dự đoán ngắn hạn dùng cho cấp quản lý trung bình và thấp, cho chiến lược tức thời. - Dự báo dài hạn : Khoảng cách dự báo dài dùng cho quản lý cấp cao, cho các đối tượng nghiên cứu mang tầm cỡ chiến lược. Cao Hào Thi 7 b) Dựa theo kết quả : - Dự báo điểm : Kết quả dự báo được thể hiện bằng một giá trị duy nhất. Ft+l : giá trị dự báo thời điểm t+l. - Dự báo khoảng : Kết quả dự báo được thể hiện dưới dạng khoảng tin cậy với xác suất xảy ra được chủ định. c) Dựa theo đối tượng nghiên cứu: - Dự báo tài nguyên. - Dự báo khoa học kỹ thuật. - Dự báo dân số lao động. - Dự báo xã hội. - Dự báo thị trường… 8.3.2 Các bước dự báo: Công tác dự báo gồm 4 bước: 8.3.2.1 Thu thập số liệu: Yêu cầu phải có số liệu - Chính xác - Đúng mục đích dự báo Đây là phần khó khăn và tốn thời gian. 8.3.2.2 Xử lý sơ bộ số liệu: - Bỏ những số liệu không cần thiết, không chính xác. - Bổ xung những số liệu còn thiếu. - Chia tập số liệu thành 2 nhóm : nhóm đầu và nhóm kiểm tra. 8.3.2.3 Lựa chọn phương pháp và xây dựng mô hình dự báo - Phương pháp dự báo được chọn sao cho phù hợp với số kiệu thuộc nhóm đầu và với đối tượng nghiên cứu. - Lập mô hình dự báo sao cho sai số dự báo là nhỏ nhất. Sai số dự báo được kiểm định bởi nhóm số liệu kiểm tra. 8.3.2.4 Dự báo: - Từ mô hình dự báo xác định giá trị dự báo - Phân tích kết quả nhận được. F t+l = A Ft+l = A ε± Cao Hào Thi 8 8.3.3 Các phương pháp dự báo thông dụng: Các phương pháp dự báo thường dùng có thể chia làm 3 loại: - Phương pháp giản đơn (naive method) - Phương pháp trung bình (average method) - Phương pháp làm trơn (smoothing method) 8.3.3.1 Phương pháp dự báo giản đơn: A. Phương pháp 1: Trong phương pháp này người ta giả thiết giá trị gần đây nhất là giá trị đúng nhất cho tương lai. Ft+1 : là giá trị dự báo ở thời điểm t+1 Xt : là trị quan sát được ở thời điểm t Nhận Xét: - Đây là mô hình đơn giản nhất. Mô hình này không thể hiện được các thành phần của chuỗi thời gian. - Để đánh giá độ chính xác của công tác dự báo người ta phải tính sai số dự báo e. Ví dụ: Lượng hàng bán ra theo qúy của một công ty từ năm 1979 đến 1985 được cho trong bảng số liệu. Dựa vào bảng số liệu lập mô hình dự báo lượng hàng bán ra theo quý trong tương lai. Năm Quý T Lương sp bán được 1979 1980 1981 1 2 3 4 1 2 3 4 1 2 1 2 3 4 5 6 7 8 9 10 500 350 250 400 450 350 200 300 350 200 Ft+1 = Xt et+1 = Xt+1 – Ft+1 Cao Hào Thi 9 1982 1983 1984 1985 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 150 400 550 350 250 550 550 400 350 600 750 500 400 650 850 600 450 700 Giải: Nếu chúng ta sử dụng số liệu từ năm 1979 đến năm 1984 làm phần đầu của nhóm số liệu và sử dụng số liệu năm 1985 là phần kiểm tra Giá trị dự báo cho quí I năm 1985 (thời điểm 25) F25 = F24 + 1 = X24 = 650 Sai số dự báo ở thời điểm 25 là e25 = X25 – F25 = 850 – 650 = 200 Tương tự, giá trị dự báo cho quí II năm 1985 (thời điểm 26) là F26 = X25 = 850 Sai số dự báo ở thời điểm 26 là e26 = X26 – F26 = 600 –850 = -250 Nhận Xét: Sai số lớn cần phải sửa đổi mô hình. B. Phương pháp 2: Trong phương pháp này, người ta thêm vào các số hạng để đánh giá ảnh hưởng của thành phần xu hướng trong chuỗi thời gian. Mô hình có thể có dạng: Cao Hào Thi 10 a) Đánh giá ảnh hưởng của thành phần xu hướng Ví dụ: Giá trị dự báo ở thời điểm 25 F25 = X24 + ( X24 - X23 ) = 650 + ( 650 – 400) F25 = 900 Sai số dự báo ở thời điểm 25 E25 = X25 - F25 = 850 - 900 e25 = -50 b) Ví dụ: F25 = X24 * 23 24 X X = 650 * 400 650 F25 = 1050 e25 = X25 - F25 = 850 -1056 e25 = -206 C. Phương pháp 3: Trong phương pháp này, người ta có chú ý đến ảnh hưởng của thành phần mùa trong chuỗi thời gian. Ft+1 = Xt + ( Xt – Xt – 1) Ft+1 = Xt * 1t t X X − Ft+1 = Xt-3 Cao Hào Thi 11 Với công thức này lượng sản phẩm bán ra ở quý dự báo bằng lượng sản phẩm bán ra trong quý tương ứng ở năm trước đó. Nhược điểm của phương pháp này là không chú ý tới tác động khác nhau giữa các năm và thành phần xu hướng. Ví dụ: F25 = X21 = 750 e25 = X25 - F25 = 850 – 750 e25 = 100 D. Phương pháp 4: Trong phương pháp này, người ta chú ý đến ảnh hưởng của thành phần mùa và thành phần xu hướng của chuỗi thời gian. Ví dụ: F25 = X21 + 4 )XX()XX)XX()XX( 2021212222232324 −+−+−+− = 750 + 4 )600750()750500()500400()400650( −+−+−+− = 750 +12,5 F25 = 762,5 e25 = X25 - F25 = 850 - 762.5 e25 = 87.5 Ft+1 = Xt-3 + 4 )XX(...)XX( 4t3t1tt −−− −++− T/phần mùa Giá trị trung bình của sự thay đổi của 4 qúy gần nhất T/phần xu hướng Cao Hào Thi 12 Nhận xét chung: Phương pháp Naive có ưu điểm đơn giản và phù hợp cho những phân tích ban đầu nhưng sai số lớn. 8.3.3.2 Các phương pháp trung bình: a. Phương pháp trung bình giản đơn: Trong phương pháp này, người ta sử dụng giá trị trung bình của toàn bộ số liệu đã có trước thời điểm dự báo làm giá trị dự báo. Ví dụ: giá trị dự báo cho quí I/1985 (thời điểm t = 25) F25 = 24 1 ∑ = 24 1t tX = )9800(* 24 1 F25 = 408,33 e25 = X25 – F25 = 850 – 408,33 e25 = 441,67 Giá trị dự báo cho quí II/1985 (thời điểm t = 26) F26 = ⎥⎦ ⎤⎢⎣ ⎡ += ∑∑ == 25 24 1t t 25 1t t XX25 1X 25 1 = [ ]8509800 25 1 + F26 = 25 1 * 10650 = 426 e26 = X26 - F26 = 600 - 426 Ft+1 = n 1 ∑ = n 1t tX Cao Hào Thi 13 e26 = 174 Trong ví dụ này, các sai số dự báo lớn → dự báo không chính xác. Phương pháp trung bình đơn giản thường được sử dụng khi dãy số liệu không biến đổi theo mùa,không có hướng, không đối xứng và với tập số liệu lớn. b. Phương pháp trung bình dịch chuyển ; (Moving – Average) Trong phương pháp này, người ta sử dụng giá trị trung bình của n số liệu quan sát trước thời điểm dự báo. Nhận xét: - Mô hình này chú ý đến n số liệu quan sát đã biết gần thời điểm dự báo nhất. - Số n không thay đổi khi tính giá trị trung bình dịch chuyển. • n = 1⇒ Ft+1 = Xt : Phương pháp naive • n = 1⇒ Ft+1 = ∑ = n 1t tXn 1 :Phương pháp trung bình giản đơn. - Tổng quát, phương pháp trung bình dịch chuyển tốt hơn phương pháp trung bình giản đơn. Ví dụ: Giá trị dự báo cho quí I/1985 với n = 4 F25 = 4 1 (X24 +X23 + X22 +X21 ) = 4 1 (650 + 400 +500 +750 ) = 4 1 * 2300 F25 = 575 e25 = X25 - F25 = 850 – 575 e25 = 275 c. Phương pháp làm trơn hàm mũ:(Exponential Smoothing Methods) Ft+1 = n 1 (Xt + Xt-1 + Xt-2 +….+ Xt-n+1) (toàn bộ số liệu) Ft+1 = α Xt + (1-α) Ft Cao Hào Thi 14 Ft+1 :giá trị dự báo ở thời điểm t+1 Ft :giá trị dự báo ở thời điểm t Xt :giá trị quan sát ở thời điểm t α :hằng số làm trơn, 10 ≤α≤ 8.3.3.3 Phương pháp tự hồi qui:(Autoregressive models) a) Mô hình tự hồi qui bậc 1:(first-order autoregressive models) β, Φ1 : là các tham số cố định at : là biến ngẫu nhiên có số trung bình là 0 b) Mô hình tự hồi qui bậc 2 (second order autoregressive models ) c) Mô hình tự hồi qui bậc p: (Autoregressive model of order p) Xt= β + Φ1 Xt-1 + at Xt = β +Φ1 Xt-1 + Φ2 Xt-2 + at Xt = β + Φ1 Xt-1 + Φ2 Xt-2 + … + ΦpXt-p +at