Bài giảng Phân tích dữ liệu và dự báo - Bài giảng 3: Các mô hình dự báo giản đơn

Nội dung: Dự báo thô Trung bình giản đơn Trung bình di động đơn/kép San mũ giản đơn San mũ Holt/San mũ Winter Phân tách chuỗi thời gian Phần mềm ForecastX/Crystal Ball

pdf54 trang | Chia sẻ: thanhtuan.68 | Lượt xem: 4208 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Bài giảng Phân tích dữ liệu và dự báo - Bài giảng 3: Các mô hình dự báo giản đơn, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
PHÂN TÍCH DỮ LIỆU VÀ DỰ BÁO P.T.B KHOA KINH TẾ ptbinh[a-còng]ueh.edu.vn Bài giảng 3: Các mô hình dự báo giản đơn Nội dung: Dự báo thô Trung bình giản đơn Trung bình di động đơn/kép San mũ giản đơn San mũ Holt/San mũ Winter Phân tách chuỗi thời gian Phần mềm ForecastX/Crystal Ball Phân biệt 3 phương pháp đơn giản:  Các phương pháp dự báo thô: Giả định dữ liệu gần nhất cung cáp các dự đoán tốt nhất tương lai.  Các phương pháp bình quân: Dự báo dựa trên giá trị trung bình của các quan sát quá khứ (tầm quan trọng như nhau).  Các phương pháp san mũ: Dự báo bằng cách lấy trung bình giá trị quá khứ của chuỗi dữ liệu với trọng số giảm dần (tầm quan trọng giảm dần). 1. Một phương pháp dự báo được chọn dựa trên phân tích và cảm nhận của người làm dự báo về bản chất của dữ liệu. 2. Bộ dữ liệu được chia thành 2 phần: Phần chạy thử và phần kiểm định. 3. Phương pháp dự báo được chọn được sử dụng để tính các giá trị ước lượng cho phần chạy thử. Một chiến lược tốt để đánh giá dự báo thường gồm các bước sau (Hanke, 2005): 4.Phương pháp được sử dụng để dự báo phần kiểm định của dữ liệu, và sai số dự báo được xác định và dùng để so sánh/đánh giá. 5.Ra quyết định Dự báo thô (Naïve forecast) (hoặc simple random walk!!!) Thích hợp với các doanh nghiệp mới thành lập vì có rất ít dữ liệu. Giả định giai đoạn gần nhất là ước lượng tốt nhất cho tương lai: t1t YY Ví dụ xem file Table4.1H 100 200 300 400 500 600 700 800 2 4 6 8 10 12 14 16 18 20 22 24 26 28 SALES Lấy dữ liệu trong giai đoạn 1996 – 2001 là dữ liệu ước lượng, vậy giá trị dự báo 2002Q1 sẽ là: Sai số dự báo: e25 = 200, , e26 = - 250 Kết hợp đồ thị thấy dữ liệu có xu thế, nên mô hình dự báo thô giản đơn sẽ dự báo “thấp”. 2425 ^ YY 650Y25 ^ Để khắc phục nhược điểm của mô hình dự báo thô giản đơn ta có thể xem xét thêm xu hướng của nó như sau: Trong đó: P là tỷ lệ thay đổi giữa hai giai đoạn kế nhau 0 P 1. P bao nhiêu là tốt nhất? )Y P(Y YY 1-ttt1t Có khi người ta có thể sử dụng tỷ lệ thay đổi thay cho số thay đổi tuyệt đối: Dự báo thô cho dữ liệu mùa (không xu thế): 1t t t1t ^ Y Y YY 3t1t ^ YY Nếu dữ liệu mùa và có xu thế thì cách dự báo như thế sẽ dự báo “thấp”, vậy: Nếu dữ liệu theo tháng và có xu thế? 4 )YY(...)YY( YY 4t3t1tt 3t1t ^ 4 )YY( YY 4tt 3t1t ^ Table4.1 H c1t3&f6 Trung bình giản đơn (simple average forecast) Công thức: t 1i i1t Y t 1 Y 1t Y Yt Y 1t 1t 2t Phương pháp trung bình giản đơn phù hợp khi các nhân tố ảnh hưởng đến đối tượng dự báo có tính ổn định, và môi trường liên quan đến chuỗi dữ liệu là không thay đổi. Phương pháp trung bình giản đơn sử dụng giá trị trung bình của tất cả các quan sát quá khứ làm giá trị dự báo cho giai đoạn tiếp theo. Phù hợp với dữ liệu dừng. 240 250 260 270 280 290 300 310 320 5 10 15 20 25 30 Table4.3 H Trung bình di động (moving average forecast) Quan tâm đến một số cố định các quan sát gần nhất. Khi có thêm một quan sát mới, ta có một giá trị trung bình mới. Y^t+1 : giá trị dự báo giai đoạn tiếp theo Yt : giá trị thực tại thời điểm t k : hệ số trượt )k(MA k Y ... Y Y Y 1k-t1-tt1t 240 250 260 270 280 290 300 310 320 5 10 15 20 25 30 GALLONS @MOVAV(GALLONS,4) Table4.3 H Công thức trên Eviews: @MOVAV(Yt,k) Chọn hệ số trượt bao nhiêu tùy vào độ dài của chu kỳ hay bản chất của dữ liệu. Để so sánh và chọn mô hình tốt, nên dựa vào các tiêu chí thống kê (RMSE). Thường dùng đối với dữ liệu quý hoặc tháng để làm trơn các thành phần trong chuỗi thời gian. Thường dùng với chuỗi dừng. Trung bình di động kép (double moving average forecast) Khi dữ liệu có xu thế tuyến tính thì ta sử dụng phương pháp bình phương di động điều chỉnh, được gọi là “trung bình di động kép”: k Y ... Y Y Y M 1k-t1-tt1tt k M ... M M M 1k-t1-tt't )M M( 1-k 2 b 'ttt ' tt ' tttt M - 2M )M M( M a pb a Y ttpt Table4.4 H MSE = 133 MSE = 63.7 San mũ giản đơn (simple exponential smoothing forecast) Giống trung bình di động, được sử dụng khi dữ liệu không có yếu tố xu thế và mùa vụ. Trong khi MA chỉ dựa vào các quan sát gần nhất để dự báo, thì san mũ dựa vào tất cả các quan sát trước đó để dự báo nhưng với trọng số giảm dần. Giá trị dự báo tại bất kỳ thời điểm nào là giá trị trung bình có trọng số của tất cả các giá trị sẵn có trước đó. Giá trị càng xa hiện tại thì trọng số càng giảm. Nghĩa là, các quan sát gần nhất được cho là chứa đựng thông tin thích hợp nhất, và có ảnh hưởng lớn hơn các quan sát quá khứ. Quan sát gần nhất có trọng số (0< <1), quan sát kế tiếp là (1- ), quan sát tiếp theo nữa là (1- )2, Trọng số được gọi là hệ số mũ. Mô hình san mũ giản đơn có thể được viết như sau: tt1t Y)-(1 Y Y Phương trình này có thể được viết lại như sau: tt ttt ttt tt1t e Y )Y - Y( Y Y - Y Y Y)-(1 Y Y ... Y)-(1 Y)-(1 )Y-(1 Y ... Y)-(1 )Y-(1 Y ]Y)-(1 Y)[-(1 Y Y)-(1 Y Y Y)-(1 Y Y 3-t 3 2-t 2 1-tt 1-t 2 1-tt 1-t1-tt tt1t 1-t1-tt Tốc độ mà các quan sát quá khứ không còn tác động đến giá trị san mũ phụ thuộc vào . Chọn giá trị là vấn đề quan trọng nhất của phương pháp san mũ:  Nếu các dự đoán ổn định và biến đổi ngẫu nhiên ít, thì chọn nhỏ, ngược lại nên chọn lớn.  Một cách phổ biến để ước lượng là dựa vào một quy trình lặp đi lặp lại sao cho tối thiểu hóa MSE (hoặc RMSE). Có thể sử dụng phân tích độ nhạy để xác định hệ số san mũ tối ưu. Quy trình thực hiện trên Eviews:  Quick/Series Statistics/Exponential Smoothing  Series Name  Xuất hiện box sau: Chọn phương pháp (single) Chọn hệ số nếu không biết thì chọn E (Eviews sẽ ước tính)  Nhân tố thứ hai sau là việc chọn giá trị san mũ đầu tiên cho chuỗi giá trị san mũ (giá trị dự báo).  Lấy giá trị Y1: Gán cho Y1 trọng số quá lớn, nhưng ảnh hưởng này sẽ giảm khi t tăng.  Lấy giá trị trung bình của một số quan sát đầu tiên.  Cũng có thể chọn giá trị đầu tiên tối ưu bằng phân tích độ nhạy (cho cố định). 1 ^ Y San mũ Holt (san mũ kép) Khi chuỗi thời gian có yếu tố xu thế (và không có yếu tố mùa vụ). Là một mở rộng của phương pháp san mũ giản đơn bằng việc đưa thêm một thừa số xu thế vào phương trình san mũ để điều chỉnh yếu tố xu thế. 3 phương trình và 2 hằng số san mũ được sử dụng trong mô hình Holt như sau: Giá trị san mũ (giá trị trung bình) Ước lượng xu thế: Giá trị dự báo giai đoạn p trong tương lai: ))T-(1 )Y Y( T 1-t1-ttt ttpt pT Y H )T Y)(-(1 Y Y 1-t1-ttt : giá trị san mũ giai đoạn t Yt : giá trị thực giai đoạn t Tt : giá trị ước lượng xu thế : hệ số san mũ của ước lượng giá trị trung bình : hệ số san mũ của ước lượng giá trị xu thế p : số giai đoạn dự báo trong tương lai Ht+p : giá trị dự báo Holt ở giai đoạn p tY Hệ số và có thể được chọn theo chủ quan hoặc tối thiểu hóa sai số dự báo như MSE: Khi có thay đổi lớn trong giá trị các thành phần thì sử dụng trọng số lớn, và ngược lại. Có thể áp dụng phân tích độ nhạy hai chiều trên Excel. Chọn giá trị ban đầu cho:  Cách 1: Lấy quan sát thứ nhất, và xu thế bằng 0.  Cách 2: Trung bình của 5 hoặc 6 quan sát đầu tiên và xu thế là hệ số gốc của đường xu thế của các quan sát này.  Cách 3: Hệ số cắt và hệ số gốc của đường xu thế tương ứng là giá trị ban đầu và giá trị xu thế ban đầu. tY Quy trình thực hiện trên Eviews:  Quick/Series Statistics/Expon ential Smoothing  Series Name  Xuất hiện box sau: Table4.1 H L1 = Y1 = 500 Giá trị san mũ : Ước lượng xu thế: Ước lượng mùa vụ: Dự báo p giai đoạn trong tương lai: )T Y)(-(1 S Y Y 1-t1-t s-t t t ))T-(1 )Y Y( T 1-t1-ttt ))S-(1 Y Y S s-t t t t ps-tttpt S)pT Y( W : giá trị san mũ Tt : ước lượng xu thế St : ước lượng mùa vụ : hệ số san mũ của giá trị trung bình : hệ số san mũ của ước lượng xu thế : hệ số san mũ của ước lượng mùa vụ p : số giai đoạn dự báo trong tương lai s : độ dài mùa vụ Wt+p: giá trị dự báo Winter ở giai đoạn p tY Các hệ số , , và có thể được chọn theo chủ quan hoặc tối thiểu hóa sai số dự báo như MSE. Chọn giá trị ban đầu cho , T1, và S1:  Cách 1: Lấy quan sát thứ nhất, xu thế bằng 0, và chỉ số mùa vụ bằng 1.  Cách 2: Hồi quy Y = f(t), hằng số sẽ là ước lượng ban đầu của giá trị san mũ, hệ số dốc là ước lượng ban đầu cho xu thế. Giá trị ban đầu của thành phần mùa vụ từ các hệ số hồi quy của biến giả. 1Y Table4.1 H Quy trình thực hiện trên Eviews:  Quick/Series Statistics/Expone ntial Smoothing  Series Name  Xuất hiện box sau: Table4.1 H Phân tách thành phần chuỗi thời gian (decomposition forecast) Mô hình cộng (additive) Yt = Trt + Clt + Snt + Irt Mô hình nhân (Multiplicative) Yt = Trt. Clt. Snt. Irt 0100 200 300 400 500 600 700 800 900 1000 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 Month M on th ly S al es 4700 5200 5700 6200 6700 7200 7700 8200 8700 9200 9700 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 Phần mềm? ForecastX Crystal Ball