Nội dung:
Dự báo thô
Trung bình giản đơn
Trung bình di động đơn/kép
San mũ giản đơn
San mũ Holt/San mũ Winter
Phân tách chuỗi thời gian
Phần mềm ForecastX/Crystal Ball
54 trang |
Chia sẻ: thanhtuan.68 | Lượt xem: 4208 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Bài giảng Phân tích dữ liệu và dự báo - Bài giảng 3: Các mô hình dự báo giản đơn, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
PHÂN TÍCH DỮ LIỆU VÀ DỰ BÁO
P.T.B
KHOA KINH TẾ
ptbinh[a-còng]ueh.edu.vn
Bài giảng 3: Các mô hình dự báo giản đơn
Nội dung:
Dự báo thô
Trung bình giản đơn
Trung bình di động đơn/kép
San mũ giản đơn
San mũ Holt/San mũ Winter
Phân tách chuỗi thời gian
Phần mềm ForecastX/Crystal Ball
Phân biệt 3 phương pháp đơn giản:
Các phương pháp dự báo thô: Giả định dữ
liệu gần nhất cung cáp các dự đoán tốt
nhất tương lai.
Các phương pháp bình quân: Dự báo dựa
trên giá trị trung bình của các quan
sát quá khứ (tầm quan trọng như nhau).
Các phương pháp san mũ: Dự báo bằng
cách lấy trung bình giá trị quá khứ của
chuỗi dữ liệu với trọng số giảm dần
(tầm quan trọng giảm dần).
1. Một phương pháp dự báo được chọn dựa
trên phân tích và cảm nhận của người
làm dự báo về bản chất của dữ liệu.
2. Bộ dữ liệu được chia thành 2 phần:
Phần chạy thử và phần kiểm định.
3. Phương pháp dự báo được chọn được sử
dụng để tính các giá trị ước lượng
cho phần chạy thử.
Một chiến lược tốt để đánh giá dự báo
thường gồm các bước sau (Hanke, 2005):
4.Phương pháp được sử dụng
để dự báo phần kiểm định
của dữ liệu, và sai số dự
báo được xác định và dùng
để so sánh/đánh giá.
5.Ra quyết định
Dự báo thô (Naïve forecast)
(hoặc simple random walk!!!)
Thích hợp với các doanh nghiệp
mới thành lập vì có rất ít dữ
liệu.
Giả định giai đoạn gần nhất là
ước lượng tốt nhất cho tương lai:
t1t YY
Ví dụ xem file Table4.1H
100
200
300
400
500
600
700
800
2 4 6 8 10 12 14 16 18 20 22 24 26 28
SALES
Lấy dữ liệu trong giai đoạn 1996 –
2001 là dữ liệu ước lượng, vậy giá
trị dự báo 2002Q1 sẽ là:
Sai số dự báo: e25 = 200, , e26 = -
250
Kết hợp đồ thị thấy dữ liệu có xu
thế, nên mô hình dự báo thô giản đơn
sẽ dự báo “thấp”.
2425
^
YY 650Y25
^
Để khắc phục nhược điểm của mô
hình dự báo thô giản đơn ta có
thể xem xét thêm xu hướng của
nó như sau:
Trong đó: P là tỷ lệ thay đổi
giữa hai giai đoạn kế nhau 0
P 1.
P bao nhiêu là tốt nhất?
)Y P(Y YY 1-ttt1t
Có khi người ta có thể sử
dụng tỷ lệ thay đổi thay cho
số thay đổi tuyệt đối:
Dự báo thô cho dữ liệu mùa
(không xu thế):
1t
t
t1t
^
Y
Y
YY
3t1t
^
YY
Nếu dữ liệu mùa và có xu thế thì
cách dự báo như thế sẽ dự báo
“thấp”, vậy:
Nếu dữ liệu theo tháng và có xu
thế?
4
)YY(...)YY(
YY
4t3t1tt
3t1t
^
4
)YY(
YY
4tt
3t1t
^
Table4.1 H
c1t3&f6
Trung bình giản đơn (simple
average forecast)
Công thức:
t
1i
i1t Y
t
1
Y
1t
Y Yt
Y 1t
1t
2t
Phương pháp trung bình giản đơn
phù hợp khi các nhân tố ảnh hưởng
đến đối tượng dự báo có tính ổn
định, và môi trường liên quan đến
chuỗi dữ liệu là không thay đổi.
Phương pháp trung bình giản đơn
sử dụng giá trị trung bình của
tất cả các quan sát quá khứ làm
giá trị dự báo cho giai đoạn tiếp
theo. Phù hợp với dữ liệu dừng.
240
250
260
270
280
290
300
310
320
5 10 15 20 25 30
Table4.3 H
Trung bình di động (moving
average forecast)
Quan tâm đến một số cố định các quan sát
gần nhất.
Khi có thêm một quan sát mới, ta có một giá
trị trung bình mới.
Y^t+1 : giá trị dự báo giai đoạn tiếp theo
Yt : giá trị thực tại thời điểm t
k : hệ số trượt
)k(MA
k
Y ... Y Y
Y 1k-t1-tt1t
240
250
260
270
280
290
300
310
320
5 10 15 20 25 30
GALLONS @MOVAV(GALLONS,4)
Table4.3 H
Công thức trên Eviews: @MOVAV(Yt,k)
Chọn hệ số trượt bao nhiêu tùy vào độ
dài của chu kỳ hay bản chất của dữ
liệu.
Để so sánh và chọn mô hình tốt, nên
dựa vào các tiêu chí thống kê (RMSE).
Thường dùng đối với dữ liệu quý hoặc
tháng để làm trơn các thành phần
trong chuỗi thời gian.
Thường dùng với chuỗi dừng.
Trung bình di động kép (double
moving average forecast)
Khi dữ liệu có xu thế tuyến tính thì
ta sử dụng phương pháp bình phương di
động điều chỉnh, được gọi là “trung
bình di động kép”:
k
Y ... Y Y
Y M 1k-t1-tt1tt
k
M ... M M
M 1k-t1-tt't
)M M(
1-k
2
b 'ttt
'
tt
'
tttt M - 2M )M M( M a
pb a Y ttpt
Table4.4 H
MSE = 133
MSE = 63.7
San mũ giản đơn (simple
exponential smoothing forecast)
Giống trung bình di động, được sử dụng
khi dữ liệu không có yếu tố xu thế và
mùa vụ.
Trong khi MA chỉ dựa vào các quan sát
gần nhất để dự báo, thì san mũ dựa vào
tất cả các quan sát trước đó để dự báo
nhưng với trọng số giảm dần.
Giá trị dự báo tại bất kỳ thời
điểm nào là giá trị trung bình có
trọng số của tất cả các giá trị
sẵn có trước đó.
Giá trị càng xa hiện tại thì
trọng số càng giảm. Nghĩa là, các
quan sát gần nhất được cho là
chứa đựng thông tin thích hợp
nhất, và có ảnh hưởng lớn hơn các
quan sát quá khứ.
Quan sát gần nhất có trọng số
(0< <1), quan sát kế tiếp là (1-
), quan sát tiếp theo nữa là (1-
)2,
Trọng số được gọi là hệ số mũ.
Mô hình san mũ giản đơn có thể
được viết như sau:
tt1t Y)-(1 Y Y
Phương trình này có thể được viết
lại như sau:
tt
ttt
ttt
tt1t
e Y
)Y - Y( Y
Y - Y Y
Y)-(1 Y Y
... Y)-(1 Y)-(1 )Y-(1 Y
...
Y)-(1 )Y-(1 Y
]Y)-(1 Y)[-(1 Y
Y)-(1 Y Y
Y)-(1 Y Y
3-t
3
2-t
2
1-tt
1-t
2
1-tt
1-t1-tt
tt1t
1-t1-tt
Tốc độ mà các quan sát quá khứ
không còn tác động đến giá trị
san mũ phụ thuộc vào .
Chọn giá trị là vấn đề quan trọng
nhất của phương pháp san mũ:
Nếu các dự đoán ổn định và biến
đổi ngẫu nhiên ít, thì chọn
nhỏ, ngược lại nên chọn lớn.
Một cách phổ biến để ước lượng
là dựa vào một quy trình lặp đi
lặp lại sao cho tối thiểu hóa MSE
(hoặc RMSE).
Có thể sử dụng phân tích độ nhạy
để xác định hệ số san mũ tối ưu.
Quy trình thực hiện trên Eviews:
Quick/Series
Statistics/Exponential Smoothing
Series Name
Xuất hiện box sau:
Chọn phương
pháp (single)
Chọn hệ số
nếu không biết
thì chọn E
(Eviews sẽ ước
tính)
Nhân tố thứ hai sau là việc chọn giá trị
san mũ đầu tiên cho chuỗi giá trị san mũ
(giá trị dự báo).
Lấy giá trị Y1: Gán cho Y1 trọng số quá lớn,
nhưng ảnh hưởng này sẽ giảm khi t tăng.
Lấy giá trị trung bình của một số quan sát
đầu tiên.
Cũng có thể chọn giá trị đầu tiên tối ưu
bằng phân tích độ nhạy (cho cố định).
1
^
Y
San mũ Holt (san mũ kép)
Khi chuỗi thời gian có yếu tố xu thế
(và không có yếu tố mùa vụ).
Là một mở rộng của phương pháp san mũ
giản đơn bằng việc đưa thêm một thừa
số xu thế vào phương trình san mũ để
điều chỉnh yếu tố xu thế.
3 phương trình và 2 hằng số san mũ
được sử dụng trong mô hình Holt như
sau:
Giá trị san mũ (giá trị trung bình)
Ước lượng xu thế:
Giá trị dự báo giai đoạn p trong
tương lai:
))T-(1 )Y Y( T 1-t1-ttt
ttpt pT Y H
)T Y)(-(1 Y Y 1-t1-ttt
: giá trị san mũ giai đoạn t
Yt : giá trị thực giai đoạn t
Tt : giá trị ước lượng xu thế
: hệ số san mũ của ước lượng giá trị
trung bình
: hệ số san mũ của ước lượng giá trị
xu thế
p : số giai đoạn dự báo trong tương lai
Ht+p : giá trị dự báo Holt ở giai đoạn p
tY
Hệ số và có thể được chọn
theo chủ quan hoặc tối thiểu hóa
sai số dự báo như MSE: Khi có
thay đổi lớn trong giá trị các
thành phần thì sử dụng trọng số
lớn, và ngược lại.
Có thể áp dụng phân tích độ nhạy
hai chiều trên Excel.
Chọn giá trị ban đầu cho:
Cách 1: Lấy quan sát thứ nhất, và
xu thế bằng 0.
Cách 2: Trung bình của 5 hoặc 6
quan sát đầu tiên và xu thế là hệ
số gốc của đường xu thế của các
quan sát này.
Cách 3: Hệ số cắt và hệ số gốc của
đường xu thế tương ứng là giá trị
ban đầu và giá trị xu thế ban đầu.
tY
Quy trình thực
hiện trên Eviews:
Quick/Series
Statistics/Expon
ential Smoothing
Series Name
Xuất hiện box
sau:
Table4.1 H
L1 = Y1
= 500
Giá trị san mũ :
Ước lượng xu thế:
Ước lượng mùa vụ:
Dự báo p giai đoạn trong tương lai:
)T Y)(-(1
S
Y
Y 1-t1-t
s-t
t
t
))T-(1 )Y Y( T 1-t1-ttt
))S-(1
Y
Y
S s-t
t
t
t
ps-tttpt S)pT Y( W
: giá trị san mũ
Tt : ước lượng xu thế
St : ước lượng mùa vụ
: hệ số san mũ của giá trị trung bình
: hệ số san mũ của ước lượng xu thế
: hệ số san mũ của ước lượng mùa vụ
p : số giai đoạn dự báo trong tương lai
s : độ dài mùa vụ
Wt+p: giá trị dự báo Winter ở giai đoạn p
tY
Các hệ số , , và có thể được chọn
theo chủ quan hoặc tối thiểu hóa sai
số dự báo như MSE.
Chọn giá trị ban đầu cho , T1, và S1:
Cách 1: Lấy quan sát thứ nhất, xu thế
bằng 0, và chỉ số mùa vụ bằng 1.
Cách 2: Hồi quy Y = f(t), hằng số sẽ là
ước lượng ban đầu của giá trị san mũ,
hệ số dốc là ước lượng ban đầu cho xu
thế. Giá trị ban đầu của thành phần mùa
vụ từ các hệ số hồi quy của biến giả.
1Y
Table4.1 H
Quy trình thực
hiện trên
Eviews:
Quick/Series
Statistics/Expone
ntial Smoothing
Series Name
Xuất hiện box
sau:
Table4.1 H
Phân tách thành phần chuỗi thời
gian (decomposition forecast)
Mô hình cộng (additive)
Yt = Trt + Clt + Snt + Irt
Mô hình nhân (Multiplicative)
Yt = Trt. Clt. Snt. Irt
0100
200
300
400
500
600
700
800
900
1000
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76
Month
M
on
th
ly
S
al
es
4700
5200
5700
6200
6700
7200
7700
8200
8700
9200
9700
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79
Phần mềm?
ForecastX
Crystal Ball