Nội dung:
Dự báo thô
Trung bình giản đơn
Trung bình di động đơn/kép
San mũ giản đơn
San mũ Holt/San mũ Winter
Phân tách chuỗi thời gian
Phần mềm ForecastX/Crystal Ball
                
              
                                            
                                
            
                       
            
                 54 trang
54 trang | 
Chia sẻ: thanhtuan.68 | Lượt xem: 4721 | Lượt tải: 1 
              
            Bạn đang xem trước 20 trang tài liệu Bài giảng Phân tích dữ liệu và dự báo - Bài giảng 3: Các mô hình dự báo giản đơn, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
PHÂN TÍCH DỮ LIỆU VÀ DỰ BÁO 
P.T.B 
KHOA KINH TẾ 
ptbinh[a-còng]ueh.edu.vn 
Bài giảng 3: Các mô hình dự báo giản đơn 
Nội dung: 
 Dự báo thô 
 Trung bình giản đơn 
 Trung bình di động đơn/kép 
 San mũ giản đơn 
 San mũ Holt/San mũ Winter 
 Phân tách chuỗi thời gian 
 Phần mềm ForecastX/Crystal Ball 
Phân biệt 3 phương pháp đơn giản: 
 Các phương pháp dự báo thô: Giả định dữ 
liệu gần nhất cung cáp các dự đoán tốt 
nhất tương lai. 
 Các phương pháp bình quân: Dự báo dựa 
trên giá trị trung bình của các quan 
sát quá khứ (tầm quan trọng như nhau). 
 Các phương pháp san mũ: Dự báo bằng 
cách lấy trung bình giá trị quá khứ của 
chuỗi dữ liệu với trọng số giảm dần 
(tầm quan trọng giảm dần). 
1. Một phương pháp dự báo được chọn dựa 
trên phân tích và cảm nhận của người 
làm dự báo về bản chất của dữ liệu. 
2. Bộ dữ liệu được chia thành 2 phần: 
Phần chạy thử và phần kiểm định. 
3. Phương pháp dự báo được chọn được sử 
dụng để tính các giá trị ước lượng 
cho phần chạy thử. 
Một chiến lược tốt để đánh giá dự báo 
thường gồm các bước sau (Hanke, 2005): 
4.Phương pháp được sử dụng 
để dự báo phần kiểm định 
của dữ liệu, và sai số dự 
báo được xác định và dùng 
để so sánh/đánh giá. 
5.Ra quyết định 
Dự báo thô (Naïve forecast) 
(hoặc simple random walk!!!) 
Thích hợp với các doanh nghiệp 
mới thành lập vì có rất ít dữ 
liệu. 
Giả định giai đoạn gần nhất là 
ước lượng tốt nhất cho tương lai: 
t1t YY
Ví dụ xem file Table4.1H 
100
200
300
400
500
600
700
800
2 4 6 8 10 12 14 16 18 20 22 24 26 28
SALES
Lấy dữ liệu trong giai đoạn 1996 – 
2001 là dữ liệu ước lượng, vậy giá 
trị dự báo 2002Q1 sẽ là: 
Sai số dự báo: e25 = 200, , e26 = -
250 
Kết hợp đồ thị thấy dữ liệu có xu 
thế, nên mô hình dự báo thô giản đơn 
sẽ dự báo “thấp”. 
2425
^
YY 650Y25
^
Để khắc phục nhược điểm của mô 
hình dự báo thô giản đơn ta có 
thể xem xét thêm xu hướng của 
nó như sau: 
Trong đó: P là tỷ lệ thay đổi 
giữa hai giai đoạn kế nhau 0 
P 1. 
P bao nhiêu là tốt nhất? 
)Y P(Y YY 1-ttt1t
Có khi người ta có thể sử 
dụng tỷ lệ thay đổi thay cho 
số thay đổi tuyệt đối: 
Dự báo thô cho dữ liệu mùa 
(không xu thế): 
1t
t
t1t
^
Y
Y
YY
3t1t
^
YY
Nếu dữ liệu mùa và có xu thế thì 
cách dự báo như thế sẽ dự báo 
“thấp”, vậy: 
Nếu dữ liệu theo tháng và có xu 
thế? 
4
)YY(...)YY(
YY
4t3t1tt
3t1t
^
4
)YY(
YY
4tt
3t1t
^
Table4.1 H 
c1t3&f6 
Trung bình giản đơn (simple 
average forecast) 
Công thức: 
t
1i
i1t Y
t
1
 Y
1t
Y Yt
 Y 1t
1t
2t
Phương pháp trung bình giản đơn 
phù hợp khi các nhân tố ảnh hưởng 
đến đối tượng dự báo có tính ổn 
định, và môi trường liên quan đến 
chuỗi dữ liệu là không thay đổi. 
Phương pháp trung bình giản đơn 
sử dụng giá trị trung bình của 
tất cả các quan sát quá khứ làm 
giá trị dự báo cho giai đoạn tiếp 
theo. Phù hợp với dữ liệu dừng. 
240
250
260
270
280
290
300
310
320
5 10 15 20 25 30
Table4.3 H 
Trung bình di động (moving 
average forecast) 
Quan tâm đến một số cố định các quan sát 
gần nhất. 
Khi có thêm một quan sát mới, ta có một giá 
trị trung bình mới. 
 Y^t+1 : giá trị dự báo giai đoạn tiếp theo 
 Yt : giá trị thực tại thời điểm t 
 k : hệ số trượt 
)k(MA
k
Y ... Y Y
 Y 1k-t1-tt1t
240
250
260
270
280
290
300
310
320
5 10 15 20 25 30
GALLONS @MOVAV(GALLONS,4)
Table4.3 H 
Công thức trên Eviews: @MOVAV(Yt,k) 
Chọn hệ số trượt bao nhiêu tùy vào độ 
dài của chu kỳ hay bản chất của dữ 
liệu. 
Để so sánh và chọn mô hình tốt, nên 
dựa vào các tiêu chí thống kê (RMSE). 
Thường dùng đối với dữ liệu quý hoặc 
tháng để làm trơn các thành phần 
trong chuỗi thời gian. 
Thường dùng với chuỗi dừng. 
Trung bình di động kép (double 
moving average forecast) 
Khi dữ liệu có xu thế tuyến tính thì 
ta sử dụng phương pháp bình phương di 
động điều chỉnh, được gọi là “trung 
bình di động kép”: 
k
Y ... Y Y
 Y M 1k-t1-tt1tt
k
M ... M M
 M 1k-t1-tt't
)M M(
1-k
2
 b 'ttt
'
tt
'
tttt M - 2M )M M( M a
pb a Y ttpt
Table4.4 H 
MSE = 133 
MSE = 63.7 
San mũ giản đơn (simple 
exponential smoothing forecast) 
Giống trung bình di động, được sử dụng 
khi dữ liệu không có yếu tố xu thế và 
mùa vụ. 
Trong khi MA chỉ dựa vào các quan sát 
gần nhất để dự báo, thì san mũ dựa vào 
tất cả các quan sát trước đó để dự báo 
nhưng với trọng số giảm dần. 
Giá trị dự báo tại bất kỳ thời 
điểm nào là giá trị trung bình có 
trọng số của tất cả các giá trị 
sẵn có trước đó. 
Giá trị càng xa hiện tại thì 
trọng số càng giảm. Nghĩa là, các 
quan sát gần nhất được cho là 
chứa đựng thông tin thích hợp 
nhất, và có ảnh hưởng lớn hơn các 
quan sát quá khứ. 
Quan sát gần nhất có trọng số 
(0< <1), quan sát kế tiếp là (1- 
), quan sát tiếp theo nữa là (1- 
)2,  
Trọng số được gọi là hệ số mũ. 
Mô hình san mũ giản đơn có thể 
được viết như sau: 
tt1t Y)-(1 Y Y
Phương trình này có thể được viết 
lại như sau: 
tt
ttt
ttt
tt1t
e Y 
)Y - Y( Y 
Y - Y Y 
Y)-(1 Y Y
 ... Y)-(1 Y)-(1 )Y-(1 Y 
...
Y)-(1 )Y-(1 Y 
]Y)-(1 Y)[-(1 Y 
Y)-(1 Y Y
Y)-(1 Y Y
3-t
3
2-t
2
1-tt
1-t
2
1-tt
1-t1-tt
tt1t
1-t1-tt
Tốc độ mà các quan sát quá khứ 
không còn tác động đến giá trị 
san mũ phụ thuộc vào . 
Chọn giá trị là vấn đề quan trọng 
nhất của phương pháp san mũ: 
 Nếu các dự đoán ổn định và biến 
đổi ngẫu nhiên ít, thì chọn 
nhỏ, ngược lại nên chọn lớn. 
 Một cách phổ biến để ước lượng 
là dựa vào một quy trình lặp đi 
lặp lại sao cho tối thiểu hóa MSE 
(hoặc RMSE). 
Có thể sử dụng phân tích độ nhạy 
để xác định hệ số san mũ tối ưu. 
Quy trình thực hiện trên Eviews: 
 Quick/Series 
Statistics/Exponential Smoothing 
 Series Name 
 Xuất hiện box sau: 
Chọn phương 
pháp (single) 
Chọn hệ số 
nếu không biết 
thì chọn E 
(Eviews sẽ ước 
tính) 
 Nhân tố thứ hai sau là việc chọn giá trị 
san mũ đầu tiên cho chuỗi giá trị san mũ 
(giá trị dự báo). 
 Lấy giá trị Y1: Gán cho Y1 trọng số quá lớn, 
nhưng ảnh hưởng này sẽ giảm khi t tăng. 
 Lấy giá trị trung bình của một số quan sát 
đầu tiên. 
 Cũng có thể chọn giá trị đầu tiên tối ưu 
bằng phân tích độ nhạy (cho cố định). 
1
^
Y
San mũ Holt (san mũ kép) 
Khi chuỗi thời gian có yếu tố xu thế 
(và không có yếu tố mùa vụ). 
Là một mở rộng của phương pháp san mũ 
giản đơn bằng việc đưa thêm một thừa 
số xu thế vào phương trình san mũ để 
điều chỉnh yếu tố xu thế. 
3 phương trình và 2 hằng số san mũ 
được sử dụng trong mô hình Holt như 
sau: 
Giá trị san mũ (giá trị trung bình) 
Ước lượng xu thế: 
Giá trị dự báo giai đoạn p trong 
tương lai: 
))T-(1 )Y Y( T 1-t1-ttt
ttpt pT Y H
)T Y)(-(1 Y Y 1-t1-ttt
 : giá trị san mũ giai đoạn t 
 Yt : giá trị thực giai đoạn t 
 Tt : giá trị ước lượng xu thế 
 : hệ số san mũ của ước lượng giá trị 
 trung bình 
 : hệ số san mũ của ước lượng giá trị 
 xu thế 
 p : số giai đoạn dự báo trong tương lai 
 Ht+p : giá trị dự báo Holt ở giai đoạn p 
tY
Hệ số và có thể được chọn 
theo chủ quan hoặc tối thiểu hóa 
sai số dự báo như MSE: Khi có 
thay đổi lớn trong giá trị các 
thành phần thì sử dụng trọng số 
lớn, và ngược lại. 
Có thể áp dụng phân tích độ nhạy 
hai chiều trên Excel. 
Chọn giá trị ban đầu cho: 
 Cách 1: Lấy quan sát thứ nhất, và 
xu thế bằng 0. 
 Cách 2: Trung bình của 5 hoặc 6 
quan sát đầu tiên và xu thế là hệ 
số gốc của đường xu thế của các 
quan sát này. 
 Cách 3: Hệ số cắt và hệ số gốc của 
đường xu thế tương ứng là giá trị 
ban đầu và giá trị xu thế ban đầu. 
tY
Quy trình thực 
hiện trên Eviews: 
 Quick/Series 
Statistics/Expon
ential Smoothing 
 Series Name 
 Xuất hiện box 
sau: 
Table4.1 H 
L1 = Y1 
= 500 
Giá trị san mũ : 
Ước lượng xu thế: 
Ước lượng mùa vụ: 
Dự báo p giai đoạn trong tương lai: 
)T Y)(-(1 
S
Y
 Y 1-t1-t
s-t
t
t
))T-(1 )Y Y( T 1-t1-ttt
))S-(1 
Y
Y
 S s-t
t
t
t
ps-tttpt S)pT Y( W
 : giá trị san mũ 
 Tt : ước lượng xu thế 
 St : ước lượng mùa vụ 
 : hệ số san mũ của giá trị trung bình 
 : hệ số san mũ của ước lượng xu thế 
 : hệ số san mũ của ước lượng mùa vụ 
 p : số giai đoạn dự báo trong tương lai 
 s : độ dài mùa vụ 
 Wt+p: giá trị dự báo Winter ở giai đoạn p 
tY
Các hệ số , , và có thể được chọn 
theo chủ quan hoặc tối thiểu hóa sai 
số dự báo như MSE. 
Chọn giá trị ban đầu cho , T1, và S1: 
 Cách 1: Lấy quan sát thứ nhất, xu thế 
bằng 0, và chỉ số mùa vụ bằng 1. 
 Cách 2: Hồi quy Y = f(t), hằng số sẽ là 
ước lượng ban đầu của giá trị san mũ, 
hệ số dốc là ước lượng ban đầu cho xu 
thế. Giá trị ban đầu của thành phần mùa 
vụ từ các hệ số hồi quy của biến giả. 
1Y
Table4.1 H 
Quy trình thực 
hiện trên 
Eviews: 
 Quick/Series 
Statistics/Expone
ntial Smoothing 
 Series Name 
 Xuất hiện box 
sau: 
Table4.1 H 
Phân tách thành phần chuỗi thời 
gian (decomposition forecast) 
Mô hình cộng (additive) 
 Yt = Trt + Clt + Snt + Irt 
Mô hình nhân (Multiplicative) 
 Yt = Trt. Clt. Snt. Irt 
0100
200
300
400
500
600
700
800
900
1000
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76
Month
M
on
th
ly
 S
al
es
4700
5200
5700
6200
6700
7200
7700
8200
8700
9200
9700
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79
Phần mềm? 
ForecastX 
Crystal Ball