Định nghĩa:
- Chuỗi tuần tựtheo thời gian là một chuỗi các gía trịcủa một đại lượng nào đó
được ghi nhận tuần tựtheo thời gian.
Ví dụ:
• Sốlượng hàng bán được trong 12 tháng của một công ty.
- Các gía trịcủa chuỗi tuần tựtheo thời gian của đại lượng X được ký hiệu X1,
X2, , Xt, . Xn, với Xt, là gía trịquan sát của X ởthời điểm t.
8.1.2 Các thành phần của chuỗi tuần tựtheo thời gian: (Components of
time series)
Các nhà thống kê thường chia chuỗi tuần tựtheo thời gian ra làm 4 thành phần:
- Thành phần xu hướng dài hạn (long-term trend component)
- Thành phần mùa (Seasonal component)
- Thành phần chu kỳ(Cyclical component)
- Thành phần bất thường (irregular component)
14 trang |
Chia sẻ: haohao89 | Lượt xem: 2432 | Lượt tải: 3
Bạn đang xem nội dung tài liệu Phân tích chuỗi tuần tự theo thời gian và dự báo, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Cao Hào Thi 1
Chương 10
PHÂN TÍCH CHUỖI TUẦN TỰ THEO THỜI GIAN VÀ DỰ
BÁO
( Time seties Analysis and Forecoasting)
8.1 Chuỗi tuần tự theo thời gian ( Time series)
8.1.1 Định nghĩa:
- Chuỗi tuần tự theo thời gian là một chuỗi các gía trị của một đại lượng nào đó
được ghi nhận tuần tự theo thời gian.
Ví dụ:
• Số lượng hàng bán được trong 12 tháng của một công ty.
- Các gía trị của chuỗi tuần tự theo thời gian của đại lượng X được ký hiệu X1,
X2, ………, Xt, …. Xn, với Xt, là gía trị quan sát của X ở thời điểm t.
8.1.2 Các thành phần của chuỗi tuần tự theo thời gian: (Components of
time series)
Các nhà thống kê thường chia chuỗi tuần tự theo thời gian ra làm 4 thành phần:
- Thành phần xu hướng dài hạn (long-term trend component)
- Thành phần mùa (Seasonal component)
- Thành phần chu kỳ (Cyclical component)
- Thành phần bất thường (irregular component)
8.1.2.1 Thành phần xu hướng dài hạn:
Thành phần này dùng để chỉ xu hướng tăng giảm của đại lượng X trong khoảng
thời gian dài. Về mặt đồ thị thành phần này có thể diễn tả bằng một đường thẳng hay
bằng một đường cong tròn (Smooth curve)
8.1.2.2 Thành phần mùa:
Thành phần này chỉ sự thay đổi của đại lượng X theo các mùa trong năm (có thể
theo các tháng trong năm)
t
Xt
X
t
Xu hướng giảm theo thời gian
Cao Hào Thi 2
Ví dụ:
- Lượng tiêu thụ chất đốt sẽ tăng vào mùa đông và sẽ giảm vào mùa hè. Ngược
lại lượng tiêu thụ xăng sẽ tăng vào mùa hè và giảm vào mùa đông
- Lượng tiêu thụ đồ dùng học tập sẽ tăng vào mùa khai trường
8.1.2.3 Thành phần chu kỳ:
Thành phần này chỉ thay đổi của đại lượng X theo chu kỳ. Sự khác biệt của thành
phần này so với thành phần mùa là chu kỳ của nó dài hơn một năm. Để đánh gía thành
phần chu kỳ các gía trị của chuỗi tuần tự theo thời gian sẽ được quan sát hằng năm
Ví dụ:
Lượng dòng chảy đến hồ chứa Trị An từ năm 1959 đến 1985
8.1.2.4 Thành phần bất thường:
Thành phần này dùng để chỉ những sự thay đổi bất thường của các gía trị trong
chuỗi tuần tự theo thời gian. Sự thay đổi này không thể dự đoán bằng các số liệu kinh
nghiệm trong qúa khứ, về mặt bản chất này không có tính chu kỳ.
t
Chất
đốt
Xu hướng tăng theo thời gian
Thay đổi theo mùa
6 12 6 12 6 12
t (năm)
1985
Q
(m3/s)
1959 1960
Cao Hào Thi 3
8.1.3 Mô hình hóa việc dự báo gía trị của đại lượng X
8.1.3.1 Mô hình nhân: ( Multiplicative model)
Xt: Gía tị của đại lượng X ở thời điểm t
Tt: Gía trị của thành phần xu hướng ở thời điểm t. Tt có cùng đơn vị với Xt
St, Ct, It: là các hệ số đánh gía ảnh hưởng của các thành phần mùa, thành phần
chu kỳ và thành phần bất kỳ đến gía trị của X ở thời điểm t.
Trong thực tế việc xác định It rất khó khăn nên thường được bỏ qua, khi đó:
8.1.3.2 Mô hình cộng: (Additive model)
Xt: gía trị của đại lượng X ở thời điểm t
Tt, St, Ct, It: Gía trị của thành phần xu hướng, mùa, chu kỳ và bất thường ở thời
điểm t.
Trong thực tế, để dự báo gía trị của đại lượng X ta có thể phối hợp cả 2 loại mô
hình trên.
8.2. Các phương pháp làm trơn: (Smoothing methods)
Trong một số chuỡi tuần tự theo thời gian thành phần mùa và thành phần bất
thường thay đổi quá lớn làm cho việc xác định thành phần xu hướng và thành phần chu
kỳ gặp nhiều khó khăn. Sự thay đổi lớn này có thể được giảm nhỏ bằng các phương pháp
làm trơn. Các phương pháp làm trơn được đề cập trong chương này gồm phương pháp
trung bình dịch chuyển và phương pháp làm trơn bằng hàm số mũ. (Moving average and
exponential smoothing methods)
8.2.1 Phương pháp trung bình dịch chuyển: (Trung bình trượt – Moving
average)
Nội dung của phương pháp này là thay thế gía trị quan sát Xt bằng gía trị trung
bình của chính nó với m gía trị trước nó và m gía trị sau nó. Nghĩa là thay Xt bằng X*t,
với:
Xt* = ∑
−=
++
m
mj
jtX1m2
1
Xt = Tt * St * Ct * It
Xt = Tt * St *Ct
Xt = Tt + St + Ct + It
Xt* = 1m2
XX...X...XX mt1mtt1mtmt
+
++++++ +−++−−
Cao Hào Thi 4
X*t : là gía trị trung bình dịch chuyển của (2m+1) điểm
Ví dụ:
Nếu m =2, ta có gía trị trung bình trượt của 5 điểm được tính theo công thức:
Xt* = 5
XXXXX 2t1tt2t 1t ++− ++++ −
Nếu t = 3
X*3 = 5
XXXXX
54321
++++
8.2.2 Phương pháp làm trơn bằng hàm số mũ đơn giản:
(Simple exponential smoothing method)
Phương pháp làm trơn hàm số mũ tiến hành dựa trên việc xem xét một cách liên
tục các gía trị của quá khứ, dựa trên trung bình có trọng số của chuỗi dữ liệu. Trong
phương pháp này trọng số có gía trị càng nhỏ khi nó càng cách xa thời điểm dự báo. Với
ý nghĩa trên ta có:
tX = α Xt + (1-α) α Xt-1 + (1-α)2 α Xt-2 + (1-α)3 α Xt-3 +…+(1-α)t-1 α X1
Tương Tự
1
2t
4t
3
3t
2
2t1t1t X)1(......X)1(X)1(X)1(XX αα−++αα−+αα−+αα−+α= −−−−−−
1
1
3
3
2
2
11 )1(....)1()1()1()1( XXXXX
t
tttt ααααααααα −−−−− −++−+−+−=−
Từ các phương trình trên ta có:
Trong tóm tắt ta lấy
122 )1( XXX αα −+=
233 )1( XXX αα −+=
. . . . . . . . . . . . .
1ttt X)1(XX −α−+α=
. . . . . . . . . . . . . .
1nnn X)1(XX −α−+α=
Ví dụ:
Bảng số liệu sau đây cho thấy số lượng máy tính được bán ra của cửa hàng trong
24 tháng vừa qua.
a) Tìm chuỗi thời gian trung bình trượt 5 tháng
b) Tìm các gía trị trung bình bằng phương pháp làm trơn hàm mũ với hệ số làm trơn
1ttt X)1(XX −α−+α=
Với 10 ≤α≤
α: hằng số làm trơn (Smoothing Constant)
1XX = Và các trị số Xt được lấy từ số liệu quan sát
Hàm 2
Cho (1-α)
Cao Hào Thi 5
c)
STT
t
Tháng Số liệu quan sát
Xt
Số trung bình
trượt 5 tháng X*t
Số trung bình bằng PP
làm trơn hàm mũ Xt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
2 năm trước
Một
Hai
Ba
Tư
Năm
Sáu
Bảy
Tám
Chín
Mười
Mười Một
Mười Hai
1 năm trước
Môt
Hai
Ba
Tư
Năm
Sáu
Bảy
Tám
Chín
Mười
Mười một
Mười hai
21
20
19
18
14
15
22
28
25
25
25
20
25
25
24
28
36
32
25
23
22
23
22
27
18,4
17,2
17,6
19,4
20,8
23,0
25,0
24,6
24,0
24,0
23,8
24,4
27,6
29,0
29,0
28,8
27,6
25,0
23,0
23,4
21,0
20,0
19,8
18,9
16,5
15,8
18,9
23,5
24,3
24,7
24,9
22,5
23,8
24,4
24,2
26,1
31,0
31,5
28,3
25,7
23,8
23,4
22,7
24,9
8.3 Dự báo:
8.3.1 Khái niệm chung :
Dự báo là khả năng nhận thức được sự vận động của các đối tượng nghiên cứu
trong tương lai dựa trên sự phân tích chuỗi thông tin quá khứ và hiện tại. Cho đến nay,
nhu cầu dự báo đã trở nên hết sức cần thiết ở mỗi lĩnh vực.
8.3.1.1 Bản chất các khái niệm liên quan đến dự báo:
8.3.1.1.1 Tiên đoán (Predicting)
Đoán trước sự vận động của đối tượng nghiên cứu trong tương lai. Đó là kết quả
nhận thức chủ quan của con người dựa trên một số cơ sở nhất định. Có thể nêu mức độ
tiên đoán ở 3 khía cạnh.
Cao Hào Thi 6
a) Tiên đoán không tưởng:
Đó là những tiên đoán không có cơ sở khoa học, chỉ dựa trên những mối liên hệ
không tưởng thiếu căn cứ.
b) Tiên đoán kinh nghiệm:
Đó là những tiên đoán dựa trên chuỗi thông tin lịch sử. Mức độ ít nhiều có cơ sở
khách quan, tuy nhiên có nhược điểm là loại tiên đoán này không giải thích được xu thế
vận động của đối tượng nghiên cứu và đa số dừng lại ở bước định tính.
c) Tiên đoán khoa học:
Đó là tiên đoán dựa trên phân tích mối liên hệ qua lại giữa các đối tượng nghiên
cứu và phương pháp xử lý thông tin khoa học nhằm phát hiện tính quy luật của đối tượng
.
8.3.1.1.2 Dự báo (Forecasting)
Dự báo là tiên đoán khoa học mang tính xác suất và tính phương án trong khoảng
thời gian hữu hạn về tương lai phát triển của đối tượng nghiên cứu.
a) Tính xác suất :
Do dự báo dựa trên việc xử lý chuỗi thông tin bao gồm cả 2 yếu tố xu thế phát
triển và yếu tố ngẫu nhiên, vì vậy kết quả dự báo so với thực tế có sự chên lệch mang tính
xác suất.
b) Tính chất phương án:
Dự báo được thể hiện bằng nhiều dạng kết quả có thể xảy ra trong tương lai (dạng
định tính, dạng định lượng, dạng khoảng, dạng điểm, …)
c) Tính chất thời gian hữu hạn:
Sự chênh lệch giữa thời điểm dự báo và thời điểm hiện tại được gọi là khoảng
cách dự báo (tầm xa dự báo l), khoảng cách này không thể tùy tiện mà nó phụ thuộc vào
mức độ ổn định của đối tượng nghiên cứu trong quá trình phát triển . Vì vậy dự báo được
tiến hành với khoảng cách dự báo thích hợp tương ứng một khoảng thời gian hữu hạn nào
đó.
8.3.1.2 Phân loại dự báo :
a) Dựa vào thời gian :
Căn cứ vào khoảng cách dự báo, người ta chia dự báo thành 2 loại chính:
- Dự báo ngắn hạn : Khoảng cách dự đoán ngắn hạn dùng cho cấp quản lý trung
bình và thấp, cho chiến lược tức thời.
- Dự báo dài hạn : Khoảng cách dự báo dài dùng cho quản lý cấp cao, cho các
đối tượng nghiên cứu mang tầm cỡ chiến lược.
Cao Hào Thi 7
b) Dựa theo kết quả :
- Dự báo điểm : Kết quả dự báo được thể hiện bằng một giá trị duy nhất.
Ft+l : giá trị dự báo thời điểm t+l.
- Dự báo khoảng : Kết quả dự báo được thể hiện dưới dạng khoảng tin cậy với
xác suất xảy ra được chủ định.
c) Dựa theo đối tượng nghiên cứu:
- Dự báo tài nguyên.
- Dự báo khoa học kỹ thuật.
- Dự báo dân số lao động.
- Dự báo xã hội.
- Dự báo thị trường…
8.3.2 Các bước dự báo:
Công tác dự báo gồm 4 bước:
8.3.2.1 Thu thập số liệu:
Yêu cầu phải có số liệu
- Chính xác
- Đúng mục đích dự báo
Đây là phần khó khăn và tốn thời gian.
8.3.2.2 Xử lý sơ bộ số liệu:
- Bỏ những số liệu không cần thiết, không chính xác.
- Bổ xung những số liệu còn thiếu.
- Chia tập số liệu thành 2 nhóm : nhóm đầu và nhóm kiểm tra.
8.3.2.3 Lựa chọn phương pháp và xây dựng mô hình dự báo
- Phương pháp dự báo được chọn sao cho phù hợp với số kiệu thuộc nhóm đầu
và với đối tượng nghiên cứu.
- Lập mô hình dự báo sao cho sai số dự báo là nhỏ nhất. Sai số dự báo được
kiểm định bởi nhóm số liệu kiểm tra.
8.3.2.4 Dự báo:
- Từ mô hình dự báo xác định giá trị dự báo
- Phân tích kết quả nhận được.
F t+l = A
Ft+l = A ε±
Cao Hào Thi 8
8.3.3 Các phương pháp dự báo thông dụng:
Các phương pháp dự báo thường dùng có thể chia làm 3 loại:
- Phương pháp giản đơn (naive method)
- Phương pháp trung bình (average method)
- Phương pháp làm trơn (smoothing method)
8.3.3.1 Phương pháp dự báo giản đơn:
A. Phương pháp 1:
Trong phương pháp này người ta giả thiết giá trị gần đây nhất là giá trị
đúng nhất cho tương lai.
Ft+1 : là giá trị dự báo ở thời điểm t+1
Xt : là trị quan sát được ở thời điểm t
Nhận Xét:
- Đây là mô hình đơn giản nhất. Mô hình này không thể hiện được các
thành phần của chuỗi thời gian.
- Để đánh giá độ chính xác của công tác dự báo người ta phải tính sai số dự
báo e.
Ví dụ:
Lượng hàng bán ra theo qúy của một công ty từ năm 1979 đến 1985 được cho trong
bảng số liệu.
Dựa vào bảng số liệu lập mô hình dự báo lượng hàng bán ra theo quý trong tương
lai.
Năm Quý T Lương sp
bán được
1979
1980
1981
1
2
3
4
1
2
3
4
1
2
1
2
3
4
5
6
7
8
9
10
500
350
250
400
450
350
200
300
350
200
Ft+1 = Xt
et+1 = Xt+1 – Ft+1
Cao Hào Thi 9
1982
1983
1984
1985
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
150
400
550
350
250
550
550
400
350
600
750
500
400
650
850
600
450
700
Giải:
Nếu chúng ta sử dụng số liệu từ năm 1979 đến năm 1984 làm phần đầu của nhóm
số liệu và sử dụng số liệu năm 1985 là phần kiểm tra
Giá trị dự báo cho quí I năm 1985 (thời điểm 25)
F25 = F24 + 1 = X24 = 650
Sai số dự báo ở thời điểm 25 là
e25 = X25 – F25 = 850 – 650 = 200
Tương tự, giá trị dự báo cho quí II năm 1985 (thời điểm 26) là
F26 = X25 = 850
Sai số dự báo ở thời điểm 26 là
e26 = X26 – F26 = 600 –850 = -250
Nhận Xét: Sai số lớn cần phải sửa đổi mô hình.
B. Phương pháp 2:
Trong phương pháp này, người ta thêm vào các số hạng để đánh giá ảnh
hưởng của thành phần xu hướng trong chuỗi thời gian. Mô hình có thể có dạng:
Cao Hào Thi 10
a)
Đánh giá ảnh hưởng của thành phần xu hướng
Ví dụ:
Giá trị dự báo ở thời điểm 25
F25 = X24 + ( X24 - X23 )
= 650 + ( 650 – 400)
F25 = 900
Sai số dự báo ở thời điểm 25
E25 = X25 - F25
= 850 - 900
e25 = -50
b)
Ví dụ:
F25 = X24 *
23
24
X
X
= 650 *
400
650
F25 = 1050
e25 = X25 - F25
= 850 -1056
e25 = -206
C. Phương pháp 3:
Trong phương pháp này, người ta có chú ý đến ảnh hưởng của thành
phần mùa trong chuỗi thời gian.
Ft+1 = Xt + ( Xt – Xt – 1)
Ft+1 = Xt *
1t
t
X
X
−
Ft+1 = Xt-3
Cao Hào Thi 11
Với công thức này lượng sản phẩm bán ra ở quý dự báo bằng lượng sản
phẩm bán ra trong quý tương ứng ở năm trước đó. Nhược điểm của phương pháp này là
không chú ý tới tác động khác nhau giữa các năm và thành phần xu hướng.
Ví dụ:
F25 = X21 = 750
e25 = X25 - F25
= 850 – 750
e25 = 100
D. Phương pháp 4:
Trong phương pháp này, người ta chú ý đến ảnh hưởng của thành phần mùa
và thành phần xu hướng của chuỗi thời gian.
Ví dụ:
F25 = X21 + 4
)XX()XX)XX()XX( 2021212222232324 −+−+−+−
= 750 +
4
)600750()750500()500400()400650( −+−+−+−
= 750 +12,5
F25 = 762,5
e25 = X25 - F25
= 850 - 762.5
e25 = 87.5
Ft+1 = Xt-3 + 4
)XX(...)XX( 4t3t1tt −−− −++−
T/phần mùa Giá trị trung bình của sự thay đổi của 4
qúy gần nhất T/phần xu hướng
Cao Hào Thi 12
Nhận xét chung:
Phương pháp Naive có ưu điểm đơn giản và phù hợp cho những phân tích
ban đầu nhưng sai số lớn.
8.3.3.2 Các phương pháp trung bình:
a. Phương pháp trung bình giản đơn:
Trong phương pháp này, người ta sử dụng giá trị trung bình của toàn bộ
số liệu đã có trước thời điểm dự báo làm giá trị dự báo.
Ví dụ: giá trị dự báo cho quí I/1985 (thời điểm t = 25)
F25 = 24
1 ∑
=
24
1t
tX
= )9800(*
24
1
F25 = 408,33
e25 = X25 – F25
= 850 – 408,33
e25 = 441,67
Giá trị dự báo cho quí II/1985 (thời điểm t = 26)
F26 = ⎥⎦
⎤⎢⎣
⎡ += ∑∑
==
25
24
1t
t
25
1t
t XX25
1X
25
1
= [ ]8509800
25
1 +
F26 = 25
1 * 10650 = 426
e26 = X26 - F26
= 600 - 426
Ft+1 = n
1 ∑
=
n
1t
tX
Cao Hào Thi 13
e26 = 174
Trong ví dụ này, các sai số dự báo lớn → dự báo không chính xác.
Phương pháp trung bình đơn giản thường được sử dụng khi dãy số liệu không
biến đổi theo mùa,không có hướng, không đối xứng và với tập số liệu lớn.
b. Phương pháp trung bình dịch chuyển ; (Moving – Average)
Trong phương pháp này, người ta sử dụng giá trị trung bình của n số liệu quan sát
trước thời điểm dự báo.
Nhận xét:
- Mô hình này chú ý đến n số liệu quan sát đã biết gần thời điểm dự báo nhất.
- Số n không thay đổi khi tính giá trị trung bình dịch chuyển.
• n = 1⇒ Ft+1 = Xt : Phương pháp naive
• n = 1⇒ Ft+1 = ∑
=
n
1t
tXn
1 :Phương pháp trung bình giản đơn.
- Tổng quát, phương pháp trung bình dịch chuyển tốt hơn phương pháp trung bình
giản đơn.
Ví dụ:
Giá trị dự báo cho quí I/1985 với n = 4
F25 = 4
1 (X24 +X23 + X22 +X21 )
=
4
1 (650 + 400 +500 +750 ) =
4
1 * 2300
F25 = 575
e25 = X25 - F25
= 850 – 575
e25 = 275
c. Phương pháp làm trơn hàm mũ:(Exponential Smoothing Methods)
Ft+1 = n
1 (Xt + Xt-1 + Xt-2 +….+ Xt-n+1)
(toàn bộ số
liệu)
Ft+1 = α Xt + (1-α) Ft
Cao Hào Thi 14
Ft+1 :giá trị dự báo ở thời điểm t+1
Ft :giá trị dự báo ở thời điểm t
Xt :giá trị quan sát ở thời điểm t
α :hằng số làm trơn, 10 ≤α≤
8.3.3.3 Phương pháp tự hồi qui:(Autoregressive models)
a) Mô hình tự hồi qui bậc 1:(first-order autoregressive models)
β, Φ1 : là các tham số cố định
at : là biến ngẫu nhiên có số trung bình là 0
b) Mô hình tự hồi qui bậc 2 (second order autoregressive models )
c) Mô hình tự hồi qui bậc p: (Autoregressive model of order p)
Xt= β + Φ1 Xt-1 + at
Xt = β +Φ1 Xt-1 + Φ2 Xt-2 + at
Xt = β + Φ1 Xt-1 + Φ2 Xt-2 + … + ΦpXt-p +at