Bài giảng chương 7: Thực nghiệm nhận dạng hệ thống
Thí nghiệm thu thập dữ liệu Tiền xử lý dữliệu Chọn cấu trúc mô hình Chọn tiêu chuẩn ước lượng Đánh giá chất lượng mô hình
Bạn đang xem trước 20 trang tài liệu Bài giảng chương 7: Thực nghiệm nhận dạng hệ thống, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 1
MÔ HÌNH HÓA VÀ NHẬN DẠNG HỆ THỐNG
Giảng viên: TS. Huỳnh Thái Hoàng
Bộ môn Điều Khiển Tự Động, Khoa Điện – Điện Tử
Đại học Bách Khoa TP.HCM
Email: hthoang@hcmut.edu.vn,
hthoang.hcmut@yahoo.com
Homepage:
Môn học
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 2
THỰC NGHIỆM NHẬN DẠNG HỆ THỐNG
Chương 7
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 3
Vòng lặp nhận dạng hệ thống
Thí nghieäm thu
thaäp döõ lieäu
T
h
o
â
n
g
t
i
n
b
i
e
á
t
t
r
ö
ô
ù
c
v
e
à
h
e
ä
t
h
o
á
n
g
:
c
a
ù
c
q
u
i
l
u
a
ä
t
v
a
ä
t
l
y
ù
,
c
a
ù
c
p
h
a
ù
t
b
i
e
å
u
n
g
o
â
n
n
g
ö
õ
,
…
Toát⇒ chaáp nhaän moâ hình
Khoâng toát⇒ laëp laïi
Khoâng toát⇒ xeùt laïi
thoâng tin bieát tröôùc
Xöû lyù sô
boä döõ lieäu
Choïn caáu truùc
moâ hình
Choïn tieâu chuaån
öôùc löôïng
Öôùc löôïng thoâng soá
Ñaùnh giaù
moâ hình
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 4
Thí nghiệm thu thập dữ liệu
Tiền xử lý dữ liệu
Chọn cấu trúc mô hình
Chọn tiêu chuẩn ước lượng
Đánh giá chất lượng mô hình
Noääi dung chöông 7
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 5
Tham khảo:
[1] L. Ljung (1999), System Identification – Theory for the user.
Chương 12-16.
Tài liệu tham khảo
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 6
Thí nghiệm thu thập dữ liệu
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 7
Xác định ngõ vào, ngõ ra của hệ thống cần nhận dạng
⇒ xác định tín hiệu “kích thích“ để thực hiện thí nghiệm thu thập
số liệu và vị trí đặt cảm biến để đo tín hiệu ra.
Chọn tín hiệu vào:
Tín hiệu vào bao gồm thành phần tần số nào?
Biên độ, giá trị cực đại tín hiệu vào bằng bao nhiêu?
Tín hiệu vào quyết định:
điểm làm việc của hệ thống
bộ phận nào và chế độ làm việc nào của hệ thống được kích
thích trong thí nghiệm.
Xác định chu kỳ lấy mẫu.
Xác định số mẫu dữ liệu cần thu thập.
Các vấn đề liên quan đến thí nghiệm thu thập số liệu
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 8
Nhận dạng mô hình tuyến tính:
Tín hiệu vào bé, thay đổi ngẫu nhiên sao cho trạng thái của hệ
thống thay đổi trong phạm vi nhỏ quanh điểm làm việc tĩnh
Nhận dạng mô hình phi tuyến:
Tín hiệu vào ngẫu nhiên, gồm nhiều thành phần tần số và biên độ
khác nhau, sao cho trạng thái của hệ thống thay đổi rộng trong
phạm vi cần nhận dạng đặc tính phi tuyến
Chọn tín hiệu vào
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 9
Yêu cầu đối với tín hiệu vào
Tín hiệu vào phải được chọn sao cho tập dữ liệu thu thập được phải
đủ giàu thông tin.
Tập dữ liệu gần dừng Z∞ giàu thông tin nếu ma trận phổ Φz(ω) của
tín hiệu z(k) = [y(k) u(k)]T xác định dương tại hầu hết tất cả các tần
số ω.
⎥⎦
⎤⎢⎣
⎡
ΦΦ
ΦΦ=Φ
)()(
)()(
)( ωω
ωωω
yyu
uyu
z
∑+∞
−∞=
−=Φ
τ
ωττω jxx eR )()(
∑+∞
−∞=
−=Φ
τ
ωττω jxyxy eR )()(
∑
=∞→
−=−= N
kN
x kxkExN
kxkxER
1
)()(1lim)()()( τττ
∑
=∞→
−=−= N
kN
xy kykExN
kykxER
1
)()(1lim)()()( τττ
Nhắc lại:
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 10
Tín hiệu kích thích vững
Đối với trường hợp nhận dạng hệ thống hở, tập dữ liệu thực nghiệm
đủ giàu thông tin khi tín hiệu vào u(k) là tín hiệu gần dừng có phổ
φu(ω) > 0 tại hầu hết các tần số ω (“hầu hết” nghĩa là phổ có thể
bằng 0 trong một tập hợp tần số hữu hạn).
Tín hiệu u(k) thỏa mãn điều kiện trên được gọi là tín hiệu kích thích
vững (persistently exciting).
Có rất nhiều lựa chọn để tín hiệu vào là tín hiệu kích thích vững.
Khi chọn tín hiệu vào cần để ý các yếu tố sau:
Tính chất tiệm cận của thông số ước lượng (độ lệch và phương
sai) chỉ phụ thuộc phổ tín hiệu vào, không phụ thuộc dạng sóng
tín hiệu vào.
Tín hiệu vào phải có biên độ hữu hạn
Tín hiệu vào tuần hoàn có một số ưu điểm
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 11
Hệ số gợn sóng (Crest factor)
Tuy nhiên thực tế tín hiệu vào có biên độ hữu hạn (do giới hạn vật
lý) nên công suất tín hiệu vào không thể tăng lớn tùy ý được.
Hệ số gợn sóng:
∑
=∞→
= N
kN
k
r
ku
N
ku
C
1
2
2
2
)(1lim
)(max
1
0)(
)()(
)(
)ˆ,(
)ˆ,(
−
⎥⎦
⎤⎢⎣
⎡
Φ
−ΦΦΦ≈⎥⎦
⎤⎢⎣
⎡
λω
ωωωω
ω
ue
ueu
v
N
j
N
j
N
n
eH
eGCov θ
θ
Ma trận hiệp phương sai của đặc tính tần số nhận dạng tỉ lệ nghịch
với công suất tín hiệu vào (xem chương 6)
⇒ công suất tín hiệu vào càng lớn kết quả nhận dạng càng chính xác
Nhận xét: Cr≥1. Trong lớp các tín hiệu bị chặn, tín hiệu có công suất
lớn nhất khi Cr=1, đó là tín hiệu nhị phân (u(k) chỉ có 2 mức )u±
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 12
Thành phần tần số của tín hiệu vào
⇒ Tín hiệu vào cần được chọn sao cho công suất của tín hiệu tập trung
vào miền tần số mà tại đó đặc tính tần số của mô hình nhạy với sự
thay đổi thông số mô hình
⎪⎭
⎪⎬
⎫
⎪⎩
⎪⎨
⎧
⎥⎥⎦
⎤
⎢⎢⎣
⎡
Φ
Φ−+⎥⎥⎦
⎤
⎢⎢⎣
⎡ Φ−+= ∫∫
−−
π
π
π
π
ωλωθ d
H
HH
d
H
GBG
u
r
uu
2
2
0
02
2
0* minarg
θ
θ
θ
θθ
θ
2
0
02 ),()(
)(
)(.
)(
),( θθ ωωω ω
ω
ω
λ jj
u
e
u
u
j eHeHeB −Φ
Φ
Φ=
Tham số tối ưu trong trường hợp nhận dạng hệ kín (xem chương 6)
⎭⎬
⎫
⎩⎨
⎧ −= ∫
−
∗ π
π
ωω ωω dQeGeG jj )(),()(minarg *20 θθ θ
2
*
*
)(
)()( ω
ωω
j
u
eH
Q Φ=
Tham số tối ưu trong trường hợp nhận dạng hệ hở (xem chương 6)
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 13
Nhiễu trắng phân bố Gauss qua bộ lọc tần số
Nhiễu trắng có mật độ phổ công suất (Power Spectral Density) bằng
nhau tại mọi tần số, cho nhiễu trắng qua bộ lọc tần số ta sẽ được tín
hiệu ngẫu nhiên có mật độ phổ công suất tập trung tại miền tần số
mong muốn.
Về lý thuyết tín hiệu nhiễu Gauss có biên độ không bị chặn, do đó
phải cho tín hiệu nhiễu Gauss bão hòa tại một giá trị ngưỡng nào đó
để được tín hiệu ngẫu nhiên bị chặn. Thí dụ có thể cho tín hiệu bão
hòa ở mức biên độ bằng 3 lần độ lệch chuẩn, khi đó chỉ có khoảng
1% số mẫu tín hiệu bị ảnh hưởng, tín hiệu sẽ có hệ số đỉnh bằng 3
và méo tần số không đáng kể.
Các dạng tín hiệu vào thông dụng
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 14
Lệnh Matlab tạo tín hiệu ngẫu nhiên phân bố Gauss
>> u = idinput(N, ‘RGS’,[wmin wmax],[μ-σ μ+σ])
N: số mẫu
‘RGS’: Random Gaussian Signal
[wmin wmax]: băng thông của tín hiệu (mặc định [0 1])
μ: giá trị trung bình của phân bố Gauss (mặc định 0)
σ: độ lệch chuẩn của phân bố Gauss (mặc định 1)
Các dạng tín hiệu vào thông dụng (tt)
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 15
Thí dụ tín hiệu ngẫu nhiên phân bố Gauss
Các dạng tín hiệu vào thông dụng (tt)
(a) Băng thông [0 1]
μ=0, σ=1
(b) Băng thông [0 0.01]
μ=5, σ=1
0 200 400 600 800 1000
-4
-2
0
2
4
0 200 400 600 800 1000
2
4
6
8
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 16
Tín hiệu nhị phân ngẫu nhiên
Tín hiệu nhị phân ngẫu nhiên là tín hiệu có biên độ thay đổi ngẫu
nhiên giữa hai mức cố định.
Có thể tạo ra tín hiệu nhị phân ngẫu nhiên bằng cách lấy dấu tín hiệu
ngẫu nhiên phân bố Gauss, sau đó có thể dịch mức −1 và +1 sang
hai mức bất kỳ.
Tín hiệu nhị phân ngẫu nhiên có hệ số đỉnh bằng 1.
Không thể điều chỉnh như ý muốn dạng phổ tín hiệu.
Các dạng tín hiệu vào thông dụng (tt)
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 17
Lệnh Matlab tạo tín hiệu nhị phân ngẫu nhiên
>> u = idinput(N, ‘RBS’,[wmin wmax],[umin umax])
N: số mẫu
‘RBS’: Random Binary Signal
[wmin wmax]: băng thông của tín hiệu (mặc định [0 1])
[umin umax]: mức thấp và mức cao của tín hiệu
(mặc định [−1 +1])
Các dạng tín hiệu vào thông dụng (tt)
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 18
Thí dụ tín hiệu nhị phân ngẫu nhiên
Các dạng tín hiệu vào thông dụng (tt)
(a) Băng thông [0 1]
mức [−1, 1]
(b) Băng thông [0 0.01]
mức [0, 5]
0 200 400 600 800 1000
-1
-0.5
0
0.5
1
0 200 400 600 800 1000
0
1
2
3
4
5
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 19
Tín hiệu nhị phân ngẫu nhiên giả
(PRBS – Pseudo-Random Binary Signal)
Các dạng tín hiệu vào thông dụng (tt)
Tín hiệu PRBS là tín hiệu tuần hoàn với chu kỳ cực đại là M=2n – 1,
chu kỳ tuần hoàn của tín hiệu phụ thuộc vào A(q). Với mỗi giá trị n
tồn tại đa thức A(q) để chu kỳ tuần hoàn của tín hiệu PRBS đạt cực
đại.
)2),()1((rem)2),()((rem)( 1 nkuakuakuqAku n −++−== …
(rem: phần dư (remainder))
Tín hiệu nhị phân ngẫu nhiên giả là tín hiệu tiền định, tuần hoàn có
các tính chất giống tín hiệu nhiễu trắng. Tín hiệu nhị phân ngẫu
nhiên giả được tạo ra nhờ phương trình sai phân:
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 20
Các dạng tín hiệu vào thông dụng (tt)
a9, a11204711
a7, a10102310
a4, a95119
a1, a2, a7, a82558
a3, a71277
a1, a6636
a2, a5315
a1, a4154
a2, a373
a1, a232
Heä soá baèng 1M=2n−1Baäc n
Đa thức A(q) tạo ra tín hiệu PRBS có độ dài cực đại, các hệ số của
A(q) không được liệt kê trong bảng có giá trị bằng 0
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 21
Các dạng tín hiệu vào thông dụng (tt)
Phổ công suất của tín hiệu PRBS có M–1 vạch có độ cao bằng nhau
phân bố trong miền −π≤ω<π (không kể thành phần tần số ω=0)
⇒ tín hiệu PRBS có tính chất “giống” như nhiễu trắng tuần hoàn.
∑−
=
−= 1
1
2
)/2(2)(
M
l
u MlM
u πωδπωφ πω 20 <≤
Tín hiệu PRBS có hệ số đỉnh bằng 1.
u±
M
uku
M
M
k
=∑
=1
)(1
⎩⎨
⎧
−
±±==+= ∑
= khaùc /
,...2,,0)()(1)( 2
2
1 lMu
MMlulkuku
M
lR
M
k
u
Tín hiệu PRBS độ dài cực đại có biên độ thay đổi giữa hai giá trị
có tính chất sau:
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 22
Lệnh Matlab tạo tín hiệu ngẫu giả
>> u = idinput(N, ‘PRBS’,[0 B],[umin umax])
N: số mẫu
‘PRGS’: Pseudo Random Gaussian Signal
[wmin wmax]: băng thông của tín hiệu (mặc định [0 1])
[umin umax]: mức thấp và mức cao của tín hiệu
(mặc định [−1 +1])
Các dạng tín hiệu vào thông dụng (tt)
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 23
Thí dụ tín hiệu nhị phân ngẫu nhiên giả
Các dạng tín hiệu vào thông dụng (tt)
(a) B=1, mức [−1 1] (b) B=0.1, mức [0 5]
0 200 400 600 800 1000
-1
-0.5
0
0.5
1
0 200 400 600 800 1000
0
1
2
3
4
5
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 24
Tín hiệu đa hài (multi-sines)
Các dạng tín hiệu vào thông dụng (tt)
Tín hiệu đa hài là tổng của nhiều thành phần hình sin
∑
=
+= d
k
kkk kaku
1
)cos()( φω
Phổ của tín hiệu đa hài là:
∑
=
++−= d
k
kk
k
u
a
1
2
)]()([
4
2)( ωωδωωδπωφ πω 20 <≤
Bằng cách chọn d, ak, ωk, có thể tập trung công suất tín hiệu tại các
tần số mong muốn một cách chính xác
Khuyết điểm của tín hiệu đa hài là hệ số đỉnh cao, có thể lên đến
nếu các thành phần hình sin cùng pha và có biên độ bằng nhau
d2
Để giảm hệ số đỉnh cần chọn pha φk sao cho các thành phần lệch pha
càng nhiều càng tốt.
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 25
Lệnh Matlab tạo tín hiệu đa hài
>> u = idinput(N,‘SINE’,[wmin wmax],[umin umax], SINEDATA)
N: số mẫu
‘SINE’: Multi-sines signal
[wmin wmax]: băng thông của tín hiệu (mặc định [0 1])
[umin umax]: mức thấp và mức cao của tín hiệu
(mặc định [−1 +1])
SINEDATA = [No_of_Sinusoids, No_of_Trials, Grid_Skip]
Các dạng tín hiệu vào thông dụng (tt)
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 26
Thí dụ tín hiệu đa hài
Các dạng tín hiệu vào thông dụng (tt)
(a) Băng thông [0 1]
mức [−1 1]
(b) Băng thông [0 0.01]
mức [0 5]
0 200 400 600 800 1000
-1
-0.5
0
0.5
1
0 200 400 600 800 1000
0
1
2
3
4
5
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 27
Lấy mẫu quá nhanh (Ts nhỏ) có thể dẫn đến các khó khăn khi ước
lượng thông số bằng phương pháp số, mô hình khớp (fit) ở miền tần
số cao. Nếu hệ thống có thời gian chết thì việc chọn chu kỳ lấy mẫu
quá nhỏ có thể sẽ làm cho hệ thống được mô hình hóa với khâu trể
kéo dài trong nhiều chu kỳ lấy mẫu, điều này sẽ gây khó khăn khi sử
dụng mô hình để thiết kế hệ thống điều khiển.
Lấy mẫu quá chậm (Ts lớn) có thể gây ra méo tần số làm mất thông
tin. Khi chu kỳ lấy mẫu tăng vượt quá thời hằng tự nhiên của hệ
thống phương sai tăng đột ngột.
Chu kỳ lấy mẫu tối ưu trong trường hợp số mẫu dữ liệu cố định xấp
xỉ thời hằng của hệ thống. Nếu không biết trước thời hằng của hệ
thống thì ta phải ước lượng, nếu thời hằng ước lượng cao hơn thực
tế thì việc chọn chu kỳ lấy mẫu xấp xỉ thời hằng sẽ dẫn kết kết quả
nhận dạng rất xấu.
Khi thu thập dữ liệu nên lấy mẫu càng nhanh càng tốt, chu kỳ lấy
mẫu T thực tế sẽ được chọn sau khi xử lý dữ liệu.
Chọn chu kỳ lấy mẫu
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 28
Số mẫu dữ liệu càng nhiều càng mất nhiều thời gian tính toán
Chọn số mẫu dữ liệu
1
0)(
)()(
)(
)ˆ,(
)ˆ,(
−
⎥⎦
⎤⎢⎣
⎡
Φ
−ΦΦΦ≈⎥⎦
⎤⎢⎣
⎡
λω
ωωωω
ω
ue
ueu
v
N
j
N
j
N
n
eH
eGCov θ
θ
Ma trận hiệp phương sai của đặc tín tần số nhận dạng tỉ lệ nghịch
với số mẫu dữ liệu (xem chương 6)
⇒ Số mẫu dữ liệu càng nhiều thì kết quả nhận dạng càng chính xác
Nên chọn số mẫu dữ liệu bằng khoảng 100 lần số tham số cần nhận
dạng.
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 29
Tiền xử lý dữ liệu
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 30
Dữ liệu thu thập khi thí nghiệm thường không thể sử dụng ngay
trong các thuật toán nhận dạng hệ thống do các khiếm khuyết sau:
Nhiễu tần số cao trong tập dữ liệu thu thập được.
Tập dữ liệu bị gián đoạn, thiếu dữ liệu, hoặc có các giá trị đo sai
(outlier).
Nhiễu tần số thấp, trôi (drift), độ lệch không (offset).
Do vậy, nếu thực hiện nhận dạng offline trước tiên nên vẽ đồ thị dữ
liệu vào ra, xem xét đồ thị để phát hiện ra các khiếm khuyết trong
tập dữ liệu và tiền xử lý tập dữ liệu để loại bỏ các khiếm khuyết
(nếu có)
Tại sao cần tiền xử lý dữ liệu
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 31
Nhiễu tần số thấp, độ lệch không, nhiễu trôi, nhiễu chu kỳ thường
gặp trong các tập dữ liệu.
Có hai hướng xử lý:
Loại bỏ nhiễu bằng cách tiền xử lý dữ liệu.
Nhận dạng mô hình nhiễu.
6 cách loại ảnh hưởng của nhiễu tần số thấp:
Đặt y(k) và u(k) là độ lệch xung quanh điểm cân bằng vật lý
Loại bỏ trung bình mẫu
Ước lượng độ lệch không
Dùng mô hình nhiễu có khâu tích phân
Mở rộng mô hình nhiễu
Lọc thông cao
Trôi và khử trôi
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 32
Chọn cấu trúc mô hình
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 33
Chọn cấu trúc mô hình bao gồm 2 vấn đề:
Chọn loại mô hình
Chọn bậc mô hình
Tiêu chí chọn cấu trúc mô hình: nhận dạng “mô hình có chất lượng
tốt với chi phí thấp nhất”.
Tiêu chí chọn cấu trúc mô hình
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 34
Chất lượng mô hình
Mâu thuẫn:
Độ lệch càng giảm khi mô hình càng linh hoạt (bậc mô hình
càng cao, mô hình dùng càng nhiều tham số);
Phương sai tăng khi số lượng tham số sử dụng càng tăng
Có thể đánh giá chất lượng mô hình dựa vào tiêu chuẩn trung bình
bình phương sai số J(D) (D={all design variables}).
Theo chương 6, trung bình bình phương sai số có thể phân tích ra
làm 2 thành phần: độ lệch và phương sai.
)()()( DDD PB JJJ +=
⇒ Cần chọn bậc mô hình sao cho dung hòa giữa độ lệch và phương
sai.
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 35
Chi phí nhận dạng mô hình
Độ phức tạp của thuật toán ước lượng tham số:
có thể ước lượng thông số bằng công thức giải tích hay phải ước
lượng thông số bằng thuật toán lặp?
Tính đạo hàm của bộ dự báo theo tham số dễ dàng hay khó
khăn?
Tính chất của hàm tiêu chuẩn ước lượng mô hình:
có cực trị duy nhất hay nhiều cực trị
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 36
Chọn loại mô hình
Mô hình hộp xám (gray-box model):
Xây dựng mô hình tham số vật lý của hệ thống bằng cách dựa
vào hiểu biết về các qui luật vật lý bên trong hệ thống, sau đó
ước lượng tham số mô hình dựa vào dữ liệu thực nghiệm.
Mô hình hộp đen: (blackbox model) tuyến tính hay phi tuyến?
Hệ thống có thể mô tả bằng mô hình tuyến tính nếu:
Quan hệ vào ra của hệ thống chỉ phụ thuộc vào tần số mà
không phụ thuộc vào biên độ tín hiệu.
Khi tín hiệu vào là tín hiệu hình sin, ở trạng thái xác lập tín
hiệu ra là tín hiệu hình sin cùng tần số với tín hiệu vào
Hệ thống làm việc trong phạm vi “nhỏ” xung quanh điểm
tĩnh.
Các trường hợp còn lại đều phải nhận dạng hệ thống dùng cấu
trúc mô hình phi tuyến.
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 37
Chọn bậc mô hình
Nguyên tắc chung để đưa ra các tiêu chuẩn chọn bậc mô hình là sự
cân bằng giữa độ chính xác và độ phức tạp của mô hình.
Tổng quát, các tiêu chuẩn này gồm hai thành phần:
thành phần thứ nhất là trung bình bình phương sai số phản ánh
độ chính xác của mô hình;
thành phần thứ hai là hệ số phạt có đặc điểm tăng lên theo bậc hệ
thống.
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 38
Tiêu chuẩn chọn bậc mô hình tuyến tính
Tiêu chuẩn sai số dự báo cuối cùng (Final Prediction Error – FPE)
trong đó N : số mẫu dữ liệu thực nghiệm, d: số thông số của mô hình
⎥⎦
⎤⎢⎣
⎡ −−
+= ∑
=
N
k
FPE kykyNdN
dNJ
1
2))ˆ,(ˆ)((1 θ
Tiêu chuẩn thông tin Akaike (Akaike Information Critetion – AIC)
N
dkyky
N
J
N
k
AIC
2))ˆ,(ˆ)((1log
1
2 +⎥⎦
⎤⎢⎣
⎡ −= ∑
=
θ
Tiêu chuẩn độ dài mô tả cực đại (Maximum Description Length–
MDL)
N
Ndkyky
N
J
N
k
MDL
)log())ˆ,(ˆ)((1log
1
2 +⎥⎦
⎤⎢⎣
⎡ −= ∑
=
θ
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 39
Tiêu chuẩn chọn bậc mô hình phi tuyến tính
Vấn đề chọn bậc mô hình phi tuyến vẫn còn là một bài toán mở.
Thông thường số thông số của mô hình phi tuyến được chọn dựa
vào kinh nghiệm hoặc bằng phương pháp thử sai.
Có thể mở rộng tiêu chuẩn AIC cho trường hợp mô hình phi tuyến
N : số mẫu dữ liệu thực nghiệm, deff: số thông số của mô hình tác động
])[(tr 1−= HggTeffd
⎥⎦
⎤⎢⎣
⎡
∂
∂= θ
θ )ˆ(Var NVg ⎥⎦
⎤⎢⎣
⎡
∂
∂= 2
2 )ˆ(E θ
θNVH
∑
=
−= N
k
N kykyN
V
1
2))ˆ,(ˆ)((1)ˆ( θθ
N
dkyky
N
J eff
N
k
NIC
2))ˆ,(ˆ)((1log
1
2 +⎥⎦
⎤⎢⎣
⎡ −= ∑
=
θ
⇒ Tiêu chuẩn thông tin phi tuyến (Nonlinear Information Criterion–
NIC)
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 40
Chọn tiêu chuẩn ước lượng tham số
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 41
Tiêu chuẩn ước lượng tham số
Tiêu chuẩn trung bình bình phương sai số: được sử dụng phổ biến
nhất
Tiêu chuẩn trung bình trị tuyệt đối sai số
Tiêu chuẩn l∞
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 42
Đánh giá mô hình
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 43
Các phương pháp đánh giá mô hình
Thuật toán ước lượng thông số chọn được mô hình “tốt nhất” trong
cấu trúc mô hình đã chọn. Câu hỏi đặt ra là mô hình “tốt nhất” này
đã “đủ tốt” chưa? Câu hỏi trên bao hàm:
Mô hình có phù hợp với dữ liệu quan sát?
Mô hình đủ tốt để sử dụng theo mục đích nào đó?
Mô hình có mô tả được “hệ thống thật”?
Có nhiều phương pháp đánh giá mô hình tùy theo phương pháp
đánh giá đó trả lời câu hỏi nào trong số 3 câu hỏi nêu trên.
Đa số các phương pháp đánh giá được trình bày trong các tài liệu
trả lời câu hỏi 1.
Câu hỏi 2 tùy theo từng ứng dụng cụ thể.
Câu hỏi 3 thực tế không thể trả lời được.
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 44
Độ phù hợp của mô hình
Độ phù hợp của mô hình với dữ liệu có thể đánh giá bằng công thức:
[ ]
[ ] %100)(
)ˆ,(ˆ)(
1
1
2
1
2
×
⎟⎟
⎟⎟
⎠
⎞
⎜⎜
⎜⎜
⎝
⎛
−
−
−=
∑
∑
=
=
N
k
N
k
N
yky
kyky
fitness
θ
∑
=
= N
k
ky
N
y
1
)(1 trong đó:
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 45
Phân tích thặng dư
Thặng dư (residual) là phần dữ liệu mà mô hình không tái tạo được
)ˆ,(ˆ)()ˆ,()( NN kykykk θθεε −==
Thặng dư phản ánh chất lượng của mô hình, nếu mô hình “tốt” thì:
thặng dư phải có giá trị nhỏ , và
thặng dư là chuỗi tín hiệu ngẫu nhiên.
Nếu ε(k) “nhỏ” thì các đại lượng thống kê sau đây sẽ có giá trị nhỏ:
)(max1 kS
k
ε=
∑
=
= N
k
k
N
S
1
22
2 )(
1 ε
Thặng dư cực đại:
Thặng dư trung bình:
29 December 2009 © H. T. Hoàng - ÐHBK TPHCM 46
Phân tích thặng dư (tt)
Nếu ε(k) là chuỗi ngẫu nhiên thì:
ε(k) không tương quan với u(k), do đó hàm hiệp phương sai
chéo giữa thặng dư ε(k) và tín hiệu và