Cho đến nay việc giải các bài toán điều khiển tối ưu chủyếu dựa trên cơsởcủa các nguyên
lý Bellmal, nguyên lý cực đại Pontriagin hoặc các lý thuyết khác. Những lý thuyết này còn có
chung hạn chếvềnguyên tắc là ởchỗnó chỉlà những điều kiện cần mà không đủ. Khi vận
dụng còn có yếu tốkinh nghiệm trực quan và có thểdẫn đến hiểu sai. Từnhững kết quả
nghiên cứu theo hướng tiếp cận khác bài báo đã chỉrõ một sốtrường hợp hiểu sai ngay ởcác
bài toán được coi là kinh điển trong các sách giáo khoa bậc Đại học và các tài liệu khác của
các tác giảtrong và ngoài nước.
8 trang |
Chia sẻ: maiphuongtt | Lượt xem: 1713 | Lượt tải: 1
Bạn đang xem nội dung tài liệu Những hạn chế về nguyên tắc của các lý thuyết điều khiển tối ưu hiện nay và những hiểu sai thường gặp khi vận dụng, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
1
NHỮNG HẠN CHẾ VỀ NGUYÊN TẮC CỦA CÁC LÝ THUYẾT ĐIỀU KHIỂN TỐI
ƯU HIỆN NAY VÀ NHỮNG HIỂU SAI THƯỜNG GẶP KHI VẬN DỤNG
TS . Lê Văn Ngự
Viện NC Điện tử, Tin học, Tự động hóa
Tóm tắt
Cho đến nay việc giải các bài toán điều khiển tối ưu chủ yếu dựa trên cơ sở của các nguyên
lý Bellmal, nguyên lý cực đại Pontriagin hoặc các lý thuyết khác. Những lý thuyết này còn có
chung hạn chế về nguyên tắc là ở chỗ nó chỉ là những điều kiện cần mà không đủ. Khi vận
dụng còn có yếu tố kinh nghiệm trực quan và có thể dẫn đến hiểu sai. Từ những kết quả
nghiên cứu theo hướng tiếp cận khác bài báo đã chỉ rõ một số trường hợp hiểu sai ngay ở các
bài toán được coi là kinh điển trong các sách giáo khoa bậc Đại học và các tài liệu khác của
các tác giả trong và ngoài nước.
1. Thiết lập bài toán
Đến nay ở hầu hết các tài liệu bài toán được đặt ra như sau.
Cho đối tượng điều khiển có mô hình động lực học dạng ( ) ( )u,xftx =& (1)
Trong đó : x( xnxixx ,,,,2,1 LL ) là biến (vec tơ ) trạng thái
( )uruiuuu ,,,,2,1 KK là vec tơ điều khiển
với điều kiện hạn chế uu u maxmax ≤≤− (2)
Hàm mục tiêu có dạng : ( ) ( )dttuxGtuxQ T∫=
0
,,,, (3)
Trong đó G(x,u,t) là hàm đối với x,u và thời gian t .
Vec tơ điều khiển )(* tu cần phải xác định để chuyển đối tượng từ trạng thái ban đầu x(to)
đến trạng thái cuối x(T) để hàm mục tiêu Q đạt giá trị nhỏ nhất gọi là điều khiển tối ưu.Quỹ
đạo trạng thái tương ứng từ x(to) đến x(T) gọi là quĩ đạo tối ưu. Khi G=1 thì được gọi là bài
toán tối ưu tác động nhanh.
Đây là bài toán rất khó , đến nay vẫn chưa có cách giải hoàn chỉnh.Là bài toán được thiết
lập cho hệ thống nhiều biến có liên quan đến những khái niệm trừu tượng và phải được hiểu
chính xác.Những khó khăn này tồn tại ở ngay bước thiết lập bài toán.
Thứ nhất là điều kiện hạn chế của u trong trường hợp tổng quát là đại lượng biến đổi phụ
thuộc vào trạng thái của đối tượng mà không phải luôn luôn ở dạng uu u maxmax ≤≤− (mặc dù
các thành phần có thể hạn chế ở dạng maxmax iii uuu ≤≤− )
Thứ hai là hàm mục tiêu được thiết lập ở dạng tích phân của biến thời gian. Điều này gặp
phải khó khăn là ngay ở những trường hợp đơn giản cũng không tìm được hàm tường minh
của các đại lượng theo thời gian.Trường hợp tác động nhanh khi G=1 thì hàm mục tiêu
∫=
T
dtQ
0
.1 không biểu hiện rõ quan hệ của nó với các đại lượng khác của bài toán ,ngay cả
khoảng thời gian xảy ra quá trình cũng chưa biết và thực tế thời gian không được tính theo
biểu thức này.Các lí thuyết áp dụng cho trường hợp này phải qua các bước tính toán rất phức
tạp nhưng kết quả vẫn bị hạn chế do bản thân các lí thuyết chưa hoàn chỉnh .Dưới đây xin
trình bày hướng tiếp cận mới.
2. Hướng tiếp cận mới
Mục tiêu cơ bản của bài toán không thay đổi nhưng hướng tiếp cận mới được thể hiện ở
các nội dung sau
2
2.1 Quan niệm sự biến thiên trạng thái động học như là một thuộc tính của đối tượng. Do đó
việc khảo sát sự biến thiên trạng thái được thực hiện độc lập với tác động điều khiển (là
nguyên nhân gây ra biến đổi trạng thái ,thường có liên quan trực tiếp hay gián tiếp đến quá
trình biến đổi năng lượng)
2.2. Xác lập hàm mục tiêu là hàm của các biến trạng thái ( )XXQ &, mà không theo biến thời
gian.Thời gian được coi như một tham số ,khi cần nó có thể được xác định theo các biến
trạng thái.
2.3 Xác định quĩ đạo tối ưu đồng thời với điều khiển tối ưu dựa trên các quan hệ của các biến
trạng thái đối với ( )XXQ &, và ( )XU &X,
3 Các bước thực hiện
3.1. Sự biến thiên trạng thái động học
Ở đây khảo sát sự biến thiên trạng thái mà không quan tâm đến tác động điều khiển là
nguyên nhân gây ra nó nên gọi là biến thiên trạng thái động học.Không gian trạng thái được
biểu diễn bởi trục hoành là X và trục tung là X& (hình 1)
Mục tiêu là phải điều khiển đối tượng từ trạng thái ban đầu đến trạng thái cuối để
Qmin ,tức là phải xác định quĩ đạo tối ưu.
Trước khi xác định quĩ đạo tối ưu ta hãy xét quĩ đạo trạng thái nói chung,tức là quan hệ
giữa
⋅
X và X. Tại mỗi điểm ta có
dt
dX
dt
Xd
dX
Xd
⋅
⋅
=
X
X
dX
Xd &&&& = (4)
Đây là phương trình vi phân của quĩ đạo trạng thái của đối tượng bất kì. Ý nghĩa hình học
của (4) là độ dốc của quĩ đạo tại điểm (X, X& ).Nó phụ thuộc vào các biến trạng thái và có quan
hệ với u từ mô hình động lực học.
Tại một điểm đã cho có X& đã biết, độ dốc chỉ phụ thuộc X&& và bị hạn chế trong giới
hạn XX X &&&& && maxmin ≤≤ do u bị hạn chế .Các giá trị giới hạn này hoàn toàn xác định được từ
mô hình động lực học .
Nếu tại một điểm ta dựng các vecto tiếp tuyến với các quỹ đạo ứng với XX &&&& minmax , và góc
giữa chúng là α thì các quĩ đạo đi qua điểm đó phải nằm trong góc α.Vì thế góc α biểu thị
phạm vi điều khiển tại một điểm .Góc α biến thiên theo XX && , tăng thì α giảm
α = π khi X& = 0 (trên trục hoành )
α = 0 khi XX &&&& minmax = và tại đó chỉ tồn tại duy nhất một quĩ đạo điều khiển .Tốc độ
mà tại đó XX &&&& minmax = gọi là tốc độ giới hạn X gh& và luôn luôn xác định được .Tập hợp các
điểm có tốc độ giới hạn tạo thành quĩ đạo giới hạn .Việc điều khiển không thực hiện được ở
tốc độ cao hơn tốc độ giới hạn .
3
Nếu trên quỹ đạo giới hạn có X&& là dương thì tồn tại điểm K tại đó 0Xmin =&& và đổi dấu từ
âm sang dương,vì thế quĩ đạo ứng với Xmin&& là cực tiểu.Trên khoảng từ K đến quĩ đạo giới
hạn luôn có X&& >0 ,vì thế quĩ đạo luôn luôn tăng .Tương tự nếu trên quĩ đạo giới hạn có X&& là
âm thì tồn tại điểm H tại đó X&& max =0 và đổi dấu từ dương sang âm vì thế quĩ đạo ứng với
X&& max là cực tiểu .Trên khoảng từ H đến quĩ đạo giới hạn luôn có X&& <0 ,quĩ đạo luôn luôn
giảm .Tập hợp các điểm K và H tạo thành quĩ đạo gọi là quĩ đạo không (đường nét đứt hình
1)Quĩ đạo này chia không gian trạng thái thành ba miền có các tính chất khác nhau là :
1.Miền có thể tăng hoặc giảm (ở dưới điểm K và H)
2.Miền chỉ có thể tăng (ở trên điểm K).Là miền điều khiển không bền vững
3.Miền chỉ có thể giảm (ở trên điểm H)
3.2. Điều khiển từ trạng thái đầu đến trạng thái cuối
Việc điều khiển từ trạng thái đầu ( )xxA &, đến trạng thái cuối ( )xxB &, cũng chỉ có thể thực
hiện được trong phạm vi nhất định.Ta dựng các nhánh quĩ đạo ứng với X&& max và Xmin&& đi ra
khỏi A và đi tới B ,nếu chúng cắt nhau trong miền tốc độ giới hạn thì các quĩ đạo điều khiển
từ A đến B nằm trong miền giới hạn của các đường này (Hình 2.a)
nếu chúng cắt nhau ở ngoài miền tốc độ cho phép thì phải xét cụ thể điều kiện có thể thiết lập
được đoạn quĩ đạo nối các nhánh với nhau H.2,b hay không, nhất là ở miền gần quĩ đạo giới
hạn.
3.3. Áp dụng cho bài toán tối ưu tác động nhanh
Ví dụ khảo sát bài toán tối ưu tác động nhanh cho đối tượng có mô hình động lực học
UX =&& , 1≤U . Ta thấy ngay quĩ đạo tối ưu với thời gian ngắn nhất là quĩ đạo ứng với tốc độ
cao nhất , khi X&& max =1 và Xmin&& = −1
X&
A
B
X
X&
A
B
X
a b
H.2. Miền điều khiển từ A đến B
α
O x
K H
H .1 .Các miền biến thiên trạng thái
X&
4
Từ phương trình (4) khi X&& max =1 ta có dXXdX =&& . Tích phân biểu thức này được:
0CX2X2 =+−&
Tương tự khi Xmin&& = −1 có: 0CX2X 2 =++&
Đó là các nhánh Parabol , đúng như cách tính theo nguyên lí Pontriagin.Khi đã xác định được
quĩ đạo tối ưu ta dễ dàng tính được thời gian theo biểu thức Xd/dXdT &=
4. Đối chiếu với một số tác giả khác
Phần này nhằm làm rõ hơn một số nội dung đã được đề cập ở một số tài liệu khác
4.1 Nguyên lý cực đại Pontriagin
Về nguyên tắc không thể áp dụng nguyên lý cực đại Pontriagin vì nó chỉ là điều kiện cần.
Nếu không thỏa mãn nguyên lý này thì kết luận là không tối ưu, còn khi thỏa mãn thì chưa thể
kết luận được là tối ưu.
4.2 Sự biến thiên của quỹ đạo tối ưu
Lời chú thích không đúng với sự biến thiên của quỹ đạo điều khiển ở một số khoảng (quĩ
đạo là tăng tốc thì chú thích là giảm, quĩ đạo là giảm tốc thì chú thích là tăng tốc) của các tác
giả [6] vì quĩ đạo điều khiển ở những miền chỉ tăng tốc hoặc chỉ giảm tốc. Những miền này
không tồn tại ở những trường hợp đơn giản thường gặp mà ở đó gia tốc lớn nhất và nhỏ nhất
luôn trái dấu nhau. Sự nhầm lẫn của các tác giả này là ở chỗ cho rằng gia tốc lơn nhất luôn là
dương, nhỏ nhất là âm.
Quỹ đạo tối ưu ở trường hợp tổng quát không tiếp tuyến với quỹ đạo tốc độ giới hạn.
Khi nói về cách dựng quỹ đạo tối ưu ở trường hợp các nhánh qua điểm đầu và điểm cuối
của quỹ đạo không cắt nhau trong miền tốc độ cho phép thì dựng các đoạn tối ưu ứng với
maxλ&& hoặc minλ&& tiếp tuyến với quỹ đạo tốc độ giới hạn để nối chúng với nhau. Vì ở tốc độ giới
hạn chỉ tồn tại một quỹ đạo điều khiển duy nhất qua đó và nó hoàn toàn đã được xác định và
nói chung không là tiếp tuyến với quỹ đạo tốc độ giới hạn (khác với các tác giả [1], [6]).
4.3 Không thể thay thế tương đương đường cong tối ưu bằng đường gẫy khúc
Khi áp dụng vào thực tế người ta thường thay thế quỹ đạo tối ưu lý thuyết bằng quỹ đạo
gần đúng. Việc thay thế này về nguyên tắc phải thực hiện điều khiển được trên thực tế. Trong
tính toán để tính gần đùng người ta thường thay thế đường cong bằng đường gãy khúc gồm
ngững đoạn thẳng có điểm giao nhau với đường cong. Tuy nhiên đối với đường cong điều
khiển tối ưu thì việc thay thế như trên nói chung là không đúng. Lý do vì tại mỗi điển các quỹ
đạo điều khiển tối ưu là biên của phạm vi điều khiển, nếu thay bằng đoạn thẳng giao nhau với
đường cong thì sẽ có phần vượt ra khỏi phạm vi điều khiển.
λ D
C
B
A λ&
0 Accelerate Decelerate Accelerate Decelerate
H.3. Lời chú thích sai
5
Ví dụ tại điểm P có hai nhánh quỹ đạo cong tối ưu đi qua (Hình 4). Nếu ta thay các cung
cong bằng các đoạn thẳng PN và PM thì toàn bộ đoạn thẳng PN và phần cuối của đoạn thăng
PM nằm ngoài phạm vi điều khiển (vì tại M hướng của quỹ đạo thảng nằm ngoài phạm vi
điều khiển). Ta có thể xác định được đoạn nào trên PM nằm ngoài phạm vi điều khiển.
Dưới đây sẽ xét trường hợp không đúng khi thay thế đường cong chuyển đổi tối ưu bằng
một đường gẫy khúc để điều khiển tối tượng về gốc tọa độ của [2] hình 5.a, b
Trường hợp ở hình 5a là thay thế việc điều khiển theo đường cong tối ưu là Parabol bằng
đường thẳng (theo chế độ trượt) về gốc tọa độ khi điều khiển đối tượng được mô tả bởi
phương trình d2y/dt2 = U với | U | ≤ 1. Trường hợp này đã được đề cập ở [5]
Trường hợp ở hình 5b là thay thế quỹ đạo chuyển đổi tối ưu lý thuyết là Parabol bằng
đượng gẫy khúc ANOPB để tại đó đổi chiều tác động nhằm điều khiển đối tượng theo các quỹ
đạo tối ưu dầnhội tụ về gốc tạo độ. Theo tài liệu đã dẫn thì quá trình được thực hiện như sau.
P
M
N
H.4. Không thể điều khiển theo đoạn thẳng
y1
y2
B
Q P
M2
M
C
N L
A
y2
B P
M2
M1
N
A
y1
a) b)
H.5. Không điều khiển được về 0
c)
O
O
6
Từ trạng thái ban đầu M1 chuyển động theo quỹ đạo tối ưu rồi cắt đường chuyển đổi AN và
sau đó lại chuyển động theo quỹ đạo tối ưu thứ hai và cắt đượng chuyển đổi PO rồi tiếp tục
theo quỹ đạo tối ưu thứ ba và cắt đường chuyển đổi ANO v.v... Quỹ đạo pha đó cứ xoắn dần
vào gốc tọa độ. Vì thế trượng hợp này quá trình quá độ là một dao động tắt dần (vì quỹ đạo
pha ứng với quá trình đó hội tụ vào tiêu điểm cân bằng 0).
Trường hợp hình 5c cũng hiểu sai tương tự.
Thực ra quá trình trên không phải là quá trình tắt dần và hội tụ về 0, mà như H.6. Theo lý
thuyết thì mọi quỹ đạo pha tại trục hoành đều có tiếp tuyến thẳng đứng, tại gốc tọa độ là trục
tung. Vì thế đoạn NOP ở lân cận 0 luôn ở phía trước đường cong chuyển đổi lý thuyết, nghĩa
là các quỹ đạo tối ưu gặp đoạn thẳng trước khi gặp đường cong chuyển đổi mà không phải ở
phía sau như hình 5b
Nếu chuyển đổi điều khiển ở đoạn thẳng lân cận bên trái điểm 0 thì quỹ đạo tối ưu cắt trục
hoành ở bên trái điêmr 0 rồi ra xa khỏi điển 0. Cũng tương tự khi chuyển đổi điều khiển ở
đoạn thẳng lân cận bên phải 0. H.6,a
Nếu cho đường gẫy khúc ở phía sau đường cong thì đoạn thẳng qua 0 chính là trục tung.
Các quỹ đạo tối ưu cắt nhau trên trục tung thì đối xứng với nhau qua 0 . Nếu đổi chiều điều
khiển trên trục tung thì quá trình hoặc là đi xa khỏi 0 hoặc là chuyển động quanh 0 tùy theo
chiều và vị trí chuyển đổi. Nếu ở điển phía trên 0 chuyển điều khiển từ âm sang dương thì đi
xa khỏi 0, chuyển từ dương sang âm thì quỹ đạo tiếp theo sẽ cắt trục tung ở điểm dưới và đối
sứng qua 0 và tại đó lại chuyển sang dương thì quỹ đạo lại cắt trục tung ở điểm chuyển đổi lần
trước và nếu chuyển đổi tiếp thì quá trình chuyển động quanh 0 lặp lại mà không tiến tới 0.
Cũng tương tự với đối với điểm chuyển đổi ở phía dưới 0.
Tóm lại là về nguyên tắc không thể thay thế tương đương quỹ đạo cong tối ưu bằng đường
gấp khúc.
O y1
b)
H.6. Quỹ đạo tối ưu lân cận 0
a)
O y1
y2
7
4.4. Điều khiển ở chế độ gần tối ưu
Trong thực tế thường phải thỏa mãn đồng thời các yêu cầu khác nhau vì vậy phải thực hiện
điều khiển các chế độ gần tối ưu . Quá trình điều khiển thường có ba giai đoạn: giai đoạn quá
độ ban đầu đưa đến chế độ ổn định, giai đoạn ổn định để thực hiện nhiệm vụ nào đó và cuối
cùng là giai đoạn quá độ về trạng thái ngừng hoạt động. Trong ba giai đoạn thì giai đoạn ổn
định thường là quan trọng nhất cần có yêu cầu cao về chất lượng điều khiển ta thực hiện theo
chế độ trượt. Giai đoạn đầu và cuối điều khiển theo chế độ tối ưu hoặc gần tối ưu. Giả sử theo
phương án trên thì có thể thực hiện điều khiển gần tối ưu từ điểm P về O (H.7) như sau:
- Thay quỹ đạo chuyển đổi tối ưu về 0 bằng miền lân cận nó.
- Xác định miền điều khiển được về 0 theo đường thẳng ở chế độ trượt (giới hạn bởi trục
hoành và đường X1 = - X22) (xem [5])
- Từ P điều khiển theo quỹ đạo tối ưu thì PM là đoạn điều khiển được về 0 theo đường thẳng
nhưng ở tốc độ thấp. Muốn được tốc độ cao hơn thì tới N.
- Từ N có thể theo các đường thẳng có độ nghiêng khác nhau tới miền lân cận đường chuyển
đổi tối ưu
- Theo quỹ đạo tối ưu về miền điều khiển được theo đường thẳng lân cận O.
- Về O theo đường thẳng.
Bằng cách này có thể dễ dàng chọn được chế độ điều khiển thích hợp. Việc chuyển đổi
được thực hiện ở một miền mà không phải ở điểm nên dễ thực hiện.
5. Kết luận
Các lí thuyết hiện nay còn hạn chế về nguyên tắc .Khi áp dụng còn các yếu tố trực quan và
dễ dẫn đến hiểu sai. Là vấn đề khó và phong phú vì vậy những nội dung đề cập ở đây chỉ là
bước đầu, tuy nhiên cũng góp phần làm sáng tỏ hơn bản chất của bài toán. Vấn đề cần được
nghiên cứu tiếp.
H.7. Điều khiển gần tối ưu
P
X2
X1 = - 22X
X1 = - 222
1 X
O
M
N
X1
8
Tài liệu tham khảo :
[1] .KIM B.K, SHIN K.G., (1983) Suboptimal control of indiustrial manipulator with a
weighted minimum time - fuel criterion. Proc. 22 nd IEEE Conf. Decis and Cont. San
Anlonio. Vol.3. New York.N.Y
[2]. PHẠM CÔNG NGÔ., (1996) Lý thuyết điều khiển tự động . NXB KHKT
[3]. NGUYỄN THƯƠNG NGÔ., (1999) Lý thuyết điều khiển tự động hiện đại . NXB KHKT
[4]. LE VAN NGU., (1999) The change of the minimum time controllable trajectory and the
enduring controllable zones of industrial robot with geometric path constrains. 30th
International Symposium on robotics, Proc. pp177- 180, Tokyo, Japan
[5]. LÊ VĂN NGỰ ., (2000) Bổ sung cơ sở lý thuyết cho phương pháp điều khiển tối ưu.
Tuyển tập báo cáo khoa học. Hội nghị toàn quốc lầm thứ 4 về Tự động hóa.
pp. 317- 322
[6]. SHIN K.G.,MCKAY ND., (1985)Minimum time control robotic manipulation with
geometric path constraints. IEEE trans. Auto.cont. Vol30, No6, pp 531 - 541.
[7]. NGUYỄN DOÃN PHƯỚC, PHAN XUÂN MINH., (1999) Điều khiển tối ưu và bền
vững . NXB Khoa học Kỹ thuật
người nhận : Phạm anh tuấn Viện cơ học ĐT 7627205
264 Đội cấn. mechatronics@hn.vnn.vn