Những hạn chế về nguyên tắc của các lý thuyết điều khiển tối ưu hiện nay và những hiểu sai thường gặp khi vận dụng

Cho đến nay việc giải các bài toán điều khiển tối ưu chủyếu dựa trên cơsởcủa các nguyên lý Bellmal, nguyên lý cực đại Pontriagin hoặc các lý thuyết khác. Những lý thuyết này còn có chung hạn chếvềnguyên tắc là ởchỗnó chỉlà những điều kiện cần mà không đủ. Khi vận dụng còn có yếu tốkinh nghiệm trực quan và có thểdẫn đến hiểu sai. Từnhững kết quả nghiên cứu theo hướng tiếp cận khác bài báo đã chỉrõ một sốtrường hợp hiểu sai ngay ởcác bài toán được coi là kinh điển trong các sách giáo khoa bậc Đại học và các tài liệu khác của các tác giảtrong và ngoài nước.

8 trang | Chia sẻ: maiphuongtt | Lượt xem: 1926 | Lượt tải: 1

Bạn đang xem nội dung tài liệu Những hạn chế về nguyên tắc của các lý thuyết điều khiển tối ưu hiện nay và những hiểu sai thường gặp khi vận dụng, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên

1 NHỮNG HẠN CHẾ VỀ NGUYÊN TẮC CỦA CÁC LÝ THUYẾT ĐIỀU KHIỂN TỐI ƯU HIỆN NAY VÀ NHỮNG HIỂU SAI THƯỜNG GẶP KHI VẬN DỤNG TS . Lê Văn Ngự Viện NC Điện tử, Tin học, Tự động hóa Tóm tắt Cho đến nay việc giải các bài toán điều khiển tối ưu chủ yếu dựa trên cơ sở của các nguyên lý Bellmal, nguyên lý cực đại Pontriagin hoặc các lý thuyết khác. Những lý thuyết này còn có chung hạn chế về nguyên tắc là ở chỗ nó chỉ là những điều kiện cần mà không đủ. Khi vận dụng còn có yếu tố kinh nghiệm trực quan và có thể dẫn đến hiểu sai. Từ những kết quả nghiên cứu theo hướng tiếp cận khác bài báo đã chỉ rõ một số trường hợp hiểu sai ngay ở các bài toán được coi là kinh điển trong các sách giáo khoa bậc Đại học và các tài liệu khác của các tác giả trong và ngoài nước. 1. Thiết lập bài toán Đến nay ở hầu hết các tài liệu bài toán được đặt ra như sau. Cho đối tượng điều khiển có mô hình động lực học dạng ( ) ( )u,xftx =& (1) Trong đó : x( xnxixx ,,,,2,1 LL ) là biến (vec tơ ) trạng thái ( )uruiuuu ,,,,2,1 KK là vec tơ điều khiển với điều kiện hạn chế uu u maxmax ≤≤− (2) Hàm mục tiêu có dạng : ( ) ( )dttuxGtuxQ T∫= 0 ,,,, (3) Trong đó G(x,u,t) là hàm đối với x,u và thời gian t . Vec tơ điều khiển )(* tu cần phải xác định để chuyển đối tượng từ trạng thái ban đầu x(to) đến trạng thái cuối x(T) để hàm mục tiêu Q đạt giá trị nhỏ nhất gọi là điều khiển tối ưu.Quỹ đạo trạng thái tương ứng từ x(to) đến x(T) gọi là quĩ đạo tối ưu. Khi G=1 thì được gọi là bài toán tối ưu tác động nhanh. Đây là bài toán rất khó , đến nay vẫn chưa có cách giải hoàn chỉnh.Là bài toán được thiết lập cho hệ thống nhiều biến có liên quan đến những khái niệm trừu tượng và phải được hiểu chính xác.Những khó khăn này tồn tại ở ngay bước thiết lập bài toán. Thứ nhất là điều kiện hạn chế của u trong trường hợp tổng quát là đại lượng biến đổi phụ thuộc vào trạng thái của đối tượng mà không phải luôn luôn ở dạng uu u maxmax ≤≤− (mặc dù các thành phần có thể hạn chế ở dạng maxmax iii uuu ≤≤− ) Thứ hai là hàm mục tiêu được thiết lập ở dạng tích phân của biến thời gian. Điều này gặp phải khó khăn là ngay ở những trường hợp đơn giản cũng không tìm được hàm tường minh của các đại lượng theo thời gian.Trường hợp tác động nhanh khi G=1 thì hàm mục tiêu ∫= T dtQ 0 .1 không biểu hiện rõ quan hệ của nó với các đại lượng khác của bài toán ,ngay cả khoảng thời gian xảy ra quá trình cũng chưa biết và thực tế thời gian không được tính theo biểu thức này.Các lí thuyết áp dụng cho trường hợp này phải qua các bước tính toán rất phức tạp nhưng kết quả vẫn bị hạn chế do bản thân các lí thuyết chưa hoàn chỉnh .Dưới đây xin trình bày hướng tiếp cận mới. 2. Hướng tiếp cận mới Mục tiêu cơ bản của bài toán không thay đổi nhưng hướng tiếp cận mới được thể hiện ở các nội dung sau 2 2.1 Quan niệm sự biến thiên trạng thái động học như là một thuộc tính của đối tượng. Do đó việc khảo sát sự biến thiên trạng thái được thực hiện độc lập với tác động điều khiển (là nguyên nhân gây ra biến đổi trạng thái ,thường có liên quan trực tiếp hay gián tiếp đến quá trình biến đổi năng lượng) 2.2. Xác lập hàm mục tiêu là hàm của các biến trạng thái ( )XXQ &, mà không theo biến thời gian.Thời gian được coi như một tham số ,khi cần nó có thể được xác định theo các biến trạng thái. 2.3 Xác định quĩ đạo tối ưu đồng thời với điều khiển tối ưu dựa trên các quan hệ của các biến trạng thái đối với ( )XXQ &, và ( )XU &X, 3 Các bước thực hiện 3.1. Sự biến thiên trạng thái động học Ở đây khảo sát sự biến thiên trạng thái mà không quan tâm đến tác động điều khiển là nguyên nhân gây ra nó nên gọi là biến thiên trạng thái động học.Không gian trạng thái được biểu diễn bởi trục hoành là X và trục tung là X& (hình 1) Mục tiêu là phải điều khiển đối tượng từ trạng thái ban đầu đến trạng thái cuối để Qmin ,tức là phải xác định quĩ đạo tối ưu. Trước khi xác định quĩ đạo tối ưu ta hãy xét quĩ đạo trạng thái nói chung,tức là quan hệ giữa ⋅ X và X. Tại mỗi điểm ta có dt dX dt Xd dX Xd ⋅ ⋅ = X X dX Xd &&&& = (4) Đây là phương trình vi phân của quĩ đạo trạng thái của đối tượng bất kì. Ý nghĩa hình học của (4) là độ dốc của quĩ đạo tại điểm (X, X& ).Nó phụ thuộc vào các biến trạng thái và có quan hệ với u từ mô hình động lực học. Tại một điểm đã cho có X& đã biết, độ dốc chỉ phụ thuộc X&& và bị hạn chế trong giới hạn XX X &&&& && maxmin ≤≤ do u bị hạn chế .Các giá trị giới hạn này hoàn toàn xác định được từ mô hình động lực học . Nếu tại một điểm ta dựng các vecto tiếp tuyến với các quỹ đạo ứng với XX &&&& minmax , và góc giữa chúng là α thì các quĩ đạo đi qua điểm đó phải nằm trong góc α.Vì thế góc α biểu thị phạm vi điều khiển tại một điểm .Góc α biến thiên theo XX && , tăng thì α giảm α = π khi X& = 0 (trên trục hoành ) α = 0 khi XX &&&& minmax = và tại đó chỉ tồn tại duy nhất một quĩ đạo điều khiển .Tốc độ mà tại đó XX &&&& minmax = gọi là tốc độ giới hạn X gh& và luôn luôn xác định được .Tập hợp các điểm có tốc độ giới hạn tạo thành quĩ đạo giới hạn .Việc điều khiển không thực hiện được ở tốc độ cao hơn tốc độ giới hạn . 3 Nếu trên quỹ đạo giới hạn có X&& là dương thì tồn tại điểm K tại đó 0Xmin =&& và đổi dấu từ âm sang dương,vì thế quĩ đạo ứng với Xmin&& là cực tiểu.Trên khoảng từ K đến quĩ đạo giới hạn luôn có X&& >0 ,vì thế quĩ đạo luôn luôn tăng .Tương tự nếu trên quĩ đạo giới hạn có X&& là âm thì tồn tại điểm H tại đó X&& max =0 và đổi dấu từ dương sang âm vì thế quĩ đạo ứng với X&& max là cực tiểu .Trên khoảng từ H đến quĩ đạo giới hạn luôn có X&& <0 ,quĩ đạo luôn luôn giảm .Tập hợp các điểm K và H tạo thành quĩ đạo gọi là quĩ đạo không (đường nét đứt hình 1)Quĩ đạo này chia không gian trạng thái thành ba miền có các tính chất khác nhau là : 1.Miền có thể tăng hoặc giảm (ở dưới điểm K và H) 2.Miền chỉ có thể tăng (ở trên điểm K).Là miền điều khiển không bền vững 3.Miền chỉ có thể giảm (ở trên điểm H) 3.2. Điều khiển từ trạng thái đầu đến trạng thái cuối Việc điều khiển từ trạng thái đầu ( )xxA &, đến trạng thái cuối ( )xxB &, cũng chỉ có thể thực hiện được trong phạm vi nhất định.Ta dựng các nhánh quĩ đạo ứng với X&& max và Xmin&& đi ra khỏi A và đi tới B ,nếu chúng cắt nhau trong miền tốc độ giới hạn thì các quĩ đạo điều khiển từ A đến B nằm trong miền giới hạn của các đường này (Hình 2.a) nếu chúng cắt nhau ở ngoài miền tốc độ cho phép thì phải xét cụ thể điều kiện có thể thiết lập được đoạn quĩ đạo nối các nhánh với nhau H.2,b hay không, nhất là ở miền gần quĩ đạo giới hạn. 3.3. Áp dụng cho bài toán tối ưu tác động nhanh Ví dụ khảo sát bài toán tối ưu tác động nhanh cho đối tượng có mô hình động lực học UX =&& , 1≤U . Ta thấy ngay quĩ đạo tối ưu với thời gian ngắn nhất là quĩ đạo ứng với tốc độ cao nhất , khi X&& max =1 và Xmin&& = −1 X& A B X X& A B X a b H.2. Miền điều khiển từ A đến B α O x K H H .1 .Các miền biến thiên trạng thái X& 4 Từ phương trình (4) khi X&& max =1 ta có dXXdX =&& . Tích phân biểu thức này được: 0CX2X2 =+−& Tương tự khi Xmin&& = −1 có: 0CX2X 2 =++& Đó là các nhánh Parabol , đúng như cách tính theo nguyên lí Pontriagin.Khi đã xác định được quĩ đạo tối ưu ta dễ dàng tính được thời gian theo biểu thức Xd/dXdT &= 4. Đối chiếu với một số tác giả khác Phần này nhằm làm rõ hơn một số nội dung đã được đề cập ở một số tài liệu khác 4.1 Nguyên lý cực đại Pontriagin Về nguyên tắc không thể áp dụng nguyên lý cực đại Pontriagin vì nó chỉ là điều kiện cần. Nếu không thỏa mãn nguyên lý này thì kết luận là không tối ưu, còn khi thỏa mãn thì chưa thể kết luận được là tối ưu. 4.2 Sự biến thiên của quỹ đạo tối ưu Lời chú thích không đúng với sự biến thiên của quỹ đạo điều khiển ở một số khoảng (quĩ đạo là tăng tốc thì chú thích là giảm, quĩ đạo là giảm tốc thì chú thích là tăng tốc) của các tác giả [6] vì quĩ đạo điều khiển ở những miền chỉ tăng tốc hoặc chỉ giảm tốc. Những miền này không tồn tại ở những trường hợp đơn giản thường gặp mà ở đó gia tốc lớn nhất và nhỏ nhất luôn trái dấu nhau. Sự nhầm lẫn của các tác giả này là ở chỗ cho rằng gia tốc lơn nhất luôn là dương, nhỏ nhất là âm. Quỹ đạo tối ưu ở trường hợp tổng quát không tiếp tuyến với quỹ đạo tốc độ giới hạn. Khi nói về cách dựng quỹ đạo tối ưu ở trường hợp các nhánh qua điểm đầu và điểm cuối của quỹ đạo không cắt nhau trong miền tốc độ cho phép thì dựng các đoạn tối ưu ứng với maxλ&& hoặc minλ&& tiếp tuyến với quỹ đạo tốc độ giới hạn để nối chúng với nhau. Vì ở tốc độ giới hạn chỉ tồn tại một quỹ đạo điều khiển duy nhất qua đó và nó hoàn toàn đã được xác định và nói chung không là tiếp tuyến với quỹ đạo tốc độ giới hạn (khác với các tác giả [1], [6]). 4.3 Không thể thay thế tương đương đường cong tối ưu bằng đường gẫy khúc Khi áp dụng vào thực tế người ta thường thay thế quỹ đạo tối ưu lý thuyết bằng quỹ đạo gần đúng. Việc thay thế này về nguyên tắc phải thực hiện điều khiển được trên thực tế. Trong tính toán để tính gần đùng người ta thường thay thế đường cong bằng đường gãy khúc gồm ngững đoạn thẳng có điểm giao nhau với đường cong. Tuy nhiên đối với đường cong điều khiển tối ưu thì việc thay thế như trên nói chung là không đúng. Lý do vì tại mỗi điển các quỹ đạo điều khiển tối ưu là biên của phạm vi điều khiển, nếu thay bằng đoạn thẳng giao nhau với đường cong thì sẽ có phần vượt ra khỏi phạm vi điều khiển. λ D C B A λ& 0 Accelerate Decelerate Accelerate Decelerate H.3. Lời chú thích sai 5 Ví dụ tại điểm P có hai nhánh quỹ đạo cong tối ưu đi qua (Hình 4). Nếu ta thay các cung cong bằng các đoạn thẳng PN và PM thì toàn bộ đoạn thẳng PN và phần cuối của đoạn thăng PM nằm ngoài phạm vi điều khiển (vì tại M hướng của quỹ đạo thảng nằm ngoài phạm vi điều khiển). Ta có thể xác định được đoạn nào trên PM nằm ngoài phạm vi điều khiển. Dưới đây sẽ xét trường hợp không đúng khi thay thế đường cong chuyển đổi tối ưu bằng một đường gẫy khúc để điều khiển tối tượng về gốc tọa độ của [2] hình 5.a, b Trường hợp ở hình 5a là thay thế việc điều khiển theo đường cong tối ưu là Parabol bằng đường thẳng (theo chế độ trượt) về gốc tọa độ khi điều khiển đối tượng được mô tả bởi phương trình d2y/dt2 = U với | U | ≤ 1. Trường hợp này đã được đề cập ở [5] Trường hợp ở hình 5b là thay thế quỹ đạo chuyển đổi tối ưu lý thuyết là Parabol bằng đượng gẫy khúc ANOPB để tại đó đổi chiều tác động nhằm điều khiển đối tượng theo các quỹ đạo tối ưu dầnhội tụ về gốc tạo độ. Theo tài liệu đã dẫn thì quá trình được thực hiện như sau. P M N H.4. Không thể điều khiển theo đoạn thẳng y1 y2 B Q P M2 M C N L A y2 B P M2 M1 N A y1 a) b) H.5. Không điều khiển được về 0 c) O O 6 Từ trạng thái ban đầu M1 chuyển động theo quỹ đạo tối ưu rồi cắt đường chuyển đổi AN và sau đó lại chuyển động theo quỹ đạo tối ưu thứ hai và cắt đượng chuyển đổi PO rồi tiếp tục theo quỹ đạo tối ưu thứ ba và cắt đường chuyển đổi ANO v.v... Quỹ đạo pha đó cứ xoắn dần vào gốc tọa độ. Vì thế trượng hợp này quá trình quá độ là một dao động tắt dần (vì quỹ đạo pha ứng với quá trình đó hội tụ vào tiêu điểm cân bằng 0). Trường hợp hình 5c cũng hiểu sai tương tự. Thực ra quá trình trên không phải là quá trình tắt dần và hội tụ về 0, mà như H.6. Theo lý thuyết thì mọi quỹ đạo pha tại trục hoành đều có tiếp tuyến thẳng đứng, tại gốc tọa độ là trục tung. Vì thế đoạn NOP ở lân cận 0 luôn ở phía trước đường cong chuyển đổi lý thuyết, nghĩa là các quỹ đạo tối ưu gặp đoạn thẳng trước khi gặp đường cong chuyển đổi mà không phải ở phía sau như hình 5b Nếu chuyển đổi điều khiển ở đoạn thẳng lân cận bên trái điểm 0 thì quỹ đạo tối ưu cắt trục hoành ở bên trái điêmr 0 rồi ra xa khỏi điển 0. Cũng tương tự khi chuyển đổi điều khiển ở đoạn thẳng lân cận bên phải 0. H.6,a Nếu cho đường gẫy khúc ở phía sau đường cong thì đoạn thẳng qua 0 chính là trục tung. Các quỹ đạo tối ưu cắt nhau trên trục tung thì đối xứng với nhau qua 0 . Nếu đổi chiều điều khiển trên trục tung thì quá trình hoặc là đi xa khỏi 0 hoặc là chuyển động quanh 0 tùy theo chiều và vị trí chuyển đổi. Nếu ở điển phía trên 0 chuyển điều khiển từ âm sang dương thì đi xa khỏi 0, chuyển từ dương sang âm thì quỹ đạo tiếp theo sẽ cắt trục tung ở điểm dưới và đối sứng qua 0 và tại đó lại chuyển sang dương thì quỹ đạo lại cắt trục tung ở điểm chuyển đổi lần trước và nếu chuyển đổi tiếp thì quá trình chuyển động quanh 0 lặp lại mà không tiến tới 0. Cũng tương tự với đối với điểm chuyển đổi ở phía dưới 0. Tóm lại là về nguyên tắc không thể thay thế tương đương quỹ đạo cong tối ưu bằng đường gấp khúc. O y1 b) H.6. Quỹ đạo tối ưu lân cận 0 a) O y1 y2 7 4.4. Điều khiển ở chế độ gần tối ưu Trong thực tế thường phải thỏa mãn đồng thời các yêu cầu khác nhau vì vậy phải thực hiện điều khiển các chế độ gần tối ưu . Quá trình điều khiển thường có ba giai đoạn: giai đoạn quá độ ban đầu đưa đến chế độ ổn định, giai đoạn ổn định để thực hiện nhiệm vụ nào đó và cuối cùng là giai đoạn quá độ về trạng thái ngừng hoạt động. Trong ba giai đoạn thì giai đoạn ổn định thường là quan trọng nhất cần có yêu cầu cao về chất lượng điều khiển ta thực hiện theo chế độ trượt. Giai đoạn đầu và cuối điều khiển theo chế độ tối ưu hoặc gần tối ưu. Giả sử theo phương án trên thì có thể thực hiện điều khiển gần tối ưu từ điểm P về O (H.7) như sau: - Thay quỹ đạo chuyển đổi tối ưu về 0 bằng miền lân cận nó. - Xác định miền điều khiển được về 0 theo đường thẳng ở chế độ trượt (giới hạn bởi trục hoành và đường X1 = - X22) (xem [5]) - Từ P điều khiển theo quỹ đạo tối ưu thì PM là đoạn điều khiển được về 0 theo đường thẳng nhưng ở tốc độ thấp. Muốn được tốc độ cao hơn thì tới N. - Từ N có thể theo các đường thẳng có độ nghiêng khác nhau tới miền lân cận đường chuyển đổi tối ưu - Theo quỹ đạo tối ưu về miền điều khiển được theo đường thẳng lân cận O. - Về O theo đường thẳng. Bằng cách này có thể dễ dàng chọn được chế độ điều khiển thích hợp. Việc chuyển đổi được thực hiện ở một miền mà không phải ở điểm nên dễ thực hiện. 5. Kết luận Các lí thuyết hiện nay còn hạn chế về nguyên tắc .Khi áp dụng còn các yếu tố trực quan và dễ dẫn đến hiểu sai. Là vấn đề khó và phong phú vì vậy những nội dung đề cập ở đây chỉ là bước đầu, tuy nhiên cũng góp phần làm sáng tỏ hơn bản chất của bài toán. Vấn đề cần được nghiên cứu tiếp. H.7. Điều khiển gần tối ưu P X2 X1 = - 22X X1 = - 222 1 X O M N X1 8 Tài liệu tham khảo : [1] .KIM B.K, SHIN K.G., (1983) Suboptimal control of indiustrial manipulator with a weighted minimum time - fuel criterion. Proc. 22 nd IEEE Conf. Decis and Cont. San Anlonio. Vol.3. New York.N.Y [2]. PHẠM CÔNG NGÔ., (1996) Lý thuyết điều khiển tự động . NXB KHKT [3]. NGUYỄN THƯƠNG NGÔ., (1999) Lý thuyết điều khiển tự động hiện đại . NXB KHKT [4]. LE VAN NGU., (1999) The change of the minimum time controllable trajectory and the enduring controllable zones of industrial robot with geometric path constrains. 30th International Symposium on robotics, Proc. pp177- 180, Tokyo, Japan [5]. LÊ VĂN NGỰ ., (2000) Bổ sung cơ sở lý thuyết cho phương pháp điều khiển tối ưu. Tuyển tập báo cáo khoa học. Hội nghị toàn quốc lầm thứ 4 về Tự động hóa. pp. 317- 322 [6]. SHIN K.G.,MCKAY ND., (1985)Minimum time control robotic manipulation with geometric path constraints. IEEE trans. Auto.cont. Vol30, No6, pp 531 - 541. [7]. NGUYỄN DOÃN PHƯỚC, PHAN XUÂN MINH., (1999) Điều khiển tối ưu và bền vững . NXB Khoa học Kỹ thuật người nhận : Phạm anh tuấn Viện cơ học ĐT 7627205 264 Đội cấn. [email protected]