Gần đây, mạng hàm bán kính cơ sở (RBF) được sử dụng khá rộng rãi khi sử dụng mạng nơron
làm bộ điều khiển cho các đối tượng có nhiều tham số bất định như các loại robot. Điều quan
trong nhất khi sử dụng mạng nơron học online là lựa chọn hệ số để cho mạng có tốc độ hội tụ
nhanh.
Từ trước đến nay hệ số này vẫn được chọn theo kinh nghiệm và nhiều khi cũng mất khá nhiều
thời gian để tìm được một hệ số học thoả mãn yêu cầu của bài toán điều khiển. Một vấn đề nữa
là, khi tìm được hệ số học thoả mãn được yêu cầu của bài toán điều khiển rồi, chúng ta cũng
chưa thể kết luận được hệ số đó là tối ưu nhất. Bài báo này đề cập đến việc sử dụng giải thuật di
truy ền (GAs) để t ìm được hệ số học tối ưu cho mạng RBF khi được sử dụng làm bộ điều khiển
cho các đối tượng có các tham số bất định
13 trang |
Chia sẻ: tranhoai21 | Lượt xem: 1370 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Điều khiển robot với mạng nơron RBF có hệ số học được tối ưu bằng giải thuật di truyền, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Điều khiển robot với mạng nơron
RBF có hệ số học được tối ưu
bằng giải thuật di truyền
Tóm tắt:
Gần đây, mạng hàm bán kính cơ sở (RBF) được sử dụng khá rộng rãi khi sử dụng mạng nơron
làm bộ điều khiển cho các đối tượng có nhiều tham số bất định như các loại robot. Điều quan
trong nhất khi sử dụng mạng nơron học online là lựa chọn hệ số để cho mạng có tốc độ hội tụ
nhanh.
Từ trước đến nay hệ số này vẫn được chọn theo kinh nghiệm và nhiều khi cũng mất khá nhiều
thời gian để tìm được một hệ số học thoả mãn yêu cầu của bài toán điều khiển. Một vấn đề nữa
là, khi tìm được hệ số học thoả mãn được yêu cầu của bài toán điều khiển rồi, chúng ta cũng
chưa thể kết luận được hệ số đó là tối ưu nhất. Bài báo này đề cập đến việc sử dụng giải thuật di
truyền (GAs) để tìm được hệ số học tối ưu cho mạng RBF khi được sử dụng làm bộ điều khiển
cho các đối tượng có các tham số bất định
RBF Neural Control of Robot Manipulator with GA Optimazation
Abstract:
Recently, radial basis function (RBF) network is used quite widely when using neural networks
as controllers for subjects with multiple uncertain parameters such as the robot. The most
important thing when using online learning neural network system is the choice of coefficient for
networks with fast convergence speed. So far this coefficient has been chosen by experience and
sometimes it takes quite a long time to find a coefficient that satisfies the requirement of the
controlling task. Another problem is, when finding coefficients satisfying the required study of
the problem and control, we can not conclude that the optimal coefficients. This article refers to
the use of genetic algorithms (GAs) to find optimal learning coefficient for RBF network is used
as a controller for objects whose parameters are uncertain.
Từ khóa: Mạng RBF, Giải thuật di truyền., Điều khiển rô bốt
1. Đặt vấn đề
Giải thuật di truyền hay còn gọi là thuật Gen (Genetic Algorithm -GAs) là sự nghiên cứu thuật
điều khiển dựa trên sự chọn lọc và phát triển tự nhiên, Holland (1992). Chọn lọc tự nhiên là sự
liên kết giữa các nhiễm sắc thể (Chromosome) và biểu diễn cấu trúc mã hoá của chúng để chọn
ra được cá thể có đặc tính tốt nhất. Giống như trong tự nhiên, bằng quá trình chọn lọc, thuật gen
sẽ tìm ra được những nhiễm sắc thể tốt nhất nhờ hiệu chỉnh thông tin của chúng theo yêu cầu của
bài toán [4]. Những thông tin này cho phép ước lượng được giá trị của mỗi nhiễm sắc thể theo
một hàm mục tiêu chọn trước [7][10][13][14]. Điều đó cho phép chọn ra những nhiễm sắc thể có
giá trị ước lượng tốt nhất và loại bỏ những nhiễm sắc thể có giá trị ước lượng kém. Ưu đểm lớn
nhất của GAs là cho phép tìm kiếm tối ưu trên toàn bộ không gian của các biến trạng thái. Do đó
mà người ta đã sử dụng GAs rất nhiều trong các bài toán tối ưu đặc biệt là trong lĩnh vực điều
khiển. Đã có nhiều công trình bài báo sử dụng GAs để tối ưu các tham số của bộ điều khiển [1].
Gần đây, khi mạng nơron được sử dụng rộng rãi khi xây dựng các bộ điều khiển thì GAs cũng
được sử dụng trong bài toán học của mạng nơron để tìm ra các trọng số liên kết tối ưu thay cho
thuật học sai số lan truyền ngược (EBP) truyền thống [1][2][4][5][6][8][10]. Đối với các hệ
thống điều khiển có tính phi tuyến cao và độ bất định lớn, các tham số của hệ thống như độ ma
sát, sự thay đổi của tải trọng .v.v. luôn thay đổi trong trong quá trình điều khiển do đó yêu cầu rất
quan trọng trong quá trình học của các bộ điều khiển nơrơn là phải đảm bảo quá trình học online.
Rất tiếc rằng GAs không thể đáp ứng được yêu cầu đó. Gần đây người ta thường sử dụng thuật
học hàm bán kính cơ sở làm thuật học cho mạng nơron (mạng RBF). Đây là một mạng nơron có
cấu trúc đơn giản nhưng cho phép xấp xỉ hóa được các hàm phi tuyến. Giống như GAs, thuật học
hàm bán kính cơ sở cũng cho phép tối ưu trọng số của mạng nơron trên toàn bộ không gian của
biến trạng thái nhưng đảm bảo quá trình học online. Đối với những bài toán cần tối ưu các tham
số cố định một cách trực tiếp GAs vẫn thể hiện được ưu điểm của nó. Trong các nghiên cứu gần
đây về quá trình học của mạng nơron dù bằng phương pháp hàm bán kính cơ sở hay bằng
phương pháp EBP thì hệ số học h của mạng nơron vẫn được chọn theo kinh nghiệm của người
lập trình. Trong bài báo này tác giả đề cập đến việc sử dụng công cụ GAs để tối ưu hệ số học h
của mạng nơron RBF thay vì lựa chọn bằng kinh nghiệm như đã nêu ra ở trên. Thứ tự của quá
trình học và tối ưu hệ số học h của mạng nơron được thực hiện như sau: Đầu tiên chọn một hệ số
học h theo kinh nghiệm và mạng RBF sẽ học online để tìm ra được tham số tối ưu nhất của
mạng. Bước tiếp theo là dựa trên tập hợp các tham số tối ưu nhất của mạng RBF chúng ta sử
dụng GAs để tìm ra được hệ số học h tối ưu nhất tương ứng với tập hợp trọng số của mạng RBF
đã tìm được trước đó. Bài báo được chia thành năm phần. Sau phần mở đầu, phần hai trình bày
bài toán điều khiển robot với rất nhiều thành phần bất định và phương pháp điều khiển trượt sử
dụng mạng RBF với hệ số học h được chọn theo kinh nghiệm được lựa chọn để xây dựng bộ
điều khiển. Phần ba trình bày các bước tối ưu hệ số học h bằng GAs trong bài toán điều khiển
robot sử dụng mạng RBF. Kết quả mô phỏng GAs tối ưu hệ số học cho mạng RBF điều khiển
robot hai bậc tự do được trình bày trong phần bốn. Phần năm là những nhận xét và đánh giá về
chất lượng của hệ điều khiển robot sử dụng mạng RBF có hệ số học được tối ưu bằng GAs.
5. Kết luận
Với mô hình điều khiển robot theo nguyên lý trượt sử dụng mạng RBF đảm bảo quá trình học
online và cho phép tối ưu trên toàn bộ không gian trạng thái. Kết quả cho thấy hệ thống đảm bảo
hội tụ và sai lệch tiến đến không. Việc sử dụng GAs để tìm ra hệ số học tối ưu cho phép nâng
khảo sát, đánh giá được ảnh hưởng của hệ số học đến quá trình hội tụ của thuật học đồng thời
làm nâng cao hơn nữa chất lượng của quá trình điều khiển. Đây là một bước tiến trong quá trình
nghiên cứu ứng dụng mạng nơron để xây dựng các bộ điều khiển robot vừa đảm bảo tính hội tụ
và ổn định đồng thời nâng cao hơn nữa chất lượng của điều khiển.
Tài liệu tham khảo
[1] Nguyễn Trần Hiệp, Phạm Thượng Cát - Nghiên cứu bài toán dao động con lắc ngược sử dụng thuật Gen bằng Matlab.
Hội thảo toàn quốc về Phát triển công cụ tin học trợ giúp cho giảng dạy nghiên cứu và ứng dụng toán học - Hà nội 4/1999,
trang 326 - 334. .
[2] Nguyễn Trần Hiệp, Phạm Thượng Cát., (1999) Điều khiển con lắc ngược bằng phương pháp trượt, sử dụng mạng nơron
được tối ưu bằng thuật Gen. Tr 30 – 38. Tạp chí KHKT số 90 năm 2000 - Học viện kỹ thuật Quân sự .
[3] Nguyễn Trần Hiệp, Phạm Thượng Cát., Điều khiển robot n bậc tự do với mặt trượt tích phân và mạng nơron xấp xỉ các
đại lượng phi tuyến bất định. Tr 36 – 45. Tạp chí KHKT số 127 năm 2009 - Học viện kỹ thuật Quân sự.
[4] Nguyễn Trần Hiệp, Phạm Thượng Cát - GA and its application in Control Engineering. – Seminar on Simulation 16, 17 –
12 – 1998 – Militart Technical University.
[5] Nguyễn Trần Hiệp, Phạm Thượng Cát - A GAs optimized Neuron Controller for Robot Manipulator – Hội nghị Cơ điện tử
quốc tế lần thứ 8 tại Hà nội, Việt nam 8th đến 12th – 11 năm 2004.
[6] Nguyễn Trần Hiệp, Phạm Thượng Cát - Robust Neural Sliding Mode Control of Robot Manipulators – Proceeding of 2nd
Mediterrannean Conference on Intelligent Systems and Automation, March 23-25 2009, Zarzis, Tunisia. Page 210 -215 (API
Conference Proceedings 1107).
[7] Nguyễn Trần Hiệp, Phạm Thượng Cát - Robot control nDOF by integrated sliding surface and approximating neural
networks – Proceeding of European Control Conreference 2009, 23 - 26 August 2009 Budapest Hungary. Page 2187-2192.
[8] Nguyễn Thanh Thuỷ, Trần Ngọc Hà., (1999) Tích hợp kỹ thuật mạng nơron và giải thuật di truyền trong phân tích dữ
liệu. Tạp chí tin học và điều khiển học T15, S.2
[9] Il-Kwon Jeong, Changkyu Choi, Jin-Ho Shin and Ju-Jang Lee - A Modified Genetic Algorithm for Neurocontrollers. IEEE
Trans. 0-7803-2759-4/95/ pp 306 - 311 1995.
[10] K. Ng and Y. Li. - Design of sophisticated fuzzy logic controllers using genetic algorithms. In Proc. 3rd IEEE Int. Conf.
Fuzzy Systems, IEEE World Congress on Computational Intelligence, pages 1708-1712, Orlando, FL, 1994.
[11] Kunihh Nakazono, Masahiro Katagiri, Hiroshi Kmjo, Tetsuhiko Yamamoto. Force and Position Control of Robot
Manipulator Using Neurocontroller with GA Based Training. Proceedings 2003 lEEE International Symposium on
Computational Intelligence in Robotics and Automation July 1620,2003, Kobe, Japan.
[12] Makoto Iwasaki, Masanobu Miwa and Nobuyuki Matsui. GA-Based Evolutionary Identification Algorithm for Unknown
Structured Mechatronic Systems. IEEE Transactions on Industrial Electronics, Vol. 52, No. 1, February 2005.
[13] Chin - Teng Lin and C.S George Lee - Neural Fuzzy systems - Book is to the Chiao-Tung University Centennial 1996.
[14] H. Asada, J. J. E. Slotine – Robot Analysis and Control, Massachusetts Institude of Technology, 1985.
[15] J.Somlo - B.Lantos - P.T.Cat - Advanced Robot Control. Akademiai Kiado. Budapest 1997.
[16] S. Kawaji, K. Ogasawara, Hidenobu Honda - Swing-up of pendulum using Genetic Algorithms, Proceedings of the 33rd
Conference on Decision and Control Lake Buena Vista Florida, December 1994.
[17] Yun Li and Alexander HauBler - University of Glasgow, UK- Artificial evolution of neural networks and its application to
feedback control. Artifical Intelligence In Engineering, 10(2), pp 143 – 152, February 1996
Nguyễn Trần Hiệp
Khoa kỹ thuật điều khiển – Học viện kỹ thuật Quân sự - 100 Hoàng Quốc Việt, Cầu giấy, Hà nội
hiepnguyentran@vnn.vn
Phản biện 1: PGS. TS. Đào Văn Hiệp, Học Viện Kỹ thuật Quân sự
Phản biện 2: PGS. TS. Lê Hòai Quốc, Sở Khoa học và Công nghệ TP Hồ Chí Minh