Điều khiển robot với mạng nơron RBF có hệ số học được tối ưu bằng giải thuật di truyền

Gần đây, mạng hàm bán kính cơ sở (RBF) được sử dụng khá rộng rãi khi sử dụng mạng nơron làm bộ điều khiển cho các đối tượng có nhiều tham số bất định như các loại robot. Điều quan trong nhất khi sử dụng mạng nơron học online là lựa chọn hệ số để cho mạng có tốc độ hội tụ nhanh. Từ trước đến nay hệ số này vẫn được chọn theo kinh nghiệm và nhiều khi cũng mất khá nhiều thời gian để tìm được một hệ số học thoả mãn yêu cầu của bài toán điều khiển. Một vấn đề nữa là, khi tìm được hệ số học thoả mãn được yêu cầu của bài toán điều khiển rồi, chúng ta cũng chưa thể kết luận được hệ số đó là tối ưu nhất. Bài báo này đề cập đến việc sử dụng giải thuật di truy ền (GAs) để t ìm được hệ số học tối ưu cho mạng RBF khi được sử dụng làm bộ điều khiển cho các đối tượng có các tham số bất định

13 trang | Chia sẻ: tranhoai21 | Lượt xem: 1229 | Lượt tải: 0

Bạn đang xem nội dung tài liệu Điều khiển robot với mạng nơron RBF có hệ số học được tối ưu bằng giải thuật di truyền, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên

Điều khiển robot với mạng nơron RBF có hệ số học được tối ưu bằng giải thuật di truyền Tóm tắt: Gần đây, mạng hàm bán kính cơ sở (RBF) được sử dụng khá rộng rãi khi sử dụng mạng nơron làm bộ điều khiển cho các đối tượng có nhiều tham số bất định như các loại robot. Điều quan trong nhất khi sử dụng mạng nơron học online là lựa chọn hệ số để cho mạng có tốc độ hội tụ nhanh. Từ trước đến nay hệ số này vẫn được chọn theo kinh nghiệm và nhiều khi cũng mất khá nhiều thời gian để tìm được một hệ số học thoả mãn yêu cầu của bài toán điều khiển. Một vấn đề nữa là, khi tìm được hệ số học thoả mãn được yêu cầu của bài toán điều khiển rồi, chúng ta cũng chưa thể kết luận được hệ số đó là tối ưu nhất. Bài báo này đề cập đến việc sử dụng giải thuật di truyền (GAs) để tìm được hệ số học tối ưu cho mạng RBF khi được sử dụng làm bộ điều khiển cho các đối tượng có các tham số bất định RBF Neural Control of Robot Manipulator with GA Optimazation Abstract: Recently, radial basis function (RBF) network is used quite widely when using neural networks as controllers for subjects with multiple uncertain parameters such as the robot. The most important thing when using online learning neural network system is the choice of coefficient for networks with fast convergence speed. So far this coefficient has been chosen by experience and sometimes it takes quite a long time to find a coefficient that satisfies the requirement of the controlling task. Another problem is, when finding coefficients satisfying the required study of the problem and control, we can not conclude that the optimal coefficients. This article refers to the use of genetic algorithms (GAs) to find optimal learning coefficient for RBF network is used as a controller for objects whose parameters are uncertain. Từ khóa: Mạng RBF, Giải thuật di truyền., Điều khiển rô bốt 1. Đặt vấn đề Giải thuật di truyền hay còn gọi là thuật Gen (Genetic Algorithm -GAs) là sự nghiên cứu thuật điều khiển dựa trên sự chọn lọc và phát triển tự nhiên, Holland (1992). Chọn lọc tự nhiên là sự liên kết giữa các nhiễm sắc thể (Chromosome) và biểu diễn cấu trúc mã hoá của chúng để chọn ra được cá thể có đặc tính tốt nhất. Giống như trong tự nhiên, bằng quá trình chọn lọc, thuật gen sẽ tìm ra được những nhiễm sắc thể tốt nhất nhờ hiệu chỉnh thông tin của chúng theo yêu cầu của bài toán [4]. Những thông tin này cho phép ước lượng được giá trị của mỗi nhiễm sắc thể theo một hàm mục tiêu chọn trước [7][10][13][14]. Điều đó cho phép chọn ra những nhiễm sắc thể có giá trị ước lượng tốt nhất và loại bỏ những nhiễm sắc thể có giá trị ước lượng kém. Ưu đểm lớn nhất của GAs là cho phép tìm kiếm tối ưu trên toàn bộ không gian của các biến trạng thái. Do đó mà người ta đã sử dụng GAs rất nhiều trong các bài toán tối ưu đặc biệt là trong lĩnh vực điều khiển. Đã có nhiều công trình bài báo sử dụng GAs để tối ưu các tham số của bộ điều khiển [1]. Gần đây, khi mạng nơron được sử dụng rộng rãi khi xây dựng các bộ điều khiển thì GAs cũng được sử dụng trong bài toán học của mạng nơron để tìm ra các trọng số liên kết tối ưu thay cho thuật học sai số lan truyền ngược (EBP) truyền thống [1][2][4][5][6][8][10]. Đối với các hệ thống điều khiển có tính phi tuyến cao và độ bất định lớn, các tham số của hệ thống như độ ma sát, sự thay đổi của tải trọng .v.v. luôn thay đổi trong trong quá trình điều khiển do đó yêu cầu rất quan trọng trong quá trình học của các bộ điều khiển nơrơn là phải đảm bảo quá trình học online. Rất tiếc rằng GAs không thể đáp ứng được yêu cầu đó. Gần đây người ta thường sử dụng thuật học hàm bán kính cơ sở làm thuật học cho mạng nơron (mạng RBF). Đây là một mạng nơron có cấu trúc đơn giản nhưng cho phép xấp xỉ hóa được các hàm phi tuyến. Giống như GAs, thuật học hàm bán kính cơ sở cũng cho phép tối ưu trọng số của mạng nơron trên toàn bộ không gian của biến trạng thái nhưng đảm bảo quá trình học online. Đối với những bài toán cần tối ưu các tham số cố định một cách trực tiếp GAs vẫn thể hiện được ưu điểm của nó. Trong các nghiên cứu gần đây về quá trình học của mạng nơron dù bằng phương pháp hàm bán kính cơ sở hay bằng phương pháp EBP thì hệ số học h của mạng nơron vẫn được chọn theo kinh nghiệm của người lập trình. Trong bài báo này tác giả đề cập đến việc sử dụng công cụ GAs để tối ưu hệ số học h của mạng nơron RBF thay vì lựa chọn bằng kinh nghiệm như đã nêu ra ở trên. Thứ tự của quá trình học và tối ưu hệ số học h của mạng nơron được thực hiện như sau: Đầu tiên chọn một hệ số học h theo kinh nghiệm và mạng RBF sẽ học online để tìm ra được tham số tối ưu nhất của mạng. Bước tiếp theo là dựa trên tập hợp các tham số tối ưu nhất của mạng RBF chúng ta sử dụng GAs để tìm ra được hệ số học h tối ưu nhất tương ứng với tập hợp trọng số của mạng RBF đã tìm được trước đó. Bài báo được chia thành năm phần. Sau phần mở đầu, phần hai trình bày bài toán điều khiển robot với rất nhiều thành phần bất định và phương pháp điều khiển trượt sử dụng mạng RBF với hệ số học h được chọn theo kinh nghiệm được lựa chọn để xây dựng bộ điều khiển. Phần ba trình bày các bước tối ưu hệ số học h bằng GAs trong bài toán điều khiển robot sử dụng mạng RBF. Kết quả mô phỏng GAs tối ưu hệ số học cho mạng RBF điều khiển robot hai bậc tự do được trình bày trong phần bốn. Phần năm là những nhận xét và đánh giá về chất lượng của hệ điều khiển robot sử dụng mạng RBF có hệ số học được tối ưu bằng GAs. 5. Kết luận Với mô hình điều khiển robot theo nguyên lý trượt sử dụng mạng RBF đảm bảo quá trình học online và cho phép tối ưu trên toàn bộ không gian trạng thái. Kết quả cho thấy hệ thống đảm bảo hội tụ và sai lệch tiến đến không. Việc sử dụng GAs để tìm ra hệ số học tối ưu cho phép nâng khảo sát, đánh giá được ảnh hưởng của hệ số học đến quá trình hội tụ của thuật học đồng thời làm nâng cao hơn nữa chất lượng của quá trình điều khiển. Đây là một bước tiến trong quá trình nghiên cứu ứng dụng mạng nơron để xây dựng các bộ điều khiển robot vừa đảm bảo tính hội tụ và ổn định đồng thời nâng cao hơn nữa chất lượng của điều khiển. Tài liệu tham khảo [1] Nguyễn Trần Hiệp, Phạm Thượng Cát - Nghiên cứu bài toán dao động con lắc ngược sử dụng thuật Gen bằng Matlab. Hội thảo toàn quốc về Phát triển công cụ tin học trợ giúp cho giảng dạy nghiên cứu và ứng dụng toán học - Hà nội 4/1999, trang 326 - 334. . [2] Nguyễn Trần Hiệp, Phạm Thượng Cát., (1999) Điều khiển con lắc ngược bằng phương pháp trượt, sử dụng mạng nơron được tối ưu bằng thuật Gen. Tr 30 – 38. Tạp chí KHKT số 90 năm 2000 - Học viện kỹ thuật Quân sự . [3] Nguyễn Trần Hiệp, Phạm Thượng Cát., Điều khiển robot n bậc tự do với mặt trượt tích phân và mạng nơron xấp xỉ các đại lượng phi tuyến bất định. Tr 36 – 45. Tạp chí KHKT số 127 năm 2009 - Học viện kỹ thuật Quân sự. [4] Nguyễn Trần Hiệp, Phạm Thượng Cát - GA and its application in Control Engineering. – Seminar on Simulation 16, 17 – 12 – 1998 – Militart Technical University. [5] Nguyễn Trần Hiệp, Phạm Thượng Cát - A GAs optimized Neuron Controller for Robot Manipulator – Hội nghị Cơ điện tử quốc tế lần thứ 8 tại Hà nội, Việt nam 8th đến 12th – 11 năm 2004. [6] Nguyễn Trần Hiệp, Phạm Thượng Cát - Robust Neural Sliding Mode Control of Robot Manipulators – Proceeding of 2nd Mediterrannean Conference on Intelligent Systems and Automation, March 23-25 2009, Zarzis, Tunisia. Page 210 -215 (API Conference Proceedings 1107). [7] Nguyễn Trần Hiệp, Phạm Thượng Cát - Robot control nDOF by integrated sliding surface and approximating neural networks – Proceeding of European Control Conreference 2009, 23 - 26 August 2009 Budapest Hungary. Page 2187-2192. [8] Nguyễn Thanh Thuỷ, Trần Ngọc Hà., (1999) Tích hợp kỹ thuật mạng nơron và giải thuật di truyền trong phân tích dữ liệu. Tạp chí tin học và điều khiển học T15, S.2 [9] Il-Kwon Jeong, Changkyu Choi, Jin-Ho Shin and Ju-Jang Lee - A Modified Genetic Algorithm for Neurocontrollers. IEEE Trans. 0-7803-2759-4/95/ pp 306 - 311 1995. [10] K. Ng and Y. Li. - Design of sophisticated fuzzy logic controllers using genetic algorithms. In Proc. 3rd IEEE Int. Conf. Fuzzy Systems, IEEE World Congress on Computational Intelligence, pages 1708-1712, Orlando, FL, 1994. [11] Kunihh Nakazono, Masahiro Katagiri, Hiroshi Kmjo, Tetsuhiko Yamamoto. Force and Position Control of Robot Manipulator Using Neurocontroller with GA Based Training. Proceedings 2003 lEEE International Symposium on Computational Intelligence in Robotics and Automation July 1620,2003, Kobe, Japan. [12] Makoto Iwasaki, Masanobu Miwa and Nobuyuki Matsui. GA-Based Evolutionary Identification Algorithm for Unknown Structured Mechatronic Systems. IEEE Transactions on Industrial Electronics, Vol. 52, No. 1, February 2005. [13] Chin - Teng Lin and C.S George Lee - Neural Fuzzy systems - Book is to the Chiao-Tung University Centennial 1996. [14] H. Asada, J. J. E. Slotine – Robot Analysis and Control, Massachusetts Institude of Technology, 1985. [15] J.Somlo - B.Lantos - P.T.Cat - Advanced Robot Control. Akademiai Kiado. Budapest 1997. [16] S. Kawaji, K. Ogasawara, Hidenobu Honda - Swing-up of pendulum using Genetic Algorithms, Proceedings of the 33rd Conference on Decision and Control Lake Buena Vista Florida, December 1994. [17] Yun Li and Alexander HauBler - University of Glasgow, UK- Artificial evolution of neural networks and its application to feedback control. Artifical Intelligence In Engineering, 10(2), pp 143 – 152, February 1996 Nguyễn Trần Hiệp Khoa kỹ thuật điều khiển – Học viện kỹ thuật Quân sự - 100 Hoàng Quốc Việt, Cầu giấy, Hà nội hiepnguyentran@vnn.vn Phản biện 1: PGS. TS. Đào Văn Hiệp, Học Viện Kỹ thuật Quân sự Phản biện 2: PGS. TS. Lê Hòai Quốc, Sở Khoa học và Công nghệ TP Hồ Chí Minh