TÓM TẮT
Trong bài báo này chúng tôi trình bày phương pháp có tên “từng bước tốt hơn”:
biến việc giải hệ phương trình phi tuyến thành bài toán tìm cực tiểu của một hàm có
dạng tổng bình phương. Phương pháp này dựa vào hướng gradient giảm dần giá trị của
hàm để dần xấp xỉ đến giá trị cực tiểu của hàm và giá trị đó cũng chính là nghiệm địa
phương của hệ phương trình ban đầu. Quá trình này đã được lập trình trên Matlab để
thử nghiệm, so sánh nghiệm và tốc độ hội tụ của phương pháp này với với phương pháp
Newton.
8 trang |
Chia sẻ: thanhle95 | Lượt xem: 345 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Thuật toán từng bước (Có độ dốc) tốt hơn cho việc giải hệ phương trình phi tuyến, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
TAÏP CHÍ ÑAÏI HOÏC SAØI GOØN Soá 6 - Thaùng 6/2011
91
THUẬT TOÁN TỪNG BƯỚC (CÓ ĐỘ DỐC) TỐT HƠN
CHO VIỆC GIẢI HỆ PHƯƠNG TRÌNH PHI TUYẾN
NGUYỄN PHÚ VINH
(*)
TÓM TẮT
Trong bài báo này chúng tôi trình bày phương pháp có tên “từng bước tốt hơn”:
biến việc giải hệ phương trình phi tuyến thành bài toán tìm cực tiểu của một hàm có
dạng tổng bình phương. Phương pháp này dựa vào hướng gradient giảm dần giá trị của
hàm để dần xấp xỉ đến giá trị cực tiểu của hàm và giá trị đó cũng chính là nghiệm địa
phương của hệ phương trình ban đầu. Quá trình này đã được lập trình trên Matlab để
thử nghiệm, so sánh nghiệm và tốc độ hội tụ của phương pháp này với với phương pháp
Newton.
ABSTRACT
In this article, we study the steepest - descent algorithmwhich is a transformation of
the solving nonlinear equations system into finding the minimum of a multivariable
function belonging to the form of sum of squares. This method is on the decent of
gradient of the function. This function value is approached by the minimum of the
function which is the local solution of the above nonlinear equations system. This
process is programmed by Matlab in order to test the solution of this problem. It is used
to compare the solution and the rate of convergence of this method and Newton method.
1. ĐẶT VẤN ĐỀ (*)
Việc giải xấp xỉ gần đúng một hệ
phương trình phi tuyến là việc mà nhiều tác
giả trong và ngoài nước đã từ lâu vẫn quan
tâm. Nhưng chưa có một phương pháp nào
tổng quát để giải mọi hệ phương trình.
Hiện nay phương pháp Newton có thể xem
là phương pháp tốt nhất, tốc độ hội tụ
nhanh nhất để giải hệ phi tuyến, nhưng vẫn
không phải là phương pháp vạn năng cho
(*) TS, Khoa Cơ bản, Đại học Công nghiệp Tp. Hồ
Chí Minh
mọi hệ phương trình. Trong bài báo này
chúng tôi trình bày phương pháp có tên
“từng bước tốt hơn”: biến việc giải hệ
phương trình phi tuyến thành bài toán tìm
cực tiểu của một hàm có dạng tổng bình
phương. Phương pháp này dựa vào hướng
gradient giảm dần của hàm để dần xấp xỉ
đến cực tiểu của hàm và đó chính là
nghiệm địa phương của hệ phương trình
ban đầu.
2. PHƯƠNG PHÁP VÀ KẾT QUẢ NGHIÊN CỨU
2.1. Phương pháp luận về thuật toán töøng böôùc toát hôn (steepest)
Đặt bài toán: hãy giải hệ phi tuyến đa biến sau:
92
1 1 2 n
2 1 2 n
n 1 2 n
f x , x ,..., x = 0
f x , x ,..., x = 0
F = 0
- - - - - - - - - - -
f x , x ,..., x = 0
, trong đó
1 1 2 n
2 1 2 n
n 1 2 n
f x , x ,..., x
f x , x ,..., x
F =
.......................
f x , x ,..., x
ta biến bài toán thành bài toán tìm cực tiểu hàm có dạng tổng bình phương sau:
1
2 2 2 2
n i 1 1 2 1 2 n n 1 2 n2
n
g x , x ,.., x = f = f x , x ,.., x + f x , x ,.., x +..+ f x , x , .., xn 2
i=1
vậy bài toán đưa về là bài toán tìm p địa phương:
nx R
g p = min g x
=0.
Để làm giảm từng bước hàm g(x) và dần đến 0 là cực tiểu của hàm, tiến hành với thuật
toán như sau: bắt đầu với (0)x , sau đó tìm điểm dần tốt hơn (1)x sao cho:
(1) (0) (0)x = x -α g x với >0, (chú ý g là hướng có khả năng làm giảm hàm g(x)),
ta sẽ điều chỉnh như thế nào đó để: (1) (0)g x g x .
Để xác định , cần tìm cực tiểu của hàm một biến (0) (0)h g x g x .
Nhưng việc khảo sát và lấy đạo hàm trực tiếp của h một cách bài bản thì thật là
khó, thay vào đó làm theo phương pháp steepest như sau:
Chọn ba số 1 2 3 và hi vọng chúng sẽ gần vị trí cực tiểu của hàm h , bằng
cách ta xây dựng một tam thức bậc hai P(x) chính là đa thức nội suy Newton tiến của
h tại ba điểm mốc nội suy 1 2, và 3 . Sau đó ta tìm 1 3, để P là
cực tiểu trong đoạn 1 3, và dùng P để xấp xỉ cực tiểu của h . Rồi dùng
làm giá trị xấp xỉ mới cho hàm g, tức là: (1) (0) (0)x x g x . Tổng quát ta có
công thức truy hồi để tìm nghiệm xấp xỉ:
( 1) ( ) ( )i i ix x g x
Tính công thức gradient hàm g:
93
n n
i i i i,1 i,2 i,3 i,n
i=1 i=1
g x = 2f f = 2f f ,f ,f ,..,f = 1 1,1 1,2 1,n2f f , f ,.., f +
2 2,1 2,2 2,n2f f , f ,.., f + 3 3,1 3,2 3,n n n,1 n,2 n,n2f f , f ,.., f +...+ 2f f , f ,.., f =
=
T
1,1 2,1 n,1 1,1 1,2 1,n1 1
1,2 2,2 n,2 2,1 2,2 2,n2 2
n n1,n 2,n n,n n,1 n,2 n,n
f f M f f f M ff f
f f M f f f M ff f
2 = 2
M MM M M M M M M M
f ff f M f f f M f
= T 1 2 n2J F x , x ,..., x
Trong đó J là Jacobi của hàm 1 2, , ..., nF x x x . Sau đây là thuật toán steepest.
2.2. Thuật toán từng bước tốt hơn (steepest)
Nhập giá trị ban đầu: 1 2, , ...,
T
nx x x x , số bước N cần tính, sai số chịu đựng tính
toán TOL (tolerant)
while k N do
1. Set 1 1 2, , ..., ng g x x x
1 2 1 2, , ..., 2 , , ...,
T
n nz g x x x J F x x x
0 2
z z
2. If 0z 0 then OUTPUT(“Zero gradient, may have a minimum”) , STOP
3.
0
z
z
z
, 1 0 , 3 1 , 3 3g g x z
4. While 3 1g g do steps 5 and 6
5. 3 3 / 2 , 3 3g g x z
6. If 3 / 2TOL then OUTPUT(“Improvement, may have a
minimum”) , STOP
7. 2 3 / 2 , 2 2g g x z
8. 2 11
2 1
g g
h
, 3 22
3 2
g g
h
, 2 13
3 1
h h
h
9. 10 2
3
0.5
h
h
, 0 0g g x z
10. Tìm từ 0 3, để 0 3min ,g g x z g g
11. x x z
12. If 1g g TOL then OUTPUT(“successful”) , STOP
94
13. k=k+1
End
2.3. Các ví dụ và so sánh kết quả
Ví dụ 1: giải hệ:
1 2
1 1 2 3
2
2 2 1 3
3 3
6 2cos 1 0
9 sin 1.06 0.9 0
60 3 10 3 0
x x
f x x x
f x x x
f x e
,
lấy nghiệm ban đầu (0) 1,1,1 Tx . Với hàm 2 2 2 21 2 3
1
n
i
i
g f f f f
,
Tính Jacobi:
J=
1 2 1 2
2 3 3 2 3 2
3
1
2 2
1 3 1 3
2 1
6 2sin 2sin
2cos
9
sin 1.06 sin 1.06
3 3 60
x x x x
x x x x x x
xx
x x x x
x e x e
,
và
1
2
3
f
F f
f
k=1,
Thế (0)x để tính (0)1g g x 8163.7523; z= 2 TJ F =
-136.9376876467
24.4584536238
10759.2205558461
,
tính chuẩn 0 2
z z =10760.1197537; và
(0)
0
-0.01272640925754
0.00227306518733
0.99991643234926
g x
z
z
.
Vậy
Với (0) (0)1 1 10 g g x z g x 8163.7523
Với 3 1 F (0) 3x z =
3.07635846249709
11.32373711890548
29.51313389084277
95
==> (0)3 3g g x z 1008.71607578
Vì g3 < g1 nên ta chấp nhận 3 1 và gán 2 0.5 , rồi tính
F (0) 2x z =
3.28250948349129
11.48734095680031
59.51632652171600
==>
(0)2 2g g x z 3684.9269934065
Bây giờ dựa vào bảng mốc nội suy:
1 2 3
1 2 3g g g
, để nội suy ra hàm bậc hai theo :
1 1 1 3 1 2 1 1 3 2P g h h g h h
bằng phương pháp Newton tiến nhờ bảng dữ liệu sau:
1 1
2 2
3 3
0 8163.7523
0.5 3684.9269
1 1008.7160
g
g
g
;
ta có: 2 11
2 1
g g
h
=-8957.6507317, 3 22
3 2
g g
h
= -5352.42183523,
2 13
3 1
h h
h
=3605.228896495
Thế 1 3,h h vào P , sau đó ta lấy đạo hàm P để tìm cực tiểu của nó, tức giải
/ 0P để tìm được nghiệm: 10 2
3
0.5
h
h
=1.4923137322,
==> F (0) 0x z =
3.34977423120232
11.14453481099873
-0.02878932588947
==> (0)0 0g g x z =135.4224723
ta thấy 0g nhỏ hơn 1g và 3g .
Vậy ta lấy (1) (0) 0
1.01899179529672
0.99660787360675
-0.49218902305463
x x z
và tính (1)g x 135.4224723
k=2, tính lại z= 2 TJ F =
58.072382205939
203.772128736778
-2.042514338131
.............
(2) (1) 0 0.695645, -0.137993, -0.480816
T
x x z và (2)g x 10.107836......
96
Và thuật toán cứ thế lặp lại với công thức truy hồi: ( 1) ( ) ( )i i ix x g x cho đến
khi đạt được nghiệm khá gần với nghiệm chính xác là:
(0.498145, -0.199606, -0.528826)
T
ở đây ta lấy tiêu chuẩn dừng của thuật toán là:
( ) ( 1) 5
10
k k
x x
, khoảng 28
bước (xem bảng sau) mới đạt được điều đó.
k ( )
1
k
x
( )
2
k
x
( )
3
k
x g(x)
1 1.018992 0.996608 -0.492189 135.422472
2 0.695645 -0.137993 -0.480816 10.107836
3 0.693185 -0.137886 -0.528789 1.814149
4 0.583604 -0.226612 -0.523367 0.494123
5 0.582668 -0.225863 -0.530753 0.295721
6 0.555173 -0.209607 -0.525621 0.182806
7 0.554550 -0.209322 -0.529834 0.118411
8 0.535784 -0.204358 -0.526724 0.077100
9 0.535372 -0.204218 -0.529429 0.050569
1
0
0.522932 -0.202299 -0.527436 0.033205
1
1
0.522660 -0.202218 -0.529208 0.021829
1
2
0.514463 -0.201270 -0.527910 0.014356
1
3
0.514284 -0.201220 -0.529074 0.009448
1
4
0.508890 -0.200672 -0.528222 0.006219
1
5
0.508772 -0.200640 -0.528988 0.004094
1
6
0.505221 -0.200300 -0.528428 0.002696
1
7
0.505144 -0.200279 -0.528932 0.001775
1
8
0.502806 -0.200060 -0.528564 0.001169
1
9
0.502755 -0.200046 -0.528896 0.000770
2
0
0.501215 -0.199904 -0.528653 0.000507
97
2
1
0.501181 -0.199895 -0.528872 0.000334
2
2
0.500167 -0.199802 -0.528712 0.000220
2
3
0.500145 -0.199796 -0.528856 0.000145
2
4
0.499477 -0.199735 -0.528751 0.000096
2
5
0.499463 -0.199731 -0.528846 0.000063
2
6
0.499023 -0.199691 -0.528777 0.000041
2
7
0.499013 -0.199688 -0.528839 0.000027
2
8
0.498723 -0.199662 -0.528793 0.000018
Vậy sau 28 bước ta có nghiệm xấp xỉ là: (498145, -0.199606, -0.528826)T
So với phương pháp Newton chính thống với ví dụ trên như bảng sau:
( )
1
k
x
( )
2
k
x
( )
3
k
x
1.127638 -0.270927 -0.513022
0.498513 -0.192263 -0.523877
0.498150 -0.199606 -0.528826
0.498145 -0.199606 -0.528826
Ta thấy phương pháp Newton chính thống có tốc độ hội tụ nhanh hơn nhiều so với
phương pháp steepest. Ta xét thêm ví dụ sau:
Ví dụ 2: Giải hệ
1 1 1 2 3
24
2 1 2 3 3
2 2
3 1 2 2 3
cos 1 0
1 0.05 0.15 1 0
0.1 0.01 1 0
f x x x x
f x x x x
f x x x x
, lấy (0) 0,0,0 Tx ;
Kết quả được chương trình in ra như bảng sau: chỉ cần năm bước là hội tụ
k ( )
1
k
x
( )
2
k
x
( )
3
k
x g(x)
1 0.000000 0.009944 0.994385 0.008090
2 -0.020018 0.090056 0.995265 0.000449
3 -0.000128 0.094959 1.000282 0.000025
98
4 -0.001133 0.099438 0.999764 0.000001
5 -0.000003 0.099718 0.999995 0.000000
Nghiệm đúng của hệ này là: x1=0, x2=0.1, x3=1.
3. KẾT LUẬN
Phương pháp steepest có tốc độ hội tụ
chậm hơn nhiều so với phương pháp chính
thống Newton, nhưng phương pháp
steepest luôn chọn được hướng (gradient
tốt dần) hội tụ của bài toán, thậm chí có
những bài toán mà phương pháp Newton
không cho ta kết quả, trong khi đó phương
pháp steepest lại cho ta kết quả, tất nhiên
tốc độ hội tụ của phương pháp này rất
chậm. Trên đây cũng chỉ là một trong
nhiều phương pháp mà thế giới đã nghiên
cứu. Ở đây chúng tôi dựa vào phương pháp
tối ưu để tìm cực trị của hàm phi tuyến đa
biến cho trường hợp riêng khi hàm phi
tuyến đa biến lại là dạng tổng bình phương
của các hàm phi tuyến đa biến. Các kết quả
này chỉ là bước đầu của việc tìm nghiệm
địa phương, chưa đề cập đến việc đánh giá
sai số giữa nghiệm xấp xỉ và nghiệm chính
xác, cũng như chưa xác định vùng cận để
chọn giá trị ban đầu (0)x sao cho bài toán
hội tụ đến nghiệm địa phương cần tìm,
chúng tôi sẽ hẹn những bài báo sau.