Численное решение задач оптимального управления нелинейными динамическими системами
Запропоновано чисельний метод розв’язання задач оптимального керування об’єктами, які описуються системою нелінійних звичайних диференціальних рівнянь на класах кусково-сталих, кусково-лінійних і кусково-заданих керувань. В задачах оптимізуються кусково-сталі значення коефіцієнтів з формул для керув...
Saved in:
| Published in: | Проблемы управления и информатики |
|---|---|
| Date: | 2012 |
| Main Author: | |
| Format: | Article |
| Language: | Russian |
| Published: |
Інститут кібернетики ім. В.М. Глушкова НАН України
2012
|
| Subjects: | |
| Online Access: | https://nasplib.isofts.kiev.ua/handle/123456789/207541 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| Journal Title: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Cite this: | Численное решение задач оптимального управления нелинейными динамическими системами / А.Б. Рагимов // Проблемы управления и информатики. — 2012. — № 6. — С. 54–66. — Бібліогр.: 13 назв. - рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| _version_ | 1859717569803452416 |
|---|---|
| author | Рагимов, А.Б. |
| author_facet | Рагимов, А.Б. |
| citation_txt | Численное решение задач оптимального управления нелинейными динамическими системами / А.Б. Рагимов // Проблемы управления и информатики. — 2012. — № 6. — С. 54–66. — Бібліогр.: 13 назв. - рос. |
| collection | DSpace DC |
| container_title | Проблемы управления и информатики |
| description | Запропоновано чисельний метод розв’язання задач оптимального керування об’єктами, які описуються системою нелінійних звичайних диференціальних рівнянь на класах кусково-сталих, кусково-лінійних і кусково-заданих керувань. В задачах оптимізуються кусково-сталі значення коефіцієнтів з формул для керувань, і, що найважливіше, оптимізуються межі інтервалів сталості цих значень. Отримано аналітичні формули градієнта функціонала за параметрами, які оптимізуються. Проведено порівняння формул градієнта функціонала, отриманих для вихідної неперервної і відповідної дискретизованої задач оптимального керування на класі кусково-сталих керувань. Наведено результати чисельних експериментів на прикладі розв’язання модельних задач.
Numerical method of solving to optimal control problems is proposed for objects described by the system of ordinary nonlinear differential equations on the classes of piecewise constant, piecewise linear and piecewise given controls. Both the piecewise constant values of the coefficients in the expression of controls as well as the boundaries of constancy intervals of these values are optimized. Analytical formulas for the gradient of the functional with respect to the optimized parameters are obtained. Comparison of the formulas for the gradient of the functional obtained for the initial continuous optimal control problem and for the corresponding discretized optimal control problem on the class of piecewise constant controls is carried out. Results of numerical experiments carried out through the examples of the solutions to some model problems are also given.
|
| first_indexed | 2025-12-01T08:26:42Z |
| format | Article |
| fulltext |
© А.Б. РАГИМОВ, 2012
54 ISSN 0572-2691
УДК 519.6, 517.977.5
А.Б. Рагимов
ЧИСЛЕННОЕ РЕШЕНИЕ ЗАДАЧ ОПТИМАЛЬНОГО
УПРАВЛЕНИЯ НЕЛИНЕЙНЫМИ
ДИНАМИЧЕСКИМИ СИСТЕМАМИ
Введение
При управлении многими реальными процессами осуществление частых из-
менений значений управляющих воздействий либо связано с большими трудно-
стями реализации, либо вообще невозможно. Поэтому с практической точки зре-
ния возникает необходимость исследования задач оптимального управления,
например на классах кусочно-постоянных, кусочно-линейных и других легко реа-
лизуемых классах управляющих воздействий. В статье исследуются нелинейные
задачи оптимального управления процессами, описываемые системами обыкно-
венных дифференциальных уравнений. В рассматриваемых задачах управление
принадлежит классам кусочно-постоянных, кусочно-линейных и кусочно-задан-
ных управляющих функций; оптимизируемыми являются кусочно-постоянные
значения коэффициентов, участвующих в выражении управлений и оптимизиру-
ются сами интервалы постоянства этих коэффициентов. Важным в рассматривае-
мых задачах является также то, что границы интервалов постоянства коэффици-
ентов неизвестны и оптимизируются. Предложен метод численного определения
оптимальных кусочно-постоянных значений коэффициентов, участвующих в вы-
ражении управлений, и интервалов постоянства этих коэффициентов, основанный
на методах конечномерной оптимизации первого порядка и полученных форму-
лах градиента функционала по оптимизируемым параметрам.
Отметим, что различные другие аспекты оптимального управления на классе
кусочно-постоянных функций исследовались многими авторами [1–6]. В частности,
в [3] для решения линейно-квадратичной задачи управления на классе кусочно-
постоянных управляющих функций с оптимизируемыми временами их переключе-
ния использована фундаментальная матрица решений. В [5] получены условия оп-
тимальности для случая, когда управления принимают значения из заданного мно-
жества с конечным числом значений. В [6] получены формулы для градиента функ-
ционала в задаче оптимального управления объектами, описываемыми системами
обыкновенных дифференциальных уравнений на классе кусочно-постоянных функ-
ций при неточной информации о начальных условиях и параметрах.
1. Постановка задачи
Рассматривается задача оптимального управления объектами, описываемыми
системой обыкновенных в общем случае нелинейных дифференциальных уравнений.
Пусть состояние управляемого объекта описывается следующей задачей Коши:
,)0(],,0(),,,()( 0xxTttuxftx (1)
где ,],0[,)( TtEtxx n — фазовое состояние объекта; ],,0[,)( TtEtuu r —
управление; вектор-функция )...,,,( 21 nffff вместе с частными производными
непрерывны по ).,( ux Момент времени T и начальная точка
nEx 0 заданы. Рас-
смотрены три типа задач в зависимости от наложения на управление различных
условий.
Международный научно-технический журнал
«Проблемы управления и информатики», 2012, № 6 55
1.1. Управления из класса кусочно-постоянных функций. Управление
,)( rEtu ,],0[ Tt является постоянным [7] на каждом полуинтервале ),,[ 1 jj
,,...,1 Lj полученном разбиением отрезка ],0[ T )1( L оптимизируемыми точ-
ками ,1,...,1, Ljj (рис. 1), т.e.
,),,[,const)( 1
r
jjjj Evtvtu (2)
,,0,,...,1, 01 TLj Ljj (3)
а значения управления ,,...,1, LjEv r
j принадлежат некоторому множеству U,
в частности, следующему параллелепипеду:
.},...,1,,,,),,...,(:{ 1 LjEvvvvvvU r
jjjjjjL (4)
Задача заключается в нахожде-
нии кусочно-постоянных значений
управления ),(tu т.е. значений ко-
нечномерных векторов ,rj Ev
,,...,1 Lj и границ интервалов по-
стоянства этих значений, определя-
емых вектором ),,...,( 11 L
при которых заданный функционал
))((),,(),()(
0
0 TxdttuxfvJuJ
T
(5)
при условиях (1)–(4) принимает минимальное значение,
1)1(),( rLEv . Предпола-
гается, что заданные функции
0f и непрерывны вместе с частными производны-
ми по своим аргументам и число интервалов постоянства управлений L задано.
1.2. Управления из класса
кусочно-линейных функций. Уп-
равление ,)( rEtu ,],0[ Tt яв-
ляется линейной функцией на
каждом полуинтервале ),,[ 1 jj
,...,,1 Lj (рис. 2), полученном
разбиением отрезка ],0[ T )1( L
оптимизируемыми точками ,j
,1...,,1 Lj т.е.
,,,1,,),,[,)()( 211211 LjEcctctctu rjj
jj
j
j
j (6)
а допустимые значения управления принадлежат некоторому множеству U, в част-
ности параллелепипеду
.]},0[,,,)(),(:{ TtEtutuuuU r (7)
Если обозначить ),,,...,,,,()...,,( 21
2
2
2
1
1
2
1
1
1 LLL ccccccCCC то будет ясно, что
функционал (5) зависит от параметров C и :
.))((),,(),()(
0
0 TxdttuxfCJuJ
T
(8)
v1
v2
vL
u
t 0
t0 t1 t2
0 1 2 L 1 L
t3 t4 t5 t6 t7 t8 t9 tN 1 tN
Рис. 1
u
t 0
t0 t1 t2
0 1 2 L 1 L
t3 t4 t5 t6 t7 t8 t9 tN 1 tN
,)( 1
20
1
1 ctc
,)( 2
21
2
1 ctc L
L
L ctc 211 )( …,
Рис. 2
56 ISSN 0572-2691
Задача заключается в нахожде-
нии при условиях (1), (6), (3),
(7) таких векторов ...,( 1CC
)..., LC и ),,...,( 11 L при
которых заданный функцио-
нал (8) принимает мини-
мальное значение.
1.3. Управления из клас-
са кусочно-заданных функ-
ций. Управление ,)( rEtu
,],0[ Tt определяется задан-
ными базисными функциями ),( 1 jm t ,,...,1 Mm ),,[ 1 jjt с неизвестны-
ми оптимизируемыми постоянными коэффициентами ),...,,( 1
j
M
jj ccC ,,...,1 Lj
на каждом полуинтервале ),,[ 1 jj полученном разбиением отрезка ],0[ T )1( L
оптимизируемыми точками ,j 1,...,1 Lj (рис. 3), т.е.
,...,,1,),,[,)()( 1
1
1 MmEcttctu rj
mjj
M
m
jm
j
m
(9)
а допустимые значения управлений принадлежат некоторому множеству U, в част-
ности параллелепипеду (7).
Задача заключается в нахождении векторов ,...,...,()...,,( 11
1
1
M
L ccCCC
)...,,..., 1
L
M
L cc и ),...,( 11 L при условиях (1), (9), (3), (7), при которых задан-
ный функционал (8) принимает минимальное значение. Предполагается, что за-
данные функции ),( 1 jm t ),,[,...,,1 1 jjtMm вместе с частными про-
изводными по ),( ux непрерывны.
Таким образом, в зависимости от выбора управления в форме (2), (6) или (9)
будем рассматривать три типа задач оптимального управления:
задача 1: (1)–(5);
задача 2: (1), (6), (3), (7), (8);
задача 3: (1), (9), (3), (7), (8).
2. Численное решение дискретизированных задач
Для численного решения поставленных выше трех задач используем схему,
предложенную в [8, 9]. Для этого на отрезке ],0[ T введем равномерную сеточную
область .}/,,...,0,:{ NThNiihtt ii Здесь N — заданное натуральное
число. Не умаляя общности, для простоты расчетных формул систему (1) аппрок-
симируем явной схемой Эйлера:
001 ,1...,,0),,,( xxNituxhfxx iiiii . (10)
Рассмотрим каждую задачу по отдельности.
2.1. Формулы для решения задачи 1. Во введенной сеточной области аппрок-
симируем значение управления ,)( rEtuu ,],0[ Tt следующим образом:
.1,...,0
,1,...,1),,[,/))()((
,...,,1),,[),[,
111
11
Ni
Ljtthtvtv
Ljttv
u
iijijjjij
jjiij
i
(11)
Интеграл, участвующий в выражении (5), аппроксимируем методом прямоугольников:
.min),,()(),(
,
1
0
0
v
N
i
iiiN tuxfhxvI (12)
В результате получим конечномерную задачу математического программирова-
ния (10)–(12) с учетом условий (3), (4).
u
t
0
t0 t1 t2
0 1 2 L 1 L
t3 t4 t5 t6 t7 t8 t9 tN 1 tN
Рис. 3
Международный научно-технический журнал
«Проблемы управления и информатики», 2012, № 6 57
Из (11) видно, что если момент времени переключения управления j нахо-
дится между узловыми точками 1, ii tt , то значение управления iu аппроксими-
руется линейной комбинацией значений ., 1jj vv
Для решения задачи (10)–(12), т.е. для определения оптимальных значений
векторов v и используем численные методы конечномерной оптимизации перво-
го порядка, в частности итерационный метод проекции градиента функционала в
пространстве оптимизируемых параметров :),( v
,...,1,0)],/),(,/),((),[(),( )4(),3(
11 kvIvvIvPv kkkkkkkk (13)
где )4(),3(P — оператор проектирования вектора ),( v на допустимую область
параметров, определяемую ограничениями (3), (4); ),( 00 v — некоторое задан-
ное начальное приближение для оптимизируемых параметров; векторы
)/,...,/(/),(,)/,...,/(/),( 111 LL ddIddIdvdIdvdIdvdIdvvdI (14)
определяют градиент функционала задачи (10)–(12), формулы для компонент ко-
торого получены ниже; T — знак транспонирования.
Введем векторы импульсных переменных [7–9]:
.,...,0,,/),( NiEpdxvdIp n
iii (15)
Здесь производная понимается как полная, с учетом взаимозависимости значений
,,...,0, Nixi из (10). Отсюда c учетом (10) имеем
,0...,,1,
),,(),,(
1
0
1
1
Nip
x
tuxf
hE
x
tuxf
hp
x
x
x
I
p i
i
iii
i
iii
i
i
i
i
i
(16)
,
)(
N
N
N
N
x
x
x
I
p
(17)
где E — n-мерная единичная матрица. Систему (16), (17) назовем сопряженной.
Предположим, что момент переключения j находится между узловыми
точками 1jkt и ,
jkt т.е. ),,[ 1 jj kkj tt .1,...,1 Lj Тогда компоненты гради-
ента ,...,,1,/ LjvddI j определяются следующим образом:
j
j
k
ks
s
j
s
jj
p
v
x
v
I
vd
Id
1
,...,,1,
),,(),,(
1
1
1
1111
1
111
0
Ljp
v
u
u
tuxf
v
u
u
tuxf
h
j
j
k
ks
s
j
s
s
sss
j
s
s
sss
(18)
а частные производные ,...,,1,1,...,1,/ 1 Ljkksvu jjjs определяются из
соотношения (11):
.1,/)(
,1,/)(
,2,...,,1
111
1
jsj
jjs
jj
j
s
ksht
ksht
kks
v
u
(19)
Для компонент градиента ,1...,,1,/ LjddI j имеем
j
j
j
j
j
j
k
j
k
k
k
j
k
j
k
jj
p
u
u
xI
p
xI
d
dI 1
1
....,,1,
),,(),,(
1
111
1
111
0
1
Ljp
u
tuxf
u
tuxfu
h
j
j
jjj
j
jjjj
k
k
kkk
k
kkk
j
k
(20)
58 ISSN 0572-2691
Частные производные ,1...,,1,/1 Lju jk j
определяются непосредственно
из соотношения (11):
.1...,,1,/)(/ 11 Ljhvvu jjjk j
(21)
Тогда из (20) и (21) для 1,...,1 Lj получаем, что
.1...,,1
,
),,(),,(
)(
1
111
1
111
0
1
Lj
p
u
tuxf
u
tuxf
vv
d
dI
j
j
jjj
j
jjj
k
k
kkk
k
kkk
jj
j (22)
Формулы (18), (22) определяют компоненты градиента (14) функционала за-
дачи (10)–(12). Реализация итерационного процесса (13) происходит в три этапа:
1) при текущих значениях вектора
12),( Lkk Ev из формул (10), (11)
определяется решение аппроксимированной задачи Коши NiEx n
i ,...,0, ;
2) из формул (16), (17) находим векторы импульсов
n
i Ep в обратном по-
рядке, начиная с Ni до ;0i
3) из формул (18), (22) определяются компоненты вектора градиента (14);
4) выполняется процедура (13) с выбором из условия одномерной миними-
зации функционала (12) (учитывая «простоту» допустимой области параметров
(3), (4) операция проектирования )4(),3(P не представляет сложности), определя-
ется новое приближение ).,( 11 kkv В случае невыполнения условия оптималь-
ности или останова итерационного процесса повторяются этапы 1)–4).
2.2. Формулы для решения задачи 2. Аппроксимируем во введенной сеточ-
ной области значение управления ,)( rEtuu ,],0[ Tt и функционал (8) сле-
дующим образом:
,1...,0
,1...,,1),,[)],)()((
))()([(
1
,...,,1),,[),[,)(
1211
1
21
1
11
11211
Ni
Ljttctct
ctct
h
Ljttctc
u
iij
j
ji
j
ij
j
ji
j
ji
jjii
j
ji
j
i
(23)
.min),,()(),(
,
1
0
0
C
N
i
iiiN tuxfhxCI (24)
Из (23) видно, что если момент времени переключения управления j находится
между узловыми точками ,, 1ii tt то значение управления iu аппроксимируется
линейной комбинацией значений ),)(( 211
j
ji
j
ctc ).)((
1
21
1
1
j
ji
j
ctc
Итак, аппроксимируя задачу (1), (6), (3), (7), (8), получаем конечномерную за-
дачу математического программирования (10), (23), (24) с учетом условий (3), (7).
Для решения задачи (10), (23), (24), т.е. для определения оптимальных значений
векторов ),,...,,,,( 21
2
2
2
1
1
2
1
1
LL ccccccC и используем итерационный метод проек-
ции градиента функционала в пространстве оптимизируемых параметров ),( C :
,...,1,0)],/),(,/),((),[(),( )7(,)3(
11 kdCdIdCCdICPC kkkkkkkk (25)
Международный научно-технический журнал
«Проблемы управления и информатики», 2012, № 6 59
где )7(),3(P — оператор проектирования вектора ),( C на допустимую область
параметров, определяемую ограничениями (3), (7); ),( 00 C — некоторое задан-
ное начальное приближение для оптимизируемых параметров; векторы
T
21
2
1
1
2
1
1
T
11
)/,/,...,/,/,/(/
,)/,...,/(/
LL
L
dcdIdcdIdcdIdcdIdcdICdId
ddIdIddId
(26)
определяют градиент функционала (24).
После введения вектора импульсных переменных (15), определяемого из си-
стемы (16), (17), получим формулы градиента (26). Предположим, что момент пере-
ключения j находится между узловыми точками 1jkt и
jkt , т.е. ,),[ 1 jj kkj tt
.1...,,1 Lj Тогда компоненты градиента ,2,1,/ mdcId j
m ,...,,1 Lj вычис-
ляются следующим образом:
,2,1,...,,1
,
),,(),,(
),,(
),,(
1
1
11
1
1
1111
1
111
0
1
1
111
1
1
111
0
mLj
p
c
u
u
tuxf
c
u
u
tuxf
h
p
c
u
u
tuxf
h
c
u
u
tuxf
hp
c
x
c
I
cd
Id
j
j
j
j
j
j
j
j
k
ks
sj
m
s
s
sss
j
m
s
s
sss
k
ks
sj
m
s
s
sss
k
ks
j
m
s
s
sss
k
ks
sj
m
s
j
m
j
m
(27)
а частные производные ,1...,,1,/ 1 jj
j
ms kkscu ,2,1,...,,1 mLj опре-
деляются из соотношения (23):
,1,/))((
,1,/)(
,2,...,,
1
1
2
11
11
1
jjssj
jjs
jjjs
j
s
kshtt
ksht
kkst
c
u
(28)
.1,/)(
,1,/)(
,2,...,,1
111
1
2
jsj
jjs
jj
j
s
ksht
ksht
kks
c
u
(29)
Для компонент градиента ,1...,,1/ LjddI j используем соотношение (20).
Частные производные ,1...,,1,/1 Lju jk j
участвующие в (20), находим
непосредственно из соотношения (23):
.])()(2[
1
2
1
2111
1
1
1 jj
jk
j
kj
j
j
k
cctctc
h
u
jj
j
(30)
Если учесть (30) в (20), для ,1...,,1,/ LjddI j получаем, что
j
j
jjj
j
jjj
k
k
kkk
k
kkk
j
p
u
tuxf
u
tuxf
d
Id
1
111
1
111
0 ),,(),,(
.1...,,1],)()(2[ 2
1
2111
1
1
Ljcctctc
jj
jk
j
kj
j
jj
(31)
Формулы (27), (31) определяют компоненты градиента функционала (24) за-
дачи (10), (23), (24).
60 ISSN 0572-2691
2.3. Формулы для решения задачи 3. Во введенной сеточной области ап-
проксимируем значение управления ,],0[,)( TtEtuu r следующим образом:
iu
,1...,,1),,[,)()(
1
,...,,1),,[),[,
1
1
1,
1
,11
1
11
1
1,
Ljttctct
h
Ljttc
iij
M
m
ji
m
j
mij
M
m
ji
m
j
mji
jjii
M
m
ji
m
j
m
(32)
,1...,,0 Ni
где .1...,,0,1...,,0,...,,1),(, LjNiMmt jim
ji
m
Итак, аппроксимируя задачу (1), (9), (3) (7), (8), получаем конечномерную за-
дачу математического программирования (10), (32), (24) с учетом условий (3), (7).
Для определения оптимальных значений векторов ),...,,...,,...,( 1
11
1
L
M
L
M ccccC
и используем процедуру (25). Здесь векторы
T
1
11
1
T
11
)/,...,/,...,/,...,/(/
,)/,...,/(/
L
M
L
M
L
dcdIdcdIdcdIdcdIdCdI
ddIddIddI
(33)
определяют градиент функционала задачи (10), (32), (24).
Введем вектор импульсных переменных (15) и предположим, что ,),[ 1 jj kkj tt
.1...,,1 Lj Тогда компоненты градиента ,...,,1,/ MmdcdI j
m ,...,,1 Lj опре-
деляются следующим образом:
,,...,1,,...,1
,
),,(),,(
1
1
1
1
1111
1
111
0
MmLj
p
c
u
u
tuxf
c
u
u
tuxf
h
p
c
x
c
I
cd
Id
j
j
j
j
k
ks
sj
m
s
s
sss
j
m
s
s
sss
k
ks
sj
m
s
j
m
j
m
(34)
а частные производные ,1...,,1,/ 1 jj
j
ms kkscu ,...,,1,...,,1 MmLj —
из соотношения (32):
.1,/)(
,1,/)(
,2,...,,
1,
1
1,1
11
1
1,
j
js
msj
j
js
mjs
jj
js
m
j
m
s
ksht
ksht
kks
c
u
(35)
Для компонент градиента ,1...,,1,/ LjddI j используем соотношение (20).
Частные производные ,1...,,1,/1 Lju jk j
участвующие в (20), определя-
ются непосредственно из соотношения (32):
.)(
11
1
,11,1
1
,1
1
1,11
M
m
jk
m
j
m
jk
m
j
m
M
m
jk
m
j
m
M
m
jk
m
j
m
j
k
jjjjj
cc
h
cc
h
u
(36)
Тогда из (20), (36) для ,1...,,1,/ LjddI j получаем, что
Международный научно-технический журнал
«Проблемы управления и информатики», 2012, № 6 61
j
j
jjj
j
jjj
k
k
kkk
k
kkk
j
p
u
tuxf
u
tuxf
d
Id
1
111
1
111
0 ),,(),,(
.1...,,1,)(
1
,11,1
Ljcc
M
m
jk
m
j
m
jk
m
j
m
jj (37)
Формулы (34), (37) определяют компоненты градиента функционала (24) за-
дачи (10), (32), (24).
Замечание. Ясно, что выбор схемы метода Эйлера для аппроксимации по-
ставленных выше трех задач не имел принципиального значения для предлагае-
мого подхода. Полученные формулы несложно распространить и на другие схемы
дискретизации исходной задачи [8, 9].
3. Сравнение формул градиента функционала исходной непрерывной
и дискретизированной задач на классе кусочно-постоянных управлений
На классе кусочно-постоянных функций получим формулу градиента целево-
го функционала непосредственно для исходной непрерывной задачи (1)–(5). При
этом функция Гамильтона–Понтрягина и сопряженная система имеют следующий
вид [10]:
,),,()(),,(),,,( 0 tuxfttuxftuxH (38)
,
))((
)(),(
),,(),,(
)(
0
x
Tx
Tt
x
tuxf
x
tuxf
t
(39)
где nEt )( — решение задачи Коши (39), соответствующее допустимому
управлению .)( Utuu Пусть допустимое управление )(tu получило прираще-
ние ),(tuu причем .)()( Ututu Тогда соответствующее приращение
функционала (5) можно записать следующим образом [10]:
,))(()(
),,,(
)()()(),(
0
uodttu
u
tuxH
uJuuJuJvJ
T
(40)
где ,)()()(
2/1
0
2
],0[2
T
ETL
dttututu r .0
)(
lim
0
u
uo
u
Для получения формул для компонент градиента ),( vJv , учитывая кусоч-
но-постоянство управления, приращение )(tu выберем из предположения, что
произвольно выбранная i-я компонента управления, ri ,...,1 , на каком-либо j-м
интервале постоянства, Lj ,...,1 , получила приращение ijv , т.е.
,,const
,,0,0
)(
1
1
jjji
jj
tv
Ttt
tu (41)
где .)0...,,0,,0...,,0( ijji vv Преобразуем соответствующее приращению уп-
равления (41) выражение приращения функционала (40):
dtu
u
tuxH
dtu
u
tuxH
uJvJ
j
j
j
v
1
1
),,,(),,,(
)(),(
0
).)((
),,,(
uodtu
u
tuxH
T
j
(42)
62 ISSN 0572-2691
Если учесть (41) в (42), то, поскольку первое и третье слагаемые в выражении (42)
обращаются в нуль, формула для приращения функционала примет вид
))((
),,,(
),(
1
uodtv
u
tuxH
vJ
j
j
jiv
.))((
),,,(
1
uodtv
u
tuxH
j
j
ij
i
(43)
Разделив обе части (43) на ijv и перейдя к пределу при ,0 ijv с учетом того,
что ,0)/))((( ijvuo будем иметь
....,,1,...,,1
,)(
),,(),,(),,,(),(
11
0
riLj
dtt
u
tuxf
u
tuxf
dt
u
tuxH
dv
vJd
j
j
j
j
iiiij
(44)
Теперь получим формулу для ).,( vJ Пусть j получило приращение ,j
причем 0 j и 1 jjj . Такое изменение значения j соответствует
тому, что в этом случае управление получит приращение ),(tu которое можно
записать в следующем виде:
.,
,,0,0
)(
1 jjjjj
jjj
tvv
Ttt
tu (45)
Для приращения функционала (40), соответствующего приращению управления
(45), будем иметь
dtu
u
tuxH
dtu
u
tuxH
uJvJ
jj
j
j
),,,(),,,(
)(),(
0
))((
),,,(
uodtu
u
tuxH
T
jj
).)((
),,,(
)( 1
uodt
u
tuxH
vv
jj
j
jj (46)
Разделим обе части (46) на j и перейдем к пределу 0 j . С учетом теоре-
мы о среднем значении и в силу (45) имеет место
.1...,,1,)(
),,(),,(
)(
),( 0
1
Ljt
u
tuxf
u
tuxf
vv
d
vJd
jt
jj
j
(47)
В случае, когда j получает отрицательное приращение 0 j такое, что
1 jjj , это соответствует тому, что управление )(tu получает прира-
щение
.,
,,0,0
)(
1 jjjjj
jjj
tvv
Ttt
tu
Повторив аналогичные формуле (46) выкладки, снова имеем формулу (47).
Международный научно-технический журнал
«Проблемы управления и информатики», 2012, № 6 63
Таким образом, в непрерывном случае компоненты градиента функционала
(5) определяются формулами (44) и (47). Покажем, что эти формулы совпадают с
выражениями, которые получаются при переходе к пределу в формулах градиента
(18), (22) функционала (12) дискретной задачи (10)–(12). Преобразуя дискретную
сопряженную систему (16), (17) и переходя к пределу при 0h , получим
.
))((
)(,
),,(),,(0
x
Tx
Tpp
x
tuxf
x
tuxf
p
(48)
Переходя к пределу в (18) при ,0h учитывая при этом, что
jkt стремится к j ,
получаем
....,,1,
),,(),,(),(
1
0
Ljdtp
u
tuxf
u
tuxf
dv
vdI
j
j
j
(49)
Аналогично из (22) имеем
.1...,,1,
),,(),,(
)(
),( 0
1
Ljp
u
tuxf
u
tuxf
vv
d
vdI
jt
jj
j
(50)
Если в системе (48) провести замену )()( ttp (учитывая произвольность
вектор-функции nEtp )( ), то формулы (49), (50) совпадут соответственно с
формулами (44), (47) градиента функционала (5).
4. Результаты численных экспериментов
Задача 1. Применим предложенный подход к решению тестовой задачи не-
линейного оптимального управления на отрезке ]4/3,0[ [11]:
,4)(1,0)0(,1)0(
,)(
,
21
12
21
tuxx
xtux
xx
.min)(1 TxJ (51)
Здесь .356194,24/3,1,2 Tmn Точное решение задачи следующее
(рис. 4):
,
4
3
4
,1
,
4
0,4
)(*
t
t
еu
,
4
3
4
,
4
cos2
,
4
0,2sin2
)(
,
4
3
4
,
4
sin2
,
4
0,2cos
)( *
2
*
1
tt
tt
tx
tt
tt
tx
а минимальное значение функционала .2)( * uJ Оптимальное управление в за-
даче (51) имеет релейный тип с двумя интервалами постоянства, т.е. 2L . Опти-
мальное значение вектора ),( v следующее:
.)785392,0;1;4(),,(),( *
1
*
2
*
1
** vvv
В табл. 1 приведены результаты числен-
ных экспериментов с использованием метода
проекции сопряженных градиентов с точно-
стью 001,0 при различных начальных
значениях ),( 00 v управляющего вектора
),( v , шаг 0,01178.h
v1 4
u
t 0
4
1
v2 1
4
3
Рис. 4
64 ISSN 0572-2691
Таблица 1
N ),( 00 v 0I ),( ** v *I
Число
итераций
1 (3,200; 1,500; 1,231) 1,31334 (4,000000; 1,000000; 0,789326) 2,05638082 6
2 (2,850; 1,200; 0,522) 1,37611 (4,000000; 1,000000; 0,789323) 2,05638072 6
3 (3,150; 2,430; 0,953) 0,88576 (4,000000; 1,000000; 0,789325) 2,05638083 7
4 (3,540; 1,820; 1,847) 0,46159 (4,000000; 1,000000; 0,789325) 2,05638084 8
5 (2,180; 1,470; 1,368) 1,21106 (4,000000; 1,000000; 0,789329) 2,05638077 4
6 (1,890; 0,750; 2,092) 1,05994 (4,000000; 1,000000; 0,789325) 2,05638084 4
Задача 2. Рассмотрим следующую тестовую задачу [12]:
.min)5()5(
,1)(,0)0(,5)0(,]5;0(,sin,
2
2
2
1
211221
xxJ
tuxxtxuxxx
(52)
Здесь 5,1,2 Tmn . Оптимальное управление в данной задаче имеет релей-
ный тип с тремя интервалами постоянства (рис. 5), т.е. 3L :
;]5,50,4[,1)();50,4,95,0[,1)(;)95,0,0[,1)( *** ttuttuttu
.)50,4,95,0,1,1,1(),,,,(),( *
2
*
1
*
3
*
2
*
1
** vvvv
В табл. 2 приведены результаты численных экспериментов с использованием ме-
тода проекции сопряженных градиентов с точностью 001,0 при различных
начальных значениях ),( 00 v управляющего вектора ),( v , шаг 05,0h .
v1 1
u
t 0
95,01
v2 1
v3 1
5
5,42
Рис. 5
Таблица 2
N ),( 00 v 0I ),( ** v *I
Число
итераций
1 (0.78;3.46;0.7;-0.6;0.5) 32.38 (0.950;4.511;1.0;-1.0;1.0) 11.6681 24
2 (0.78;3.46;2;-2;0.5) 9.15 (0.950;4.501;1.0;-1.0;1.0) 11.6686 19
3 (0.52;2.73;0.8;-0.8;0.4) 44.39 (0.950;4.528;1.0;-1.0;1.0) 11.6699 40
4 (0.28;3.26;0.26;-0.4;0.32) 42.78 (0.950;4.512;1.0;-1.0;1.0) 11.6681 22
Задача 3. Рассмотрим следующую тестовую задачу [13] на отрезке ]8,0[ :
.min)()()(
,1)(,0)0(,0)0(,16)0(
,
,
,
2
3
2
2
2
1
321
3
32
21
TxTxTxJ
tuxxx
ux
xx
xx
(53)
Здесь 8,1,3 Tmn . Точное решение задачи слудующее:
,86,1
,62,1
,20,1
)(*
t
t
t
tu
Международный научно-технический журнал
«Проблемы управления и информатики», 2012, № 6 65
а минимальное значение функ-
ционала .0)( * uJ Оптималь-
ное управление в задаче (53)
имеет релейный тип с тремя ин-
тервалами постоянства, т.е.
3L . Оптимальное значение
вектора ),( v следующее:
),,,,(),( *
2
*
1
*
3
*
2
*
1
** vvvv
.)6,2,1,1,1(
В табл. 3, 4 приведены результаты численных экспериментов с использованием ме-
тода проекции сопряженных градиентов с точностью 001,0 при различных
начальных значениях ),( 00 v управляющего вектора ),( v , шаг 0,04h .
Таблица 4
N ),( ** v *I
Число
итераций
1 (0,99866; 0,99820; 1,00000; 2,00052; 6,00382) 0,0000057 87
2 (1,00000; 0,99998; 1,00000; 2,00002; 6,00011) 0,0000007 70
3 (1,00000; 1,00000; 0,99956; 1,99997; 5,99966) 0,0000001 95
4 (0,99991; 0,99164; 0,99999; 1,99331; 6,01179) 0,0000523 93
5 (1,00000; 0,99998; 0,99895; 2,00002; 5,99977) 0,0000036 55
6 (0,99997; 1,00000; 0,99972; 2,00031; 6,00196) 0,0000429 90
Заключение
Получены аналитические формулы для градиента целевого функционала в
задаче оптимального управления на классах кусочно-постоянных, кусочно-
линейных и кусочно-заданных управлений с оптимизируемыми временами пере-
ключений. Формулы для градиента целевого функционала позволяют применять
методы оптимизации первого порядка для численного решения задач оптималь-
ного управления.
Учитывая существенную техническую простоту реализации кусочно-посто-
янных, кусочно-линейных и кусочно-заданных управляющих воздействий, ре-
зультаты данной работы могут применяться при разработке математического
обеспечения систем автоматизированного и автоматического управления техно-
логическими процессами различного назначения.
А.Б. Рагімов
ЧИСЕЛЬНЕ РОЗВ’ЯЗАННЯ ЗАДАЧ
ОПТИМАЛЬНОГО КЕРУВАННЯ НЕЛІНІЙНИМИ
ДИНАМІЧНИМИ СИСТЕМАМИ
Запропоновано чисельний метод розв’язання задач оптимального керування
об’єктами, які описуються системою нелінійних звичайних диференціальних
рівнянь на класах кусково-сталих, кусково-лінійних і кусково-заданих керу-
вань. В задачах оптимізуються кусково-сталі значення коефіцієнтів з формул
для керувань, і, що найважливіше, оптимізуються межі інтервалів сталості цих
значень. Отримано аналітичні формули градієнта функціонала за параметрами,
які оптимізуються. Проведено порівняння формул градієнта функціонала,
отриманих для вихідної неперервної і відповідної дискретизованої задач опти-
мального керування на класі кусково-сталих керувань. Наведено результати
чисельних експериментів на прикладі розв’язання модельних задач.
Таблица 3
N ),( 00 v 0I
1 (0,530; 0,760; 0,700; 0,382; 6,321) 4435,0140
2 (0,600; 0,500; 0,800; 0,782; 4,647) 655,9553
3 (0,300; 0,780; 0,550; 1,191; 3,463) 703,9213
4 (0,840; 0,710; 0,670; 1,665; 6,742) 100,1715
5 (0,100; 0,640; 0,410; 2,357; 5,745) 1554,4936
6 (0,260; 0,400; 0,320; 3,281; 7,069) 713,2167
66 ISSN 0572-2691
A.B. Rahimov
NUMERICAL SOLUTION TO OPTIMAL CONTROL
PROBLEMS OF NONLINEAR DYNAMICAL SYSTEMS
Numerical method of solving to optimal control problems is proposed for objects de-
scribed by the system of ordinary nonlinear differential equations on the classes of
piecewise constant, piecewise linear and piecewise given controls. Both the piece-
wise constant values of the coefficients in the expression of controls as well as the
boundaries of constancy intervals of these values are optimized. Analytical formulas
for the gradient of the functional with respect to the optimized parameters are ob-
tained. Comparison of the formulas for the gradient of the functional obtained for the
initial continuous optimal control problem and for the corresponding discretized op-
timal control problem on the class of piecewise constant controls is carried out. Re-
sults of numerical experiments carried out through the examples of the solutions to
some model problems are also given.
1. Systems and control encyclopedia / Ed. M.G. Singh. — Vol. 1–8. — Oxford; New York; Pekin :
Pergamon Press, 1987.
2. The control handbook / Ed. W.S. Levine. — Boca Raton : CDC Press, 1996. — 1566 p.
3. Табак Д., Куо Б. Оптимальное управление и математическое программирование. — М.:
Наука, 1975. — 280 с.
4. Bryson A.E., Ho Yu-Chi. Applied optimal control: optimization, estimation, and control. — Wal-
tham : Blaisdell Publ. Co., 1975. — 481 p.
5. Моисеев А.А. Оптимальное управление при дискретных управляющих воздействиях // Ав-
томатика и телемеханика. — 1991. — № 9. — С. 123–132.
6. Айда-заде К.Р., Рагимов А.Б. Релейное управление нелинейной системой при неточно за-
данных значениях параметров // Международный научно-технический журнал «Проблемы
управления и информатики». — 2010. — № 4. — С. 53–63.
7. Айда-заде К.Р., Рагимов А.Б. О решении задач оптимального управления на классе кусоч-
но-постоянных функций // Автоматика и вычислительная техника. — 2007. — 41, № 1. —
С. 27–36.
8. Айда-заде К.Р., Евтушенко Ю.Г. Быстрое автоматическое дифференцирование на ЭВМ //
Математическое моделирование. — 1989. — 1, № 1. — С. 120–131.
9. Айда-заде К.Р. Исследование и численное решение конечно-разностных аппроксимаций
задач управления распределенными системами // Журн. вычисл. математики и мат. физики.
— 1989. — 29, № 3. — С. 346–354.
10. Габасов Р., Кириллова Ф.М. Принцип максимума в теории оптимального управления. —
М. : Наука и техника, 1974. — 272 с.
11. Александров В.В., Бахвалов Н.С., Григорьев К.Г. и др. Практикум по численным методам в
задачах оптимального управления. — М. : Изд-во МГУ, 1988. — 80 с.
12. Васильев О.В., Тятюшкин А.И. Об одном методе решения задач оптимального управления,
основанном на принципе максимума // Журн. вычисл. математики и мат. физики. — 1981.
— 21, № 6. — С. 1376–1384.
13. Федоренко Р.П. Приближенное решение задач оптимального управления. — М.: Наука,
1978. — 486 с.
Получено 12.03.2012
|
| id | nasplib_isofts_kiev_ua-123456789-207541 |
| institution | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| issn | 0572-2691 |
| language | Russian |
| last_indexed | 2025-12-01T08:26:42Z |
| publishDate | 2012 |
| publisher | Інститут кібернетики ім. В.М. Глушкова НАН України |
| record_format | dspace |
| spelling | Рагимов, А.Б. 2025-10-09T11:44:36Z 2012 Численное решение задач оптимального управления нелинейными динамическими системами / А.Б. Рагимов // Проблемы управления и информатики. — 2012. — № 6. — С. 54–66. — Бібліогр.: 13 назв. - рос. 0572-2691 https://nasplib.isofts.kiev.ua/handle/123456789/207541 519.6, 517.977.5 10.1615/JAutomatInfScien.v44.i11.50 Запропоновано чисельний метод розв’язання задач оптимального керування об’єктами, які описуються системою нелінійних звичайних диференціальних рівнянь на класах кусково-сталих, кусково-лінійних і кусково-заданих керувань. В задачах оптимізуються кусково-сталі значення коефіцієнтів з формул для керувань, і, що найважливіше, оптимізуються межі інтервалів сталості цих значень. Отримано аналітичні формули градієнта функціонала за параметрами, які оптимізуються. Проведено порівняння формул градієнта функціонала, отриманих для вихідної неперервної і відповідної дискретизованої задач оптимального керування на класі кусково-сталих керувань. Наведено результати чисельних експериментів на прикладі розв’язання модельних задач. Numerical method of solving to optimal control problems is proposed for objects described by the system of ordinary nonlinear differential equations on the classes of piecewise constant, piecewise linear and piecewise given controls. Both the piecewise constant values of the coefficients in the expression of controls as well as the boundaries of constancy intervals of these values are optimized. Analytical formulas for the gradient of the functional with respect to the optimized parameters are obtained. Comparison of the formulas for the gradient of the functional obtained for the initial continuous optimal control problem and for the corresponding discretized optimal control problem on the class of piecewise constant controls is carried out. Results of numerical experiments carried out through the examples of the solutions to some model problems are also given. ru Інститут кібернетики ім. В.М. Глушкова НАН України Проблемы управления и информатики Оптимальное управление и методы оптимизации Численное решение задач оптимального управления нелинейными динамическими системами Чисельне розв’язання задач оптимального керування нелінійними динамічними системами Numerical Solution to Optimal Control Problems of Nonlinear Dynamical Systems Article published earlier |
| spellingShingle | Численное решение задач оптимального управления нелинейными динамическими системами Рагимов, А.Б. Оптимальное управление и методы оптимизации |
| title | Численное решение задач оптимального управления нелинейными динамическими системами |
| title_alt | Чисельне розв’язання задач оптимального керування нелінійними динамічними системами Numerical Solution to Optimal Control Problems of Nonlinear Dynamical Systems |
| title_full | Численное решение задач оптимального управления нелинейными динамическими системами |
| title_fullStr | Численное решение задач оптимального управления нелинейными динамическими системами |
| title_full_unstemmed | Численное решение задач оптимального управления нелинейными динамическими системами |
| title_short | Численное решение задач оптимального управления нелинейными динамическими системами |
| title_sort | численное решение задач оптимального управления нелинейными динамическими системами |
| topic | Оптимальное управление и методы оптимизации |
| topic_facet | Оптимальное управление и методы оптимизации |
| url | https://nasplib.isofts.kiev.ua/handle/123456789/207541 |
| work_keys_str_mv | AT ragimovab čislennoerešeniezadačoptimalʹnogoupravleniânelineinymidinamičeskimisistemami AT ragimovab čiselʹnerozvâzannâzadačoptimalʹnogokeruvannânelíníinimidinamíčnimisistemami AT ragimovab numericalsolutiontooptimalcontrolproblemsofnonlineardynamicalsystems |