Об одном свойстве функции Беллмана в задаче оптимального быстродействия
In the framework of a 2D Time Optimal Control Problem, the specific property of Bellman function is obtained.
Збережено в:
| Опубліковано в: : | Теорія оптимальних рішень |
|---|---|
| Дата: | 2005 |
| Автор: | |
| Формат: | Стаття |
| Мова: | Russian |
| Опубліковано: |
Інститут кібернетики ім. В.М. Глушкова НАН України
2005
|
| Онлайн доступ: | https://nasplib.isofts.kiev.ua/handle/123456789/84938 |
| Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Цитувати: | Об одном свойстве функции Беллмана в задаче оптимального быстродействия / А.В. Руденко // Теорія оптимальних рішень: Зб. наук. пр. — 2005. — № 4. — С. 146-151. — Бібліогр.: 3 назв. — рос. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraine| id |
nasplib_isofts_kiev_ua-123456789-84938 |
|---|---|
| record_format |
dspace |
| spelling |
Руденко, А.В. 2015-07-17T06:02:55Z 2015-07-17T06:02:55Z 2005 Об одном свойстве функции Беллмана в задаче оптимального быстродействия / А.В. Руденко // Теорія оптимальних рішень: Зб. наук. пр. — 2005. — № 4. — С. 146-151. — Бібліогр.: 3 назв. — рос. XXXX-0013 https://nasplib.isofts.kiev.ua/handle/123456789/84938 519.8 In the framework of a 2D Time Optimal Control Problem, the specific property of Bellman function is obtained. ru Інститут кібернетики ім. В.М. Глушкова НАН України Теорія оптимальних рішень Об одном свойстве функции Беллмана в задаче оптимального быстродействия On a property of Bellman function in a time optimal control problem Article published earlier |
| institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| collection |
DSpace DC |
| title |
Об одном свойстве функции Беллмана в задаче оптимального быстродействия |
| spellingShingle |
Об одном свойстве функции Беллмана в задаче оптимального быстродействия Руденко, А.В. |
| title_short |
Об одном свойстве функции Беллмана в задаче оптимального быстродействия |
| title_full |
Об одном свойстве функции Беллмана в задаче оптимального быстродействия |
| title_fullStr |
Об одном свойстве функции Беллмана в задаче оптимального быстродействия |
| title_full_unstemmed |
Об одном свойстве функции Беллмана в задаче оптимального быстродействия |
| title_sort |
об одном свойстве функции беллмана в задаче оптимального быстродействия |
| author |
Руденко, А.В. |
| author_facet |
Руденко, А.В. |
| publishDate |
2005 |
| language |
Russian |
| container_title |
Теорія оптимальних рішень |
| publisher |
Інститут кібернетики ім. В.М. Глушкова НАН України |
| format |
Article |
| title_alt |
On a property of Bellman function in a time optimal control problem |
| description |
In the framework of a 2D Time Optimal Control Problem, the specific property of Bellman function is obtained.
|
| issn |
XXXX-0013 |
| url |
https://nasplib.isofts.kiev.ua/handle/123456789/84938 |
| citation_txt |
Об одном свойстве функции Беллмана в задаче оптимального быстродействия / А.В. Руденко // Теорія оптимальних рішень: Зб. наук. пр. — 2005. — № 4. — С. 146-151. — Бібліогр.: 3 назв. — рос. |
| work_keys_str_mv |
AT rudenkoav obodnomsvoistvefunkciibellmanavzadačeoptimalʹnogobystrodeistviâ AT rudenkoav onapropertyofbellmanfunctioninatimeoptimalcontrolproblem |
| first_indexed |
2025-11-25T23:52:37Z |
| last_indexed |
2025-11-25T23:52:37Z |
| _version_ |
1850587195464744960 |
| fulltext |
Теорія оптимальних рішень. 2005, № 4 146
ÒÅÎвß
ÎÏÒÈÌÀËÜÍÈÕ
вØÅÍÜ
Показано, что в двумерной задаче
о тележке функция Беллмана
( )x,xTT &= обладает свойством
( ) ( )x,xTkxk,xkT && =2 , 0>k .
Получено также явное выражение
201
02012
pxp
xpxp
T
+
+
−=
&
&
,
где ( )21 p,p - начальное состояние
сопряженной системы.
А.В. Руденко, 2005
ÓÄÊ 519.8
À.Â. ÐÓÄÅÍÊÎ
ÎÁ ÎÄÍÎÌ ÑÂÎÉÑÒÂÅ ÔÓÍÊÖÈÈ
ÁÅËËÌÀÍÀ  ÇÀÄÀ×Å
ÎÏÒÈÌÀËÜÍÎÃÎ ÁÛÑÒÐÎÄÅÉÑÒÂÈß
Формулировка задачи. В евклидовой плос-
кости 2R имеется дифференциальное урав-
нение второго порядка вида
., 1≤= uux&& (1)
которое, согласно закону Ньютона, описывает
динамику материальной точки массы 1=m
под действием изотропной силы u .
Ищется оптимальное (программное) управ-
ление ( )tuu = , которое переводит систему
(1) из произвольного начального состояния
( )00 xx &, в конечное состояние ( ) ( )00,, =11 xx &
за минимальное время T .
Принцип максимума утверждает, что это
оптимальное управление существует, един-
ственно и имеет вид
t
t
12
12
pp
pp
u
−
−
= , (2)
где ( )21 pp , - заранее неизвестное начальное
состояние сопряженной системы
( )
( ) .,
,,
2212
111
0
0
pψψψ
pψψ
=−=
==
&&
& 0
Параметры 21 pp , определены с точностью
до произвольного общего положительного
множителя λ , что, очевидно, не влияет на
выражение для оптимального управления u
ввиду его однородности степени нуль по
( )21 pp , .
Эти параметры находятся из краевых условий
( ) ( )
( ) ( ) ,T,T
,,
00 ==
==
xx
xxxx
&
&&
00 00
которые в исходном интегральном виде за-
писываются следующим образом:
ОБ ОДНОМ СВОЙСТВЕ ФУНКЦИИ БЕЛЛМАНА В ЗАДАЧЕ ОПТИМАЛЬНОГО БЫСТРОДЕЙСТВИЯ
Теорія оптимальних рішень. 2005, № 4 147
,dt
t
t
T
0
0 12
12 x
pp
pp
&−=
−
−
∫ (3)
( )
,dt
t
tt
T
0
0 12
12 x
pp
pp
=
−
−
∫ (4)
где фигурирует также заранее неизвестное время T .
Таким образом, задача нахождения параметров ( )21 pp , оптимального
управления (2) на самом деле связана с нахождением совокупности ( )T,, 21 pp .
Поэтому важно изучить свойства как ( )21 pp , в их зависимости от ( )00 xx &, , так и
свойства функции ( )00 xx &,TT = .
Переход от интегральных соотношений к конечным. Все интегралы в
системе (3), (4) берутся в элементарных функциях. Но делать это лучше не в
координатах, а в бескоординатной форме, так как задача симметрична относи-
тельно вращений. Искомые параметры в итоге будут зависеть от инвариантов
типа 2
000
2
0 xxxx && ,, (а не от всех четырех компонент векторов 00 xx &, ).
1. Умножим (3) скалярно на ( )1p− и обратим внимание на то, что возни-
кающее в этом случае подынтегральное выражение есть в точности производная
( )1
12
12
12 p
pp
pp
pp −⋅
−
−
=−
t
t
t
dt
d
. (5)
Отсюда
01212 xpppp &=−− T ,
или, что то же самое,
T12201 pppxp −=+& . (6)
Уравнение (6) представляет собой следствие универсального свойства
гамильтониана ( ) ttH 121 ppxp −+= & быть интегралом движения:
( ) const.121 =−+= ttH ppxp &
Поскольку это верно для всех [ ]T,t 0∈ (и даже для всех R∈t ), то, в частности,
( ) ( )THH =0 . Если теперь дополнительно учесть, что ( ) 0=Tx& , то мы приходим
к уравнению (6). Поэтому его можно записать сразу, не выполняя интегрирова-
ния. Однако важно понимать его происхождение как результат проекции век-
торного уравнения (3) на направление ( )1p± .
А.В. РУДЕНКО
Теорія оптимальних рішень. 2005, № 4 148
2. Оказывается, что в двумерном случае, кроме гамильтониана, в задаче о
тележке, ввиду ее специфики, имеется еще один интеграл движения. Он интере-
сен тем, что дает сразу же еще одно уравнение относительно ( )21 pp , , причем
линейное и без участия T .
Его легко обнаружить, если воспользоваться тем, что в плоскости 2R наря-
ду со скалярным произведением ba пары векторов ( )ba , можно ввести также
их кососкалярное произведение ba∧ , которое обладает свойством abba ∧−=∧
и имеет следующий смысл (о кососкалярном произведении в n2R см. [1, § 41]).
Сначала первый вектор поворачивается на o90 вперед (т.е. в положи-
тельном направлении), а затем берется его скалярное произведение со вторым.
Получается ориентированная площадь параллелограмма, построенного на упо-
рядоченной паре векторов ( )ba , . При этом ba и ba∧ не независимы и связаны
соотношением ( ) ( ) 2222
bababa =∧+ , что следует из тригонометрического тож-
дества 1sincos 22 =+ αα .
Рассмотрим выражение
( ) ( ) ( ) ( )tttt xppxp &∧−+∧= 121Λ
и убедимся, что его производная тождественно равна нулю. Действительно,
( ) ( ) ( )( ) ( ) ( )
( )
( )
,
t
t
t
ttttt
dt
d
0
12
12
12
1211
=
−
−
∧−=
=∧−+∧−+∧=
pp
pp
pp
xppxpxp &&&&Λ
поскольку всегда 0≡∧aa . Отсюда следует, что
( ) ( ) ( ) ( ) .const121 =∧−+∧= tttt xppxp &Λ
В частности, ( ) ( ).TΛΛ =0 Но ( ) 0=TΛ в силу того, что ( ) ( ) .00 == T,T xx & По-
этому и ( ) 00 =Λ . Это приводит к линейному однородному уравнению
,00201 =∧+∧ xpxp & (7)
связывающему векторы 21 pp , и не содержащему время T .
3. Продолжим переход от интегральных соотношений (3), (4) к конечным.
Умножим (4) скалярно на ( )1p− . В результате получим
( )
( ) 01
0
1
12
12 xpp
pp
pp
−=−⋅
−
−
∫
T
t
t
t
.
Для вычисления этого интеграла заметим, что подынтегральное выражение, как
следует из (5), имеет вид
ОБ ОДНОМ СВОЙСТВЕ ФУНКЦИИ БЕЛЛМАНА В ЗАДАЧЕ ОПТИМАЛЬНОГО БЫСТРОДЕЙСТВИЯ
Теорія оптимальних рішень. 2005, № 4 149
( )
( ).t
t
t
t
dt
d
t 1
12
12
12 p
pp
pp
pp −⋅
−
−
=−
Такой интеграл вычисляется по частям:
.dttttdtt
dt
d
t
T
T
T
∫∫ −−−=−
0
12012
0
12 pppppp
Для нахождения интеграла от t12 pp − поступим следующим образом, исполь-
зуя непосредственно специфику задачи.
Рассмотрим функцию
( ) ( ) ( ) ( )ttttL xppxp &
121 −+=
и вычислим ее производную ( )tL& . Имеем
( ) ( ) ( ) ( )
( )
( )
.t
t
t
t
tttL
12
12
12
12
1211
pp
pp
pp
pp
xppxpxp
−=
−
−
−=
=−+−+= &&&&&
Следовательно,
( ) ( ) ( )0
00
12 LTLdttLdtt
TT
−==− ∫∫ &pp .
Однако ( ) ( ) ( ) ( ) 0121 =−+= TTTTL xppxp & , ( ) 02010 xpxp &+=L . Поэтому
( )0201
0
12 xpxppp &+−=−∫
T
dtt .
Отсюда
( )020112
0
12 xpxppppp &++−=−∫ TTdtt
dt
d
t
T
.
Таким образом,
( )02011201 xpxpppxp &++−=− TT ,
или, что то же самое,
( )020112 2 xpxppp &+−=− TT .
Теперь воспользуемся соотношением (6), которое позволяет заменить ради-
кал T12 pp − на не содержащее T выражение 201 pxp +& . Окончательно имеем
201
02012
pxp
xpxp
+
+
−=
&
&
T . (8)
А.В. РУДЕНКО
Теорія оптимальних рішень. 2005, № 4 150
4. Необходимо найти еще одно, четвертое уравнение, недостающее для
определения совокупности параметров ( )T,, 21 pp . Оно оказывается трансцен-
дентным (чего, к сожалению, нельзя избежать) и имеет вид
( )
.
TT
2121
121121
121
01 ln
1
pppp
pppppp
ppp
xp
−
−−−
=
∧
∧
−
& (9)
Основной результат. Представим полученные конечные соотношения в виде
системы относительно ( )T,, 21 pp , дополнив ее условием нормировки 11 =p :
,T12201 pppxp −=+&
,00201 =∧+∧ xpxp &
,T
201
02012
pxp
xpxp
+
+
−=
&
&
( )
2121
121121
121
01 ln
1
pppp
pppppp
ppp
xp
−
−−−
=
∧
∧
−
TT&
,
11 =p . (10)
Единственность решение этой системы гарантируется принципом максиму-
ма Понтрягина и является ее важным свойством. Из этого вытекает полезное
следствие, позволяющее понизить размерность задачи при ее численном решении.
Теорема. Пусть ( )T,, 21 pp - единственное решение системы (10), соответст-
вующее заданному начальному состоянию )( 00 xx &, . Для произвольного положи-
тельного числа k рассмотрим преобразование вида )()( 00
2
00 xxxx &a& k,k, и
обозначим ( )kkk T,, 21 pp единственное решение системы, соответствующее
начальному состоянию )( 00
2 xx &k,k . Тогда
.kTT,k, kkk === 2211 pppp (11)
Доказательство. Заменим сначала в системе (10) )( 00 xx &, на )( 00
2 xx &k,k и,
соответственно, ( )T,, 21 pp на ( )kkk T,, 21 pp . Непосредственная подстановка
выражений (11) в полученную систему показывает, что ( )Tk,k, 21 pp является
ее решением. В частности, ( ) ( )x,xTkxk,xkT && =2 , что не зависит от нормировки.
Заключение. Работа является развитием исследований [1, 2]. Полученные
результаты показывают, что при численном нахождении ( )T,, 21 pp нет необхо-
димости рассматривать произвольные наборы )( 00 xx &, . Выбрав, например,
0
1 x&=−k , вектор скорости 0x& всегда можно считать единичным.
ОБ ОДНОМ СВОЙСТВЕ ФУНКЦИИ БЕЛЛМАНА В ЗАДАЧЕ ОПТИМАЛЬНОГО БЫСТРОДЕЙСТВИЯ
Теорія оптимальних рішень. 2005, № 4 151
О.В. Руденко
ПРО ОДНУ ВЛАСТИВІСТЬ ФУНКЦІЇ БЕЛЛМАНА В ЗАДАЧІ ОПТИМАЛЬНОЇ
ШВИДКОДІЇ
Показано, що в двовимірній задачі про візок функція Беллмана ( )x,xTT &= має властивість
( ) ( )x,xTkxk,xkT && =2 , 0>k .
Отримано також явний вираз
201
02012
pxp
xpxp
T
+
+
−=
&
&
,
де ( )21 p,p - початковий стан спряженої системи.
A.V. Rudenko
ON A PROPERTY OF BELLMAN FUNCTION IN A TIME OPTIMAL CONTROL PROBLEM
In the framework of a 2D Time Optimal Control Problem, the following property of Bellman func-
tion is obtained:
( ) ( ) .k,x,xTkxk,xkT 02 >= &&
The explicit expression
201
02012
pxp
xpxp
T
+
+
−=
&
&
,
where ( )21 p,p is an initial state of a conjugate system, is obtained, too.
1. Арнольд В.И. Математические методы классической механики. – М.: Наука, 1974. –
432 с.
2. Руденко А.В. Об одной задаче оптимального быстродействия // Теорія оптимальних
рішень. – Киев: Ин-т кибернетики им. В.М.Глушкова НАН Украины, 2002. – №1. –
С. 135-141.
3. Руденко А.В. Двумерная тележка: вариационная оценка снизу функции Беллмана //
Теорія оптимальних рішень. – Киев: Ин-т кибернетики им. В.М. Глушкова НАН
Украины, 2003. – №2. – С. 135-148.
Получено 04.04.2005
|