Об одном свойстве функции Беллмана в задаче оптимального быстродействия

In the framework of a 2D Time Optimal Control Problem, the specific property of Bellman function is obtained.

Збережено в:
Бібліографічні деталі
Опубліковано в: :Теорія оптимальних рішень
Дата:2005
Автор: Руденко, А.В.
Формат: Стаття
Мова:Russian
Опубліковано: Інститут кібернетики ім. В.М. Глушкова НАН України 2005
Онлайн доступ:https://nasplib.isofts.kiev.ua/handle/123456789/84938
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Об одном свойстве функции Беллмана в задаче оптимального быстродействия / А.В. Руденко // Теорія оптимальних рішень: Зб. наук. пр. — 2005. — № 4. — С. 146-151. — Бібліогр.: 3 назв. — рос.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id nasplib_isofts_kiev_ua-123456789-84938
record_format dspace
spelling Руденко, А.В.
2015-07-17T06:02:55Z
2015-07-17T06:02:55Z
2005
Об одном свойстве функции Беллмана в задаче оптимального быстродействия / А.В. Руденко // Теорія оптимальних рішень: Зб. наук. пр. — 2005. — № 4. — С. 146-151. — Бібліогр.: 3 назв. — рос.
XXXX-0013
https://nasplib.isofts.kiev.ua/handle/123456789/84938
519.8
In the framework of a 2D Time Optimal Control Problem, the specific property of Bellman function is obtained.
ru
Інститут кібернетики ім. В.М. Глушкова НАН України
Теорія оптимальних рішень
Об одном свойстве функции Беллмана в задаче оптимального быстродействия
On a property of Bellman function in a time optimal control problem
Article
published earlier
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
title Об одном свойстве функции Беллмана в задаче оптимального быстродействия
spellingShingle Об одном свойстве функции Беллмана в задаче оптимального быстродействия
Руденко, А.В.
title_short Об одном свойстве функции Беллмана в задаче оптимального быстродействия
title_full Об одном свойстве функции Беллмана в задаче оптимального быстродействия
title_fullStr Об одном свойстве функции Беллмана в задаче оптимального быстродействия
title_full_unstemmed Об одном свойстве функции Беллмана в задаче оптимального быстродействия
title_sort об одном свойстве функции беллмана в задаче оптимального быстродействия
author Руденко, А.В.
author_facet Руденко, А.В.
publishDate 2005
language Russian
container_title Теорія оптимальних рішень
publisher Інститут кібернетики ім. В.М. Глушкова НАН України
format Article
title_alt On a property of Bellman function in a time optimal control problem
description In the framework of a 2D Time Optimal Control Problem, the specific property of Bellman function is obtained.
issn XXXX-0013
url https://nasplib.isofts.kiev.ua/handle/123456789/84938
citation_txt Об одном свойстве функции Беллмана в задаче оптимального быстродействия / А.В. Руденко // Теорія оптимальних рішень: Зб. наук. пр. — 2005. — № 4. — С. 146-151. — Бібліогр.: 3 назв. — рос.
work_keys_str_mv AT rudenkoav obodnomsvoistvefunkciibellmanavzadačeoptimalʹnogobystrodeistviâ
AT rudenkoav onapropertyofbellmanfunctioninatimeoptimalcontrolproblem
first_indexed 2025-11-25T23:52:37Z
last_indexed 2025-11-25T23:52:37Z
_version_ 1850587195464744960
fulltext Теорія оптимальних рішень. 2005, № 4 146 ÒÅÎÐ²ß ÎÏÒÈÌÀËÜÍÈÕ Ð²ØÅÍÜ Показано, что в двумерной задаче о тележке функция Беллмана ( )x,xTT &= обладает свойством ( ) ( )x,xTkxk,xkT && =2 , 0>k . Получено также явное выражение 201 02012 pxp xpxp T + + −= & & , где ( )21 p,p - начальное состояние сопряженной системы.  А.В. Руденко, 2005 ÓÄÊ 519.8 À.Â. ÐÓÄÅÍÊÎ ÎÁ ÎÄÍÎÌ ÑÂÎÉÑÒÂÅ ÔÓÍÊÖÈÈ ÁÅËËÌÀÍÀ  ÇÀÄÀ×Å ÎÏÒÈÌÀËÜÍÎÃÎ ÁÛÑÒÐÎÄÅÉÑÒÂÈß Формулировка задачи. В евклидовой плос- кости 2R имеется дифференциальное урав- нение второго порядка вида ., 1≤= uux&& (1) которое, согласно закону Ньютона, описывает динамику материальной точки массы 1=m под действием изотропной силы u . Ищется оптимальное (программное) управ- ление ( )tuu = , которое переводит систему (1) из произвольного начального состояния ( )00 xx &, в конечное состояние ( ) ( )00,, =11 xx & за минимальное время T . Принцип максимума утверждает, что это оптимальное управление существует, един- ственно и имеет вид t t 12 12 pp pp u − − = , (2) где ( )21 pp , - заранее неизвестное начальное состояние сопряженной системы ( ) ( ) ., ,, 2212 111 0 0 pψψψ pψψ =−= == && & 0 Параметры 21 pp , определены с точностью до произвольного общего положительного множителя λ , что, очевидно, не влияет на выражение для оптимального управления u ввиду его однородности степени нуль по ( )21 pp , . Эти параметры находятся из краевых условий ( ) ( ) ( ) ( ) ,T,T ,, 00 == == xx xxxx & && 00 00 которые в исходном интегральном виде за- писываются следующим образом: ОБ ОДНОМ СВОЙСТВЕ ФУНКЦИИ БЕЛЛМАНА В ЗАДАЧЕ ОПТИМАЛЬНОГО БЫСТРОДЕЙСТВИЯ Теорія оптимальних рішень. 2005, № 4 147 ,dt t t T 0 0 12 12 x pp pp &−= − − ∫ (3) ( ) ,dt t tt T 0 0 12 12 x pp pp = − − ∫ (4) где фигурирует также заранее неизвестное время T . Таким образом, задача нахождения параметров ( )21 pp , оптимального управления (2) на самом деле связана с нахождением совокупности ( )T,, 21 pp . Поэтому важно изучить свойства как ( )21 pp , в их зависимости от ( )00 xx &, , так и свойства функции ( )00 xx &,TT = . Переход от интегральных соотношений к конечным. Все интегралы в системе (3), (4) берутся в элементарных функциях. Но делать это лучше не в координатах, а в бескоординатной форме, так как задача симметрична относи- тельно вращений. Искомые параметры в итоге будут зависеть от инвариантов типа 2 000 2 0 xxxx && ,, (а не от всех четырех компонент векторов 00 xx &, ). 1. Умножим (3) скалярно на ( )1p− и обратим внимание на то, что возни- кающее в этом случае подынтегральное выражение есть в точности производная ( )1 12 12 12 p pp pp pp −⋅ − − =− t t t dt d . (5) Отсюда 01212 xpppp &=−− T , или, что то же самое, T12201 pppxp −=+& . (6) Уравнение (6) представляет собой следствие универсального свойства гамильтониана ( ) ttH 121 ppxp −+= & быть интегралом движения: ( ) const.121 =−+= ttH ppxp & Поскольку это верно для всех [ ]T,t 0∈ (и даже для всех R∈t ), то, в частности, ( ) ( )THH =0 . Если теперь дополнительно учесть, что ( ) 0=Tx& , то мы приходим к уравнению (6). Поэтому его можно записать сразу, не выполняя интегрирова- ния. Однако важно понимать его происхождение как результат проекции век- торного уравнения (3) на направление ( )1p± . А.В. РУДЕНКО Теорія оптимальних рішень. 2005, № 4 148 2. Оказывается, что в двумерном случае, кроме гамильтониана, в задаче о тележке, ввиду ее специфики, имеется еще один интеграл движения. Он интере- сен тем, что дает сразу же еще одно уравнение относительно ( )21 pp , , причем линейное и без участия T . Его легко обнаружить, если воспользоваться тем, что в плоскости 2R наря- ду со скалярным произведением ba пары векторов ( )ba , можно ввести также их кососкалярное произведение ba∧ , которое обладает свойством abba ∧−=∧ и имеет следующий смысл (о кососкалярном произведении в n2R см. [1, § 41]). Сначала первый вектор поворачивается на o90 вперед (т.е. в положи- тельном направлении), а затем берется его скалярное произведение со вторым. Получается ориентированная площадь параллелограмма, построенного на упо- рядоченной паре векторов ( )ba , . При этом ba и ba∧ не независимы и связаны соотношением ( ) ( ) 2222 bababa =∧+ , что следует из тригонометрического тож- дества 1sincos 22 =+ αα . Рассмотрим выражение ( ) ( ) ( ) ( )tttt xppxp &∧−+∧= 121Λ и убедимся, что его производная тождественно равна нулю. Действительно, ( ) ( ) ( )( ) ( ) ( ) ( ) ( ) , t t t ttttt dt d 0 12 12 12 1211 = − − ∧−= =∧−+∧−+∧= pp pp pp xppxpxp &&&&Λ поскольку всегда 0≡∧aa . Отсюда следует, что ( ) ( ) ( ) ( ) .const121 =∧−+∧= tttt xppxp &Λ В частности, ( ) ( ).TΛΛ =0 Но ( ) 0=TΛ в силу того, что ( ) ( ) .00 == T,T xx & По- этому и ( ) 00 =Λ . Это приводит к линейному однородному уравнению ,00201 =∧+∧ xpxp & (7) связывающему векторы 21 pp , и не содержащему время T . 3. Продолжим переход от интегральных соотношений (3), (4) к конечным. Умножим (4) скалярно на ( )1p− . В результате получим ( ) ( ) 01 0 1 12 12 xpp pp pp −=−⋅ − − ∫ T t t t . Для вычисления этого интеграла заметим, что подынтегральное выражение, как следует из (5), имеет вид ОБ ОДНОМ СВОЙСТВЕ ФУНКЦИИ БЕЛЛМАНА В ЗАДАЧЕ ОПТИМАЛЬНОГО БЫСТРОДЕЙСТВИЯ Теорія оптимальних рішень. 2005, № 4 149 ( ) ( ).t t t t dt d t 1 12 12 12 p pp pp pp −⋅ − − =− Такой интеграл вычисляется по частям: .dttttdtt dt d t T T T ∫∫ −−−=− 0 12012 0 12 pppppp Для нахождения интеграла от t12 pp − поступим следующим образом, исполь- зуя непосредственно специфику задачи. Рассмотрим функцию ( ) ( ) ( ) ( )ttttL xppxp & 121 −+= и вычислим ее производную ( )tL& . Имеем ( ) ( ) ( ) ( ) ( ) ( ) .t t t t tttL 12 12 12 12 1211 pp pp pp pp xppxpxp −= − − −= =−+−+= &&&&& Следовательно, ( ) ( ) ( )0 00 12 LTLdttLdtt TT −==− ∫∫ &pp . Однако ( ) ( ) ( ) ( ) 0121 =−+= TTTTL xppxp & , ( ) 02010 xpxp &+=L . Поэтому ( )0201 0 12 xpxppp &+−=−∫ T dtt . Отсюда ( )020112 0 12 xpxppppp &++−=−∫ TTdtt dt d t T . Таким образом, ( )02011201 xpxpppxp &++−=− TT , или, что то же самое, ( )020112 2 xpxppp &+−=− TT . Теперь воспользуемся соотношением (6), которое позволяет заменить ради- кал T12 pp − на не содержащее T выражение 201 pxp +& . Окончательно имеем 201 02012 pxp xpxp + + −= & & T . (8) А.В. РУДЕНКО Теорія оптимальних рішень. 2005, № 4 150 4. Необходимо найти еще одно, четвертое уравнение, недостающее для определения совокупности параметров ( )T,, 21 pp . Оно оказывается трансцен- дентным (чего, к сожалению, нельзя избежать) и имеет вид ( ) . TT 2121 121121 121 01 ln 1 pppp pppppp ppp xp − −−− = ∧ ∧ − & (9) Основной результат. Представим полученные конечные соотношения в виде системы относительно ( )T,, 21 pp , дополнив ее условием нормировки 11 =p : ,T12201 pppxp −=+& ,00201 =∧+∧ xpxp & ,T 201 02012 pxp xpxp + + −= & & ( ) 2121 121121 121 01 ln 1 pppp pppppp ppp xp − −−− = ∧ ∧ − TT& , 11 =p . (10) Единственность решение этой системы гарантируется принципом максиму- ма Понтрягина и является ее важным свойством. Из этого вытекает полезное следствие, позволяющее понизить размерность задачи при ее численном решении. Теорема. Пусть ( )T,, 21 pp - единственное решение системы (10), соответст- вующее заданному начальному состоянию )( 00 xx &, . Для произвольного положи- тельного числа k рассмотрим преобразование вида )()( 00 2 00 xxxx &a& k,k, и обозначим ( )kkk T,, 21 pp единственное решение системы, соответствующее начальному состоянию )( 00 2 xx &k,k . Тогда .kTT,k, kkk === 2211 pppp (11) Доказательство. Заменим сначала в системе (10) )( 00 xx &, на )( 00 2 xx &k,k и, соответственно, ( )T,, 21 pp на ( )kkk T,, 21 pp . Непосредственная подстановка выражений (11) в полученную систему показывает, что ( )Tk,k, 21 pp является ее решением. В частности, ( ) ( )x,xTkxk,xkT && =2 , что не зависит от нормировки. Заключение. Работа является развитием исследований [1, 2]. Полученные результаты показывают, что при численном нахождении ( )T,, 21 pp нет необхо- димости рассматривать произвольные наборы )( 00 xx &, . Выбрав, например, 0 1 x&=−k , вектор скорости 0x& всегда можно считать единичным. ОБ ОДНОМ СВОЙСТВЕ ФУНКЦИИ БЕЛЛМАНА В ЗАДАЧЕ ОПТИМАЛЬНОГО БЫСТРОДЕЙСТВИЯ Теорія оптимальних рішень. 2005, № 4 151 О.В. Руденко ПРО ОДНУ ВЛАСТИВІСТЬ ФУНКЦІЇ БЕЛЛМАНА В ЗАДАЧІ ОПТИМАЛЬНОЇ ШВИДКОДІЇ Показано, що в двовимірній задачі про візок функція Беллмана ( )x,xTT &= має властивість ( ) ( )x,xTkxk,xkT && =2 , 0>k . Отримано також явний вираз 201 02012 pxp xpxp T + + −= & & , де ( )21 p,p - початковий стан спряженої системи. A.V. Rudenko ON A PROPERTY OF BELLMAN FUNCTION IN A TIME OPTIMAL CONTROL PROBLEM In the framework of a 2D Time Optimal Control Problem, the following property of Bellman func- tion is obtained: ( ) ( ) .k,x,xTkxk,xkT 02 >= && The explicit expression 201 02012 pxp xpxp T + + −= & & , where ( )21 p,p is an initial state of a conjugate system, is obtained, too. 1. Арнольд В.И. Математические методы классической механики. – М.: Наука, 1974. – 432 с. 2. Руденко А.В. Об одной задаче оптимального быстродействия // Теорія оптимальних рішень. – Киев: Ин-т кибернетики им. В.М.Глушкова НАН Украины, 2002. – №1. – С. 135-141. 3. Руденко А.В. Двумерная тележка: вариационная оценка снизу функции Беллмана // Теорія оптимальних рішень. – Киев: Ин-т кибернетики им. В.М. Глушкова НАН Украины, 2003. – №2. – С. 135-148. Получено 04.04.2005