Синтез импульсных управлений при фазовых ограничениях
Розглянуто задачу синтезу керувань у лінійних системах, в класі імпульсних керувань при обмеженнях на фазові координати та невизначеності в системі.
Gespeichert in:
| Datum: | 2016 |
|---|---|
| 1. Verfasser: | |
| Format: | Artikel |
| Sprache: | Russian |
| Veröffentlicht: |
Інститут кібернетики ім. В.М. Глушкова НАН України
2016
|
| Schriftenreihe: | Проблемы управления и информатики |
| Schlagworte: | |
| Online Zugang: | https://nasplib.isofts.kiev.ua/handle/123456789/208073 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Zitieren: | Синтез импульсных управлений при фазовых ограничениях / А.Б. Куржанский // Проблемы управления и информатики. — 2016. — № 2. — С. 6-20. — Бібліогр.: 24 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| id |
irk-123456789-208073 |
|---|---|
| record_format |
dspace |
| spelling |
irk-123456789-2080732025-10-20T00:05:09Z Синтез импульсных управлений при фазовых ограничениях Синтез імпульсних керувань при фазових обмеженнях Synthesis of impulse controls under phase constraints Куржанский, А.Б. Проблемы динамики управляемых систем Розглянуто задачу синтезу керувань у лінійних системах, в класі імпульсних керувань при обмеженнях на фазові координати та невизначеності в системі. The synthesis of controls in linear systems in the class of impulse controls under constraints on phase coordinates and uncertainties in the system. 2016 Article Синтез импульсных управлений при фазовых ограничениях / А.Б. Куржанский // Проблемы управления и информатики. — 2016. — № 2. — С. 6-20. — Бібліогр.: 24 назв. — рос. 0572-2691 https://nasplib.isofts.kiev.ua/handle/123456789/208073 517.977 10.1615/JAutomatInfScien.v48.i3.20 ru Проблемы управления и информатики application/pdf Інститут кібернетики ім. В.М. Глушкова НАН України |
| institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| collection |
DSpace DC |
| language |
Russian |
| topic |
Проблемы динамики управляемых систем Проблемы динамики управляемых систем |
| spellingShingle |
Проблемы динамики управляемых систем Проблемы динамики управляемых систем Куржанский, А.Б. Синтез импульсных управлений при фазовых ограничениях Проблемы управления и информатики |
| description |
Розглянуто задачу синтезу керувань у лінійних системах, в класі імпульсних керувань при обмеженнях на фазові координати та невизначеності в системі. |
| format |
Article |
| author |
Куржанский, А.Б. |
| author_facet |
Куржанский, А.Б. |
| author_sort |
Куржанский, А.Б. |
| title |
Синтез импульсных управлений при фазовых ограничениях |
| title_short |
Синтез импульсных управлений при фазовых ограничениях |
| title_full |
Синтез импульсных управлений при фазовых ограничениях |
| title_fullStr |
Синтез импульсных управлений при фазовых ограничениях |
| title_full_unstemmed |
Синтез импульсных управлений при фазовых ограничениях |
| title_sort |
синтез импульсных управлений при фазовых ограничениях |
| publisher |
Інститут кібернетики ім. В.М. Глушкова НАН України |
| publishDate |
2016 |
| topic_facet |
Проблемы динамики управляемых систем |
| url |
https://nasplib.isofts.kiev.ua/handle/123456789/208073 |
| citation_txt |
Синтез импульсных управлений при фазовых ограничениях / А.Б. Куржанский // Проблемы управления и информатики. — 2016. — № 2. — С. 6-20. — Бібліогр.: 24 назв. — рос. |
| series |
Проблемы управления и информатики |
| work_keys_str_mv |
AT kuržanskijab sintezimpulʹsnyhupravlenijprifazovyhograničeniâh AT kuržanskijab sintezímpulʹsnihkeruvanʹprifazovihobmežennâh AT kuržanskijab synthesisofimpulsecontrolsunderphaseconstraints |
| first_indexed |
2025-10-20T01:15:53Z |
| last_indexed |
2025-10-21T01:10:01Z |
| _version_ |
1846551774511497216 |
| fulltext |
© А.Б. КУРЖАНСКИЙ, 2016
6 ISSN 0572-2691
ПРОБЛЕМЫ ДИНАМИКИ УПРАВЛЯЕМЫХ СИСТЕМ
УДК 517.977
А.Б. Куржанский
СИНТЕЗ ИМПУЛЬСНЫХ
УПРАВЛЕНИЙ ПРИ ФАЗОВЫХ
ОГРАНИЧЕНИЯХ
Введение
Исследование управляемых систем с импульсными воздействиями — одна из
активно развиваемых тем в современной теории управления, мотивированных мно-
гими прикладными проблемами [1–8]. В отличие от более ранних работ по програм-
мному управлению, особенное внимание в настоящее время уделяется задачам синтеза
позиционных стратегий управления для таких систем [3, 9–12]. В данной работе рас-
сматриваются математические вопросы синтеза оптимальных импульсных управ-
лений при фазовых ограничениях, отличающиеся спецификой структуры искомых
решений. А именно, если без фазовых ограничений решения задачи для линейных
систем могут сводиться к управлениям, состоящим исключительно из набора дельта-
образных импульсов [2], то при наличии таких ограничений решения, естественно,
оказываются более сложными. Более сложным является и применение гамильтонова
формализма в форме динамического программирования для таких систем (см. [13–16]),
где оно должно сочетаться с использованием элементов теории обобщенных функ-
ций [17, 18–20]. Методы вариационного анализа и их применение к задачам управ-
ления использованы в соответствии с публикациями [15, 21].
Ниже подобная задача рассматривается при дополнительной неопределен-
ности в системе.
Управляемая система
Рассматривается система
,=)(],,[,)()()()()()(=)( 1 xtxttdvCdUBdxAdx (1)
с управлением )];,([)( 10
pttBVU R в пространстве p-векторных функций ограни-
ченной вариации и неизвестным возмущением
],,[),(int0,)()( 1ttv q R
моделируемым измеримой функцией, ограниченной заданной трубкой )( —
многозначной функцией с сечениями в виде выпуклых компактов, полунепре-
рывной сверху в хаусдорфовой метрике.
Здесь размерности параметров матричных фунций таковы: ,)( nnA R
pnB R)( и ,)( qnC R при том что эти функции известны и непрерывны.
Временной интервал ],[ 1tt полагается заданным.
Работа поддержана грантом РФФИ, № 15-01-05950а.
60
1956 2016
Международный научно-технический журнал
«Проблемы управления и информатики», 2016, № 2 7
Траектории )(x системы (1) подвержены фазовым ограничениям
,],,[),()(=)( 1
nmNttNxy R (2)
где )( — непрерывная по Хаусдорфу трубка с выпуклыми компактными
сечениями. Выполнение этого ограничения должно обеспечиваться управлени-
ем ,)(U каким бы ни было возмущение .)(v
Задача синтеза импульсного управления
Пусть задана замкнутая выпуклая терминальная функция ,)( ограниченная
снизу, и функционал типа Майера–Больца, зависящий от управления и возмущения:
0)).(()(Var=),)(),(( 10)1,[ txUxtvUJ tt (3)
Здесь ))(,,(=][ txtsxsx — тректория уравнения (1) при программных управлении
)(U и возмущении ,)(v выпущенная из положения .=)( xtx
Управление )(U должно минимизировать этот фукционал, невзирая на
возмущение. А именно, для заданной начальнй позиции },{ xt оно должно гаран-
тировать, что значение этого функционала не превзойдет некоторого уровня V
при любом .v Более того, уровень V должен быть наименьшим из возможных.
Однако следует искать не программное, а синтезированное управление.
Будем выбирать его как стратегию управления в классе функций ограниченной
вариации ,),( xtU имея в виду следующее. Если )(x — траектория, реализован-
ная при ,)(),,( vxtU то можно рассматривать соответствие
)).(,(=)()},(),({~)}(,{ txttUUxv UU
При этом пары )}(,)(),({ vUx U могут быть неединственны, тогда как каждая
пара )}()()(),({ Uuvu будет порождать единственное решение ][x уравнения (1).
Множество таких функций ][x при заданном U далее обозначено ],[ U .
На основе (3) введем критерий
(2)},)},(,)(),({),)(),(({sup=),)(,(
][
vUxxtvUJxtv
x
UU (4)
определяющий наихудшую реализацию ],[][ Ux при фиксированных ).(, vU
И наконец промаксимизируем этот критерий по всем ,)(v получив гарантирован-
ное значение
).,)](,(sup=),(
)()(
xtvUxt
v
U
Задача 1. В классе синтезирующих стратегий найти следующую функцию
цены при фазовом ограничении:
=),(inf=))(,;,(=),( 1 xttxtxt U
U
(2)}.)},(,)(),({0))(()(Var{supsupinf= 10)1,[
)()(
vUxtxUtt
v
U
U
(5)
Зная ,),( xt сформулируем следующую основную залачу.
Задача 2. Найти стратегию ,*U реализующую условие
),(=),( * xtxt U
для всех ],[ 10 ttt и всех ,nx R удовлетворяющих фазовому ограничению (2).
Подобные стратегии называют универсальными.
8 ISSN 0572-2691
Принцип оптимальности. Уравнение ГЯБА
Этот принцип оптимальности имеет похожие по смыслу формы для разных
версий. Однако вычисление решений для каждой версии различно. В рассматривае-
мой задаче при неопределенности и фазовых ограничениях оно приводит к соот-
ношениям
(2)},0))(,()(Var{supinf=)),(,,,( 0)=,[
)()(
xxt vt
v
U
U
(6)
где )(Var 0)=,[ vt U рассматривается в смысле (5). Схема доказательства этого прин-
ципа в целом аналогична задачам без фазового ограничения [22], однако отличия
состоят в вычислениях, которым и посвящена данная работа.
Содержательно указанный принцип имеет следующие объяснения. Здесь
программные управления ищутся в классе :)(U
0},=)()];,([)({=)( tUtBVUt p
sc R
а возмущения — в классе
]}.,[),()(],[)({=)( tvtLvt D
Класс ),( t импульсных позиционных стратегий ),( tU состоит из ото-
бражений ,)()(: tt sc U где реализации ][vU стратегии U неупреждающие.
А именно, для любого ],[ t имеет место импликация
,)]([=)]([],[),()( 2121 svsvtssvsv UU
т.е. из совпадения )(1 sv и )(2 sv почти всюду на ],[ ts вытекает совпадение
реализаций: )]([=)]([ 21 svsv UU на промежутке 0].,[ t Указанное свойство обес-
печивает выполнение условия (6) (см. [15], гл. 2.3).
Для решения задачи 1 приведем соответствующее уравнение ГЯБА. Вначале
отметим следующие возможные ситуации для текущей позиции ,},{ xt обозначив
обобщенную производную udtdU =/ ( ср. с [9]).
(i) Вектор .)(int tx Управление .0))((,const)( tutU
(ii) Траектория )(=)( tNxty находится на границе )(t фазового ограни-
чения при 0.>),,[ tt
(iii) При t= функция )(U имеет скачок и ).(=)( tu
Полагая, что функция ),( xt дифференцируема по любому направлению ,},{ h
причем производная ),,( hxtD непрерывна по },{},,{ hxt и равномерно по
,},{ h приходим к уравнению ГЯБА
0,=},,{min= 321 (7)
определяющему функцию цены для задачи 2 импульсного управления при неоп-
ределенности и фазовом ограничении.
Компоненты i функции имеют вид
0,=))()(),(()(1,),(=),,,(1 tCxtxtAxtDxt txt (8)
когда 0=)(u (управления нет и траектория )(int)( ttNx m при любом возму-
щении );)(tv
Уравнение Гамильтона–Якоби–Беллмана–Айзекса (ГЯБА).
Международный научно-технический журнал
«Проблемы управления и информатики», 2016, № 2 9
)},(),())()()(1,),({maxmin=),,,(2 tvtPuvtCutBxtAxtDxt
vu
xt (9)
когда траектория )(tNx достает границы фазового ограничения, затем следует
вдоль границы ,],[),()( ttx при обычном, не импульсном управле-
нии ,)(u несмотря на возмущение. При этом )(u ограничено множеством ,)(tP
указанным далее:
,)})(0,),({min=),,,(
1=
*
3 hhtBxtDkxt
h
xt
(10)
когда имеют место скачки в направлениях, указанных решением, размеры которых
определяются дополнительно. Так если скачок условно происходит в позиции
,},{ xt где 0=0,> 31 HH и ,)(int)( ttx то размер скачка вычисляется из
условия, чтобы при ,0t т.е. после скачка снова было ,0=1 при том что
).(0)( ttx
Теорема 1. Функция ),( xt уравнения (7) решает задачу 1.
Управляющая стратегия ),( xtU определяется по функции ,),( xt значения
которой зависят от минимизатора среди .i
Для позиции },{ xt возможны следующие варианты:
1) в позиции },{ xt имеем ,0=1 здесь агрегат )()({max=)()( sBsB
]},[ t отсутствует и ;0=),(0 xtdU
2) в позиции },{ xt имеем 0,=2 когда ,0>),,[ tt здесь норма
],[=)()( tsB sc достигается, тогда обычное управление }/)(=),(0 dttdUxttu
определяется следующим образом: пусть
},},1,:{=(0)(0),:{min=),( mllllxNxNh RBB
где ),( xNh — хаусдорфово расстояние между )(txN и ,)(t тогда при
)()( ttxN управление
,)()}(0,/))(),((:{)()( tPtQvdtttxNdhuttu
где 1}=,))((,{max)( pptpxNpth
p
и максимизатор 0= pp единствен-
ный; отсюда получаем
=/))((,=/))(),(( 00 ttpxNpdtttNxdh m
;0/))(())()(())()((,= 000 ttpttNCputBxtANp
3) в позиции },{ xt имеем ,00,>0,= 213 тогда
)},(),()(=)({=),( 0*00 txthtktuxt
где )(Var=)( ],0[ Utk tt и ),(0 xth — минимизатор задачи
0,0)(0,0)()(=)()},,)(0,),({min *
1=
tktktktkhhtBxtD
h
значение )(* tk определяется из условия ).(0)(0;=1 ttx
10 ISSN 0572-2691
Примечание. (a) При 0=0,= 21 в позиции },{ xt скачка нет. (b) При
0=0,>0,> 321 и далее, в позиции ,},{ xt препятствий нет; позиция },{ xt
находится в условиях задачи без фазового ограничения и скачок возможен.
Теорема 2. Стратегия управления ,),(0 xtU решающая задачу 2, описывается
условиями 1)–3), указанными выше.
Предлагаемое решение опирается на программные конструкции. Укажем их.
Функция цены при программных управлениях и фазовом ограничении
В силу громоздкости формул сделаем преобразование координат =)(tz
),(),(= txtG которое при сохранении прежних обозначений приводит систему (1)
к виду
,],,[,=)(,)()()()(=)( ttsxtxdssvsCsdUsBsdx (11)
где ).()( ssv Данное преобразование не умаляет общности и справедливо
при .t
Рассмотрим функционал ,),)(),(( xtvUJ (3) при фазовом ограничении (2).
Также положим mxxt =),( .
В классе программных управлений рассмотрим две функции цены:
,),)(),((infsup=))(,;,(
),[)()(
xtvUJxtV
tUtv
sc
(12)
),)(),((supinf=))(,;,(
)()(),[
xtvUJxtV
tvtU
sc
(13)
(здесь supremum и infimum суть фактически maximum и minimum).
Рассмотрим вначале задачу (12) на maxmin при фазовом ограничении (2) и
фиксированном конце 1=)( xx траектории .)(x А именно, будем искать минималь-
ную вариацию управления )(U для следующей задачи: найти
),(=(2)}],)[(Var{minmax=),;,( 10
)(
1 xtUxxtV
Uv
переводящее x в 1x при неопределенности и фазовом ограничении.
Записывая условия задачи в виде неравенств, при фиксированном )(tk
получим
)()()()(minmaxmin,
,)(
(1) dUBdsssNlxl
tlUv
ddvsCdsssNlxdsssNl m
ttt
))()(()()()()(,)()(
по всем управлениям )(],)[(Var tktU и ].,[)(, tLl n
R Здесь операции
max по U и min по },{ l могут быть переставлены.
Используя сопряженное уравнение
,=)(],,[),()(= lstNs
и обозначая ),;,(=][ lss , перепишем предыдущее выражение в виде
Международный научно-технический журнал
«Проблемы управления и информатики», 2016, № 2 11
,}},{),,(][)()({,
],[
(1)
lltcsBtkxl
tC
.)()(()()(][],[=),,,(
ddvCsxtsvltc m
tt
Последнее приводит нас к минимизатору )()( 1
00 xtk
)},()(],,[},{),,,(,{maxmax=)( 1
,
1
0
vtlvltcxlx sc
lv
(14)
где 1}=][)(:,{=],[
],0[
tCsc sBlt .
Далее, полагая mxx 1=)( , рассмотрим подзадачу
},)({min=))(,;,( 11
0
1
mxxxtV
x
и поменяв местами 1min
x
и max ,, lv , используем формулу
,,(0))(=},)(,{max=},{min
mllmlmxmxlmxxl
mxx
B
где (0))B — единичный шар в евклидовом пространстве.
В заключение имеем
xtsmlxtV
l
],[,max=))(,;,(
,
.(0)())()(())()(][(
BlIddCs m
tt
(15)
Лемма 1. Максиминное значение функции цены ))(,;,( xtV определя-
ется соотношением (15) при дополнительном условии
1}.=][)(max:,{=],[
],[
sBlt
t
sc
Перейдем к решению задачи (13) на минимакс. Фиксируя ,)(=1 xx вначале
рассмотрим задачу на минимакс полной вариации управления ,)(U а именно,
).(=(2)}],)[(Var{maxmin=),;,( 10
)(
1 xtUxxtV
vU
Переходя к описанию задачи на vU maxmin с помощью двойственных пере-
менных, при фиксированных l, имеем
))()()(()()(minminmax,
)(
1 dvCdUBdsssNlxl
t
vU
.))()((,)()(
dxdsssNl m
tt
(16)
12 ISSN 0572-2691
Далее получаем
xsxl
U
],[minmax,
)(
1
.))()(()))()(][()()((][(
ddCsdUBs m
t
(17)
Теперь min и max не могут быть немедленно переставлены, так как правая
часть в фигурных скобках предыдущего выражения может оказаться невыпуклой
по ., l Однако это выражение будет эквивалентно следующему, которое
выпишем, используя переменную ][s сопряженного уравнения. А именно, рас-
смотрим выражения
,)(Var),,(],[)()(][minmax
)(
UlthxtsdUBs
t
U
(18)
.))()(][())()((=),(
dsCsdlh m
t
Здесь приходится провести овыпукление ,),( lh приводящее к функции
),(=)),((conv ** lhlh . После этого овыпукления перестановка min и max в (18)
уже возможна и при фиксированном l получаем
=)(Var),(],[)()(][maxmin, **
)(
(1)
UlhxtsdUBsxl
t
U
.),(],[][)(maxmin **
],[
lhxtssB
t
(19)
Отметим, что при ,],[),(int0 t минимум по достигается при всех .l
Если в (19) убрать min по , то это неравенство остается справедливым при
всех . Сказанное приводит к соотношению
]}.,[,),(],[,{max=(1))( **1
,
0
tBllhxtsxlx sc
l
Вычисляя ,}(1))({min 10 mxxx наконец получаем
])}.,[,),(),(,{max=))(,;,( **
,
tllhxtsmlxtV sc
l
sc (20)
Лемма 2. Минимаксная функция цены ))(,;,( xtVsc определяется при
условии
1}.=]},[][)({max:,{=],[=),;,(
tsBltlt scsc
Акт овыпукления фактически состоит в вычислении второй сопряженной функции .),(** lh
При этом параметр в (18) должен быть достаточно большим, чтобы выпуклая оболочка
функции ),,( lh по },{ l приводила к условию .=),((conv lh
Международный научно-технический журнал
«Проблемы управления и информатики», 2016, № 2 13
Попятная достижимость
Рассмотрим систему
],,[
,=)(,)(=)(
,=)(),()()()(=)(
t
ktkdUdk
xtxtvtCdUBdx
(21)
при фазовом ограничении (2). В данном разделе используется чисто терминаль-
ный функционал.
Предположение 1. В задаче (7)–(10) функционал
),,(=)(0,)(0,)(=0)},(({sup=),)(,( 2 xdxkkkxxtv
v
где — выпуклый компакт в .nR
Затем рассмотрим задачу о достижимости при неопределенности и фазовых
ограничениях с применением решения к задаче синтеза управлений. Вследствие
этого будет рассмотрена задача о попятной достижимости в классе синтезируе-
мых управлений. Однако начнем со вспомогательных задач с программными
управлениями и возмущениями.
Определение (минимаксная достижимость). Множеством попятной достижи-
мости минимаксного типа в классе программных управлений в момент t из тер-
минальной позиции },{ M называется объединение ),;,(=],[ ktkt
точек ,)(= txx для каждой из которых существует программное управление )(U
с вариацией ,)(=)(Var ],[ tkkUt переводящее систему (21) из позиции },{ xt в
),;(=][ xtxx при фазовом ограничении (2), каким бы ни было возмуще-
ние .],[),()( tv
Указанный тип множества достижимости можно вычислить с помощью
следующей задачи оптимизации: найти
(2)})),,;(({maxmin=),,(0 xtxdkxtV
vU
(22)
при фазовом ограничении (2) с краевым условием
.)),((=))((0,0)(,)( 2 xdxkx
Вычисляя ),,(0 kxtV , с помощью процедур, аналогичных для (19), получаем
))()()()(]([],[maxmaxmin=),,(
,
0 dvsCdUBsxtskxtV
t
lvU
1=,)()(,)(Var)())()(( ldvkUld
t
,1=,)(Var),()()(][],[maxmin=
,
lkUlhdUBsxts
t
lU
где
dsCsMldlh
t
))()(][()())()((=),( .
14 ISSN 0572-2691
После овыпукления (0))(),(=),( Bh llhl по ,l , приводящего к
),(** lh , можно переставить minU и max ,l . В заключение имеем
.1}=,,=][),,(][)(max],[{max=),,( **
],[,
0
lllslsBkxtskxtV
tl
h (23)
Теорема 3. Множество ],[ ktW попятной достижимости минимаксного типа
в классе программных управлений в момент t из терминальной позиции },{ M
задается соотношением
.0}),,(:{=),;,(=],[ 0
kxtVxktWktW (24)
Тогда -окрестность ],[ ktW определяется как
}.),,(:{=],[ 0
kxtVxktW
Здесь управления ,U определющие границу ,],[ ktW не требуют знания
реализации .v
Замечание. Множество =],[ ktW , если функция ),( lh ограничена снизу.
Второй тип попятного множества достижимости ],[ ktW при неопределен-
ности и фазовом ограничении формально требует знания реализации )(tv до вы-
бора управления. Это множество може быть описано функцией цены для задачи
оптимизации, а именно, следующей :))()(Var],,[( tkUt
,1}=,,=][),,(][)(max)(],[{max=),,(
,
0
lllslsBtkxtskxtV
l
h (25)
вычисляемой соотношениями, аналогичными для областей первого типа.
Теорема 4. Множество ],[ ktW максиминного типа в классе программных
управлений в момент t из позиции },{ задается соотношением
}.0),,(:{=),;,(=],[ 0
kxtVxktWktW (26)
Его окрестность
}.),,(:{=],[ 0
kxtVxktW
Для его описания как в терминах функций, так и в терминах множеств
сделаем замену ,)(=)( ltL отмечая, что для каждой пары },{ l существует
матричная функция ,)( nmLL
которая реализует это преобразование. Тогда
соотношение (25) можно переписать следующим образом.
Используя матричное сопряженное уравнение в виде
],,[1,=,,=],[),()(= tllISNLS (27)
с решением ],[ LS при )()(Var],,[ tkUt получаем
)())(](,[max)(],[max=),,(
)(,
0 dUBSltkxtSlkxtV L
t
U
L
t
Ll
0.)())()(())()(],[((
lLldCSl m
tt
Международный научно-технический журнал
«Проблемы управления и информатики», 2016, № 2 15
Тогда для фиксированной функции )}(,{ Ll (так как )()( tkU ) находим
dQCSldUBSlxtSl L
t
L
t
U
L ))()(],[()()(],[max],[,
)(
.)())()((
ldLl m
t
Теперь для вычисления ],[ ktW следует описать все векторы ,x которые
удовлетворяют предыдущему неравенству при всех 1.=, ll В результате прихо-
дим к утверждению.
Теорема 5. Попятное множество ],[ ktW максиминного типа удовлетворяет
пересечению
dNLdUBStSktW
t
L
tU
L
L
)()()())()(],[(],[],[
)(
1
)(
dQCS
t
)()(],[ (28)
по всем .)(),( kUL
Здесь символ }:{= pp означает геометрическую разность
множеств и (см. [23, 24]).
Для изучения эволюции ],[ ktW во времени удобно использовать следующую
замену. Вместо уравнения (27) используем его модифицированную форму, а имен-
но, рассмотрим уравнение
)(=/ MSdS MM (29)
с решением
,=],[],,[ ISS MM
.],[],[)()(],[)()()()(=)( 1
1
MLL SSNLSNLdNLIM
(Это проверяется прямым счетом.)
Следовательно, (28) можно переписать как пересечение:
dMSdUBSSkW MM
U
M
M
)()(],[)()(],[],[],[
)(
2
)(
dQCSM )()(],[ (30)
по всем ).()(),( kUM
Соотношение (30) определяет многозначне отображение },{:],[ T
]}.,[,{ kW Далее оно используется для построения множеств достижимости
],[ kW в классе синтезированных позиционных стратегий.
Попятная достижимость при коррекциях и для синтеза управлений
Схема импульсного управления при отсутствии фазового ограничения из-
вестна (см. [9, 12]). Здесь это будет сделано при фазовом ограничении, превраща-
ющем задачу в бесконечномерную.
16 ISSN 0572-2691
Основным элементом конструирования искомых стратегий является построе-
ние попятных областей достижимости максиминного типа при неопределенности
и фазовых ограничениях в классе позиционных стратегий. Это будет сделано путем
предельного перехода от кусочно-программных конструкций c коррекциями.
Найдем вначале попятную область достижимости ],[1 ktW (30) при одной
коррекции в момент .),( t Тогда если использовать соотношение (30), то
справедлива следующая суперпозиция:
))),(,()(,(,)(,(=)))(,()(,(=],[ kWkWtktWkWtktWktW
где },{=))(,( kW при 0;>))()(( ktk .),(0,0)(0,>)( tkk
Следуя далее, для N коррекций зададим разбиение интервала ],[ t на N час-
тей, обозначенное как
}.=<<<<={= 011 NNN t
Его диаметр Ndiam есть }{max 1 ii по всем таким разбиениям. Также
1,0,=0,>)()( 1 Nikk ii при каждом разбиении.
Для дальнейших вычислений необходимо отображение
,)](,[)](,[:],[ 111 iiiiii kWkWT
которое с учетом (30) представимо в виде
=)](,[],[=)](,[ 111 iiiiii kWTkW
)](;,[))()(()](,[],[{( 111
1
)(
LkkkWS iiiiiiiiM
L
P
)]}.(;,[)])(;,[ 11 LL iiii QY (31)
Здесь использованы следующие обозначения:
,))(1)(()(Var)()(][1)(=)](;,[ 1
1
)(
1
kkUdUBSL M
i
i
U
ii P
.)()(][=)](;,[;)()(=)](;,[ 1
1
1
1
1
dCSMdNMM M
i
i
ii
i
i
ii QY
Для N коррекций, полагая, ),(=)( 0 kk имеем выражение
,)=,=(,],[,],,[=)](,[ 0011 tTTtktW NNN
N
представляющее специальный вид альтернированной интегральной суммы для
попятной максиминной области достижимости рассматриваемой задачи —
модификации, введенной в [23] (см. также [24]).
Аналогичные соотношения для попятной минимаксной области имеют следу-
ющий вид. Оператор )](,[)](,[:],[ 111 iiiiii kWkWT представим как
=)](,[],[=)](,[ 111 iiiiii kWTkW
)](,[][(()](;,[))()({( 11
)(
iiiiiii
M
kWSMkk P
.)})](;,[)])(;,[ 11 MM iiii QY (32)
Международный научно-технический журнал
«Проблемы управления и информатики», 2016, № 2 17
Тогда
).=,=(],[,],,[=)](,[ 0011 ttTTtktW NNN
N
Далее обозначим ,],[=)](,[],,[=)](,[ ktWtktWktWtktW
N
N
N
N
подчерки-
вая использование разбиения N . Таким образом, здесь определены максиминные и
минимаксные альтернированные интегральные суммы ].,[ ktW
N
Предполагая,
что все последующие операции невырождены (все геометрические разности не-
пусты), заключаем следующее.
Лемма 3. Имеет место цепь включений
].,[],[],[],[],[],[
11
ktWktWktWktWktWktW
NN
В указанных условиях существуют пределы для последовательностей мно-
жеств
N
W при N и сходимости в хаусдорфовой метрике. Таким образом,
приходим к утверждению.
Теорема 6. Пределы в хаусдорфовой метрике альтернированных макси-
минных и минимаксных сумм при N удовлетворяют соотношениям
.],[inflim],[],[=],[suplim ktWktktktW
NN
(33)
Приведенные выше соотношения определяют многозначное отображение
]},,[,{},{:],[ kttt
T
которое по построению удовлетворяет полугрупповому свойству: для любого
),( t справедлива суперпозиция
)))(,()(,()(,(=)))(,()(,(=],[ 11 kktktktktkt (34)
при .0)(0,>)()(0,>)()(},),({=))(,( kkkktkkk
Последнее позволяет применить это свойство для описания эволюционной
динамики множества достижимости .],[ kt Теперь множество ],[ kt может
использоваться для синтеза гарантирующих стратегий импульсного управления
при неопределенных возмущениях и ограниченных фазовых координатах.
Уравнение интегральных воронок. Из свойства (34) вытекает следующее
эволюционное уравнение для ],[ kt при :0](),),((=](,[ 2 kxdk
)](,[(lim
1
0
tkth
,0))(]),[)](,[(,)()( ttttktttC U (35)
0.0)()(=)(),()(),()(=],[ **
00
tktktktksdUsdUsBtt
t
t
t
tU
U
В отсутствие фазового ограничения это множество обозначим .)](,[* tkt
Уравнение для него имеет вид
.0]),[)](,[,)()(](,[(lim **
1
0
tttktttCtkth U (36)
18 ISSN 0572-2691
Синтезированные гарантирующие стратегии управления
Заметим, что координаты, не охваченные фазовым ограничением ,)(t на
рассматриваемом промежутке ],[ 0 t можем считать ограниченными с помощью
барьеров, лежащих за пределами трубки достижимости системы (21) без учета
этого фазового ограничения. Поэтому далее можем считать .=,= nNxyIN R
Также примем следующее предположение.
Предположение 2. Оптимальная траектория выходит на границу )(t
фазового ограничения только на одном интервале: 2121 ],,[ ttttt .
Рассмотрим функцию
,0}),(:{=],[]),,[,(=),,( 2 xtxktktxdkxt
где при 0>]),[,( ktxd имеем
]),[(,=1}=,]),[(),{max=]),[,( 00 ktlxlllktlxlktxd
l
c единственным максимизатором .),,(0 kxtl (При ).0=0,=]),[,( 0lktxd
Тогда при 0>),,( kxt полная производная
},,{min=),,,(=/),,( 321 HHHHH kxtdtkxtd
и управляющая стратегия ),,( kxtU определяются из условия 0,/),,( dtkxtd
0,)( tk причем имеют место следующие случаи.
1. Когда ,0=),,(=),,( 1 kxtkxt HH имеет место условие
=})(,{max=),,(=/),,(
)(
vtCkxtdtkxtd x
tQv
t H
.const=)(0,=))()((/]),[(= 00 tkttCltktl
Управление 0)( tu и при каждом возмущении v имеем .)()( ttx
2. Когда ,),,(=),,( 2 kxtkxt HH ,0>0,> 31 HH имеет место условие
0),,(=/),,( 2 kxtdtkxtd H
и фазовое ограничение активно.
Здесь для вычисления производной dtkxtd /),,( понадобятся частные
производные функции ]),[( ktl в момент ,0t а именно,
,=]),,[(
0)(
=]),[(
0)(
00 tsksl
s
ktl
t
и которая в этом случае равна нулю, так как .0=)(0)(=)(* tktktk
Случай выхода на счетном множестве интервалов обрабатывается аналогично.
Международный научно-технический журнал
«Проблемы управления и информатики», 2016, № 2 19
Поскольку ,)(],[ tkt получаем
=
0)(
]),[( 0
t
ktl
,))(|(=)][(если},/))(|(,/]),[({min
)),(|(<)][(если,/]),[(
000
*
0
00
*
0
tltlttltktl
tltltktl
(37)
где ],[* kt — попятное множество разрешимости (35) при отсутствии фазового
ограничения.
В рассматриваемом случае при )(tx на границе фазового ограничения обык-
новенное управление )(tu выбирается из условия
),((=])[( 00 tltl
c учетом равенства
.))()(())()(()()(,)(=/]),[(1)( 000*0 ttCltttutBltktktl
Тогда при
0=))(ł()()(,,=)(0,=)(),()( 0000* ttutBllttkttv
траектория )(tx следует по границе фазового ограничения и в заключение имеем
.0}/]),[()()()(,{maxmin=/),,( 00 tktltvtCutBldtkxtdV
vu
(38)
Управление ,)(),(=),( txtuxt U выбирается из условия
.],]0,=))(()()(, 21
00 ttttltutBl (39)
Лемма 4. Разрешимость условия (37) необходима для существования оптималь-
ного решения задачи 2.
3. Если ,00,>0,=),,(=),,( 213 HHHH kxtkxt то вектор )(tx лежит вне
фазового ограничения, позиция },{ xt находится в условиях задачи 2 без
фазового ограничения .],[=],[),()( * ktktxttx
В момент t имеет место скачок размера )(* tk по направлению, определяе-
мому минимизатором задачи .})(,{min)(=),,(
1=
* htBtkkxt x
h
H Размеры скачка
определяются условием .)](,[0)( tkttx
Заключение
Таким образом, при синтезе терминального управления в классе импульс-
ных воздействий, стесненном активными фазовыми ограничениями, опти-
мальная стратегия не может быть ограничена одними дельта-импульсами, но
будет содержать и «обыкновенную» составляющую — непрерывную функ-
цию, если отображение ,)(t определяющее ограничение, непрерывно в хаус-
дорфовой метрике.
20 ISSN 0572-2691
О.Б. Куржанський
СИНТЕЗ ІМПУЛЬСНИХ КЕРУВАНЬ
ПРИ ФАЗОВЫХ ОБМЕЖЕННЯХ
Розглянуто задачу синтезу керувань у лінійних системах, в класі імпульсних
керувань при обмеженнях на фазові координати та невизначеності в системі.
A.B. Kurzhanski
SYNTHESIS OF IMPULSE CONTROLS
UNDER PHASE CONSTRAINTS
The synthesis of controls in linear systems in the class of impulse controls under con-
straints on phase coordinates and uncertainties in the system.
1. Красовский Н.Н. Теория управления движением. — М. : Наука, 1968. — 476 с.
2. Neustadt L.W. Optimization, a moment problem and nonlinear programming // SIAM Journal on
Control and Optimization. — 1964. — 2, N 1. — P. 33–53.
3. Bensoussan A., Lions J.-L. Controlle impulsionel et inequalions quasi-variationelles. — Paris :
Dunod, 1982.
4. Carter T.E. Optimal impulsive space trajectories based on linear equations // Journal of
Optimization Theоry and Applications. — 1991. — 70(2). — P. 553–584.
5. Дыхта В.А., Самсонюк О.Н. Оптимальное импульсное управление с приложениями. — М. :
Физматлит, 2000. — 256 с.
6. Завалищин С.Т., Сесекин А.Н. Импульсные процессы: Модели и приложения. — М. : Наука,
1991. — 256 с.
7. Миллер Б.М., Рубинович Е.Я. Оптимизация динамических систем с импульсным управле-
нием. — М. : Наука, 2005. — 429 с.
8. Куржанский А.Б., Точилин П.А. Импульсные управления в моделях гибридных систем //
Дифференциальные уравнения. — 2009. — 45, № 5. — С. 716–727.
9. Kurzhanski A.B., Daryin A.N. Dynamic programming for impulse controls // Annual Reviews in
Control. — 2008. — 32(2). — P. 207–221.
10. Kurzhanski A.B. On synthesizing impulse controls and the theory of fast controls // Proc. Steklov
Math. Inst. — 2010. — 268(1). — P. 207–221.
11. Дарьин А.Н., Куржанский А.Б., Селезнев А.В. Метод динамического программирования в
задаче синтеза импульсных управлений // Дифференциальные уравнения. — 2005. — 41,
№ 11. — С. 1491–1500.
12. Дарьин А.Н., Минаева Ю.Ю. Синтез импульсных и быстрых управлений при неопределен-
ности // Доклады РАН. — 2011. — 441, № 5. — С. 601–605.
13. Bellman R., Dreyfus S. Applied dynamic programming. — Princeton University Press, 1962. —
390 p.
14. Krasovski N.N., Subbotin A.I. Positional differential games. — Springer Verlag, 1988. — 517 p.
15. Kurzhanski A.B., Varaiya P. Dynamics and control of trajectory tubes. Theory and computation.
— SCFA : Birkhauser, 2014. — 445 p.
16. Motta M., Rampazzo F. Dynamic programming for nonlinear systms driven by ordinary and
impulsuve control // SIAM Journal on Control and Optimization. — 1996. — 34, N 1. —
P. 199–225.
17. Schwartz L. Theorie des Distributions. I, II. — Hermann, 1956.
18. Агранович М.С. Обобщенные функции. — М. : Изд-во МЦНМО, 2008. — 128 с.
19. Владимиров В.С. Обобщенные функции в математичекой физике: 2-е изд. — М. : Наука,
1979. — 320 с.
20. Гельфанд И.М., Шилов Г.Е. Обобщенные функциии и действия над ними. Т. 1. Прост-
ранства основных и обобщенных функций, 1957; Т. 2. Обобщенные функции, 1958. — М. :
Физматгиз.
21. Rockafellar R.T., Wets R. J.-B. Variational analysis. — N.Y. : Springer-Verlag, 2005. — 934 p.
22. Дарьин А.Н., Куржанский А.Б. Синтез управлений в классе распределений высших порядков //
Дифференциальные уравнения. — 2007. — 43, № 11. — С. 1479–1489.
23. Понтрягин Л.С. К теории дифференциальных игр // Успехи математических наук. — 1966.
— 21, № 4. — C. 219–274.
24. Куржанский А.Б. Альтернированный интеграл Понтрягина в теории синтеза управлений //
Труды МИАН. — 1999. — 224. — С. 234–248.
Получено 12.01.2016
|