Оптимальное робастное управление линейными системами по неточным измерениям выходных сигналов
Досліджено задачу оптимального керування лінійною нестаціонарною системою зі збуреннями, множинною невизначеністю в початковому стані і помилками вимірювань вихідних сигналів. Запропоновано загальну схему побудови в режимі реального часу оптимальних робастних зворотних зв’язків за виходом, з урахува...
Збережено в:
| Дата: | 2011 |
|---|---|
| Автор: | |
| Формат: | Стаття |
| Мова: | Russian |
| Опубліковано: |
Інститут кібернетики ім. В.М. Глушкова НАН України
2011
|
| Назва видання: | Проблемы управления и информатики |
| Теми: | |
| Онлайн доступ: | https://nasplib.isofts.kiev.ua/handle/123456789/207375 |
| Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Цитувати: | Оптимальное робастное управление линейными системами по неточным измерениям выходных сигналов / Н.М. Дмитрук // Проблемы управления и информатики. — 2011. — № 6. — С. 25–42. — Бібліогр.: 19 назв. — рос. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraine| id |
irk-123456789-207375 |
|---|---|
| record_format |
dspace |
| spelling |
irk-123456789-2073752025-10-07T00:21:44Z Оптимальное робастное управление линейными системами по неточным измерениям выходных сигналов Оптимальне робастне управління лінійними системами за неточними вимірами вихідних сигналів Optimal Robust Control of Linear Systems Based on Inaccurate Measurements of Output Signals Дмитрук, Н.М. Оптимальное управление и методы оптимизации Досліджено задачу оптимального керування лінійною нестаціонарною системою зі збуреннями, множинною невизначеністю в початковому стані і помилками вимірювань вихідних сигналів. Запропоновано загальну схему побудови в режимі реального часу оптимальних робастних зворотних зв’язків за виходом, з урахуванням можливості замикання системи і подальшої корекції керування (оптимальний замкнений зворотний зв’язок). The problem of optimal control of linear nonstationary system with disturbances, multiple uncertainty at initial state and measurement errors of output signals is investigated. Constructed in the real time mode the general scheme of optimal robust feedbacks with respect to output in which the possibility of system closure and potential of subsequent correction of control (optimal closed-loop feedback) is presented. Работа финансируется Беларусским республиканским фондом фундаментальных исследований (грант Ф09МС-029). 2011 Article Оптимальное робастное управление линейными системами по неточным измерениям выходных сигналов / Н.М. Дмитрук // Проблемы управления и информатики. — 2011. — № 6. — С. 25–42. — Бібліогр.: 19 назв. — рос. 0572-2691 https://nasplib.isofts.kiev.ua/handle/123456789/207375 517.977 10.1615/JAutomatInfScien.v43.i11.40 ru Проблемы управления и информатики application/pdf Інститут кібернетики ім. В.М. Глушкова НАН України |
| institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| collection |
DSpace DC |
| language |
Russian |
| topic |
Оптимальное управление и методы оптимизации Оптимальное управление и методы оптимизации |
| spellingShingle |
Оптимальное управление и методы оптимизации Оптимальное управление и методы оптимизации Дмитрук, Н.М. Оптимальное робастное управление линейными системами по неточным измерениям выходных сигналов Проблемы управления и информатики |
| description |
Досліджено задачу оптимального керування лінійною нестаціонарною системою зі збуреннями, множинною невизначеністю в початковому стані і помилками вимірювань вихідних сигналів. Запропоновано загальну схему побудови в режимі реального часу оптимальних робастних зворотних зв’язків за виходом, з урахуванням можливості замикання системи і подальшої корекції керування (оптимальний замкнений зворотний зв’язок). |
| format |
Article |
| author |
Дмитрук, Н.М. |
| author_facet |
Дмитрук, Н.М. |
| author_sort |
Дмитрук, Н.М. |
| title |
Оптимальное робастное управление линейными системами по неточным измерениям выходных сигналов |
| title_short |
Оптимальное робастное управление линейными системами по неточным измерениям выходных сигналов |
| title_full |
Оптимальное робастное управление линейными системами по неточным измерениям выходных сигналов |
| title_fullStr |
Оптимальное робастное управление линейными системами по неточным измерениям выходных сигналов |
| title_full_unstemmed |
Оптимальное робастное управление линейными системами по неточным измерениям выходных сигналов |
| title_sort |
оптимальное робастное управление линейными системами по неточным измерениям выходных сигналов |
| publisher |
Інститут кібернетики ім. В.М. Глушкова НАН України |
| publishDate |
2011 |
| topic_facet |
Оптимальное управление и методы оптимизации |
| url |
https://nasplib.isofts.kiev.ua/handle/123456789/207375 |
| citation_txt |
Оптимальное робастное управление линейными системами по неточным измерениям выходных сигналов / Н.М. Дмитрук // Проблемы управления и информатики. — 2011. — № 6. — С. 25–42. — Бібліогр.: 19 назв. — рос. |
| series |
Проблемы управления и информатики |
| work_keys_str_mv |
AT dmitruknm optimalʹnoerobastnoeupravlenielinejnymisistemamiponetočnymizmereniâmvyhodnyhsignalov AT dmitruknm optimalʹnerobastneupravlínnâlíníjnimisistemamizanetočnimivimíramivihídnihsignalív AT dmitruknm optimalrobustcontroloflinearsystemsbasedoninaccuratemeasurementsofoutputsignals |
| first_indexed |
2025-10-07T01:12:15Z |
| last_indexed |
2025-10-08T01:06:51Z |
| _version_ |
1845373814915989504 |
| fulltext |
© Н.М. ДМИТРУК, 2011
Международный научно-технический журнал
«Проблемы управления и информатики», 2011, № 6 25
ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ
И МЕТОДЫ ОПТИМИЗАЦИИ
УДК 517.977
Н.М. Дмитрук
ОПТИМАЛЬНОЕ РОБАСТНОЕ УПРАВЛЕНИЕ
ЛИНЕЙНЫМИ СИСТЕМАМИ ПО НЕТОЧНЫМ
ИЗМЕРЕНИЯМ ВЫХОДНЫХ СИГНАЛОВ
Введение
Для многих прикладных задач управления характерно две важные особенно-
сти, которые должны учитываться при математическом моделировании и управ-
лении. Во-первых, физические объекты, как правило, подвержены действию воз-
мущений или содержат неопределенности, которые невозможно явно учесть при
построении математической модели. Во-вторых, совершенные (полные и точные)
измерения их состояний могут быть затруднены или вовсе невозможны. В связи с
этим возникает задача синтеза оптимальных систем в условиях неопределенности,
содержащейся в динамике системы управления и порождаемой неточностями из-
мерений выходных сигналов. Подобным задачам для дискретных и непрерывных
систем управления посвящены работы [1–4].
В настоящей публикации рассматривается задача оптимального управления
линейной нестационарной системой с возмущениями, множественной неопреде-
ленностью в начальном состоянии и ошибками измерений выходных сигналов,
для которой оптимальная обратная связь строится в режиме реального времени.
Принцип управления в реальном времени успешно реализуется в популярной
на западе методологии управления по прогнозируемой модели (Model Predictive
Control — MPC) для решения задач стабилизации [5]. К нему примыкают работы
по оптимальному управлению в режиме реального времени [6]. Теория MPC
и подход [6] опираются на решение в ходе конкретного процесса управления в
каждый текущий момент времени вспомогательных задач оптимального управле-
ния на конечном промежутке времени с начальным состоянием, совпадающим с
текущим состоянием процесса. Оптимальная программа вспомогательной задачи
подается на вход системы управления до тех пор, пока не будет получено и обра-
ботано следующее состояние. Процедура, повторяемая в темпе поступления ин-
формации о состоянии системы, реализует управление типа обратной связи, обес-
печивающего требуемые свойства замкнутой системы (асимптотическая устойчи-
вость, робастность, оптимальность и др.) в зависимости от конкретного вида
критерия качества и ограничений вспомогательной задачи.
При управлении динамическими системами в условиях неопределенности
могут использоваться различные формулировки вспомогательных задач опти-
мального управления. Первые работы по данному направлению предполагали по-
Работа финансируется Беларусским республиканским фондом фундаментальных исследований
(грант Ф09МС-029).
26 ISSN 0572-2691
строение оптимальных гарантирующих программ, которые обеспечивали бы вы-
полнение ограничений и достижение гарантированного значения критерия каче-
ства для всех возможных реализаций неопределенных величин. В данном подходе
часто имеет место ситуация, когда задача, сформированная для начального мо-
мента времени, не имеет решения из-за отсутствия допустимых управлений. Если
же решение получено, то построенная на основе оптимальных гарантирующих
программ обратная связь приводит к консервативным значениям критерия каче-
ства переходного процесса [7].
Опыт по управлению динамическими системами с неопределенностями пока-
зывает, что для преодоления указанных трудностей (в частности, для улучшения
качества процесса) в формулировке задач оптимального управления, по решениям
которых вырабатываются текущие управляющие воздействия, должны учитываться
элементы обратной связи. Здесь существуют различные подходы к формированию
вспомогательных задач для достижения компромисса между трудоемкостью вы-
числения обратной связи и необходимостью как можно полнее использовать ин-
формацию о реализовавшихся и будущих неопределенностях. Например, предлага-
ется использовать идеи параметрического и динамического программирования,
строить оптимальные обратные связи на небольшом прогнозном промежутке, ис-
пользовать обратные связи фиксированной структуры [7–9].
Одним из естественных подходов к решению данной проблемы является ис-
пользование моментов замыкания (коррекции управления), когда заранее предпо-
лагается, что в некоторые фиксированные моменты времени в будущем система
управления будет замкнута, а оптимальная программа скорректирована на основе
полученной информации о состоянии системы. Такой подход впервые применял-
ся при исследовании задач стохастического управления [10].
В рамках данного подхода исследованы задачи построения оптимальных од-
нократно и многократно замыкаемых обратных связей по состоянию для линей-
ной недетерминированной системы [11, 12], задачи построения множеств дости-
жимости линейных систем с аддитивными возмущениями [13], линейно-квадра-
тичные задачи оптимального управления [14]. Установлено, что трудоемкость
построения оптимальных (замыкаемых) обратных связей существенно ниже тре-
бований динамического программирования.
Цель данной работы — развить подход [11, 12, 14] по построению оптималь-
ных замыкаемых связей по состоянию на задачи оптимального управления линей-
ными динамическими системами по неточным измерениям их выходных сигналов.
1. Постановка задачи. Основные обозначения
На промежутке времени ],[ *
* ttT рассмотрим линейную нестационарную
систему управления с возмущениями
,)()()( wtDutBxtAx ,)( 0* Xtx (1)
где ntxx )( — состояние системы в момент времени t; Utuu )( — зна-
чение управления; }1:{
uuU r — ограниченное множество его допу-
стимых значений; ktww )( — неизвестное возмущение; ,)( nntA
,)( rntB ,)( kntD ,Tt — кусочно-непрерывные матричные функции.
Начальное состояние )(
*
tx динамической системы (1) неизвестно; информа-
ция о нем ограничивается множеством возможных значений начального состоя-
ния GZxX 00 c известными ,0
nx pnG и }.:{ *
*
dzdzZ p
Множество Z называется априорным распределением неизвестных параметров z
начального состояния )(
*
tx .
Международный научно-технический журнал
«Проблемы управления и информатики», 2011, № 6 27
Управлять системой (1) будем с помощью дискретных управлений с перио-
дом квантования h: ),()( sutu [,,[ hsst ,hTs где },,,{ *
**
hthttTh
,/)(
*
* Ntth N — натуральное число.
Будем считать, что возмущение ),(tw ,Tt представляет собой конечно-па-
раметрическую функцию вида ,)()( vtMtw ,Tt где ,)( lktM — кусочно-
непрерывная матричная функция, Vv — вектор неизвестных параметров,
}:{ *
*
vvvvV l — множество его возможных значений.
Множество VZ 0 характеризует априорную неопределенность в пове-
дении системы (1) и называется априорным распределением неизвестных пара-
метров.
Предполагается, что в процессе управления в каждый момент времени hTs
},,2,{ *
**
ththt измеряются состояния ).(sx Построению оптимальных
обратных связей по состоянию (измеряются точные значения ))(sx посвящена
работа [12]. В настоящей статье исследуется случай несовершенных измерений,
когда состояния измеряются неполно и неточно. В этом случае информация о них
поступает в виде сигналов ),(* sy ,hTs измерительного устройства
),()()()( ssxsCsy ,hTs (2)
где ,)( nqtC ,Tt — непрерывная матричная функция; ),(s ,hTs — ошиб-
ки измерения со значениями из ограниченного множества }.:{ *
*
q
Цель управления — перевод системы (1) с гарантией на заданное терминаль-
ное множество },1,:{ T* migxhxX ii
n и минимизация гарантированного
значения терминального критерия качества ).( *T
0 txh
Далее в работе используются следующие обозначения: ]",'[ tt — множество
всех дискретных управлений ),(tu ],,[ ttt со значениями в U; 0 — рас-
пределение параметров (z, v) системы (1); };,:),({ 0 nxx тройка
),,( x из момента времени ,hT состояния nx и множества распределе-
ния параметров , — позиция процесса управления.
Наряду с системой (1) будем рассматривать соответствующие ей детермини-
рованную систему управления ,)()( 00 utBxtAx 0*
)( xtx , и содержащую не-
определенности систему наблюдения ,)(ˆ)(ˆ wtDxtAx ,)(ˆ * Gztx ,)()( vtMtw
.),( 0vz Через ))(,,( |0 uxttx обозначим состояние в момент Tt систе-
мы управления с начальным условием xtx )( и управлением ;)( ]",'[ ttu
),(ˆ | vztx — состояние в момент Tt системы наблюдения.
Для заданной позиции hTx ),,( и управления
],[ *)(
t
u
введем
}),(),,(ˆ))(,,()(:)({))(,,,( ||| **
0
*** vzvztxuxtxtxtxuxtX n —
множество всех состояний системы (1), которые достижимы в терминальный мо-
мент *t под действием );( u ,),(ˆ)(:{),( | vzhxhCyy q
},),( vz — множество сигналов измерительного устройства (2) в системе
наблюдения в момент h при условии, что в момент параметры (z, v) системы (1)
составляли множество ; }),|(ˆ)(:),{(),( 0 vzxCyvzyS — множе-
ство всех параметров, согласующихся с измерением y, полученным в момент .
Для того чтобы различать переменные математических моделей (1), (2) и
фактические значения состояний, управлений, измерений в конкретном процессе
28 ISSN 0572-2691
управления, последние записываются с индексом *, т.е. ),(* u )(* y — управле-
ние и измерения, реализующиеся в конкретном процессе; )(* — множество пар
),,( vz ,Zz ,Vv способных вместе с управлением ),(* tu ],,[ * tt посту-
пившим на вход системы управления к моменту , и некоторыми возможными
ошибками измерения ,)( s ,],[)( * hh TtTs породить записанный сиг-
нал ),(* sy );( hTs )(* называется текущим (в момент времени ) распреде-
лением параметров системы (1). Его изменение во времени в конкретном процес-
се описывается рекуррентным соотношением
)),(,()()( *
0
** ySh ,hT ,)( 0*
* t
где ),()()()( *
0
**
0 xCyy )).(,,()( *
0*0
*
0 | uxtxx
Тройка ))(),(,( **
0 x — текущая позиция конкретного процесса управле-
ния системой (1) в условиях неопределенности.
2. Оптимальная обратная связь и принцип управления в реальном времени
Центральная проблема теории оптимального управления — синтез оптималь-
ных обратных связей. В рассматриваемой задаче, используя стандартные рассуж-
дения динамического программирования, можно ввести функцию Беллмана :B
},{}{ * tTh для которой имеет место рекуррентное уравнение
)),,(),,,(,(maxmin),,( 00
),(
|
0
yhSuxhxhBxB
yUu
(3)
hT , ),(x ,
с начальным условием
.),(,случаепротивномв
,),(всехдля),|(ˆ),,|(ˆmax
),,(
***T
0
),(
T
0*
x
vzXvztxxvztxhxh
xtB vz (4)
Теоретически уравнение Беллмана (3), (4) можно решить по шагам справа
налево, попутно найти функцию ),,( xB и построить дискретную оптимальную
обратную связь ),,,(0 xu ,hT ),(x , по формуле
.)),(),,,(,(maxminarg),,( 00
),(
0 |
0
yhSuxhxhBx
yUu
u
На практике решение уравнения (3), (4) затруднено из-за известного «про-
клятия размерности», поэтому в данной работе, как указано во Введении, управ-
ление системой (1) предлагается организовать на основе принципа управления в
реальном времени.
Согласно этому принципу [6] устройство, называемое оптимальным регулятором,
в каждый текущий момент времени hT по текущей позиции ))(),(,( **
0 x (или
эквивалентно по измерениям ),(* sy ))( hTs строит решение u )),(),(,( **
0| xt
],[ *tt , вспомогательной задачи оптимального управления, формулировки кото-
рой различны в зависимости от преследуемых целей. До поступления следующей ин-
формации в момент h оптимальный регулятор подает на вход динамической си-
стемы (1) постоянное управляющее воздействие ),()( ** utu ,],[ ht где
)(*u u ))(),(,( **
0x u .))(),(,( **
0| x (5)
Международный научно-технический журнал
«Проблемы управления и информатики», 2011, № 6 29
Функция ),(* tu ,Tt значения которой вычислены по формуле (5), называется
реализацией оптимальной обратной связи в конкретном процессе управления.
Общую вспомогательную задачу оптимального управления, связанную с по-
строением функций u ),,,( | xt ],,[ *tt ( ,( hT ),),( x будем обозна-
чать ),,,( x где аргументы указывают, что процесс управления начинается
в момент времени из позиции ).,,( x
Ниже рассматривается два способа построения реализации обратной свя-
зи (5) на основе различных постановок вспомогательных задач оптимального
управления * ).,,( x
3. Оптимальная размыкаемая обратная связь
Простейшая обратная связь в исследуемой задаче строится на основе опти-
мальных гарантирующих программ ),,,( |0 xtu ,],[ *tt которые обеспечи-
вают выполнение ограничений и достижение гарантированного значения крите-
рия качества при всех возможных реализациях неопределенных величин. Такую
обратную связь будем называть оптимальной размыкаемой обратной связью.
Вспомогательную задачу, связанную с построением оптимальных программ, обо-
значим ).,,(0 x
Кратко остановимся на этапах построения реализации (5) оптимальной раз-
мыкаемой обратной связи. Детали алгоритма работы оптимального регулятора и
методы решения возникающих при этом сопровождающих задач оптимального
управления и наблюдения изложены в [15].
Функцию
],[ *),,( |
t
xu
назовем программой задачи ),,,(0 x если
.))(,,,( ** | XuxtX Качество программы ),,( | xu оценим с помощью
функционала
.max),,)(( T
0
))(,,,|(
0
*
| xhxuJ
uxtXx
Оптимальная программа ),,( |0 xu определяется равенством
),,,)((min),,)((),,( || 0
)(
000
xuJxuJxJ
u
где минимум ищется среди всех программ задачи ).,,(0 x
Функция
),,,(),,( |00 xuxu ,hT ,),( x
называется оптимальной размыкаемой (дискретной) обратной связью.
Как показано в [15], оптимальная программа ),,( |0 xu служит решением
следующей детерминированной задачи (сопровождающей задачи оптимального
управления):
,min)( *
0
T
0
u
txh , ,)()( 00 utBxtAx ,)(0 xx (6)
),,(ˆ)( *
0
T iii gtxh ,,1 mi ,)( Utu .],[ *tt
При этом гарантированное значение критерия качества равно
.))(,,(),(ˆ),,( 0*
0
T
00
0 | uxtxhxJ
В том случае, если задача ),,(0 x не имеет решения, полагаем .),,(0 xJ
30 ISSN 0572-2691
В задаче (6) значение критерия качества и терминальные ограничения зави-
сят от вектора ),,0),,(ˆ(),(ˆ mii который дает оценку наихудшим реа-
лизациям неопределенностей. Его компоненты вычисляются по формуле
).,|(ˆmax),(ˆ *T
),(
vztxhi
vz
i
Согласно принципу управления в реальном времени (разд. 2) в конкретном
процессе управления на вход системы (1) подается реализация оптимальной раз-
мыкаемой обратной связи
)),(),(,|())(),(,()( **
0
0**
0
0* xuxutu [,,[ ht hT .
Как показано в [15], для вычисления )(* u в конкретном процессе управле-
ния нет необходимости строить текущие распределения ),(* .hT В сопро-
вождающей задаче оптимального управления (6) фигурируют лишь их оценки
)),(,(ˆ)(ˆ ** которые можно получить по известным к моменту управле-
нию ),(* tu ],[
*
tt , и сигналу ),(* sy ),( hTs измерительного устройства (2) из
задачи
),(ˆmax)(ˆ *T
,
* txhi
vz
i ,)(ˆ)(ˆ wtDxtAx ,)(ˆ * Gztx (7)
,)(ˆ)()(*
0 sxsCsy ),( hTs ,)()( vtMtw ,Tt ,Zz .Vv
Задача (7) — задача оптимального наблюдения, сопровождающая задачу опти-
мального управления по несовершенным измерениям [15]. Вектор )(ˆ* называ-
ется достаточной оценкой текущего распределения параметров ).(* Он полно-
стью характеризует распределение )(* и является одним из ключевым элемен-
тов при построении эффективного метода вычисления замыкаемой обратной
связи в разд. 4.
Отметим, что возможность реализации оптимальной размыкаемой обратной свя-
зи определяется существованием оптимальной программы ),,,( 00*
0 | xttu ,Tt
в начальный момент времени ,
*
t что можно сформулировать как утверждение.
Утверждение 1. Пусть в задаче ),,( 00*
0 xt существует оптимальная програм-
ма. Тогда ))(),(,( **
0
0 x имеет решение для всех hT и )),(),(,( **
0
0 xJ
,hT не возрастает.
При больших неопределенностях в системе управления нельзя априорно га-
рантировать существование решения в задаче ).,,( 00*
0 xt Тогда оптимальная
размыкаемая обратная связь не может быть реализована. В тех случаях, когда это
возможно, полученная обратная связь доставляет консервативное значение крите-
рию качества по сравнению с решением с помощью динамического программиро-
вания. Для достижения компромисса между качеством процесса управления и
трудоемкостью вычисления обратной связи в настоящей работе предлагается ис-
пользовать оптимальные замыкаемые обратные связи [11, 12].
4. Оптимальная замыкаемая обратная связь
Главная особенность оптимальной размыкаемой обратной связи состоит в том,
что при ее определении не используется априорная информация о том, что система
управления будет замкнута не только в текущий, но и в последующие моменты
времени. Это обстоятельство полностью учитывается при построении оптимальной
Международный научно-технический журнал
«Проблемы управления и информатики», 2011, № 6 31
обратной связи ,0
u которую в этом смысле можно назвать оптимальной замкнутой
обратной связью (разд. 2). Промежуточный случай между простейшими оптималь-
ными размыкаемыми связями и оптимальными замкнутыми связями, когда предпо-
лагается, что система будет замкнута в некоторые изолированные последующие
моменты времени ,h
i Tt ,,1 *ii дает обратные связи, называемые замыкаемы-
ми [11, 12]. Конструктивно они проще решения задачи оптимального управления
методом динамического программирования и являются его аппроксимацией, при-
ближающейся к замкнутой обратной связи при увеличении числа точек замыкания.
В данной работе исследуется случай однократного замыкания в момент .1t
4.1. Оптимальная однократно замыкаемая обратная связь. Общая схема.
Пусть задан момент времени ,1
hTt ,*1
*
httt который будем называть мо-
ментом замыкания системы управления (1); ],,[ 1
*
1 ttT ;],[ *10 ttT ,h
kk
h TTT
,1,0k .],])( 11
hh TtT
При 0
hT управление системой (1) осуществляется с помощью размыкае-
мой обратной связи (разд. 3), построенной в режиме реального времени по реше-
нию задачи .))(),(,( **
0
0 x
Рассмотрим ситуацию .1
hT Для момента 1t введем множество замыкания
.}),,(:),{( 1110111 xtJx
Согласно определению множество замыкания 1 состоит из таких пар ),( 11 x , для
которых существует оптимальная программа ),,( 1110 | xtu в задаче ).,,( 1110 xt
Предположение 1. Момент замыкания 1t таков, что .1
Пусть ,min T
0* xh ,max T
0
* xh .*Xx
Для ],[ *
*
определим -множество замыкания в момент :1t
},),,(:),{( 1110111 xtJx
т.e. для любой пары
111 ),( x оптимальная программа ),,( 1110 | xtu обес-
печивает гарантированное значение критерия качества задачи ),,,( 1110 xt
не большее .
Замечание 1. Для множеств замыкания ,1
1
можно дать эквивалентные
определения, основанные на существовании программ без требования их опти-
мальности. Так, множество замыкания 1 состоит из всех пар ),,( 11 x для кото-
рых в задаче ),,( 1110 xt существует допустимая программа. Для
111 ),( x
она должна гарантировать значение критерия качества, не большее . Эти опре-
деления проще приведенных выше с конструктивной точки зрения, поскольку нет
необходимости в обеспечении оптимальности программ.
Пусть задано некоторое управление .)(
],[ 1t
u
Обозначим ),,)(( |1 xu
совокупность всех пар ,),( 11 x которые могут быть получены к моменту ,1t
если процесс стартует из позиции ),,( x под действием ).( u В силу свойства
разделимости линейных процессов управления и наблюдения ),,)(( |1 xu со-
стоит из пар :),( 11 x
32 ISSN 0572-2691
)},(,),(ˆ)()(:),{())(,,(
)),(,,(
11111
1
0
1
|
|
hTsvzsxsCsyvzy
uxtxx
(8)
где ,),()( 11 y ),(1 — совокупность всех возможных (будущих) сигна-
лов измерения на промежутке ],[ 1t в системе наблюдения:
)}.(,)(,),(),(),(ˆ)()(:)({),( 11 | hTssvzsvzsxsCsyy (9)
Предположим, что при некотором ],[ *
*
выполняются следующие
условия:
1) -множество замыкания 1
непусто;
2) существует управление ,),,(
],[
1
1|
t
xu
для которого
.),,( 111 | xu (10)
Построим следующую стратегию управления: на промежутке ],[ 1t используем
управление );,,( |1 xu по достижении момента 1t выберем оптимальную прог-
рамму ))()),(,,(,( 1111
0
10 || tuxtxtu задачи ))()),(,,(,( 1111
0
10 | tuxtxt в за-
висимости от того, какое текущее распределение параметров )( 11 t реализуется в
момент .1t В силу включения (10) построенная стратегия управления обеспечит
значение критерия качества, не большее .
Управление ),,( |1 xu назовем начальной 1t -замыкаемой программой. Вмес-
те с семейством оптимальных программ )},,)((),(),,,({ || 11111110 xuxxtu
она составляет 1t -замыкаемую программу.
Минимальное значение ),,,(0 x при котором выполняются условия 1), 2),
является оптимальным гарантированным значением критерия качества. Соответ-
ствующую этому значению программу назовем оптимальной 1t -замыкаемой прог-
раммой. Оптимальное управление на промежутке ],[ 1t задается оптимальной
начальной 1t -замыкаемой программой: .),,(),,( || 11
0
xuxu
Задачу оптимального управления, связанную с построением оптимальной 1t -за-
мыкаемой программы, обозначим ).,,(1 x Оптимальное значение критерия ка-
чества в задаче ),,(1 x равно ).,,(),,( 01 xxJ Если в задаче ),,(1 x
не существует оптимальной 1t -замыкаемой программы, считаем .),,(1 xJ
Функцию
,,),(),,,(
,,),(),,,(
),,(
00
11
1
|
|
h
h
Txxu
Txxu
xu
будем называть оптимальной однократно замыкаемой связью по выходу.
В конкретном процессе управления реализация (5) оптимальной замыкаемой
обратной связи, подаваемая на вход системы управления (1), имеет вид
.[,[,)),(),(,(
,)),(),(,(
))(),(,()(
0**
0
0
1**
0
1
**
0
1*
|
|
htTxu
Txu
xutu
h
h
Международный научно-технический журнал
«Проблемы управления и информатики», 2011, № 6 33
Введенное в данном разделе понятие оптимальной 1t -замыкаемой программы
задачи ),,(1 x и основанная на нем оптимальная однократно замыкаемая об-
ратная связь гораздо проще оптимальной обратной связи ,0
u рассмотренной
в разд. 2. Однако связанные с оптимальной 1t -замыкаемой программой конструк-
ции используют множественное описание неопределенностей системы (1), что за-
трудняет обоснование аналитических и получение конструктивных результатов.
В связи с этим далее перейдем к эквивалентным определениям введенных кон-
струкций на основе специальных конечномерных оценок позиции ),,,( 111 xt что
позволит получить условия существования решения задачи ),,(1 xP и предло-
жить алгоритм его вычисления.
4.2. Редукция к конечномерным оценкам. Редукцию множественной не-
определенности к конечномерным оценкам построим на основе агрегированной
оценки ̂ позиции ),,,( x которую определим формулой
,),(ˆ)(),,(ˆ xx
где ,)( )1( nmt :Tt ),(tA ).,0,()( * miht i
С помощью агрегированных оценок ),,(ˆˆ 1111 xt , 111 ),( x , сформиру-
ем конечномерные аналоги введенных выше понятий: множеств замыкания, 1t -за-
мыкаемых программ и оптимальной 1t -замыкаемой программы.
Заметим, что с помощью агрегированной оценки 1̂ задачу оптимального
управления (6), сопровождающую задачу ),,( 1110 xt , можно представить в виде
,min)( *
0
T
0
u
txh ,)()( 00 utBxtAx ,0)( 1
0 tx (11)
,ˆ)( 1*
0
T
iii gtxh ,,1 mi ,)( Utu .0Tt
Ее оптимальную программу обозначим ).ˆ,( 110 | tu Соответствующее значение
критерия качества равно )).(,0,(ˆ)ˆ,( 01*
0
T
0
1
0
110 | uttxhtJ
Следуя правилам построения множеств замыкания ,1 ,1
определим их
аналоги:
},)ˆ,(:ˆ{ˆ 110111 tJX m .})ˆ,(:ˆ{ˆ 110111
tJX m
Множество замыкания 1X̂ непусто. Кроме того, ,ˆ 1X
1ˆ
X — выпуклые компакты.
Замечание 2. Множества замыкания ,ˆ 1X
1ˆ
X могут содержать векторы ,ˆ 1
для которых невозможно найти ,ˆ1 определяющее непустое множество .1 Одна-
ко в реальном процессе управления такие оценки не реализуются и соответству-
ющие им решения задачи ),,( 1110 xt не используются.
Теперь рассмотрим задачу ),,,(1 x .1
hT Для формирования конечно-
мерного аналога включения (10) необходимо провести редукцию к агрегирован-
ным оценкам элементов совокупности ).,,)(( |1 xu Ему соответствует мно-
жество .)},,|)((),(),,,(ˆˆ{),,)((ˆ 11111111 | xuxxtxuX C учетом
представления (8) получим
,)},(ˆˆ,ˆ))(,,()(ˆ:ˆ{),,)((ˆ 1111
0
11111 || uxtxtxuX m
34 ISSN 0572-2691
где ),(ˆ 1 — множество всех достаточных оценок, которые могут реализовать-
ся к моменту замыкания :1t
.)},()())),(,,(,(ˆˆ:ˆ{),(ˆ 111111111 yytm
Теперь цель управления системой (1) на промежутке ],[ 1t формулируется сле-
дующим образом: для заданного ],[ *
*
найти управление
],[
1
1),,( |
t
xu
,
такое что выполняется аналог включения (10)
111 ˆ),,)((ˆ | XxuX , (12)
или эквивалентно, 1111
0
1 ˆˆ))(,,()( | Xuxtxt для всех ).,(ˆˆ 11
Пусть для некоторого ],[ *
*
существует начальная 1t -замыкаемая прог-
рамма ),,,( |1 xu удовлетворяющая (12). Тогда 1t -замыкаемая программа, гаран-
тирующая значение критерия качества , имеет вид
)}.,,)((ˆˆ),ˆ,();,,({ ||| 1111101 xuXtuxu
Как и ранее, минимальное значение ),,,(0 x при котором выполняется (12), —
оптимальное гарантированное значение критерия качества задачи ),,,(1 x а со-
ответствующее управление — оптимальная 1t -замыкаемая программа.
Таким образом, получены простые, конечномерные конструкции для постро-
ения оптимальных однократно замыкаемых обратных связей.
5. Анализ замыкаемых обратных связей
Для формулировки теоремы существования решения задачи ),,(1 x и до-
статочных условий оптимальности 1t -замыкаемых программ установим связь
между этой задачей и решением следующей задачи оптимального управления:
,min)(
u
,)()( 00 utBxtAx ,)(0 xx (13)
,ˆˆ)()( 111
0
1
Xtxt ),(ˆˆ 11 , ,)(
tu .],[ 1tt
Оптимальную программу задачи (13) обозначим ),,,( |0 xtu .],[ 1tt
Следующее утверждение определяет условия существования оптимальной 1t -за-
мыкаемой программы и достаточные условия оптимальности, которые в разд. 6
используются для построения численных методов решения задачи ),,(1 x .
Утверждение 2. Пусть задача (13) имеет решение при ,* .1)( * Тог-
да в задаче ),,(1 x существует оптимальная 1t -замыкаемая программа. Опти-
мальное гарантированное значение ),,(0 x критерия качества задается соот-
ношениями:
(i) 1)( 0 или
(ii) ,0 если ,1)( и задача (13) не имеет решения при .
При этом ),,(),,( || 0
)(
1
0
xuxu — оптимальная начальная 1t -замыкае-
мая программа.
Международный научно-технический журнал
«Проблемы управления и информатики», 2011, № 6 35
Доказательство. Предположение 1)( * одновременно влечет следую-
щие условия: 1) множество замыкания 1
*
ˆ
X непусто; 2) существует управление
(равное )),,,|(0
)( *
xu которое позволяет обеспечить выполнение основного
включения (12); 3) указанное управление — начальная 1t -замыкаемая программа
задачи ),,(1 x , поскольку ,1)(),,( *0
)(
|*
xtu , .],[ 1tt Таким
образом, при сделанном предположении в задаче ),,(1 x множество 1t -замы-
каемых программ непусто.
Очевидно, при 1)( невозможно найти управление ,)(
],[ 1t
u
удо-
влетворяющее условию (12). При 1)( в качестве управления )(1 u можно
использовать .),,( |0 xu Таким образом, оптимальное гарантированное значе-
ние критерия качества определяется из следующей экстремальной задачи:
,min0 ,1)( .],[ * (14)
Поскольку функция ],[: * выпукла и невозрастающая, ,1)( *
то задача (14) имеет единственное решение, которое определяется условием (i)
или (ii).
Следующее утверждение устанавливает важное свойство квазиадаптивности,
т.е. неухудшение гарантированного значения критерия качества на оптимальной
1t -замыкаемой программе по сравнению с оптимальной программой.
Утверждение 3. Пусть позиция ),,( x такова, что задачи ),,,(0 x
),,(1 x имеют решения. Тогда выполняется неравенство ).,,(),,( 01 xJxJ
Доказательство утверждения основано на следующих наблюдениях.
Для заданного ),(tu ],,[ 1tt гарантированное значение критерия качества:
),ˆ,(max),,)(( 110
ˆ
1
1
|
tJxuJ ),,,)((ˆˆ |11 xuX в частности для сужения
на ],[ 1t оптимальной программы ),,,( |0 xtu :],[ *tt ),,)(( |01 xuJ
),ˆ,(max 110
ˆ1
tJ .),,)((ˆˆ |011 xuX
Поскольку ),(0 tu ,0Tt — допустимое управление в каждой точке 1ˆ
),,,)((ˆ |01 xuX имеем ),,()ˆ,( 0110 xJtJ для любого ),,,)((ˆˆ |011 xuX
поэтому ).,,()ˆ,(max 0110
ˆ1
xJtJ
Для оптимальной 1t -замыкаемой программы: .),,)((min),,( |11 xuJxJ
u
Тогда из предыдущих пунктов следует ),,)((min),,( |11 xuJxJ
u
),,,()ˆ,(max),,)(( 0110
),,|)((ˆˆ
01
011
|
xJtJxuJ
xuX
что и доказывает
утверждение.
Важным для реализации принципа оптимального управления в реальном
времени является обоснование условий, при которых в конкретном процессе
управления задача ))(),(,( **
0
1 x имеет решение для каждого .hT Анало-
гично утверждению 1, устанавливающему данное свойство для оптимальной раз-
мыкаемой обратной связи, имеет место следующее утверждение.
36 ISSN 0572-2691
Утверждение 4. Пусть в задаче ),,( 00*
1 xt существует оптимальная 1t -за-
мыкаемая программа. Тогда ))(),(,( **
0
1 x имеет решение для всех ,1
hT
в ))(),(,( **
0
0 x существует оптимальная программа при всех 0
h
T и функ-
ция )),(),(,( **
0
1 xJ ,1
hT )),(),(,( **
0
0 xJ ,0
h
T не возрастает.
6. Алгоритм вычисления субоптимальной замыкаемой программы
Опишем алгоритм вычисления 1t -замыкаемого решения задачи ),,,(1 x
.1
hT Поскольку данная задача решается с помощью численных методов, воз-
можно получить только ее субоптимальное решение. Более того, структура -мно-
жеств замыкания ,ˆ 1
X ],,[ *
*
очень сложна, и точно описать их в общем
случае невозможно. Поэтому используем их внешние аппроксимации
11 ˆ~
XX
и соответственно будем вычислять функцию ),(~1 u которая вместо точного
включения (12) удовлетворяет приближенному условию
.
~
),,)(~(ˆ 111 | XxuX (15)
Для построения субоптимального 1t -замыкаемого управления задачи сначала
опишем правила построения аппроксимации
1~
X для заданного ],,[ *
*
затем,
используя задачу (13), сформулируем вспомогательную задачу оптимального
управления для вычисления ),,(~ |1 xu и, наконец, на основе утверждения 2
опишем итерационный алгоритм решения задачи ).,,(1 x
6.1. Построение внешних аппроксимаций множеств замыкания. В рас-
сматриваемом ниже методе вместо множества замыкания
1ˆ
X используем его
внешнюю аппроксимацию многогранником ,
~1
X грани которого построены по
заданной системе нормальных векторов ,1 m
jp ,1jp :,1 *jj
},,1),(ˆ:ˆ{
~
*1T111 jjfpX jj
m
где .ˆˆ,ˆmax)( 111T
Xpf jj
Проблема выбора векторов ,1 m
jp ,,1 *jj исследована в [12] и в дан-
ной работе не обсуждается. Будем считать, что в малой окрестности множества
),,)((ˆ |11 xuX множество
1~
X аппроксимирует
1ˆ
X достаточно хорошо.
По определению множество замыкания 1X̂ состоит из тех и только тех векторов
,ˆ 11 m для которых существует оптимальная программа в задаче (11). Как отмече-
но в замечании 1, вместо оптимального можно ограничиться поиском любого управле-
ния .)(
],[ *1 tt
u При этом вместе с некоторым 1̂ для системы (6) оно должно удо-
влетворять терминальным ограничениям вида ,))(,0,(ˆ 1*
0
T1 | iii guttxh .,1 mi
Если выполняется неравенство ,))(,0,(ˆ 1*
0
T
0
1
0 | uttxh то )ˆ,( 110 tJ ,
и .ˆˆ 11
X Тогда )(jf находится из следующей задачи оптимального управления:
,ˆmax)( 1T
)(,ˆ1
j
u
j pf ,)()( 00 utBxtAx ,0)( 1
0 tx (16)
)(ˆ *
0
T
0
1
0 txh , ,)(ˆ *
0
T1
iii gtxh ,,1 mi ,)( Utu ,0Tt
относительно неизвестных управления ),(tu ,0Tt и вектора .ˆ 11 m
Международный научно-технический журнал
«Проблемы управления и информатики», 2011, № 6 37
6.2. Построение начальной t1-замыкаемой программы. Заменим в зада-
че (13) условие (12) на ограничение (15). Тогда (13) можно представить в виде
,min)(
u
,)()( 00 utBxtAx ,)(0 xx (17)
),,(ˆ)()()( 1
0
1T jjj ftxtp ,,1 *jj ,)(
tu ],,[ 1tt
где
,ˆmax),(ˆ 1T
),(ˆˆ 11
jj p .,1 *jj (18)
6.3. Алгоритм. Алгоритм вычисления субоптимальной 1t -замыкаемой про-
граммы задачи ),,(1 x итеративный и основан на утверждении 2. Для задан-
ной системы нормальных векторов ,jp ,,1 *jj каждая итерация состоит из
следующих шагов:
1) выбираем ],[ *
* и малые параметры , ;0
2) решаем *j задач (18);
3) решаем *j задач (16);
4) если ,
~1 X то увеличиваем и возвращаемся к шагу 3;
5) находим ),( ),,,( |0 xtu ],[ 1tt , — решение задачи (17);
6) если * и ,1)( то увеличиваем ; если
*
и ,1)( то
уменьшаем ; возвращаемся к шагу 3.
7) при 1)(1 или 1)( и
1~
X полагаем ,~0
);,,(),,(~ || 01 xuxu построение субоптимального решения завершаем.
Задачи (16), (17) представляют собой линейные задачи оптимального управ-
ления. В классе дискретных управлений они сводятся к задачам линейного про-
граммирования, которые можно решить стандартными методами или cпеци-
альными методами, учитывающими динамические особенности получающихся
задач линейного программирования, и необходимость их решения для каждого
момента hT при малых значениях периода квантования h. Один такой метод
разработан в [16].
Задача (18) представляет собой специальную задачу двухуровнего програм-
мирования, решение которой дает оценку протяженности множества ),(ˆ1
в направлении .jp Такие оценки назовем препостериорными. Ранее в литературе
подобные оценки не исследовались. Изучению особенностей задачи (18) для по-
строения эффективного алгоритма их решения посвящен следующий раздел.
7. Построение препостериорных оценок
Рассмотрим задачу построения препостериорных оценок (18) для некоторого
направления :1 mp
,ˆmax),(ˆ 1T p ).,(ˆˆ 11 (19)
Компоненты вектора ),(ˆˆ 11 находятся как решение (m 1)-й задачи опти-
мального наблюдения вида
),(ˆmaxˆ *T
,
1 txhi
vz
i ,)(ˆ)(ˆ wtDxtAx ,)(ˆ
*
Gztx
,)(ˆ)()(1 sxsCsy ),(1 hTs ,)()( vtMtw ,Tt ,),( vz
38 ISSN 0572-2691
поэтому задачу (19) можно сформулировать как двухуровневую задачу математи-
ческого программирования:
,ˆmax),(ˆ
0
1
)(1
m
i
ii
y
p );,()( 11 y (20)
),(ˆmaxˆ *T
,
1 txh ii
vz
i
ii
,)(ˆ)(ˆ iii wtDxtAx ,)(ˆ
* ii Gztx
,)(ˆ)()(1 sxsCsy i ),(1 hTs ,)()( ii vtMtw ,Tt ,),( ii vz .,0 mi
В общем случае решение задачи (20) затруднительно. В то же время от воз-
можности быстро решать подобные задачи зависит реализуемость предлагаемой в
работе схемы управления системой (1) в режиме реального времени. Покажем,
что, проанализировав направления ,jp ,,1 *jj для которых вычисляются пре-
постериорные оценки ),,(ˆ j ,,1 *jj в (18), можно значительно упростить их
формулировку, перейдя к одноуровневой оптимизационной задаче.
Рассмотрим задачу построения внешнего аппроксимирующего многогранни-
ка
1~
X для -множества замыкания .ˆ 1
X Нетрудно видеть, что задача (16) имеет
решение только при .0jp
Действительно, предположим, что 0
0
jip для некоторого ,0i .0 0 mi Пусть
выбрана некоторая программа ,)(
],[ *1 tt
u порождающая в системе (16) траек-
торию )).(,0,( 1
0 | utx Тогда вектор 1̂ с компонентами )),(,0,(ˆ 1*
0
T
0
1
0 | uttxh
)),(,0,(ˆ 1*
0
T1 | uttxhg iii ,,1 mi является допустимым в задаче (16).
Построим ),ˆ;,,0,ˆˆ(ˆ 10
0
11010
0
Riimi
iii где .ˆ1
0i
R Вектор
10̂ в
силу вида ограничений задачи (16) также является допустимым. При этом значе-
ние критерия качества задачи (16) равно Rppp jii
m
iii
jij 0
0
1
,0
10T ˆˆ
и при
R неограниченно возрастает.
Таким образом, задачу построения препостериорных оценок (20) имеет
смысл рассматривать только при ,0p что позволяет записать ее в эквивалент-
ной форме:
,)(ˆmax),(ˆ
0
*T
,);(1
m
i
iii
vzy
txhp
ii
,)(ˆ)(ˆ iii wtDxtAx ,)(ˆ
* ii Gztx
,)(ˆ)()(1 sxsCsy i ),(1 hTs ,)()( ii vtMtw ,Tt ,),( ii vz ,,0 mi
).,()( 11 y
В конкретном процессе управления препостериорные оценки вычисляются
для текущего распределения параметров ),(* что вместе с аналитическим опи-
санием совокупности ),( *1 (формула (9)) позволяет записать:
,)(ˆmax))(,(ˆ)(ˆ
0
*T
,);(,,
**
m
i
iii
vzvz
txhp
ii
Международный научно-технический журнал
«Проблемы управления и информатики», 2011, № 6 39
,)(ˆ)(ˆ wtDxtAx ,)(ˆ * Gztx
,)(ˆ)()(*
0 sxsCsy ),( hTs ,)()( vtMtw ,Tt ,Zz Vv ;
,)(ˆ)(ˆ iii wtDxtAx ,)(ˆ * ii Gztx
,)(ˆ)()(*
0 sxsCsy i ),( hTs ,)()( ii vtMtw ,Tt ,ii Zz ,ii Vv ,,0 mi
,)(ˆ)()()(ˆ)( sxsCssxsC i ,)( s ),(1 hTs .,0 mi
Следуя [15], запишем последнюю задачу в эквивалентной функциональной
форме:
,))()((max)(ˆ
0
**T
,);(,,
*
m
i
iiii
vzvz
vtPztFhp
ii
(21)
,)()()()()( **
0* vsPsCzsFsCsy ),( hTs
,)()()()()( **
0* ii vsPsCzsFsCsy ),( hTs ,,0 mi
,)())(()())(()( *
* svvsPsCzzsFsC ii ),(1 hTs ,,0 mi
,*
*
dzd ,*
*
dzd i ,*
*
vvv ,*
*
vvv i ,,0 mi ,)( *
* s ),(1 hTs
где ,)( pntF :Tt ,)( FtAF ;)( * GtF ,)( lntP :Tt PtAP )(
),()( tMtD .0)( * tP
Задача (21) является задачей линейного программирования с ))(2( lpm
)(1 hTq неизвестными и )()2()()1( 1 hh TmqTmq основными ограни-
чениями. Матрица основных ограничений имеет специальную блочную структу-
ру. Задача (21) гораздо проще задачи (19) и ее можно решить стандартными мето-
дами линейного программирования c использованием информации о решении
аналогичных задач в предыдущий момент времени .h
8. Пример
Для иллюстрации предложенных в проекте оптимальных обратных связей
и их сравнения рассмотрим на промежутке времени ],0[ *tT линейную динами-
ческую систему
,21 xx ,12 uxx ,)0( zx (22)
где }.2,1,5,0:{ 2
0 jzzZz j
Цель управления системой (22) — ее перевод с помощью ограниченных
управлений },1:{)( uuUtu ,Tt за конечное время 6* t на полу-
плоскость }3:{ 1
2* xxX с максимальным значением скорости в терми-
нальный момент времени ).( *
2 tx
Полное состояние системы (положение и скорость) недоступно для измере-
ний, измерительное устройство способно с ошибкой измерять только положение
в моменты },6,,2,{ hhTs h :02,0h
),()()( 1 ssxsy
где — ограниченные ошибки измерения, 3,0)( s , .hTs
40 ISSN 0572-2691
Предполагается, что конкретный процесс порожден следующими (неизвест-
ными органу управления) величинами: ,0* z ,2sin15,0)(* ss .hTs
Для заданного процесса построена оптимальная размыкаемая обратная связь. Ее
реализация, подаваемая на вход системы (22), имеет вид (рис. 1, сплошная линия):
.[66,3;64,3[,99645360,0
[,64,3;3,0[,1
[,32,0;3,0[,24862147,0
],6;66,3[[3,0;0[,1
)(*
t
t
t
t
tu
0 1 2 3 4 5 6
t
u
p
1
0,8
0,6
0,4
0,2
0
0,2
0,4
0,6
0,8
1
3 2 1 0 1 2 3
x1 1,5
1
0,5
0,5
1,0
1,5
2
2,5
3
3,5
4
x2
Рис. 1
В начальный момент времени 0 значение критерия качества ),0( 0
0 ZJ , со-
ответствующее оптимальной программе ),,0( 0
0 | Zu оказалось равным 0,88512687.
К концу процесса )6( оно достигло значения ))6(,6( *0 ZJ 1,96926857.
Для построения оптимальной однократно замыкаемой обратной связи выбран
момент замыкания .21 t При точности аппроксимации -множеств замыкания,
равной 10
7
, получена следующая реализация оптимальной замыкаемой обратной
связи (рис. 1, шриховая линия):
[.4;58,3[,14662713.0
[,58,3;4,0[,1
[,4,0;38,0[,35428867,0
[,38,0;36,0[,99985764,0
[,6;4[[36,0;0[,1
)(*
t
t
t
t
t
tu
Значение критерия качества ),,0( 0
1 ZJ соответствующее управлению ),,0( 0
1 | Zu
оказалось равным 1,09360932. К концу процесса оно достигло значения
))6(,6( *1 ZJ 2,00099802.
Изменение во времени функций ))(,( *0 ZJ и ))(,( *1 ZJ , hT , изоб-
ражено на рис. 2. Отметим, что, несмотря на незначительное улучшение в терми-
нальный момент времени, которое дает оптимальная замыкаемая обратная связь
по сравнению с размыкаемой, первая имеет явное преимущество в том случае, если,
например, добавить в рассматриваемую задачу терминальное ограничение
.1)6(2 x Тогда оптимальная размыкаемая связь не может быть реализована из-за
отсутствия решения задачи ).,0( 0
0 Z В то же время ),0( 0
1 Z имеет допустимые
1t -замыкаемые программы.
Международный научно-технический журнал
«Проблемы управления и информатики», 2011, № 6 41
0 1 2 3 4 5 6
t
J
1
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2
J
1
J
0
Рис. 2
Заключение
Для задачи оптимального управления линейной нестационарной системой с воз-
мущениями, множественной неопределенностью в начальном состоянии и в ошиб-
ках измерений выходных сигналов исследованы три подхода к построению опти-
мальных робастных обратных связей. Предложена общая схема построения замыка-
емых обратных связей по выходу как промежуточный случай между простейшей
размыкаемой обратной связью, основанной на оптимальных гарантирующих про-
граммах, и решением задачи методом динамического программирования (замкну-
той обратной связью). Обоснованы методы редукции множественной неопреде-
ленности к эквивалентным конечномерным оценкам; на их основе сформулированы
сопровождающие задачи оптимального наблюдения и оптимального управления,
по результатам решения которых формируются управляющие сигналы, реализу-
ющие оптимальные однократно замыкаемые обратные связи. Получены свойства
оптимальных замыкаемых обратных связей: условия существования, критерий оп-
тимальности, исследованы качественные характеристики в сравнении с оптимальной
размыкаемой и классической обратной связью, получены условия реализуемости оп-
тимальной замыкаемой обратной связи в режиме реального времени. Предложен
эффективный алгоритм построения оптимальных однократно замыкаемых программ
и основанной на них оптимальной обратной связи по несовершенным измерениям.
Н.М. Дмитрук
ОПТИМАЛЬНЕ РОБАСТНЕ КЕРУВАННЯ
ЛІНІЙНИМИ СИСТЕМАМИ ЗА НЕТОЧНИМИ
ВИМІРЮВАННЯМИ ВИХІДНИХ СИГНАЛІВ
Досліджено задачу оптимального керування лінійною нестаціонарною систе-
мою зі збуреннями, множинною невизначеністю в початковому стані і помил-
ками вимірювань вихідних сигналів. Запропоновано загальну схему побудови в
режимі реального часу оптимальних робастних зворотних зв’язків за виходом,
з урахуванням можливості замикання системи і подальшої корекції керування
(оптимальний замкнений зворотний зв’язок).
N.M. Dmitruk
OPTIMAL ROBUST CONTROL
OF LINEAR SYSTEMS BY INACCURATE
MEASUREMENTS OF OUTPUT SIGNALS
The problem of optimal control of linear nonstationary system with disturbances,
multiple uncertainty at initial state and measurement errors of output signals is inves-
tigated. Constructed in the real time mode the general scheme of optimal robust feed-
backs with respect to output in which the possibility of system closure and potential
of subsequent correction of control (optimal closed-loop feedback) is presented.
42 ISSN 0572-2691
1. Mayne D.Q., Raković S.V., Findeisen R., Allgöwer F. Robust output feedback model predictive
control of constrained linear systems // Automatica. — 2006. — 42. — Р. 1217–1222.
2. Goulart P.J., Kerrigan E.C. Output feedback receding horizon control of constrained systems //
Intern. J. of Contr. — 2007. — 80, N 1. — P. 8–20.
3. Moitie R.R., Quincampoix M., Veliov V.M. Optimal control of discrete-time uncertain systems
with imperfect measurement // IEEE Trans. on Automat. Contr. — 2002. — 47, N 11. —
P. 1909–1914.
4. Kurzhanski A.B. The principle of optimality in measurement feedback control for linear systems //
Lecture Notes in Contr. and Inform. Sci. — 2003. — 286. — P. 193–202.
5. Mayne D.Q., Rawlings J.B., Rao C.V., Scokaert P.O.M. Constrained model predictive control:
Stability and optimality // Automatica. — 2000. — 36, N 6. — P. 789–814.
6. Габасов Р., Кириллова Ф.М. Принципы оптимального управления // Докл. НАН Беларуси.
— 2004. — 48, №1. — С. 15–18.
7. Scokaert P.O.M., Mayne D.Q. Min-max feedback model predictive control for constrained linear
systems // IEEE Trans. on Autom. Contr. — 1998. — 43, N 8. — P. 1136–1142.
8. Kerrigan E.C., Maciejowski J.M. Robustly stable feedback min-max model predictive control //
Proc. of the American Contr. Conf. — 2003. — 4. — P. 3490–3495.
9. Fontes F., Magni L. Min-max model predictive control of nonlinear systems using discontinuous
feedbacks // IEEE Trans. on Autom. Contr. — 2003. — 48, N 10. — P. 1750–1755.
10. Curry R. A new algorithm for suboptimal stochastic control // Ibid. — 1969. — 14, N 5. —
P. 533–536.
11. Габасов Р., Кириллова Ф.М., Костина Е.А. Замыкаемые обратные связи по состоянию для
оптимизации неопределенных систем управления // Автоматика и телемеханика. — 1996.
№ 7. — С. 121–130.
12. Балашевич Н.В., Габасов Р., Кириллова Ф.М. Построение оптимальных обратных связей по
математическим моделям с неопределенностью // Журн. вычисл. математики и мат. физи-
ки. — 2004. — 44, № 2. — С. 265–286.
13. Kurzhanski A.B., Varaiya P. Reachability analysis for uncertain systems — the ellipsoidal tech-
nique // Dynamics of Continuous, Discrete and Impulsive Systems Series B: Appl. and Algo-
rithms. — 2002. — 9, N 3. — P. 347–367.
14. Kostyukova O., Kostina E. Robust optimal feedback for terminal linear-quadratic control prob-
lems under disturbances // Mathemat. Program., Ser. B. — 2006. — 107, N 1–2. — P. 131–153.
15. Габасов Р., Дмитрук Н.М., Кириллова Ф.М. Оптимальное управление многомерными си-
стемами по неточным измерениям их выходных сигналов // Тр. Ин-та математики и меха-
ники УрО РАН. — Екатеринбург, 2004. — 10, № 2. — С. 33–57.
16. Балашевич Н.В., Габасов Р., Кириллова Ф.М. Численные методы программной и позицион-
ной оптимизации линейных систем управления // Журн. вычисл. математики и мат. физи-
ки. — 2000. — 40, № 6. — C. 838–859.
Получено 03.04.2011
|