Оптимизация линейной системы управления с терминальными ограничениями
Запропоновано метод обчислення оптимального програмного керування для лінійної динамічної системи з нелінійними термінальними обмеженнями, що базується на розв’язанні послідовності лінійних допоміжних задач оптимального керування. Обгрунтовано застосовність процедур методу для реалізації оптимально...
Gespeichert in:
| Datum: | 2007 |
|---|---|
| 1. Verfasser: | |
| Format: | Artikel |
| Sprache: | Russian |
| Veröffentlicht: |
Інститут кібернетики ім. В.М. Глушкова НАН України
2007
|
| Schriftenreihe: | Проблемы управления и информатики |
| Schlagworte: | |
| Online Zugang: | https://nasplib.isofts.kiev.ua/handle/123456789/206983 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Zitieren: | Оптимизация линейной системы управления с терминальными ограничениями / Н.В. Балашевич // Проблемы управления и информатики. — 2007. — № 3. — С. 5-20. — Бібліогр.: 15 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| id |
irk-123456789-206983 |
|---|---|
| record_format |
dspace |
| spelling |
irk-123456789-2069832025-09-28T00:10:47Z Оптимизация линейной системы управления с терминальными ограничениями Оптимізація лінійної системи керування з термінальними обмеженнями Optimization of linear control system under terminal constraints Балашевич, Н.В. Проблемы динамики управляемых систем Запропоновано метод обчислення оптимального програмного керування для лінійної динамічної системи з нелінійними термінальними обмеженнями, що базується на розв’язанні послідовності лінійних допоміжних задач оптимального керування. Обгрунтовано застосовність процедур методу для реалізації оптимального зворотного зв’язку в режимі реального часу. Наведено результати чисельних експериментів. A method of computing an optimal openloop control for a linear dynamical system under nonlinear terminal constraints is suggested. The method is based on solving a sequence of linear auxiliary optimal control problems. Applicability of the developed procedures for realtime implementation of optimal feedback is justified. Numerical results are given. 2007 Article Оптимизация линейной системы управления с терминальными ограничениями / Н.В. Балашевич // Проблемы управления и информатики. — 2007. — № 3. — С. 5-20. — Бібліогр.: 15 назв. — рос. 0572-2691 https://nasplib.isofts.kiev.ua/handle/123456789/206983 517.977 ru Проблемы управления и информатики application/pdf Інститут кібернетики ім. В.М. Глушкова НАН України |
| institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| collection |
DSpace DC |
| language |
Russian |
| topic |
Проблемы динамики управляемых систем Проблемы динамики управляемых систем |
| spellingShingle |
Проблемы динамики управляемых систем Проблемы динамики управляемых систем Балашевич, Н.В. Оптимизация линейной системы управления с терминальными ограничениями Проблемы управления и информатики |
| description |
Запропоновано метод обчислення оптимального програмного керування для лінійної динамічної системи з нелінійними термінальними обмеженнями, що базується на розв’язанні послідовності лінійних допоміжних задач оптимального керування. Обгрунтовано застосовність процедур методу для реалізації оптимального зворотного зв’язку в режимі реального часу. Наведено результати чисельних експериментів. |
| format |
Article |
| author |
Балашевич, Н.В. |
| author_facet |
Балашевич, Н.В. |
| author_sort |
Балашевич, Н.В. |
| title |
Оптимизация линейной системы управления с терминальными ограничениями |
| title_short |
Оптимизация линейной системы управления с терминальными ограничениями |
| title_full |
Оптимизация линейной системы управления с терминальными ограничениями |
| title_fullStr |
Оптимизация линейной системы управления с терминальными ограничениями |
| title_full_unstemmed |
Оптимизация линейной системы управления с терминальными ограничениями |
| title_sort |
оптимизация линейной системы управления с терминальными ограничениями |
| publisher |
Інститут кібернетики ім. В.М. Глушкова НАН України |
| publishDate |
2007 |
| topic_facet |
Проблемы динамики управляемых систем |
| url |
https://nasplib.isofts.kiev.ua/handle/123456789/206983 |
| citation_txt |
Оптимизация линейной системы управления с терминальными ограничениями / Н.В. Балашевич // Проблемы управления и информатики. — 2007. — № 3. — С. 5-20. — Бібліогр.: 15 назв. — рос. |
| series |
Проблемы управления и информатики |
| work_keys_str_mv |
AT balaševičnv optimizaciâlinejnojsistemyupravleniâsterminalʹnymiograničeniâmi AT balaševičnv optimízacíâlíníjnoísistemikeruvannâztermínalʹnimiobmežennâmi AT balaševičnv optimizationoflinearcontrolsystemunderterminalconstraints |
| first_indexed |
2025-09-28T01:16:57Z |
| last_indexed |
2025-09-29T01:09:02Z |
| _version_ |
1844558579306070016 |
| fulltext |
© Н.В. БАЛАШЕВИЧ, 2007
Проблемы управления и информатики, 2007, № 3 5
ПРОБЛЕМЫ ДИНАМИКИ УПРАВЛЯЕМЫХ СИСТЕМ
УДК 517.977
Н.В. Балашевич
ОПТИМИЗАЦИЯ ЛИНЕЙНОЙ СИСТЕМЫ
УПРАВЛЕНИЯ С ТЕРМИНАЛЬНЫМИ
ОГРАНИЧЕНИЯМИ
Введение
В 80-х годах XX века в теории управления выделилось новое направление
исследований — управление в реальном времени [1], которое, в отличие от клас-
сических принципов программного управления и управления типа обратной свя-
зи, предполагает вычисление управляющих сигналов по ходу процесса управле-
ния на основании поступающей информации о состоянии системы. Интенсивное
развитие указанной тематики обусловлено как востребованностью эффективных
методов управления в многочисленных приложениях, так и достижениями совре-
менной вычислительной техники. В основе методов оптимального управления (ОУ)
в реальном времени лежат алгоритмы быстрой коррекции оптимальных про-
граммных управлений, соответствующих реализовавшимся позициям оптимизи-
руемой динамической системы [2–4].
Методы реализации оптимальных обратных связей в реальном времени
составляют основу современной методологии управления по прогнозируемой мо-
дели Model Predictive Control (MPC) [5–7]. Суть подхода MPC состоит в следую-
щем. При управлении сложными системами на больших промежутках времени
смоделировать поведение системы в течение всей длительности процесса весьма
проблематично. Поэтому в конкретном процессе управления на каждом этапе по
информации, полученной до текущего момента времени, составляется математи-
ческая модель исследуемого процесса на некоторый конечный будущий промежу-
ток времени (горизонт) и формулируется вспомогательная задача ОУ на конечном
промежутке. Текущее состояние процесса рассматривается как начальное состоя-
ние вспомогательной задачи, вычисляется оптимальное программное управление
этой задачи, начальная часть построенного управления подается на вход системы
до наступления следующего этапа. Путем повторения процедуры по мере поступ-
ления информации о состоянии системы достигается реализация управления типа
обратной связи, обеспечивающего желаемые свойства замкнутой системы, как
правило ее асимптотическую устойчивость [8]. Для осуществления указанного
способа управления необходимо вычислять ОУ вспомогательной задачи за время,
не превышающее длительность этапа. При этом решающую роль играет всесто-
ронний учет специфики исследуемого класса оптимизируемых систем.
Наиболее простой для исследования объект — линейные системы. В рабо-
те [9] предложены алгоритмы программной и позиционной оптимизации линей-
ных динамических систем с линейным терминальным критерием качества и ли-
Работа выполнена при финансовой поддержке Белорусского республиканского фонда фундаменталь-
ных исследований (грант Ф06Р-016).
6 ISSN 0572-2691
нейными терминальными ограничениями, представляющие динамические реали-
зации адаптивного метода линейного программирования [10]. Задача [9] является
базовой для более сложных нелинейных задач, и дальнейшие исследования
направлены на последовательный анализ особенностей, возникающих при введе-
нии нелинейных элементов в постановку задачи. Конечная цель заключается в
разработке арсенала приемов, которые можно применять в различных сочетаниях
при исследовании конкретных задач, содержащих нелинейности различных типов.
В [11] метод [9] развит для системы с нелинейной динамикой. Для учета не-
линейностей решается кусочно-линейная аппроксимационная задача ОУ и вы-
полняется асимптотическая коррекция определяющих элементов оптимального
управления. В [12] исследована задача ОУ линейной системой с выпуклым тер-
минальным критерием качества.
В настоящей работе развивается подход [9] для задачи ОУ линейной систе-
мой с учетом нелинейных терминальных ограничений, задающих выпуклое тер-
минальное множество.
1. Постановка задачи
На промежутке времени ],[
= ttT в классе дискретных управлений ),()( = utu
[,,[ ht + };,,,{ ** hthttTh −+= Ntth /)( *−=
(N — натуральное
число) рассмотрим задачу ОУ линейной системой
.,1)(,)(
,)(,)()(max,)(
**
0
T
TttuXtx
xtxutbxtAxtxc
=+=→
(1)
Здесь A(t), b(t), t T, — непрерывные (n n)-матричная и n-векторная функции;
)(txx = — n-вектор состояния динамической системы в момент времени t;
nRx 0 — известное начальное состояние; == IixRxX i
n ,0)(:{*
}},,1{ m= — выпуклое множество, заданное дважды непрерывно дифференци-
руемыми выпуклыми функциями ),(xi ,nRx .Ii
Дискретную функцию u(t), ,Tt назовем допустимым программным управ-
лением, если она удовлетворяет ограничению ,,1 )( Tttu и порожденная ею
траектория x(t), ,Tt системы (1) в момент = tt попадает на множество .X
Допустимое управление ),(0 tu ,Tt будем называть оптимальным про-
граммным управлением задачи (1), если на соответствующей траектории ),(0 tx
,Tt критерий качества задачи (1) достигает максимального значения.
Чтобы ввести понятие ОУ типа обратной связи (позиционного решения зада-
чи (1)), введем задачу (1) в семейство задач
],,[,1)(,)(
,)(,)()(max,)(
**
*T
=
=+=→
tTttuXtx
zxutbxtAxtxc
(2)
зависящее от скаляра hT и n-вектора z. Пусть ),,(0 ztu ,Tt — оптималь-
ное программное управление задачи (2) для позиции (, z); X — множество со-
стояний z, для которых задача (2) имеет решение. Функция
,,),,(),( 00
hTXzzuzu =
(3)
называется ОУ типа обратной связи (ОС) задачи (1).
Проблемы управления и информатики, 2007, № 3 7
Под траекторией системы управления, замкнутой оптимальной обратной
связью (3) и находящейся под действием неизвестного ограниченного кусочно-
непрерывного возмущения ,),( Tttw
,)(),(),()()( 0
0 xtxtwxtutbxtAx =++= (4)
)),(,())(,( 00 = xutxtu hTht + [,,[ ,
понимается непрерывное решение уравнения
,)( ),()()()( 0xtxtwtutbxtAx =++=
с управлением )),(,()( 0 = xutu .[,,[ hTht +
Цель данной работы — разработка эффективных алгоритмов построения оп-
тимальных программного и позиционного решений задачи (1).
Программное решение задачи (1) строится с помощью трех процедур. В ходе
первой процедуры формируется и решается серия аппроксимационных задач с
линейными терминальными ограничениями, что позволяет получить субопти-
мальное дискретное управление, с заданной точностью обеспечивающее выпол-
нение терминальных ограничений (1). Вторая процедура представляет собой до-
водку построенного дискретного решения до кусочно-непрерывного решения за-
дачи (1) и заключается в локальной коррекции точек переключения ОУ и вектора
Лагранжа с помощью решения специальной системы нелинейных алгебраических
уравнений. Третья процедура служит для формирования дискретного решения за-
дачи (1) путем преобразования кусочно-непрерывного управления, построенного
при помощи доводки.
Перейдем к описанию указанных процедур.
2. Решение аппроксимационных задач
Для формирования начальной аппроксимационной задачи выберем совокуп-
ность n-векторов ,1, )()( =ii hh ,,1 li = ,nl в которой каждые n векторов ли-
нейно-независимы. Дополним эту совокупность векторами ,)()( lii hh −−= .2,1 lli +=
Подсчитаем числа ,max T
)( xhg ii = ,*Xx ,2,1 li = и из совокупности ,)(ih ,2,1 li =
удалим векторы ,)(ih для которых .=ig В результате получаем совокупность
,)(ih },,,1{ 1)1( mIi = и числа ,ig ,)1(Ii определяющие первую линейную
аппроксимацию множества .X
Положим .1=k
Множество },:{ )(T
)(
)( k
ii
nk IigxhRxX = назовем k-й линейной ап-
проксимацией множества .X
Сформулируем k-ю аппроксимационную задачу:
.,1)(,)(
,)(,)()(max,)(
)(
0
*T
TttuXtx
xtxutbxtAxtxc
k
=+=→
(5)
Решение задачи (5) строим с помощью метода [9, 13]. Приведем основные
элементы метода, необходимые для дальнейшего изложения.
8 ISSN 0572-2691
Запишем задачу (5) в функциональной форме:
max,)()( →
uc
hT
,~)()( gud
hT
,1)( u .hT
Здесь
,)()( T dtbtc c
h
=
+
,)()()( dttbtGd
h
+
= ,)(~
0* xtGgg −= );,( )(k
i Iigg =
,),( Tttc — решение сопряженного уравнения
;)(,,T ctTtA =−= (6)
,),( TttG — (m
k
n)-матричная функция, представляющая собой решение
уравнения
,,)( TtAtGG −=
с начальным условием
.,)(
)(
T
)(*
==
k
i
Ii
h
HHtG
Выделим из множества )(kI произвольное подмножество ,)(
s
kI из множества
hT — подмножество )(
s
kT так, чтобы .)(
s
)(
s
kk IT = Сформируем матрицу
.
),(
),(
)(
s
)(
s)(
s
)(
sss
==
k
k
ikk
Ii
Td
TIDD
Совокупность },{ )(
s
)(
s
)(
s
kkk TIK = назовем опорой задачи (5), если .0det s D
Совокупность },{ )(
s
)(
s
)(
s === kkk TIK — (пустая) опора по определению.
Для опоры )(
s
kK характерны следующие элементы.
1. Потенциалы ).,( )(k
i Ii= Неопорные компоненты потенциалов пола-
гаем равными нулю: ;0)\,( )(
s
)()(
nn === kkk
i IIIi опорные компоненты =s
),( )(
s
k
i Ii= вычислим как решение уравнения
,T
ss
T
s cDv =
где ).),(( )(
ss
kTcc =
2. Коуправление
.,)())()(()( TT
hc
h
TdttbtGt −=
+
3. Псевдоуправление hThtt += [,,[),()( , и выходной псевдосиг-
нал ).,( )(k
i Ii= Для их построения сначала зададим неопорные значения
)\),(()( )(
s
)(
nn
k
h
k TTTt == псевдоуправления
,)(sign)( = если ;0)( ],1,1[)( − если ,,0)( )(
n
kT (7)
Проблемы управления и информатики, 2007, № 3 9
и опорные значения ),( )(
ss
k
i Ii= выходного псевдосигнала
,ii g= если ;,0 )(
s
k
i Ii ,ii g если .,0 )(
s
k
i Ii=
Опорные компоненты )),(( )(
ss
kT= псевдоуправления найдем из системы
уравнений
,
),(
)(
s
*
0
T
)(
ss
−
=
k
ii
Ii
txh
D
где ),(0 tx ,Tt — траектория системы
,,)(,)()( 0 TtxtxutbxtAx =+= (8)
с дискретным управлением
=
.,0
,),(
)(
)(
s
)(
n
k
k
T
T
u
Неопорные компоненты ),( )(
nn
k
i Ii= выходного псевдосигнала вычис-
ляются по формуле
,),( )(
n
T
)(
k
ii Iitxh =
где ),(tx ,Tt — траектория системы (8) с .),()( hTu =
Опору )(
s
kK назовем оптимальной, если на соответствующих псевдоуправ-
лении hT ),( , и выходном псевдосигнале выполняются неравенства
.;,1)( s gT
Псевдоуправление hT ),( , соответствующее оптимальной опоре, пред-
ставляет собой оптимальное программное управление задачи (5): ),()(ˆ0 =u
.hT
В ходе итераций двойственного метода [9] выполняются преобразования
опоры, позволяющие получить оптимальную опору .0)(
s
kK
Преобразование текущей опоры
)(
s
kK в новую опору
)(
s
kK осуществляется
таким образом. Вначале следует найти момент ,)(
s
0 kT который будет выве-
ден из множества ,)(
s
kT либо индекс ,)(
n
0 kIi который будет введен в множе-
ство .)(
s
kI Затем вычисляется шаг вдоль вариации потенциалов , который
обеспечивает полную релаксацию целевой функции задачи, двойственной к (5).
Для определения шага вычисляется последовательность коротких шагов
,,,1 l при каждом из которых либо появляется новый нуль варьированного
коуправления, либо обращается в нуль компонента варьированного вектора по-
тенциалов. Если из
)(
s
kT выводится момент ,0 то в зависимости от опреде-
ляется либо вводимый в
)(
s
kT вместо 0 момент , либо выводимый из
)(
s
kI ин-
декс .i Если же в
)(
s
kI вводится индекс ,0i то определяется либо вводимый
в
)(
s
kT момент , либо выводимый из
)(
n
kI индекс .i
Если задача (5) не имеет решения, то не имеет решения и исходная задача (1).
10 ISSN 0572-2691
Вычислив оптимальное программное управление ,),(ˆ0 Tttu задачи (5),
найдем состояние ),(ˆ tx в которое в момент t попадет система (1) под действи-
ем .),(ˆ0 Tttu
Подсчитаем невязки терминальных ограничений (1) в точке )(ˆ tx и найдем
среди них максимальную )).(ˆ(max
= txr i
Ii
Если ,r где 0 — заданная
точность, то переходим к доводке. В противном случае находим индекс i такой,
что )),(ˆ(
= txr
i
полагаем 1:,1: 1 +=+= −kk mmkk и формируем следующую
аппроксимационную задачу.
Для этого к ограничениям, задающим множество ,)(kX добавляем новое огра-
ничение ,T
)(
kk mm
gxh где ,))(ˆ(grad/))(ˆ(grad
)(
= txtxh
iimk ),~(xg
imk =
x~ — оптимальный план задачи нелинейного программирования max,T
)(
→xh km
, Xx и итерация метода [13] при решении k-й задачи (5) начинается с введения
в имеющееся множество опорных индексов
0)1(
s
−kI индекса ,km после чего вы-
полняются стандартные операции по замене опоры.
Следуя [9, 14], эффективность метода решения задачи ОУ будем оценивать
по количеству полных интегрирований прямой (1) и сопряженной (6) систем, тре-
буемых для построения ОУ. Особенность динамической реализации [9, 13] метода
решения задачи (5) состоит в формировании, хранении и преобразовании вспомо-
гательной информации, включающей векторы
,)()()()( 0*
)(
n
xtGtdssbsGp
ht
tTt k
+=
+
,),( )(
s
kTd
значения функций )(),( ttG c в точках )(
s* , kTt и в точках множества неопорных
нулей коуправления
},0)()(:\{ *
)(
n
)(
0n
−= thttTtT kk
благодаря чему при вычислении коротких шагов
l ,,1 осуществляется инте-
грирование функций ),(),( ttG c ,Tt лишь на промежутках длины h или 2h в
окрестности точек .},{
)(
0n
)(
s*
kk TTtt При этом предполагается, что в распоря-
жении имеется достаточное количество микропроцессоров, чтобы выполнять ин-
тегрирование параллельно, т.е. трудоемкость вычисления короткого шага не пре-
восходит )./(2 *tth −
Начальная вспомогательная информация формируется до
проведения итераций метода, для ее формирования требуется параллельно вы-
полнить не более двух полных интегрирований прямой и сопряженной систем.
Поскольку в данной работе решается семейство задач (5) с последовательным
добавлением новых ограничений, то в отличие от [9, 13] вместо значений ),(tG
,}{
)(
0n
)(
s*
)( kkk
o TTtTt = хранятся значения фундаментальной матрицы )( tF
и матрицы )(1 tF −
в точках :)(k
oTt
.)(),(,)(,)( 111 EtFtAFFEtFFtAF =−===
−−−
Проблемы управления и информатики, 2007, № 3 11
Тогда .),()()( )(1 k
oTttFtHFtG = − При формировании новой задачи (5) в мат-
рицу Н добавляется новая строка ,T
)( km
h а в матрицу ),(tG ,)(k
oTt — строка
).()()( 1T
)(
T
)(
tFtFhtG kk mm
−= Аналогично вместо вектора р хранится вектор
.)()()()()()( 0
11
)(
n
xtFtFtdssbsFtFp
ht
tTt k
−−
+
+=
Тогда .pHp = Вместо ),(d ,)(
s
kT хранятся векторы
,)()()()( 1 dssbsFtFf
h
−
+
= ).()(:)(
s = fHdT k
Таким образом, поскольку формирование начальной вспомогательной ин-
формации осуществляется только перед решением первой задачи (5), а построе-
ние оптимальной опоры 0)(
s
kK сводится к коррекции оптимальной опоры
,0)1(
s
−kK то трудоемкость решения отдельно взятой k-й задачи (5) равна трудоем-
кости построения оптимального программного управления k-й задачи (5) в ре-
зультате последовательной коррекции решений предшествующих 1−k задач.
3. Кусочно-непрерывное решение исходной задачи
Пусть при решении k-й задачи (5) выполняется условие .r
Согласно [15], для оптимальности допустимого управления ),(0 tu ,Tt за-
дачи (1) необходимо существование вектора Лагранжа mR такого, что на со-
ответствующих траекториях ,),( Tttx прямой (1) и сопряженной ,),( Ttt си-
стем выполняется соотношение
),()(sign)( T0 tbttu = ,Tt (9)
где
,)(T −= tA ,
))((
)(
−=
Ii
i
i
x
tx
ct
,0))(( = txii ,0i .Ii
В силу (9) ОУ задачи (1) имеет вид
},,,0{[,,[,)( 1 pPjttttu jjj == + (10)
где
),0(sign0 += t ;,1,1 pjjj =−= −
;),()()( T Tttbtt = ,0)( = jt .,1 pj =
Таким образом, управление (9) определяется значениями элементов совокупности
},,;,1,{ aij Iipjty == (11)
где aI — множество активных ограничений задачи (1) на управлении (9) =aI
}.0))((:{ == txIi i
12 ISSN 0572-2691
Совокупность },,{ 0 aIpS = назовем структурой ОУ (9).
При известной структуре S элементы (11) вычисляются из системы уравнений
,0)( =yR (12)
которые назовем уравнениями доводки. Здесь
.,,)()()()()(
,,1),()()(
))((
,)),((
)(
10
1
0
1
1
T
1
+
−
−
−
==
+=
=
−
=
+
ttttdssbsFxtFtFtx
pjtbtFtF
x
tx
c
Iitx
yR
pPj
t
t
j
jj
Ii
i
i
ai
j
j
a (13)
Для решения системы (12) используется метод Ньютона
,,1),()( )1()1(1)1()( −−−− =−= llyRyyy llll
где (y) — матрица Якоби системы (12), l — номер приближения, обеспечива-
ющего )~0(~,~)(
lyR — заданная точность.
Матрица (y) имеет вид
,
)()(
0)(
)(
32
~1
=
yAyA
yA
y
pm
(14)
где ,~
aIm =
,,1,
,)()()(
))((
2
)(
1
1
T
1
=
=
−
−
pj
Ii
tbtFtF
x
tx
yA
a
jjj
i
,,1)),()()()(()(
))((
)()()()()()(
))((
2diag
)(
1*
T
*
1
T
1
1
2
2
2
=+
−+
+
−
=
=
−
−
−
−
pjtbtbtAtFtF
x
tx
c
tbtFtFtbtFtF
x
tx
c
yA
jjjj
i
Ii i
jjjjj
i
i
Ii
a
a
;,
,1
),()()(
))((
)(
1
T
3
=
=
−
a
jj
i
Ii
pj
tbtFtF
x
tx
yA
при выполнении условия ,,1,0)( pjt j = эта матрица невырожденная.
Структуру ОУ (9) и начальное приближение )0(y элементов (11) формируем
по результатам решения аппроксимационных задач (5). После решения k-й зада-
чи известны оптимальная опора ,0)(
s
kK множество неопорных нулей коуправле-
ния ,
)(
0n
k
T оптимальный вектор потенциалов ., 0)(
s
0
k
i Ii
Проблемы управления и информатики, 2007, № 3 13
В множество aI включаем индексы Ii такие, что .))(ˆ( txi Если
окажется, что ,0)(
s
k
a II то из aI удаляем 0)(
s
− k
a II индексов, соответ-
ствующих меньшим значениям .)),(ˆ( ai Iitx
Величина 0 равна значению псевдоуправления в первом неопорном моменте.
Положим .
)(
n0
0)(
s
** kk TTp += В качестве ,,1,
)0(
pjt j = возьмем упорядо-
ченные элементы множества .
)(
0n
0)(
s
kk TT
Для вычисления ,,
)0(
ai Ii подсчитаем векторы
,)(
0
0)(
s
ii
Ii
h
k
=
.,
))(ˆ(
a
i
i Ii
x
tx
=
Значения ,,
)0(
ai Ii найдем из системы уравнений
.,T0T
=
aIi
ajiij Ij
Для первой итерации доводки левая часть системы (12) и матрица (14) форми-
руются с использованием сохраненной при решении k-й задачи (5) вспомогатель-
ной информации. На каждой последующей итерации метода Ньютона осуществля-
ется интегрирование функций ,),(),(1 TtttF c −
на промежутках ],,[
)()1( l
j
l
j tt
−
.,1 pj = При параллельном выполнении этих интегрирований общая трудоем-
кость процедуры доводки составляет
).(/max
1
)1()(
,1
=
−
=
−−=
ttttA
l
l
l
j
l
j
pj
Отметим, что поскольку доводка осуществляет локальную коррекцию положения
точек переключения, то интегрирование выполняется на коротких промежутках и
затраты на интегрирование становятся сопоставимы затратами на менее трудоем-
кие операции, такие, как обращение матрицы и умножение матрицы на вектор.
В ходе итераций метода Ньютона структура S может измениться при нару-
шении одного из условий
;,0
)(
a
l
i Ii (15)
;\,0))(( )(
a
l
i IIitx
(16)
,)()(
1
tttt l
p
l (17)
где )()( tx l
— вектор (13), построенный по совокупности ,
)(l
jt .,1 pj =
Если на l-й итерации для некоторого aIi нарушается условие (15), пола-
гаем .\: = iII aa
Если для некоторого aIIi \ нарушается условие (16), полагаем ,: = iII aa
.0
)(
=
l
i
14 ISSN 0572-2691
В случае нарушения условия (17) возвращаемся к решению аппроксимацион-
ных задач (5) с меньшими значениями h и .
Решив систему (12), получаем оптимальные значения 0y элементов (11) и
формируем ОУ задачи (1) вида (10).
4. Решение задачи в классе дискретных управлений
Результат процедуры доводки — кусочно-непрерывное ОУ задачи (1). Учи-
тывая, что в реальных системах управляющие воздействия, как правило, выраба-
тываются устройствами дискретного действия, опишем метод дискретизации
найденного кусочно-непрерывного ОУ для получения дискретного ОУ задачи (1).
Найдем ближайшие к ,,1,0 pjt j = точки .,1, pjThj = Вычислим
,)()()()(~
0
1
2
0
1
1
+=
=
−
−
+
−
+p
j
j
h
h
dssbsFxtFtFx
j
j
,,2 10 hth p +=−=
+
и сформулируем задачу нелинейного программирования
max,)()(
1
11
→++
−==
khukhc jj
k
p
j
,,0)()(~
1
11
Iikhukhfx jj
k
p
j
i
+++
−==
(18)
,,1,1,0,1,1)( pjkkhu j =−=+
относительно p3 переменных .,1;1,0,1),( pjkkhu j =−=+
В случае, если на решении ,,1;1,0,1),( pjkkhu j =−=+ задачи (18) вы-
полняется условие
,,1,0,1)( pjkkhu j ==+ (19)
получаем оптимальное дискретное управление задачи (1)
===+
+
=
+
+
.,,,0[,,[),(
[,,[,
)(
10
10
ttpjhtu
ht
tu
pjjj
jjj
Если же ,0,1)( + kkhu
j
для некоторого },,,1{ pj то сдвигаем мо-
мент
j
в точку kh
j
+ , пересчитываем x
~ и решаем задачу (18). Процесс
продолжаем, пока не будет выполнено условие (19).
При решении практических задач, как правило, нет необходимости добивать-
ся столь высокой точности определения значения критерия качества, которую
обеспечивает решение задачи (18), достаточно ограничиться приближенной дис-
кретизацией, обеспечивающей выполнение терминальных ограничений и опти-
мальность значений управления на промежутке T за исключением, быть может,
некоторого количества отрезков длины h в окрестности точек .,1, pjj =
Для этого из совокупности },1,{ pjj == выбираем m~ точек =Q
},~,1,{ mkqk == вычисляем
Проблемы управления и информатики, 2007, № 3 15
,,,)()(
)()()()(~
10
1
:
1
:
0
1
1
1
+
−
−
−
==
+
+
+=
+
+
+
ttdssbsF
dssbsFxtFtFx
pj
QPj
j
QPj
q
j
hjj
j
jj
и находим значения ,~,1),( mkqu k = из системы
.,0))()(~(
~
1
akk
m
k
qi Iiquqfx =+
=
(20)
Если
,~,1,1)( mkqu k = (21)
то в качестве субоптимального управления задачи (1) берем
=
+
=
+
+
+
.~,1[,,[),(
,,[,,[,
,[,,[,
)(~
1
1
1
mkqqtqu
PjQht
Qt
tu
kkk
jjj
jjj
Если же для некоторого ,~,1 mk = нарушается условие (21), то в совокупности Q
заменяем kq на некоторую точку ,,1, pjQj = и заново решаем систему (20).
5. Реализация оптимальной ОС
Классическое определение оптимальной ОС (3) подразумевает ее вычисление
до начала процесса управления для всех возможных позиций ),,( z , Xz
,hT т.е. реализацию принципа управления по замкнутому контуру. В такой
постановке задача синтеза оптимальных ОС не решена до сих пор как для зада-
чи (1), так и для линейной задачи (5). Однако с созданием быстродействующих
вычислительных устройств появилась возможность реализовывать сигналы опти-
мальной ОС (3) в каждом конкретном процессе управления, основываясь на прин-
ципе управления в реальном времени [1].
Для введения необходимых понятий проанализируем использование ОС (3) в
конкретном процессе управления. Пусть в рассматриваемом процессе реализуют-
ся некоторое начальное состояние
= 0)( xtx и возмущение .),( Tttw
Они по-
рождают в системе (4) переходный процесс ,),( Tttx вдоль которого выполня-
ется тождество
.)(,),())(,()()()()( 0
0
=++ xtxTttwtxtutbtxtAtx (22)
Из выражения (22) видно, что в конкретном процессе управления используются
лишь значения ОС (3)
,)),(,()( 0
hTttxtutu =
(23)
вдоль изолированной непрерывной кривой .),( Tttx
При этом достаточно в
каждый текущий момент ,hT зная текущее состояние ),(x уметь вычислить
текущее значение ))(,()( 0 = xuu за время, не превосходящее h, т.е. в режиме
реального времени.
16 ISSN 0572-2691
Функцию (23) назовем реализацией оптимальной ОС в конкретном процессе
управления, а устройство, способное в каждом конкретном процессе управле-
ния (22) вычислять ее значения в режиме реального времени, — оптимальным ре-
гулятором (ОР).
ОР работает по следующему алгоритму. До начального момента = t он
строит решение аппроксимационных задач и выполняет доводку для задачи (2) с
начальной позицией ).,( 0
xt Поскольку вычисления выполняются до начала
процесса фактического управления системой, то можно считать, что имеется до-
статочно времени для построения программного решения задачи (2) и формиро-
вания вспомогательной информации согласно описанному алгоритму. На проме-
жутке времени [,[ h+ ОР подает на вход системы сигнал
)).(,()( 0 = xuu
Пусть в момент hT заданная точность перехода к доводке достигается для
решения k
*
()-й аппроксимационной задачи. По результатам этого решения ОР
сохраняет следующую информацию: 1) оптимальная опора ==
)()( 0))((
s
0
s
kKK
)};(),({ 0
s
0
s = IT 2) векторы аппроксимации ,)(ih );()( 0
s
)1( = IIIi 3) мно-
жество неопорных нулей коуправления );(0n T 4) матрицы ),(1 tF − = )(oTt
);()( 0n
0
s = TT 5) векторы ),(tc );( oTt 6) векторы ),(f );(0
s T
7) вектор );()()()()( 1
)(n
tdssbsFtFp
ht
tTt
= −
+
8) значение )(0 псевдоуправ-
ления на первом промежутке постоянства; 9) опорные компоненты оптимального
вектора потенциалов )).(),(()( 0
s
00
s = Iii
ОР после выполнения доводки в момент сохраняет: а) индексы активных на
оптимальном управлении ограничений задачи (2): };0))((:{)( == txIiI ia
b) совокупность точек переключения ОУ и множителей Лагранжа =)(0y
)};(,,)(,1),({ 00 == aij Iipjt c) матрицы )),(( 01 −
jtF ;)(,1 = pj d) вектор
),()()()( 1
)(
)(
)(
0
0
1
0
−
=
+
j
t
t
p
j
dssbsFtF
j
j
где ,)(0
0 =t ,)(0
1)(
+
= tt
p
),()( 1 −= −jj
.)(,1 = pj
В момент h+ по поступившему значению )( hx +
ОР должен решить за-
дачу (2) для позиции )).(,( hxh ++
С этой целью он параллельно выполняет
следующие операции.
I. Формирование и решение аппроксимационных задач путем преобразования
сохраненной информации 1–9;
II. Решение уравнений доводки для позиции ))(,( hxh ++
с использова-
нием информации а–d.
При отсутствии сходимости процедуры доводки ОР решает заново уравнения
доводки, формируя структуру и начальные приближения по результатам решения
аппроксимационных задач для позиции )).(,( hxh ++
Построив решение
Проблемы управления и информатики, 2007, № 3 17
уравнений доводки, ОР на промежутке [2,[ hh ++ подает на вход системы
сигнал )()( 1 hhu +=+ и обновляет данные 1–9, а–d для момента .h+
Если в момент hT при решении аппроксимационных задач не существует
конечного шага ,0* при котором появляется новый нуль у варьированного
коуправления либо обращается в нуль опорная компонента варьированного век-
тора потенциалов, то задача (2) для позиции ))(,( x не имеет допустимых
управлений, т.е. под действием возмущений текущее состояние )(x оказывает-
ся за пределами множества .X
В [9] приведены оценки трудоемкости метода, позволяющие сформулировать
требования к быстродействию микропроцессоров, реализующих ОР, для того
чтобы время вычисления сигнала )(u для оптимизирующей системы не пре-
восходило h единиц реального времени.
6. Пример
Полученные результаты проиллюстрируем на задаче оптимального переме-
щения двухмассовой колебательной системы в заданную окрестность нуля в про-
странстве компонент :, 21 xx
min,)(
15
0
→ dttu ,31 xx = ,42 xx = ,213 uxxx ++−= ,1,0 214 xxx −=
,5,1)0(1 =x ,1)0(2 =x ,0)0()0( 43 == xx (24)
},25,0:{)15( 2
2
2
1
4 += xxRxXx ].15,0[,1)(0 = Tttu
В качестве первой линейной аппроксимации множества X возьмем множе-
ство }.5,05,0:{ 21
4)1( = xxRxX Для достижения точности 410−= вы-
полнения терминального ограничения потребовалось решить пять аппроксимаци-
онных задач. В табл. 1 приведены данные о решении аппроксимационных задач
(k — номер задачи; ,0)(
s
kT
)(
0n
k
T — оптимальные опорные моменты и множество
неопорных нулей коуправления; ),15(ˆ1x )15(ˆ2x — компоненты вектора состояния
в момент ,15=t достигаемого под действием оптимального программного уп-
равления k-й задачи; 25,0)15(ˆ)15(ˆ 2
2
2
1 −+= xxr — невязка терминального ограни-
чения). При r к ограничениям задачи добавляется ограничение ,ˆˆ
21 gxxh +
где ),15(ˆ/)15(ˆˆ
21 xxh = ;ˆ15,0ˆ 2hg += A — трудоемкость построения оптималь-
ной опоры k-й задачи. При этом период квантования .05,0=h
Таблица 1
k 0)(
s
kT )(
0n
k
T )15(ˆ),15(ˆ 21 xx R Добавляемое ограничение A
1 1,9; 11,1 8,95 0,499995; 0,499998 0,249993 0,999993x1 + x2 0,707104 0,297
2 8,6 2,3; 11,0 0,415321; 0,291786 0,007631 1,423376x1 + x2 0,869770 0,09
3 8,65; 11,05 2,25 0,384210; 0,322897 0,001880 1,189886x1 + x2 0,777147 0,027
4 2,25 8,65; 11,05 0,394632; 0,307577 0,000338 1,283036x1 + x2 0,813354 0,02
5 8,65; 11,05 2,25 0,388731; 0,314599 0,000084 — 0,013
Таким образом, суммарная трудоемкость решения аппроксимационных задач
с учетом подготовки предварительной информации, требующей двух полных ин-
тегрирований прямой и сопряженной систем, составила 2,447.
18 ISSN 0572-2691
На рис. 1 представлены проекции на плоскость ),( 21 xx оптимальных траекто-
рий первой (пунктирная линия) и пятой (сплошная линия) аппроксимационных задач.
x1
x2
−5
−4
−3
−2
−1
0
1
2
3
4
5
−5 −4 −3 −2 −1 0 1 2 3 4 5
x1(0), x2(0)
Рис. 1
Данные о выполнении доводки приведены в табл. 2 (l — номер итерации;
,
)(l
jt ,,1 pj = — точки переключения управления; )(l — множитель Лагранжа;
),15(1x )15(2x — компоненты терминального состояния, достигаемого под дей-
ствием управления с точками переключения ,
)(l
jt ;,1 pj = )( )(lyRR = — норма
невязки уравнений доводки; r — невязка терминального ограничения; A — трудо-
емкость выполнения l-й итерации).
Таблица 2
l ,
)(l
jt pj ,1= (l) x1(15), x2(15) R r A
0 2,25; 8,65; 11,05 3,249148 0,396903; 0,312078 0,0049 0,0049 —
1 2,257103; 8,666465; 11,072986 3,271966 0,386928; 0,317210 0,0034 0,0003 0,001532
2 2,261040; 8,671100; 11,074703 3,280388 0,386226; 0,317550 0,0028 10−5 0,0003
3 2,262557; 8,672708; 11,074813 3,280547 0,386201; 0,317568 0,0011 10−6 0,0001
4 2,263122; 8,673282; 11,074824 3,280377 0,386203; 0,317565 0,0004 10−7 3,8 10−5
5 2,263328; 8,673491; 11,074827 3,280318 0,386204; 0,317563 0,0001 10−8 1,4 10−5
6 2,263440; 8,673605, 11,074829 3,280286 0,386205; 0,317562 10−5 10−10 8 10−6
Таким образом, найдено ОУ задачи (24) в классе кусочно-непрерывных
функций:
=
[.15;[11,074829 [8,673605;[2.26344 ,0
[,11,074829[8,673605; [26344,2[0; 1,
)(0
t
t
tu (25)
Критерий качества равен 4,664664.
Учитывая положение точек переключения управления (25), при выполнении
приближенной дискретизации ставим точки переключения дискретного управления в
двух моментах из совокупности = {2,25; 8,65; 11;05}. В оставшейся точке 1q
на промежутке длины h = 0,05 вычисляем сигнал управления, обеспечивающий вы-
полнение терминального ограничения. Результаты приближенной дискретизации
приведены в табл. 3 (q1 — точка дискретизации
управления; )( 1qu — управляющее воздействие на
промежутке [;,[ 11 hqq + J — соответствующее зна-
чение критерия качества задачи (24)). При 65,8=q
значение )( 1qu оказалось больше 1.
Таблица 3
q1 u(q1) J
2,25 0,329444 4,666472
11,05 0,315228 4,665761
Проблемы управления и информатики, 2007, № 3 19
Решив задачу (18), получаем управление
=
[,11,1[11,05; 0,474539,
,[8,7[8,65; 0,839582,
[,15[11,1; [8,65[2,25; ,0
[,11,05[8,7; [2,25[0; ,1
)(
t
t
t
t
tu
критерий качества равен 4,665706.
Приведем результаты позиционного решения задачи (24). Пусть на рассмат-
риваемую систему действует неизвестное ОР кусочно-непрерывное возмущение и
поведение реальной системы управления описывается уравнениями
,31 xx = ,42 xx = ,213 uxxx ++−= ),(1,0 214 twxxx +−=
.0)0()0(,1)(,5,1)0( 4321 ==== xxtxx
Действующее на систему возмущение имеет вид ,2sin2,0)( ttw −= [,10,0[t
,0)( tw [.15,10[t
На рис. 2 представлена динамика точек ),(0 jt ,3,1=j переключения ОУ
)),(,(0 xtu ,Tt вычисленных ОР путем решения уравнений доводки в мо-
менты {0, h, 2h,…, 10}, h = 0,05. Регулятором выработано управление
=
[.15 ;[10,643431 [8,9[2,35; ,0
[,434316[8,9; [2,35[0; ,1
)(u
t
)(0 tt j
6
8
10
12
14
0 2 4 6 8 10 12 14
Рис. 2
В момент 15=t компоненты ,1x 2x достигли состояния =))15(),15(( 21 xx
= (0,334278; 0,371831) при критерии качества 4,093431.
Заключение
В работе предложен новый численный итерационный метод синтеза опти-
мального программного управления линейной динамической системой с нели-
нейными терминальными ограничениями. Он характеризуется возможностью бо-
лее быстрого вычисления параметров ОС по сравнению с существующими мето-
дами и использованием небольшого объема информации по каждой итерации
численного алгоритма. Указанные особенности метода позволяют вычислять опти-
мальную ОС в реальном времени в нелинейных адаптивных системах управления.
20 ISSN 0572-2691
Н.В. Балашевич
ОПТИМІЗАЦІЯ ЛІНІЙНОЇ СИСТЕМИ КЕРУВАННЯ
З ТЕРМІНАЛЬНИМИ ОБМЕЖЕННЯМИ
Запропоновано метод обчислення оптимального програмного керування для лі-
нійної динамічної системи з нелінійними термінальними обмеженнями, що ба-
зується на розв’язанні послідовності лінійних допоміжних задач оптимального
керування. Обгрунтовано застосовність процедур методу для реалізації опти-
мального зворотного зв’язку в режимі реального часу. Наведено результати чи-
сельних експериментів.
N.V. Balashevich
OPTIMIZATION OF LINEAR CONTROL SYSTEM
UNDER TERMINAL CONSTRAINTS
A method of computing an optimal open-loop control for a linear dynamical system
under nonlinear terminal constraints is suggested. The method is based on solving
a sequence of linear auxiliary optimal control problems. Applicability of the devel-
oped procedures for real-time implementation of optimal feedback is justified.
Numerical results are given.
1. Габасов Р., Кириллова Ф.М. Принципы оптимального управления // Докл. НАН Белару-
си. — 2004. — 48, № 1. — С. 15–18.
2. Büskens C., Maurer H. SQP-methods for solving optimal control problems with control and state
constraints: Adjoint variables, sensitivity analysis and real-time control // J. Comput. Appl.
Math. — 2000. — 120, N 1–2. — P. 85–108.
3. Diehl M., Bock H.G., Schlöder J. A real-time iteration scheme for nonlinear optimization in opti-
mal feedback control // SIAM J. Control Optimization. — 2005. — 43, N 5. — P. 1714–1736.
4. Maurer H., Augustin D. Sensitivity analysis and real-time control of parametric optimal control
problems using boundary value methods // Online optimization of large scale systems / Ed. by
M. Grötschel et al. — Berlin : Springer, 2001. — P. 17–55.
5. Camacho E.F., Bordons C. Model predictive control. — Berlin : Springer, 2004. — 405 p.
6. Maciejowski J. Predictive control with constraints. — Essex : Pearson Education, 2002. — 331 p.
7. Morari M., Lee J.H. Model predictive control : Past, present and future // Computers & Chemical
Engineering. — 1999. — 23, N 4. — P. 667–682.
8. Mayne D.Q., Rawlings J., Rao C., Scokaert P. Constrained model predictive control : Stability
and optimality // Automatica. — 2000. — 36. — P. 789–814.
9. Балашевич Н.В., Габасов Р., Кириллова Ф.М. Численные методы программной и позицион-
ной оптимизации линейных систем управления // Журн. вычисл. матем. и мат. физики. —
2000. — 40, № 6. — С. 838–859.
10. Альсевич В.В., Габасов Р., Глушенков В.С. Оптимизация линейных экономических моде-
лей. — Мн. : БГУ, 2000. — 210 с.
11. Балашевич Н.В., Габасов Р., Калинин А.И., Кириллова Ф.М. Оптимальное управление не-
линейными системами // Журн. вычисл. матем. и мат. физики. — 2002. — 42, № 7. —
С. 969–995.
12. Габасов Р., Кириллова Ф.М., Хомицкая Т.Г. Программные и позиционные решения терми-
нальных линейно-выпуклых задач оптимального управления // Изв. вузов. Математика. —
2004. — № 12. — С. 3–16.
13. Габасов Р., Дмитрук Н.М., Кириллова Ф.М. Оптимизация многомерных систем управления
с параллелепипедными ограничениями // Автоматика и телемеханика. — 2002. — № 3. —
С. 3–26.
14. Федоренко Р.П. Приближенное решение задач оптимального управления. — М. : Наука,
1978. — 487 с.
15. Габасов Р., Кириллова Ф.М. Принцип максимума в теории оптимального управления. —
Мн. : Наука и техника, 1974. — 272 с.
Получено 04.05.2006
После доработки 14.02.2007
|