Оптимизация линейной системы управления с терминальными ограничениями

Запропоновано метод обчислення оптимального програмного керування для лінійної динамічної системи з нелінійними термінальними обмеженнями, що базується на розв’язанні послідовності лінійних допоміжних задач оптимального керування. Обгрунтовано застосовність процедур методу для реалізації оптимально...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Datum:2007
1. Verfasser: Балашевич, Н.В.
Format: Artikel
Sprache:Russian
Veröffentlicht: Інститут кібернетики ім. В.М. Глушкова НАН України 2007
Schriftenreihe:Проблемы управления и информатики
Schlagworte:
Online Zugang:https://nasplib.isofts.kiev.ua/handle/123456789/206983
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:Оптимизация линейной системы управления с терминальными ограничениями / Н.В. Балашевич // Проблемы управления и информатики. — 2007. — № 3. — С. 5-20. — Бібліогр.: 15 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id irk-123456789-206983
record_format dspace
spelling irk-123456789-2069832025-09-28T00:10:47Z Оптимизация линейной системы управления с терминальными ограничениями Оптимізація лінійної системи керування з термінальними обмеженнями Optimization of linear control system under terminal constraints Балашевич, Н.В. Проблемы динамики управляемых систем Запропоновано метод обчислення оптимального програмного керування для лінійної динамічної системи з нелінійними термінальними обмеженнями, що базується на розв’язанні послідовності лінійних допоміжних задач оптимального керування. Обгрунтовано застосовність процедур методу для реалізації оптимального зворотного зв’язку в режимі реального часу. Наведено результати чисельних експериментів. A method of computing an optimal openloop control for a linear dynamical system under nonlinear terminal constraints is suggested. The method is based on solving a sequence of linear auxiliary optimal control problems. Applicability of the developed procedures for realtime implementation of optimal feedback is justified. Numerical results are given. 2007 Article Оптимизация линейной системы управления с терминальными ограничениями / Н.В. Балашевич // Проблемы управления и информатики. — 2007. — № 3. — С. 5-20. — Бібліогр.: 15 назв. — рос. 0572-2691 https://nasplib.isofts.kiev.ua/handle/123456789/206983 517.977 ru Проблемы управления и информатики application/pdf Інститут кібернетики ім. В.М. Глушкова НАН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Russian
topic Проблемы динамики управляемых систем
Проблемы динамики управляемых систем
spellingShingle Проблемы динамики управляемых систем
Проблемы динамики управляемых систем
Балашевич, Н.В.
Оптимизация линейной системы управления с терминальными ограничениями
Проблемы управления и информатики
description Запропоновано метод обчислення оптимального програмного керування для лінійної динамічної системи з нелінійними термінальними обмеженнями, що базується на розв’язанні послідовності лінійних допоміжних задач оптимального керування. Обгрунтовано застосовність процедур методу для реалізації оптимального зворотного зв’язку в режимі реального часу. Наведено результати чисельних експериментів.
format Article
author Балашевич, Н.В.
author_facet Балашевич, Н.В.
author_sort Балашевич, Н.В.
title Оптимизация линейной системы управления с терминальными ограничениями
title_short Оптимизация линейной системы управления с терминальными ограничениями
title_full Оптимизация линейной системы управления с терминальными ограничениями
title_fullStr Оптимизация линейной системы управления с терминальными ограничениями
title_full_unstemmed Оптимизация линейной системы управления с терминальными ограничениями
title_sort оптимизация линейной системы управления с терминальными ограничениями
publisher Інститут кібернетики ім. В.М. Глушкова НАН України
publishDate 2007
topic_facet Проблемы динамики управляемых систем
url https://nasplib.isofts.kiev.ua/handle/123456789/206983
citation_txt Оптимизация линейной системы управления с терминальными ограничениями / Н.В. Балашевич // Проблемы управления и информатики. — 2007. — № 3. — С. 5-20. — Бібліогр.: 15 назв. — рос.
series Проблемы управления и информатики
work_keys_str_mv AT balaševičnv optimizaciâlinejnojsistemyupravleniâsterminalʹnymiograničeniâmi
AT balaševičnv optimízacíâlíníjnoísistemikeruvannâztermínalʹnimiobmežennâmi
AT balaševičnv optimizationoflinearcontrolsystemunderterminalconstraints
first_indexed 2025-09-28T01:16:57Z
last_indexed 2025-09-29T01:09:02Z
_version_ 1844558579306070016
fulltext © Н.В. БАЛАШЕВИЧ, 2007 Проблемы управления и информатики, 2007, № 3 5 ПРОБЛЕМЫ ДИНАМИКИ УПРАВЛЯЕМЫХ СИСТЕМ УДК 517.977 Н.В. Балашевич ОПТИМИЗАЦИЯ ЛИНЕЙНОЙ СИСТЕМЫ УПРАВЛЕНИЯ С ТЕРМИНАЛЬНЫМИ ОГРАНИЧЕНИЯМИ Введение В 80-х годах XX века в теории управления выделилось новое направление исследований — управление в реальном времени [1], которое, в отличие от клас- сических принципов программного управления и управления типа обратной свя- зи, предполагает вычисление управляющих сигналов по ходу процесса управле- ния на основании поступающей информации о состоянии системы. Интенсивное развитие указанной тематики обусловлено как востребованностью эффективных методов управления в многочисленных приложениях, так и достижениями совре- менной вычислительной техники. В основе методов оптимального управления (ОУ) в реальном времени лежат алгоритмы быстрой коррекции оптимальных про- граммных управлений, соответствующих реализовавшимся позициям оптимизи- руемой динамической системы [2–4]. Методы реализации оптимальных обратных связей в реальном времени составляют основу современной методологии управления по прогнозируемой мо- дели Model Predictive Control (MPC) [5–7]. Суть подхода MPC состоит в следую- щем. При управлении сложными системами на больших промежутках времени смоделировать поведение системы в течение всей длительности процесса весьма проблематично. Поэтому в конкретном процессе управления на каждом этапе по информации, полученной до текущего момента времени, составляется математи- ческая модель исследуемого процесса на некоторый конечный будущий промежу- ток времени (горизонт) и формулируется вспомогательная задача ОУ на конечном промежутке. Текущее состояние процесса рассматривается как начальное состоя- ние вспомогательной задачи, вычисляется оптимальное программное управление этой задачи, начальная часть построенного управления подается на вход системы до наступления следующего этапа. Путем повторения процедуры по мере поступ- ления информации о состоянии системы достигается реализация управления типа обратной связи, обеспечивающего желаемые свойства замкнутой системы, как правило ее асимптотическую устойчивость [8]. Для осуществления указанного способа управления необходимо вычислять ОУ вспомогательной задачи за время, не превышающее длительность этапа. При этом решающую роль играет всесто- ронний учет специфики исследуемого класса оптимизируемых систем. Наиболее простой для исследования объект — линейные системы. В рабо- те [9] предложены алгоритмы программной и позиционной оптимизации линей- ных динамических систем с линейным терминальным критерием качества и ли-  Работа выполнена при финансовой поддержке Белорусского республиканского фонда фундаменталь- ных исследований (грант Ф06Р-016). 6 ISSN 0572-2691 нейными терминальными ограничениями, представляющие динамические реали- зации адаптивного метода линейного программирования [10]. Задача [9] является базовой для более сложных нелинейных задач, и дальнейшие исследования направлены на последовательный анализ особенностей, возникающих при введе- нии нелинейных элементов в постановку задачи. Конечная цель заключается в разработке арсенала приемов, которые можно применять в различных сочетаниях при исследовании конкретных задач, содержащих нелинейности различных типов. В [11] метод [9] развит для системы с нелинейной динамикой. Для учета не- линейностей решается кусочно-линейная аппроксимационная задача ОУ и вы- полняется асимптотическая коррекция определяющих элементов оптимального управления. В [12] исследована задача ОУ линейной системой с выпуклым тер- минальным критерием качества. В настоящей работе развивается подход [9] для задачи ОУ линейной систе- мой с учетом нелинейных терминальных ограничений, задающих выпуклое тер- минальное множество. 1. Постановка задачи На промежутке времени ],[  = ttT в классе дискретных управлений ),()( = utu [,,[ ht + };,,,{ ** hthttTh −+=  Ntth /)( *−=  (N — натуральное число) рассмотрим задачу ОУ линейной системой .,1)(,)( ,)(,)()(max,)( ** 0 T TttuXtx xtxutbxtAxtxc  =+=→    (1) Здесь A(t), b(t), t  T, — непрерывные (n  n)-матричная и n-векторная функции; )(txx = — n-вектор состояния динамической системы в момент времени t; nRx 0 — известное начальное состояние; == IixRxX i n ,0)(:{* }},,1{ m= — выпуклое множество, заданное дважды непрерывно дифференци- руемыми выпуклыми функциями ),(xi ,nRx .Ii Дискретную функцию u(t), ,Tt  назовем допустимым программным управ- лением, если она удовлетворяет ограничению ,,1 )( Tttu  и порожденная ею траектория x(t), ,Tt  системы (1) в момент = tt попадает на множество .X Допустимое управление ),(0 tu ,Tt  будем называть оптимальным про- граммным управлением задачи (1), если на соответствующей траектории ),(0 tx ,Tt  критерий качества задачи (1) достигает максимального значения. Чтобы ввести понятие ОУ типа обратной связи (позиционного решения зада- чи (1)), введем задачу (1) в семейство задач ],,[,1)(,)( ,)(,)()(max,)( ** *T  = =+=→ tTttuXtx zxutbxtAxtxc  (2) зависящее от скаляра hT и n-вектора z. Пусть ),,(0 ztu  ,Tt — оптималь- ное программное управление задачи (2) для позиции (, z); X — множество со- стояний z, для которых задача (2) имеет решение. Функция ,,),,(),( 00 hTXzzuzu =  (3) называется ОУ типа обратной связи (ОС) задачи (1). Проблемы управления и информатики, 2007, № 3 7 Под траекторией системы управления, замкнутой оптимальной обратной связью (3) и находящейся под действием неизвестного ограниченного кусочно- непрерывного возмущения ,),( Tttw  ,)(),(),()()( 0 0 xtxtwxtutbxtAx =++=  (4) )),(,())(,( 00 = xutxtu hTht + [,,[ , понимается непрерывное решение уравнения ,)( ),()()()( 0xtxtwtutbxtAx =++=   с управлением )),(,()( 0 = xutu .[,,[ hTht + Цель данной работы — разработка эффективных алгоритмов построения оп- тимальных программного и позиционного решений задачи (1). Программное решение задачи (1) строится с помощью трех процедур. В ходе первой процедуры формируется и решается серия аппроксимационных задач с линейными терминальными ограничениями, что позволяет получить субопти- мальное дискретное управление, с заданной точностью обеспечивающее выпол- нение терминальных ограничений (1). Вторая процедура представляет собой до- водку построенного дискретного решения до кусочно-непрерывного решения за- дачи (1) и заключается в локальной коррекции точек переключения ОУ и вектора Лагранжа с помощью решения специальной системы нелинейных алгебраических уравнений. Третья процедура служит для формирования дискретного решения за- дачи (1) путем преобразования кусочно-непрерывного управления, построенного при помощи доводки. Перейдем к описанию указанных процедур. 2. Решение аппроксимационных задач Для формирования начальной аппроксимационной задачи выберем совокуп- ность n-векторов ,1, )()( =ii hh ,,1 li = ,nl  в которой каждые n векторов ли- нейно-независимы. Дополним эту совокупность векторами ,)()( lii hh −−= .2,1 lli += Подсчитаем числа ,max T )( xhg ii = ,*Xx ,2,1 li = и из совокупности ,)(ih ,2,1 li = удалим векторы ,)(ih для которых .=ig В результате получаем совокупность ,)(ih },,,1{ 1)1( mIi = и числа ,ig ,)1(Ii определяющие первую линейную аппроксимацию множества .X Положим .1=k Множество },:{ )(T )( )( k ii nk IigxhRxX = назовем k-й линейной ап- проксимацией множества .X Сформулируем k-ю аппроксимационную задачу: .,1)(,)( ,)(,)()(max,)( )( 0 *T TttuXtx xtxutbxtAxtxc k  =+=→   (5) Решение задачи (5) строим с помощью метода [9, 13]. Приведем основные элементы метода, необходимые для дальнейшего изложения. 8 ISSN 0572-2691 Запишем задачу (5) в функциональной форме: max,)()( →  uc hT ,~)()( gud hT   ,1)( u .hT Здесь ,)()( T dtbtc c h =  +  ,)()()( dttbtGd h  +  = ,)(~ 0* xtGgg −= );,( )(k i Iigg = ,),( Tttc  — решение сопряженного уравнения ;)(,,T ctTtA =−=  (6) ,),( TttG  — (m k  n)-матричная функция, представляющая собой решение уравнения ,,)( TtAtGG −= с начальным условием .,)( )( T )(*          == k i Ii h HHtG Выделим из множества )(kI произвольное подмножество ,)( s kI из множества hT — подмножество )( s kT так, чтобы .)( s )( s kk IT = Сформируем матрицу . ),( ),( )( s )( s)( s )( sss           == k k ikk Ii Td TIDD Совокупность },{ )( s )( s )( s kkk TIK = назовем опорой задачи (5), если .0det s D Совокупность },{ )( s )( s )( s === kkk TIK — (пустая) опора по определению. Для опоры )( s kK характерны следующие элементы. 1. Потенциалы ).,( )(k i Ii= Неопорные компоненты потенциалов пола- гаем равными нулю: ;0)\,( )( s )()( nn === kkk i IIIi опорные компоненты =s ),( )( s k i Ii= вычислим как решение уравнения ,T ss T s cDv = где ).),(( )( ss kTcc = 2. Коуправление .,)())()(()( TT hc h TdttbtGt −=  +  3. Псевдоуправление hThtt += [,,[),()( , и выходной псевдосиг- нал ).,( )(k i Ii= Для их построения сначала зададим неопорные значения )\),(()( )( s )( nn k h k TTTt == псевдоуправления ,)(sign)( = если ;0)(  ],1,1[)( − если ,,0)( )( n kT (7) Проблемы управления и информатики, 2007, № 3 9 и опорные значения ),( )( ss k i Ii= выходного псевдосигнала ,ii g= если ;,0 )( s k i Ii ,ii g если .,0 )( s k i Ii= Опорные компоненты )),(( )( ss kT= псевдоуправления найдем из системы уравнений , ),( )( s * 0 T )( ss          − = k ii Ii txh D где ),(0 tx ,Tt  — траектория системы ,,)(,)()( 0 TtxtxutbxtAx =+=  (8) с дискретным управлением       = .,0 ,),( )( )( s )( n k k T T u Неопорные компоненты ),( )( nn k i Ii= выходного псевдосигнала вычис- ляются по формуле ,),( )( n T )( k ii Iitxh =   где ),(tx ,Tt  — траектория системы (8) с .),()( hTu = Опору )( s kK назовем оптимальной, если на соответствующих псевдоуправ- лении hT ),( , и выходном псевдосигнале  выполняются неравенства .;,1)( s gT  Псевдоуправление hT ),( , соответствующее оптимальной опоре, пред- ставляет собой оптимальное программное управление задачи (5): ),()(ˆ0 =u .hT В ходе итераций двойственного метода [9] выполняются преобразования опоры, позволяющие получить оптимальную опору .0)( s kK Преобразование текущей опоры )( s kK в новую опору )( s kK осуществляется таким образом. Вначале следует найти момент ,)( s 0 kT который будет выве- ден из множества ,)( s kT либо индекс ,)( n 0 kIi  который будет введен в множе- ство .)( s kI Затем вычисляется шаг  вдоль вариации потенциалов , который обеспечивает полную релаксацию целевой функции задачи, двойственной к (5). Для определения шага  вычисляется последовательность коротких шагов ,,,1 l  при каждом из которых либо появляется новый нуль варьированного коуправления, либо обращается в нуль компонента варьированного вектора по- тенциалов. Если из )( s kT выводится момент ,0 то в зависимости от  опреде- ляется либо вводимый в )( s kT вместо 0 момент , либо выводимый из )( s kI ин- декс .i Если же в )( s kI вводится индекс ,0i то определяется либо вводимый в )( s kT момент , либо выводимый из )( n kI индекс .i Если задача (5) не имеет решения, то не имеет решения и исходная задача (1). 10 ISSN 0572-2691 Вычислив оптимальное программное управление ,),(ˆ0 Tttu  задачи (5), найдем состояние ),(ˆ tx в которое в момент t попадет система (1) под действи- ем .),(ˆ0 Tttu  Подсчитаем невязки терминальных ограничений (1) в точке )(ˆ tx и найдем среди них максимальную )).(ˆ(max   = txr i Ii Если ,r где 0 — заданная точность, то переходим к доводке. В противном случае находим индекс i такой, что )),(ˆ(  = txr i полагаем 1:,1: 1 +=+= −kk mmkk и формируем следующую аппроксимационную задачу. Для этого к ограничениям, задающим множество ,)(kX добавляем новое огра- ничение ,T )( kk mm gxh  где ,))(ˆ(grad/))(ˆ(grad )(   = txtxh iimk ),~(xg imk = x~ — оптимальный план задачи нелинейного программирования max,T )( →xh km , Xx и итерация метода [13] при решении k-й задачи (5) начинается с введения в имеющееся множество опорных индексов 0)1( s −kI индекса ,km после чего вы- полняются стандартные операции по замене опоры. Следуя [9, 14], эффективность метода решения задачи ОУ будем оценивать по количеству полных интегрирований прямой (1) и сопряженной (6) систем, тре- буемых для построения ОУ. Особенность динамической реализации [9, 13] метода решения задачи (5) состоит в формировании, хранении и преобразовании вспомо- гательной информации, включающей векторы ,)()()()( 0* )( n xtGtdssbsGp ht tTt k +=  +  ,),( )( s kTd  значения функций )(),( ttG c в точках )( s* , kTt и в точках множества неопорных нулей коуправления },0)()(:\{ * )( n )( 0n −= thttTtT kk благодаря чему при вычислении коротких шагов l ,,1  осуществляется инте- грирование функций ),(),( ttG c ,Tt лишь на промежутках длины h или 2h в окрестности точек .},{ )( 0n )( s* kk TTtt  При этом предполагается, что в распоря- жении имеется достаточное количество микропроцессоров, чтобы выполнять ин- тегрирование параллельно, т.е. трудоемкость вычисления короткого шага не пре- восходит )./(2 *tth − Начальная вспомогательная информация формируется до проведения итераций метода, для ее формирования требуется параллельно вы- полнить не более двух полных интегрирований прямой и сопряженной систем. Поскольку в данной работе решается семейство задач (5) с последовательным добавлением новых ограничений, то в отличие от [9, 13] вместо значений ),(tG ,}{ )( 0n )( s* )( kkk o TTtTt = хранятся значения фундаментальной матрицы )( tF и матрицы )(1 tF − в точках :)(k oTt .)(),(,)(,)( 111 EtFtAFFEtFFtAF =−===  −−−   Проблемы управления и информатики, 2007, № 3 11 Тогда .),()()( )(1 k oTttFtHFtG = − При формировании новой задачи (5) в мат- рицу Н добавляется новая строка ,T )( km h а в матрицу ),(tG ,)(k oTt — строка ).()()( 1T )( T )( tFtFhtG kk mm −= Аналогично вместо вектора р хранится вектор .)()()()()()( 0 11 )( n xtFtFtdssbsFtFp ht tTt k  −− +  +=  Тогда .pHp = Вместо ),(d ,)( s kT хранятся векторы ,)()()()( 1 dssbsFtFf h − +  = ).()(:)( s = fHdT k Таким образом, поскольку формирование начальной вспомогательной ин- формации осуществляется только перед решением первой задачи (5), а построе- ние оптимальной опоры 0)( s kK сводится к коррекции оптимальной опоры ,0)1( s −kK то трудоемкость решения отдельно взятой k-й задачи (5) равна трудоем- кости построения оптимального программного управления k-й задачи (5) в ре- зультате последовательной коррекции решений предшествующих 1−k задач. 3. Кусочно-непрерывное решение исходной задачи Пусть при решении k-й задачи (5) выполняется условие .r Согласно [15], для оптимальности допустимого управления ),(0 tu ,Tt  за- дачи (1) необходимо существование вектора Лагранжа mR такого, что на со- ответствующих траекториях ,),( Tttx  прямой (1) и сопряженной ,),( Ttt  си- стем выполняется соотношение ),()(sign)( T0 tbttu = ,Tt  (9) где ,)(T −= tA , ))(( )(       −= Ii i i x tx ct ,0))(( = txii ,0i .Ii В силу (9) ОУ задачи (1) имеет вид },,,0{[,,[,)( 1 pPjttttu jjj == + (10) где ),0(sign0 += t ;,1,1 pjjj =−= − ;),()()( T Tttbtt = ,0)( = jt .,1 pj = Таким образом, управление (9) определяется значениями элементов совокупности },,;,1,{ aij Iipjty == (11) где aI — множество активных ограничений задачи (1) на управлении (9) =aI }.0))((:{ == txIi i 12 ISSN 0572-2691 Совокупность },,{ 0 aIpS = назовем структурой ОУ (9). При известной структуре S элементы (11) вычисляются из системы уравнений ,0)( =yR (12) которые назовем уравнениями доводки. Здесь .,,)()()()()( ,,1),()()( ))(( ,)),(( )( 10 1 0 1 1 T 1  + −  − −    ==           +=        =           −  =    + ttttdssbsFxtFtFtx pjtbtFtF x tx c Iitx yR pPj t t j jj Ii i i ai j j a (13) Для решения системы (12) используется метод Ньютона ,,1),()( )1()1(1)1()( −−−− =−= llyRyyy llll где (y) — матрица Якоби системы (12), l — номер приближения, обеспечива- ющего )~0(~,~)(  lyR — заданная точность. Матрица (y) имеет вид , )()( 0)( )( 32 ~1         =  yAyA yA y pm (14) где ,~ aIm = ,,1, ,)()()( ))(( 2 )( 1 1 T 1             =                 = − −  pj Ii tbtFtF x tx yA a jjj i ,,1)),()()()(()( ))(( )()()()()()( ))(( 2diag )( 1* T * 1 T 1 1 2 2 2     =+           −+ +        −         = = −  − − −     pjtbtbtAtFtF x tx c tbtFtFtbtFtF x tx c yA jjjj i Ii i jjjjj i i Ii a a  ;, ,1 ),()()( ))(( )( 1 T 3                          =   = −  a jj i Ii pj tbtFtF x tx yA при выполнении условия ,,1,0)( pjt j = эта матрица невырожденная. Структуру ОУ (9) и начальное приближение )0(y элементов (11) формируем по результатам решения аппроксимационных задач (5). После решения k-й зада- чи известны оптимальная опора ,0)( s kK множество неопорных нулей коуправле- ния , )( 0n k T оптимальный вектор потенциалов ., 0)( s 0   k i Ii Проблемы управления и информатики, 2007, № 3 13 В множество aI включаем индексы Ii такие, что .))(ˆ(  txi Если окажется, что ,0)( s   k a II то из aI удаляем 0)( s  − k a II индексов, соответ- ствующих меньшим значениям .)),(ˆ( ai Iitx   Величина 0 равна значению псевдоуправления в первом неопорном моменте. Положим . )( n0 0)( s ** kk TTp += В качестве ,,1, )0( pjt j = возьмем упорядо- ченные элементы множества . )( 0n 0)( s  kk TT  Для вычисления ,, )0( ai Ii подсчитаем векторы ,)( 0 0)( s ii Ii h k =    ., ))(ˆ( a i i Ii x tx    =  Значения ,, )0( ai Ii найдем из системы уравнений .,T0T   = aIi ajiij Ij Для первой итерации доводки левая часть системы (12) и матрица (14) форми- руются с использованием сохраненной при решении k-й задачи (5) вспомогатель- ной информации. На каждой последующей итерации метода Ньютона осуществля- ется интегрирование функций ,),(),(1 TtttF c − на промежутках ],,[ )()1( l j l j tt − .,1 pj = При параллельном выполнении этих интегрирований общая трудоем- кость процедуры доводки составляет ).(/max 1 )1()( ,1   = − = −−=  ttttA l l l j l j pj Отметим, что поскольку доводка осуществляет локальную коррекцию положения точек переключения, то интегрирование выполняется на коротких промежутках и затраты на интегрирование становятся сопоставимы затратами на менее трудоем- кие операции, такие, как обращение матрицы и умножение матрицы на вектор. В ходе итераций метода Ньютона структура S может измениться при нару- шении одного из условий ;,0 )( a l i Ii (15) ;\,0))(( )( a l i IIitx   (16) ,)()( 1    tttt l p l  (17) где )()( tx l — вектор (13), построенный по совокупности , )(l jt .,1 pj = Если на l-й итерации для некоторого aIi  нарушается условие (15), пола- гаем .\: = iII aa Если для некоторого aIIi \ нарушается условие (16), полагаем ,: = iII aa  .0 )( =  l i 14 ISSN 0572-2691 В случае нарушения условия (17) возвращаемся к решению аппроксимацион- ных задач (5) с меньшими значениями h и . Решив систему (12), получаем оптимальные значения 0y элементов (11) и формируем ОУ задачи (1) вида (10). 4. Решение задачи в классе дискретных управлений Результат процедуры доводки — кусочно-непрерывное ОУ задачи (1). Учи- тывая, что в реальных системах управляющие воздействия, как правило, выраба- тываются устройствами дискретного действия, опишем метод дискретизации найденного кусочно-непрерывного ОУ для получения дискретного ОУ задачи (1). Найдем ближайшие к ,,1,0 pjt j = точки .,1, pjThj = Вычислим ,)()()()(~ 0 1 2 0 1 1           +=   = − − +  −  +p j j h h dssbsFxtFtFx j j ,,2 10 hth p +=−=  + и сформулируем задачу нелинейного программирования max,)()( 1 11 →++ −== khukhc jj k p j ,,0)()(~ 1 11 Iikhukhfx jj k p j i          +++  −==  (18) ,,1,1,0,1,1)( pjkkhu j =−=+ относительно p3 переменных .,1;1,0,1),( pjkkhu j =−=+ В случае, если на решении ,,1;1,0,1),( pjkkhu j =−=+ задачи (18) вы- полняется условие ,,1,0,1)( pjkkhu j ==+ (19) получаем оптимальное дискретное управление задачи (1)     ===+ + =  + + .,,,0[,,[),( [,,[, )( 10 10 ttpjhtu ht tu pjjj jjj Если же ,0,1)( +  kkhu j для некоторого },,,1{ pj  то сдвигаем мо- мент  j в точку kh j +  , пересчитываем x ~ и решаем задачу (18). Процесс продолжаем, пока не будет выполнено условие (19). При решении практических задач, как правило, нет необходимости добивать- ся столь высокой точности определения значения критерия качества, которую обеспечивает решение задачи (18), достаточно ограничиться приближенной дис- кретизацией, обеспечивающей выполнение терминальных ограничений и опти- мальность значений управления на промежутке T за исключением, быть может, некоторого количества отрезков длины h в окрестности точек .,1, pjj = Для этого из совокупности },1,{ pjj == выбираем m~ точек =Q },~,1,{ mkqk == вычисляем Проблемы управления и информатики, 2007, № 3 15 ,,,)()( )()()()(~ 10 1 : 1 : 0 1 1 1  + −   −    − ==      + +      +=   + + + ttdssbsF dssbsFxtFtFx pj QPj j QPj q j hjj j jj и находим значения ,~,1),( mkqu k = из системы .,0))()(~( ~ 1 akk m k qi Iiquqfx =+  = (20) Если ,~,1,1)( mkqu k = (21) то в качестве субоптимального управления задачи (1) берем      = +  = + + + .~,1[,,[),( ,,[,,[, ,[,,[, )(~ 1 1 1 mkqqtqu PjQht Qt tu kkk jjj jjj Если же для некоторого ,~,1 mk = нарушается условие (21), то в совокупности Q заменяем kq на некоторую точку ,,1, pjQj = и заново решаем систему (20). 5. Реализация оптимальной ОС Классическое определение оптимальной ОС (3) подразумевает ее вычисление до начала процесса управления для всех возможных позиций ),,( z , Xz ,hT т.е. реализацию принципа управления по замкнутому контуру. В такой постановке задача синтеза оптимальных ОС не решена до сих пор как для зада- чи (1), так и для линейной задачи (5). Однако с созданием быстродействующих вычислительных устройств появилась возможность реализовывать сигналы опти- мальной ОС (3) в каждом конкретном процессе управления, основываясь на прин- ципе управления в реальном времени [1]. Для введения необходимых понятий проанализируем использование ОС (3) в конкретном процессе управления. Пусть в рассматриваемом процессе реализуют- ся некоторое начальное состояние   = 0)( xtx и возмущение .),( Tttw  Они по- рождают в системе (4) переходный процесс ,),( Tttx  вдоль которого выполня- ется тождество .)(,),())(,()()()()( 0 0    =++ xtxTttwtxtutbtxtAtx (22) Из выражения (22) видно, что в конкретном процессе управления используются лишь значения ОС (3) ,)),(,()( 0 hTttxtutu =  (23) вдоль изолированной непрерывной кривой .),( Tttx  При этом достаточно в каждый текущий момент ,hT зная текущее состояние ),(x уметь вычислить текущее значение ))(,()( 0 =  xuu за время, не превосходящее h, т.е. в режиме реального времени. 16 ISSN 0572-2691 Функцию (23) назовем реализацией оптимальной ОС в конкретном процессе управления, а устройство, способное в каждом конкретном процессе управле- ния (22) вычислять ее значения в режиме реального времени, — оптимальным ре- гулятором (ОР). ОР работает по следующему алгоритму. До начального момента = t он строит решение аппроксимационных задач и выполняет доводку для задачи (2) с начальной позицией ).,( 0   xt Поскольку вычисления выполняются до начала процесса фактического управления системой, то можно считать, что имеется до- статочно времени для построения программного решения задачи (2) и формиро- вания вспомогательной информации согласно описанному алгоритму. На проме- жутке времени [,[ h+ ОР подает на вход системы сигнал )).(,()( 0 =  xuu Пусть в момент hT заданная точность перехода к доводке достигается для решения k * ()-й аппроксимационной задачи. По результатам этого решения ОР сохраняет следующую информацию: 1) оптимальная опора ==  )()( 0))(( s 0 s kKK )};(),({ 0 s 0 s = IT 2) векторы аппроксимации ,)(ih );()( 0 s )1( = IIIi  3) мно- жество неопорных нулей коуправления );(0n T 4) матрицы ),(1 tF − = )(oTt );()( 0n 0 s = TT  5) векторы ),(tc );( oTt 6) векторы ),(f );(0 s  T 7) вектор );()()()()( 1 )(n tdssbsFtFp ht tTt = − +   8) значение )(0  псевдоуправ- ления на первом промежутке постоянства; 9) опорные компоненты оптимального вектора потенциалов )).(),(()( 0 s 00 s = Iii ОР после выполнения доводки в момент  сохраняет: а) индексы активных на оптимальном управлении ограничений задачи (2): };0))((:{)( == txIiI ia b) совокупность точек переключения ОУ и множителей Лагранжа =)(0y )};(,,)(,1),({ 00 == aij Iipjt c) матрицы )),(( 01 − jtF ;)(,1 = pj d) вектор ),()()()( 1 )( )( )( 0 0 1 0 −    =  + j t t p j dssbsFtF j j где ,)(0 0 =t ,)(0 1)(  + = tt p ),()( 1 −= −jj .)(,1 = pj В момент h+ по поступившему значению )( hx + ОР должен решить за- дачу (2) для позиции )).(,( hxh ++  С этой целью он параллельно выполняет следующие операции. I. Формирование и решение аппроксимационных задач путем преобразования сохраненной информации 1–9; II. Решение уравнений доводки для позиции ))(,( hxh ++  с использова- нием информации а–d. При отсутствии сходимости процедуры доводки ОР решает заново уравнения доводки, формируя структуру и начальные приближения по результатам решения аппроксимационных задач для позиции )).(,( hxh ++  Построив решение Проблемы управления и информатики, 2007, № 3 17 уравнений доводки, ОР на промежутке [2,[ hh ++ подает на вход системы сигнал )()( 1 hhu +=+ и обновляет данные 1–9, а–d для момента .h+ Если в момент hT при решении аппроксимационных задач не существует конечного шага ,0*  при котором появляется новый нуль у варьированного коуправления либо обращается в нуль опорная компонента варьированного век- тора потенциалов, то задача (2) для позиции ))(,(  x не имеет допустимых управлений, т.е. под действием возмущений текущее состояние )(x оказывает- ся за пределами множества .X В [9] приведены оценки трудоемкости метода, позволяющие сформулировать требования к быстродействию микропроцессоров, реализующих ОР, для того чтобы время вычисления сигнала )(u для оптимизирующей системы не пре- восходило h единиц реального времени. 6. Пример Полученные результаты проиллюстрируем на задаче оптимального переме- щения двухмассовой колебательной системы в заданную окрестность нуля в про- странстве компонент :, 21 xx min,)( 15 0 → dttu ,31 xx = ,42 xx = ,213 uxxx ++−= ,1,0 214 xxx −= ,5,1)0(1 =x ,1)0(2 =x ,0)0()0( 43 == xx (24) },25,0:{)15( 2 2 2 1 4 +=  xxRxXx ].15,0[,1)(0 = Tttu В качестве первой линейной аппроксимации множества X возьмем множе- ство }.5,05,0:{ 21 4)1( = xxRxX Для достижения точности 410−= вы- полнения терминального ограничения потребовалось решить пять аппроксимаци- онных задач. В табл. 1 приведены данные о решении аппроксимационных задач (k — номер задачи; ,0)( s kT )( 0n k T — оптимальные опорные моменты и множество неопорных нулей коуправления; ),15(ˆ1x )15(ˆ2x — компоненты вектора состояния в момент ,15=t достигаемого под действием оптимального программного уп- равления k-й задачи; 25,0)15(ˆ)15(ˆ 2 2 2 1 −+= xxr — невязка терминального ограни- чения). При r к ограничениям задачи добавляется ограничение ,ˆˆ 21 gxxh + где ),15(ˆ/)15(ˆˆ 21 xxh = ;ˆ15,0ˆ 2hg += A — трудоемкость построения оптималь- ной опоры k-й задачи. При этом период квантования .05,0=h Таблица 1 k 0)( s kT )( 0n k T )15(ˆ),15(ˆ 21 xx R Добавляемое ограничение A 1 1,9; 11,1 8,95 0,499995; 0,499998 0,249993 0,999993x1 + x2  0,707104 0,297 2 8,6 2,3; 11,0 0,415321; 0,291786 0,007631 1,423376x1 + x2  0,869770 0,09 3 8,65; 11,05 2,25 0,384210; 0,322897 0,001880 1,189886x1 + x2  0,777147 0,027 4 2,25 8,65; 11,05 0,394632; 0,307577 0,000338 1,283036x1 + x2  0,813354 0,02 5 8,65; 11,05 2,25 0,388731; 0,314599 0,000084 — 0,013 Таким образом, суммарная трудоемкость решения аппроксимационных задач с учетом подготовки предварительной информации, требующей двух полных ин- тегрирований прямой и сопряженной систем, составила 2,447. 18 ISSN 0572-2691 На рис. 1 представлены проекции на плоскость ),( 21 xx оптимальных траекто- рий первой (пунктирная линия) и пятой (сплошная линия) аппроксимационных задач. x1 x2 −5 −4 −3 −2 −1 0 1 2 3 4 5 −5 −4 −3 −2 −1 0 1 2 3 4 5 x1(0), x2(0) Рис. 1 Данные о выполнении доводки приведены в табл. 2 (l — номер итерации; , )(l jt ,,1 pj = — точки переключения управления; )(l — множитель Лагранжа; ),15(1x )15(2x — компоненты терминального состояния, достигаемого под дей- ствием управления с точками переключения , )(l jt ;,1 pj = )( )(lyRR = — норма невязки уравнений доводки; r — невязка терминального ограничения; A — трудо- емкость выполнения l-й итерации). Таблица 2 l , )(l jt pj ,1= (l) x1(15), x2(15) R r A 0 2,25; 8,65; 11,05 3,249148 0,396903; 0,312078 0,0049 0,0049 — 1 2,257103; 8,666465; 11,072986 3,271966 0,386928; 0,317210 0,0034 0,0003 0,001532 2 2,261040; 8,671100; 11,074703 3,280388 0,386226; 0,317550 0,0028 10−5 0,0003 3 2,262557; 8,672708; 11,074813 3,280547 0,386201; 0,317568 0,0011 10−6 0,0001 4 2,263122; 8,673282; 11,074824 3,280377 0,386203; 0,317565 0,0004 10−7 3,8 10−5 5 2,263328; 8,673491; 11,074827 3,280318 0,386204; 0,317563 0,0001 10−8 1,4 10−5 6 2,263440; 8,673605, 11,074829 3,280286 0,386205; 0,317562 10−5 10−10 8 10−6 Таким образом, найдено ОУ задачи (24) в классе кусочно-непрерывных функций:      = [.15;[11,074829 [8,673605;[2.26344 ,0 [,11,074829[8,673605; [26344,2[0; 1, )(0 t t tu (25) Критерий качества равен 4,664664. Учитывая положение точек переключения управления (25), при выполнении приближенной дискретизации ставим точки переключения дискретного управления в двух моментах из совокупности  = {2,25; 8,65; 11;05}. В оставшейся точке 1q на промежутке длины h = 0,05 вычисляем сигнал управления, обеспечивающий вы- полнение терминального ограничения. Результаты приближенной дискретизации приведены в табл. 3 (q1 — точка дискретизации управления; )( 1qu — управляющее воздействие на промежутке [;,[ 11 hqq + J — соответствующее зна- чение критерия качества задачи (24)). При 65,8=q значение )( 1qu оказалось больше 1. Таблица 3 q1 u(q1) J 2,25 0,329444 4,666472 11,05 0,315228 4,665761 Проблемы управления и информатики, 2007, № 3 19 Решив задачу (18), получаем управление            = [,11,1[11,05; 0,474539, ,[8,7[8,65; 0,839582, [,15[11,1; [8,65[2,25; ,0 [,11,05[8,7; [2,25[0; ,1 )( t t t t tu критерий качества равен 4,665706. Приведем результаты позиционного решения задачи (24). Пусть на рассмат- риваемую систему действует неизвестное ОР кусочно-непрерывное возмущение и поведение реальной системы управления описывается уравнениями ,31 xx = ,42 xx = ,213 uxxx ++−= ),(1,0 214 twxxx +−= .0)0()0(,1)(,5,1)0( 4321 ==== xxtxx Действующее на систему возмущение имеет вид ,2sin2,0)( ttw −= [,10,0[t ,0)(  tw [.15,10[t На рис. 2 представлена динамика точек ),(0 jt ,3,1=j переключения ОУ )),(,(0  xtu ,Tt вычисленных ОР путем решения уравнений доводки в мо- менты   {0, h, 2h,…, 10}, h = 0,05. Регулятором выработано управление      = [.15 ;[10,643431 [8,9[2,35; ,0 [,434316[8,9; [2,35[0; ,1 )(u t )(0 tt j    6 8 10 12 14 0 2 4 6 8 10 12 14 Рис. 2 В момент 15=t компоненты ,1x 2x достигли состояния =))15(),15(( 21 xx = (0,334278; 0,371831) при критерии качества 4,093431. Заключение В работе предложен новый численный итерационный метод синтеза опти- мального программного управления линейной динамической системой с нели- нейными терминальными ограничениями. Он характеризуется возможностью бо- лее быстрого вычисления параметров ОС по сравнению с существующими мето- дами и использованием небольшого объема информации по каждой итерации численного алгоритма. Указанные особенности метода позволяют вычислять опти- мальную ОС в реальном времени в нелинейных адаптивных системах управления. 20 ISSN 0572-2691 Н.В. Балашевич ОПТИМІЗАЦІЯ ЛІНІЙНОЇ СИСТЕМИ КЕРУВАННЯ З ТЕРМІНАЛЬНИМИ ОБМЕЖЕННЯМИ Запропоновано метод обчислення оптимального програмного керування для лі- нійної динамічної системи з нелінійними термінальними обмеженнями, що ба- зується на розв’язанні послідовності лінійних допоміжних задач оптимального керування. Обгрунтовано застосовність процедур методу для реалізації опти- мального зворотного зв’язку в режимі реального часу. Наведено результати чи- сельних експериментів. N.V. Balashevich OPTIMIZATION OF LINEAR CONTROL SYSTEM UNDER TERMINAL CONSTRAINTS A method of computing an optimal open-loop control for a linear dynamical system under nonlinear terminal constraints is suggested. The method is based on solving a sequence of linear auxiliary optimal control problems. Applicability of the devel- oped procedures for real-time implementation of optimal feedback is justified. Numerical results are given. 1. Габасов Р., Кириллова Ф.М. Принципы оптимального управления // Докл. НАН Белару- си. — 2004. — 48, № 1. — С. 15–18. 2. Büskens C., Maurer H. SQP-methods for solving optimal control problems with control and state constraints: Adjoint variables, sensitivity analysis and real-time control // J. Comput. Appl. Math. — 2000. — 120, N 1–2. — P. 85–108. 3. Diehl M., Bock H.G., Schlöder J. A real-time iteration scheme for nonlinear optimization in opti- mal feedback control // SIAM J. Control Optimization. — 2005. — 43, N 5. — P. 1714–1736. 4. Maurer H., Augustin D. Sensitivity analysis and real-time control of parametric optimal control problems using boundary value methods // Online optimization of large scale systems / Ed. by M. Grötschel et al. — Berlin : Springer, 2001. — P. 17–55. 5. Camacho E.F., Bordons C. Model predictive control. — Berlin : Springer, 2004. — 405 p. 6. Maciejowski J. Predictive control with constraints. — Essex : Pearson Education, 2002. — 331 p. 7. Morari M., Lee J.H. Model predictive control : Past, present and future // Computers & Chemical Engineering. — 1999. — 23, N 4. — P. 667–682. 8. Mayne D.Q., Rawlings J., Rao C., Scokaert P. Constrained model predictive control : Stability and optimality // Automatica. — 2000. — 36. — P. 789–814. 9. Балашевич Н.В., Габасов Р., Кириллова Ф.М. Численные методы программной и позицион- ной оптимизации линейных систем управления // Журн. вычисл. матем. и мат. физики. — 2000. — 40, № 6. — С. 838–859. 10. Альсевич В.В., Габасов Р., Глушенков В.С. Оптимизация линейных экономических моде- лей. — Мн. : БГУ, 2000. — 210 с. 11. Балашевич Н.В., Габасов Р., Калинин А.И., Кириллова Ф.М. Оптимальное управление не- линейными системами // Журн. вычисл. матем. и мат. физики. — 2002. — 42, № 7. — С. 969–995. 12. Габасов Р., Кириллова Ф.М., Хомицкая Т.Г. Программные и позиционные решения терми- нальных линейно-выпуклых задач оптимального управления // Изв. вузов. Математика. — 2004. — № 12. — С. 3–16. 13. Габасов Р., Дмитрук Н.М., Кириллова Ф.М. Оптимизация многомерных систем управления с параллелепипедными ограничениями // Автоматика и телемеханика. — 2002. — № 3. — С. 3–26. 14. Федоренко Р.П. Приближенное решение задач оптимального управления. — М. : Наука, 1978. — 487 с. 15. Габасов Р., Кириллова Ф.М. Принцип максимума в теории оптимального управления. — Мн. : Наука и техника, 1974. — 272 с. Получено 04.05.2006 После доработки 14.02.2007