Стабилизация импульсных динамических систем с конечным последействием при наличии марковских параметров. Часть 2
Розглянуто задачу побудови імпульсної динамічної системи зі скінченою післядією з урахуванням марковських збурень. Ця система випадкової структури повинна мати властивість асимптотичної стійкості за ймовірністю та забезпечувати наперед задану оптимальність перехідного процесу....
Saved in:
| Date: | 2008 |
|---|---|
| Main Authors: | , , |
| Format: | Article |
| Language: | Russian |
| Published: |
Інститут кібернетики ім. В.М. Глушкова НАН України
2008
|
| Series: | Проблемы управления и информатики |
| Subjects: | |
| Online Access: | https://nasplib.isofts.kiev.ua/handle/123456789/209129 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| Journal Title: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Cite this: | Стабилизация импульсных динамических систем с конечным последействием при наличии марковских параметров. Часть 2 / В.С. Королюк, В.И. Мусуривский, В.К. Ясинский // Проблемы управления и информатики. — 2008. — № 3. — С. 5-20. — Бібліогр.: 17 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| id |
irk-123456789-209129 |
|---|---|
| record_format |
dspace |
| spelling |
irk-123456789-2091292025-11-16T01:11:49Z Стабилизация импульсных динамических систем с конечным последействием при наличии марковских параметров. Часть 2 Стабілізація імпульсних динамічних систем зі скінченою післядією за наявності марковських параметрів. Частина 2 Stabilization of impulse dynamical systems with finite aftereffect under the presence of Markovian parameters. Part II Королюк, В.С. Мусуривский, В.И. Ясинский В.К. Проблемы динамики управляемых систем Розглянуто задачу побудови імпульсної динамічної системи зі скінченою післядією з урахуванням марковських збурень. Ця система випадкової структури повинна мати властивість асимптотичної стійкості за ймовірністю та забезпечувати наперед задану оптимальність перехідного процесу. The problem of creation of impulse dynamical system with finite aftereffect in the consideration of Markoff disturbance is considered. This system of random structure must be asymptotically stable by the probability and provide preassigned optimality of a transient process. 2008 Article Стабилизация импульсных динамических систем с конечным последействием при наличии марковских параметров. Часть 2 / В.С. Королюк, В.И. Мусуривский, В.К. Ясинский // Проблемы управления и информатики. — 2008. — № 3. — С. 5-20. — Бібліогр.: 17 назв. — рос. 0572-2691 https://nasplib.isofts.kiev.ua/handle/123456789/209129 519.718:519.217:519.837:517.929 10.1615/JAutomatInfScien.v40.i5.20 ru Проблемы управления и информатики application/pdf Інститут кібернетики ім. В.М. Глушкова НАН України |
| institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| collection |
DSpace DC |
| language |
Russian |
| topic |
Проблемы динамики управляемых систем Проблемы динамики управляемых систем |
| spellingShingle |
Проблемы динамики управляемых систем Проблемы динамики управляемых систем Королюк, В.С. Мусуривский, В.И. Ясинский В.К. Стабилизация импульсных динамических систем с конечным последействием при наличии марковских параметров. Часть 2 Проблемы управления и информатики |
| description |
Розглянуто задачу побудови імпульсної динамічної системи зі скінченою післядією з урахуванням марковських збурень. Ця система випадкової структури повинна мати властивість асимптотичної стійкості за ймовірністю та забезпечувати наперед задану оптимальність перехідного процесу. |
| format |
Article |
| author |
Королюк, В.С. Мусуривский, В.И. Ясинский В.К. |
| author_facet |
Королюк, В.С. Мусуривский, В.И. Ясинский В.К. |
| author_sort |
Королюк, В.С. |
| title |
Стабилизация импульсных динамических систем с конечным последействием при наличии марковских параметров. Часть 2 |
| title_short |
Стабилизация импульсных динамических систем с конечным последействием при наличии марковских параметров. Часть 2 |
| title_full |
Стабилизация импульсных динамических систем с конечным последействием при наличии марковских параметров. Часть 2 |
| title_fullStr |
Стабилизация импульсных динамических систем с конечным последействием при наличии марковских параметров. Часть 2 |
| title_full_unstemmed |
Стабилизация импульсных динамических систем с конечным последействием при наличии марковских параметров. Часть 2 |
| title_sort |
стабилизация импульсных динамических систем с конечным последействием при наличии марковских параметров. часть 2 |
| publisher |
Інститут кібернетики ім. В.М. Глушкова НАН України |
| publishDate |
2008 |
| topic_facet |
Проблемы динамики управляемых систем |
| url |
https://nasplib.isofts.kiev.ua/handle/123456789/209129 |
| citation_txt |
Стабилизация импульсных динамических систем с конечным последействием при наличии марковских параметров. Часть 2 / В.С. Королюк, В.И. Мусуривский, В.К. Ясинский // Проблемы управления и информатики. — 2008. — № 3. — С. 5-20. — Бібліогр.: 17 назв. — рос. |
| series |
Проблемы управления и информатики |
| work_keys_str_mv |
AT korolûkvs stabilizaciâimpulʹsnyhdinamičeskihsistemskonečnymposledejstviemprinaličiimarkovskihparametrovčastʹ2 AT musurivskijvi stabilizaciâimpulʹsnyhdinamičeskihsistemskonečnymposledejstviemprinaličiimarkovskihparametrovčastʹ2 AT âsinskijvk stabilizaciâimpulʹsnyhdinamičeskihsistemskonečnymposledejstviemprinaličiimarkovskihparametrovčastʹ2 AT korolûkvs stabílízacíâímpulʹsnihdinamíčnihsistemzískínčenoûpíslâdíêûzanaâvnostímarkovsʹkihparametrívčastina2 AT musurivskijvi stabílízacíâímpulʹsnihdinamíčnihsistemzískínčenoûpíslâdíêûzanaâvnostímarkovsʹkihparametrívčastina2 AT âsinskijvk stabílízacíâímpulʹsnihdinamíčnihsistemzískínčenoûpíslâdíêûzanaâvnostímarkovsʹkihparametrívčastina2 AT korolûkvs stabilizationofimpulsedynamicalsystemswithfiniteaftereffectunderthepresenceofmarkovianparameterspartii AT musurivskijvi stabilizationofimpulsedynamicalsystemswithfiniteaftereffectunderthepresenceofmarkovianparameterspartii AT âsinskijvk stabilizationofimpulsedynamicalsystemswithfiniteaftereffectunderthepresenceofmarkovianparameterspartii |
| first_indexed |
2025-11-16T02:05:03Z |
| last_indexed |
2025-11-17T02:08:16Z |
| _version_ |
1849001557924773888 |
| fulltext |
© В.С. КОРОЛЮК, В.И. МУСУРИВСКИЙ, В.К. ЯСИНСКИЙ, 2008
Проблемы управления и информатики, 2008, № 3 5
ПРОБЛЕМЫ ДИНАМИКИ УПРАВЛЯЕМЫХ СИСТЕМ
УДК 519.718:519.217:519.837:517.929
В.С. Королюк, В.И. Мусуривский, В.К. Ясинский
СТАБИЛИЗАЦИЯ ИМПУЛЬСНЫХ ДИНАМИЧЕСКИХ
СИСТЕМ С КОНЕЧНЫМ ПОСЛЕДЕЙСТВИЕМ
ПРИ НАЛИЧИИ МАРКОВСКИХ ПАРАМЕТРОВ.
Часть 2
1. Основная теорема об оптимальной стабилизации
Метод решения задачи об оптимальной стабилизации будем строить при
двух основных ограничениях:
1) синтез оптимального управления ),,,(0 hyxtu строится по принципу пол-
ной обратной связи, т.е. существует возможность полного и точного измерения
фазового вектора mtxtx R ),()( в любой момент времени ;0tt
2) предполагается, что известна структура ),(t в которой находится систе-
ма (1), приведенная в работе [1], в данный момент времени 0tt и которая не за-
висит от цепи Маркова k 0( kk соответствует моменту ).Stk
Отказ от этих двух ограничений приводит к необходимости использования
специальных методов оценки состояния (n1)-мерного марковского процесса
)}(),({ ttx по доступному измерению неполного и неточного значения наблю-
даемого сигнала [2] .
Отметим, что для стохастических динамических систем, в которых отсутст-
вуют марковские параметры и импульсные марковские переключения, решение
задачи оценивания, полученное с помощью нелинейной фильтрации, приведено в
монографии [3, 4], а для систем со случайной структурой эта проблема рассмат-
ривается в работе [5].
Метод решения задачи оптимальной стабилизации [1] основан на непосред-
ственной связи между методом функционалов Ляпунова–Красовского [2] и мето-
дом динамического программирования Беллмана [6, 2], который лежит в основе
теории аналитического конструирования регуляторов [7, 8] для детерминирован-
ных систем. В работе [9] был обоснован метод функций Ляпунова исследования
устойчивости для стохастических систем.
Указанные направления исследований дали возможность построить общую
теорию оптимального управления для стохастических систем без последействия в
серии работ [8].
Принципиально новым моментом, предложенным в работе [2], стало допу-
щение о разрывах фазовых траекторий динамических систем в случайные момен-
ты времени, в результате которых происходят внутренние изменения структуры
системы.
6 ISSN 0572-2691
По-видимому, одно из обобщений в теории оптимальной стабилизации за-
ключается в введении импульсных переключений в динамические системы с ко-
нечным последействием с учетом марковских возмущений, что и послужило
предметом настоящих исследований.
Докажем основное утверждение об оптимальной стабилизации.
Теорема 1. Пусть для импульсной динамической системы с конечным после-
действием, приведенной в [1] (см. уравнения (1)–(3)), которая описывается диф-
ференциально-функциональным уравнением (ДФУ)
,),),(,()( dtuxttatdx t (1)
характеризуется импульсными марковскими воздействиями
),),(),(,()( kkkktt
txttgtx
k
(2)
где },,{ N ntSt nk ,lim
n
n
t и начальным условием
),],0,[()(00
m
tx RDD ,)( 0 Y yt ,
0
H hk (3)
при условии скачка (см. (4) из работ [1, 2])
:)(),()}()0(),()({ **** dzοdzztptxtxdzzztx ij P (4)
1) существует положительно-определенный функционал по ),,]0,[( mRD
),,,(0 hyt v такой, что последовательность функционалов
),,,(),,( 00 hythy kk
vv (1)
состоит из функционалов Ляпунова, и задана последовательность r-мерных функ-
ций-управлений
),,,(),,( 00 hytuhyu kk
,01 ttt kk ,,,,2,1,0 nk (2)
n
n
tlim ,Yy ,Hh (3)
причем },{ 0
k
v }{ 0
ku измеримы по всем аргументам;
2) последовательность ),,(0 hy
k
v в области
,00 ttt k ),],0,[( mRD ,Yy ,Hh (4)
допускает пределы [1]:
бесконечно малый высший при r
;),,(inf)(
,
,
hyr k
rh
yk
H
YN
(5)
бесконечно большой низший при 0r
;0),,(sup)(
,
,
hyr k
rh
yk
H
YN
(6)
Проблемы управления и информатики, 2008, № 3 7
3) последовательность функционалов
0)),,(,,,,( 0 hyuhyt
k
W (5)
из критерия [1]
),,,(
0000 ku ykI
,},,)()][,],[),(,({
00 000
0
dtxyttuxttW kt
k
kt
tk
E (7)
где 0),,,,,( uhxytW kt — неотрицательный функционал по третьему ар-
гументу, положительно-определенный по )],0,[( mRD ],,[ 1 kk ttt
;,,,2,1,0 nk
4) последовательность слабых инфинитезимальных операторов ,),,)(( 0
0
kuk
hy vQ
в силу системы (1) ],,[ 1 kk ttt вычисленных при ),,,(00 hyuu
kk
удовлетво-
ряет условию
);,,,,(),,)(( 00
0 kuk
uhythy
k
WvQ (6)
5) величина ),,,,(),,)(( 0 uhythy uk
WvQ достигает минимума при
,0uu т.е.
),,,,(),,)(( 00
0 uhythy
uk
WvQ
.0)},,,,(),,)({(min 0
uhythy uk
u r
W
R
vQ (7)
Тогда управление ),,,,(0 hytu k ,0k стабилизирует решение задачи Ко-
ши (1), (3) с импульсным возмущением (2) до асимптотической устойчивости по
вероятности, причем выполняется равенство
0
00
0
00
00
0
0
},,)()][,,][,)(,({
),,,(
0
0
k t
ktkt
k
k
dthxyttuxtt
yt
WE
v
),,,,(},,)][,,][,)(,({min 00
0
0
00
0 hytdthytuxtt
u
k t
kt
u
k
r
IWE
R
(8)
где }{ E — операция условного математического ожидания.
Доказательство. I. Асимптотическая устойчивость по вероятности в целом
импульсной динамической системы (1)-(3) с условием скачка (4) при
),,,,(0 hytuu k ,0k сразу следует из теоремы 2 работы [1], поскольку
функционалы ),,,,(0 hyt v ,0tttk ,0k удовлетворяют условиям этой тео-
ремы. Равенство (8), очевидно, тоже следствие этой теоремы.
8 ISSN 0572-2691
II. Докажем, что управления ),,,,(0 hytu k ,1 kk ttt ,0k стабилизи-
руют решение системы (1)–(3).
Доказательство проведем от противного. Пусть существует управление
),,,,(),,,( 0* hytuhytu kk которое при подстановке в (1) реализует такое ре-
шение ][* tx по некоторому начальному условию (2), что
).,,,(),,,( 00
0
00
0 0 hythyt
uu
II (9)
Из условия (7) следует неравенство
)).,,,(,,,,(),,)(( *0 hytuhythy
uk
WvQ (10)
Усредним (10) по случайным величинам })(],[{ * ttx и проинтегрируем по t
от 0t до .Tt Учитывая аддитивность интеграла, на основании формулы Дынки-
на [10] получаем
),,,(},,)),(,][,({
00
00
0
000
)(
*0
kkTkT ytyTxT vvE
dtytuxtt kkt
t
},,])[,,][,)(,({
0
0
00**WE
.},,])[,,][,)(,({
0
00**
0
k
kkt
t
dtytuxtt
k
WE (11)
Из (9) следует сходимость интеграла в правой части неравенства (11) при
,T а значит, и сходимость ряда в (11).
Далее, из сходимости интеграла в правой части (11) следует, что подынте-
гральное выражение стремится к нулю, т.е.
,0},,])[,,][,)(,({lim 00**
hytuxtt kt
t
WE (12)
а значит,
.0)},][,)(,({lim )(
*0
TkT
t
xTTvE (13)
Таким образом, неравенство (11) в естественном случае (из 0}{
t
WE сле-
дует )0}{ 0
t
vE превращается в неравенство
).,,,(),,,(),,,(
00
0
0
00
0
00
0
00
0
0
kukuk ytytyt IIv (14)
Полученное неравенство (14) противоречит предположению (9); следовательно,
это доказывает оптимальность управления ).,,,(0 hxytu
Следствие 1. В случае, когда )(t — марковская цепь, допускающая разло-
жение [1]
),()(})()({ tοttqyytytt ijjij P (8′)
получаем управление, которое должно удовлетворять оптимальному функционалу
Ляпунова ),,(0 hxy
k
v и оптимальному управлению ).,,(0 hxyu
k
Проблемы управления и информатики, 2008, № 3 9
С учетом формулы (59) из работы [1] и (2.10) из работы [2] первое уравнение
для
0
k
v получим, подставляя ),,(0 hxy
k
v и ),,(0 hxyu
k
в левую часть выраже-
ния (7) для усредненного инфинитезимального оператора .)( 0
uk
vQ
Тогда искомые уравнения в точках ),,( jk yt принимают вид
),,,(),(),,,(),,,( 00
00
hytdzztph
j
ytuyta
t
iij
l
ij
j
kk vv
vv
,0),,,,(),(),,,(),(),,,( 00
uhytdzztqhytdzztphyt ijiijj Wvv (15)
где
m
kkk
0
1
00
,,
vvv
— производные Фреше, ,0kk ),( ztpij опре-
деляются из формулы (4).
Второе уравнение для оптимального управления ),,(0 hxyu
k находим из (15)
дифференцированием по переменной u, поскольку 0uu доставляет минимум
левой части (5)
,0
0
0
uu
kk
k
uu
a Wv
(16)
где
ku
a
— nm -матрица Якоби, составленная из элементов
,,1,,1,
rsmn
u
a
ks
n .,,
1
krkk uuu
WWW
Замечание 1. Методика доказательства теоремы 1 мало отличается от доказа-
тельства соответствующей теоремы об оптимальной стабилизации стохастиче-
ской системы для непрерывной траектории [8]. Это объясняется тем, что несмотря
на разрывные траектории марковских процессов ),(),( ttx пара ))(),(( ttx сто-
хастически непрерывна [11] ],,[ 1 kk ttt ,00 kk что обеспечивает непре-
рывность по t функции
},,,),),(,({ 00
0 hytxtt ktt vv E ].,[ 1 kk ttt
Замечание 2. Уравнение (16), из которого определяются оптимальные управ-
ления ,)( r
k tu R ),,[ 1 kk ttt ,,2,1,0 k по форме совпадает с ),(tu появ-
ляющимся в детерминированных задачах оптимальной стабилизации [12].
Однако уравнение (16) все же учитывает случайную структуру системы (1)–(3)
благодаря оптимальному функционалу Ляпунова–Красовского ),,,(0 hyt v из
уравнения (16).
Замечание 3. Задача оптимальной стабилизации, согласно теореме 1, сво-
дится к решению сложной нелинейной системы уравнений (7) в частных произ-
водных для определения неизвестных функционалов Ляпунова–Красовского
),,,,(00
ikk
hyt vv ,,1 li .0kk
10 ISSN 0572-2691
Отметим, что эту систему можно получить путем исключения управления
),,,,(00 hytuu
k
),,[ 1 kk ttt из уравнений (15), (16). Решение такой системы
даже при наличии современных компьютерных технологий сопряжено с огром-
ными трудностями.
2. Оптимальная стабилизация линейных импульсных систем
дифференциально-разностных уравнений с марковскими параметрами
Рассмотрим линейные стационарные дифференциально-разностные системы,
при которых можно построить удобные алгоритмы решения.
На вероятностном базисе ),,,( FPF задана управляемая линейная стохас-
тическая система, описываемая импульсными дифференциально-разностными
уравнениями (ДРУ) с конечным последействием [13]
dttutBtxtAtxtAtdx ))())(()())(()())((()( 21 ,00 tt (17)
с импульсными марковскими переключениями
),),(),(,()( kkkktt
txttgtx
k
},,{ N ntt nk S ,lim
n
n
t (18)
и начальными условиями
;)( 0
0 Y yt ),],0,([00
m
tx RD ,
0
H hk (19)
)],0,([ mRD — пространство Скорохода [14] непрерывных справа функций,
которые имеют левосторонние пределы. Здесь ,)( mtx R ,ru R 2,1),( iyAi , —
известные матрицы-функции, заданные на множестве },,,{ 21 kyyy Y воз-
можных значений марковской цепи ).(t
Предположим, что условие скачка фазового вектора mtx R)( в момент
*tt изменения структуры системы за счет перехода iyt )( *
в ij yyt )( *
линейно и задается в форме равенства
),()()( *
1
**
txtxKtx s
N
s
sij Q (20)
где )( ss — независимые случайные величины, у которых ,0 sE
,12 sE ijK — заданные )( mm -матрицы.
Отметим, что равенство (20) может заменять общие условия скачка (4):
— для неслучайных скачков (см. (15) в работе [1]) при ;0sQ
— при непрерывном изменении фазового вектора ,0sQ IKij (единич-
ная матрица порядка )).( mm
Качество переходного процесса оценим квадратичным функционалом
),,(
00
0
ku yI
,},,][)),((][][)),((][{
0
0
0
0
dtytutDtutxtCtx
k t
kkk
k
E (21)
где ,0),( hyC 0),( hyD — симметричные матрицы размерности )( mm и
)( rr соответственно.
Проблемы управления и информатики, 2008, № 3 11
В соответствии с теоремой 1 следует найти оптимальный функционал Ляпу-
нова–Красовского ),,(0 hy
k
v и управление ),,(0 hyu
k
],,[ 1 kk ttt ,Stk
.,2,1,0 k
Оптимальный функционал Ляпунова–Красовского ищем в виде
,)()),(()()()),(()(),,( 210
t
t
kkk
dssxsGsxtxtGtxhyv (22)
где ),,( hyG i ,2,1i — положительно-определенные симметричные )( mm -мат-
рицы.
Всюду в дальнейшем, когда )(t описывает марковскую цепь с конечным
числом состояний },,,{ 21 kyyy Y и ,k ,0k — феллеровская цепь Мар-
кова со значениями kh в метрическом пространстве H с переходной вероятно-
стью на k-м шаге ),,( GhkP для упрощения записей используем обозначения
),,(11
kiik hyAA ),,(22
kiik hyAA
),,(11
kiik hyGG ),,(22
kiik hyGG (23)
).,,( kiik hy vv
При необходимости будем вводить аналогичные обозначения.
Далее подставляем функционал (22) в уравнения (15), (16) для получения оп-
тимальных функционалов Ляпунова ),,(0 hy
k
v и оптимальных управлений
),,(0 hyu
k
],[ 1 kk ttt и, учитывая выражение (61) из [1]
),,,,(),()),,,,(,,(),,,)(( 0 hxytdzhzhxytgxythxyt kkkkk vvv
H
PR
получаем
),,,(),()),,,,(,,(
)(2)(
0
22011
hytdzhzhytgyt
GAuBAGtx
kkkk
ikikkikikik
vv P
H
,0)()()()()( 002211
kikkikikikijjksjks
N
ij
uDutxGAtxtxCqGG QQ (24)
.0)(2)(2 01 ikkikik DuBGtx (25)
Заметим, что частная производная по u от разностного оператора )( vR равна
нулю, что подтверждает гипотезу о построении оптимального управления, кото-
рое не зависит от импульсных толчков вида (18) на систему (17).
Из (25) и с учетом переключений (18), ,kk h ,,1 lk находим оптималь-
ное управление при :)( iyt
).()())(( 21110 txCBDtxCBDtxu ikikikikikikik (26)
12 ISSN 0572-2691
На основании матричного равенства
),())()(()()(2 111111 txGAAGtxtxAGtx ikikikikikik
исключив )(0 xuik из (24) и приравняв к нулю матрицу получившейся квадратич-
ной формы, запишем систему матричных квадратных уравнений для определения
искомых матриц ,1
ikG 2
ikG ,,,2,1( li k соответствует полуотрезку :)),[ 1kk tt
)()(2)( 21121221111
ikikikikikikikikikikikikik GGBDBGGGAGAAG
.0)()()( 21
1
2121
ikij
l
ij
ikik
N
s
sjkjksijjkjkij CqGGGGGG QQKK (27)
Таким образом, получаем следующее утверждение.
Теорема 2. Пусть система матричных квадратных уравнений (27) имеет ре-
шения, которые представляют собой положительно-определенные матрицы по-
рядка :)( mm
,01
1 kG ,01
2 kG …, ,01 lkG
,02
1 kG ,02
2 kG …, .02 lkG (28)
Тогда управление (26) доставляет решение задачи об оптимальной стабили-
зации системы ДРУ (17)–(19) с условиями скачка (20) и критерием оптимально-
сти (21), причем
,)())(()(),,(min 020010
0 dssxGsxxGxhy ik
t
t
ikkiu
u
k
k
I ,...,2,1,0k
соответствуют полуотрезкам ).,[ 1kk tt
Следствие 2. При выполнении условий теоремы 2 оптимальная система ДРУ,
полученная из (17) при ),,,(0 hyuu экспоненциально устойчива в среднем
квадратическом.
Это сразу следует из теоремы 4 работы [15], поскольку оптимальная функция
),,(0 hy
k
v удовлетворяет всем условиям этой теоремы.
Замечание 4. Если исключить импульсные марковские переключения (18) для
системы ДРУ (17), то получим теорему 3.1 из работы [13] с учетом постоянного
запаздывания .0
Теорема 3. Пусть система матричных квадратных уравнений
)()(2)( 21121221111
iiiiiiiiiiiii GGBDBGGGAGAAG
,0)()()( 2121
1
21
iij
l
ij
iisjj
N
s
sijjjij CqGGGGGG QQKK ,,1 li (29)
имеет решения, которые заданы положительно-определенными матрицами
,1
1G ,1
2G …, ;1
lG ,2
1G ,2
2G …, .2
lG
Тогда управление
)()()( 21110 txGBDtxGBDxu iiiiiii (30)
Проблемы управления и информатики, 2008, № 3 13
доставляет решение задачи об оптимальной стабилизации системы ДРУ (17) с на-
чальными условиями
,)( 0
0 Y yt ),],0,([00
m
tx RD (31)
условием скачка (20) и критерием оптимальности
,},][))((][][))((][{),(
0
0
0
0
0
dtytutDtutxtCtxyu EI (32)
причем
t
t
iiiu
u
dssxGsxtxGtxy .][)][(][)][(),(min 020010
0I (33)
Пусть выполняются условия теоремы 3, но марковский процесс mt R )( в
системе ДРУ (17) описывает чисто разрывный однородный марковский процесс,
допускающий разложение [1]
),(),,(})(),()({ tοttpttt P
).(),(1})(,)({ tοttptttt P
Условия скачка (20) в этом случае, с учетом выражений ],,[)( 21 Yt
],,[),( 21 имеют такой вид:
),()(),()(
1
*
txtxtx s
N
s
sQK (34)
*t — момент перехода структуры системы ДРУ (17) из состояния
)(t в со-
стояние .)( * t При этом ),( ss sQ имеют тот же смысл, что и в (20).
Тогда, повторяя рассуждения теоремы 2 для системы ДРУ (17) с начальными
условиями (31), получаем следующее утверждение.
Теорема 4. Пусть коэффициенты ),(1 yA ),(2 yA )(yB системы ДРУ (17) не-
прерывны в области ],[ 21 Y и заданы начальные условия (31), тогда опти-
мальный функционал Ляпунова
t
t
dssxGsxtxGtx )()()()()()(),( 210
v
определяется из нелинейного интегрального уравнения
)()(2)())(()()( 221111 GAGAAG
))()()(()()())()(( 21121 GGBDBGG
),())()((),()( 21
2
1
KK GGG
,0),()()())()(( 21
1
21
dpGGGG
N
s
ss QQ (35)
а оптимальное управление при этом имеет вид (30).
14 ISSN 0572-2691
Замечание 5. Для нестационарных линейных систем ДРУ вида
dttuttBtxttAtxttAtdx ))())(,()())(,()())(,(()( 21 (36)
с начальными условиями (31) существование оптимального управления приведет
не к алгебраическим уравнениям типа (29) и не к интегральным уравнениям (35),
а к соответствующим матричным (интегро-дифференциальным) уравнениям типа
Риккати.
Модельная задача 1 [2]. Рассмотрим задачу об оптимальной стабилизации
материальной точки, движущейся по горизонтальной прямой в случайной среде,
когда в случайные моменты времени t происходит мгновенное присоединение
или отбрасывание массы.
Решение. Обозначим )(tx отклонение скорости от номинального значения.
Предположив, что сила сопротивления пропорциональна скорости, получим на
интервалах постоянства массы уравнение
),()()()( tbutkxtdxt (37)
,)0( 0xx ,)0( 0 (38)
где )(t — марковская цепь, },,,,{)( 21 lyyyt Y и заданные вероятности
перехода
).(})()({ tοtqytytt ijij P (39)
Предположим, что модель случайной среды [2] определяется случайными ко-
эффициентами сопротивления
,
),(
)( 0
dt
tdw
ktk
(40)
где ,0k — заданные постоянные, dttdw /),( — стандартный «белый шум» [16].
Пусть в момент
*tt происходит скачкообразное изменение массы от зна-
чения iyt )( *
до .)( *
ij yyt
Если имеет место случай присоединенной массы 0 ij yy ),( ij yy то
считаем, что присоединенная масса обладала до момента времени *t нулевой
скоростью.
Если происходит отбрасывание массы 0 ji yy ),( ij yy то эта масса
имеет нулевую скорость при .*tt
Следовательно, в момент *t скачкообразного изменения массы ji yy
происходит скачкообразное изменение скорости по закону
).()( ** txytxy ji (41)
Отметим, что (41) — следствие теоремы об изменении количества движения
и определяет разрывный характер скорости )(tx уравнения (37).
Решим задачу оптимальной стабилизации решения (37) , (38) управлением
),(0 xyuu до экспоненциальной устойчивости в среднем квадратическом и ми-
нимизируем функционал
.},][][{),( 002
0
200 dtxytutxxyIu
E (42)
Проблемы управления и информатики, 2008, № 3 15
Для определения оптимального управления в соответствии с теоремой 2 сле-
дует найти оптимальную функцию Ляпунова
.)( 20 xcx ii v
Предположим, что марковская цепь }.,{)( 21 yyt Тогда система квадрат-
ных уравнений (29) имеет вид
,01)(2 221
ijijijiiii qcckbcca (43)
где ,10
ii yka ,1 ii byb .1 jiij yyk
Если по физическим соображениям выбрать значения параметров
;5,00 k ;1b ;11 y ;5,02 y ,12112 qq
то получим нелинейную систему
0125,04
,014
12
2
2
21
2
1
ccc
ccc
с положительными решениями
;54,11 c ,73,02 c
а оптимальное управление ),(0 xyu определяется по формуле (26):
.2,46,1
,1,54,1
)(0
ix
ix
xcbxu iii (44)
Отметим, что модель случайной среды (37), (38) достаточно грубая. Она при-
нята для упрощения выкладок.
3. Проблема метода малого параметра
решения задачи об оптимальной стабилизации
Возможность алгоритмического решения задачи об оптимальной стабилиза-
ции линейных систем ДРУ (17), (19) при 02 A раскрывается путем введения
малого параметра [13], [2] (без марковских переключений (18)).
При этом рассмотрим два способа введения малого параметра.
Случай I. Вероятности переходов ji yy марковской цепи )(t малы, т.е.
интенсивности переходов ijq в разложении (8) малы за счет малого параметра
:0
.ijij rq (45)
Случай II. Скачки фазового вектора
mtx R)( малы, т.е. матрицы ijK и sQ
из (20) следует представить в виде
,ijij KIK .ss QQ (46)
Изложим идею метода малого параметра решения задачи об оптимальной
стабилизации без учета марковских переключений (18) [2].
16 ISSN 0572-2691
В этих случаях оптимальный функционал Ляпунова ),,(0 hy v будем искать
в виде сходящегося ряда по степеням :0
).(),()(),,( )1(
0
0 txhyGtxhy rr
r
v (47)
В соответствии с (26) оптимальное управление 0u следует искать в виде
сходящегося ряда
).(),()()(),,(
0
)1(10 txhyGyByDhyu
r
rr
(48)
3.1. Случай I [2]. Подставляя ряды (47), (48), с учетом (45), в (29) и прирав-
нивая коэффициенты при одинаковых степенях ,0 получаем
,0
)0(1)0()0()0(
iiiiiiiii GBDBGAGGA ,...,,2,1 li (49)
N
s
ij
r
is
r
jsij
r
iij
l
i
r
i
r
ii rGGGAGGA
1
)1()1()1(
ij
)()(
)(
~~
QQKK
,
1
1
)(1)(
r
t
tr
iiii
t
i GBDBG (50)
,1r ,
~ )0(1
iiiiii GBDBAA ....,,2,1 li
Отметим, что система (49) состоит из независимых матричных уравнений,
доставляющих при фиксированных li ...,,2,1 решение задачи об оптимальной
стабилизации системы с неизменной структурой
dttuBtxAtdx ii ))()(()( (51)
и соответствующим критерием оптимальности
,}][][][][{),( 0
0
0 dtxtuDtutxCtxxyI iiiu
E (52)
,...,,2,1 li ,0iC .0iD
Предположим, что система матричных квадратных уравнений (49) имеет
единственное положительно-определенное решение ,0
)0(
iG li ...,,2,1 [2].
Уравнения (50) для определения ,0
)(
r
iG ,1r линейные, поэтому они
имеют единственное решение при фиксированных ,,1 li ,1r и произвольных
матрицах, стоящих в правой части (50) [2].
Итак, система матричных уравнений (49), (50) позволяет последовательно
находить коэффициенты
)(r
iG соответствующих рядов (47), (48), начиная с поло-
жительного решения ,
)0(
iG .,1 li
Проблемы управления и информатики, 2008, № 3 17
Далее следует доказать сходимость рядов (47), (48) методом мажорантных
рядов [2].
Справедливо такое утверждение [2].
Теорема 5. Пусть:
1) li ,1 система (51) с неизменной структурой имеет линейное допусти-
мое управление;
2) интенсивности переходов ijq однородной марковской цепи )(t удовле-
творяют условию (45).
Тогда:
а) существует единственное решение задачи оптимальной стабилизации сис-
темы (17)–(19) с 02 A и условием скачка (20) фазового вектора ;)( mtx R
б) оптимальная функция Ляпунова ),(0 xyv и оптимальное управление
),(0 xyu определяются сходящимися рядами (47), (48), коэффициенты которых
определяются соответствующими системами (49), (50).
Модельна задача 2. Рассмотрим задачу об оптимальной стабилизации верх-
него положения равновесия маятника в линейном приближении при условии, что
в случайные моменты времени *t происходит присоединение или отбрасывание
массы [2].
Решение. На интервальном времени постоянства массы уравнение можно за-
писать в виде
,2 lyly ii (53)
где iy — масса груза, l — длина маятника, — угол отклонения от вертикали,
— управляющий момент.
Обозначив
,1x ,2x ,2ulyi ,1 al g
получим систему
,
,
12
21
uaxx
xx
(54)
которая справедлива на интервале постоянства массы.
Пусть в момент времени *t произошло мгновенное изменение массы
.ji yy Тогда выполняются соотношения, которые характеризуют скачки ско-
рости,
),()(),()( *
2
1*
2
*
1
*
1
txyytxtxtx ji
и, значит,
,0
01
),()( **
j
iijij
y
ytxtx KK .))(),(()( *
2
*
1
* txtxtx
Найдем оптимальное управление ),(0 xui минимизирующее функционал
,},][][{),( 0
2
0
2
2
0 dtmytutxxyI iiu
E (55)
где }.,{)( 21 yyt
18 ISSN 0572-2691
Решение )(0 xui ищем в виде ряда (48), ограничиваясь первыми двумя его
членами.
Далее, подставим в (49) величины
,
0
10
a
Ai ,
1
0
iB ,
10
00
iC 1iD
и в результате получим для определения матриц
)0(
iG систему квадратных нели-
нейных уравнений
.012
,0
,02
2
2212
22122211
2
1212
cc
ccacc
cac
(56)
Единственное решение (56) доставляет положительно-определенная матрица
.0
142
214)0(
2
)0(
1
aa
aaa
GG
При значениях параметров ;75,0a ;11 y ;22 y 12112 rr решением
линейной системы (50) будут матрицы [2]
,
375,00
0469,0
)1(
1
G .
5,10
0375,0
)1(
2
G
Следовательно, оптимальное управление с точностью до 2 имеет вид
,)375,02(5,1)(),( 21
)0(
2
)0(
1
1
11
0 xxxGGBxyu
.)5,12(5,1)(),( 21
)1(
2
)0(
2
1
22
0 xxxGGBxyu
3.2. Случай II [2]. Задача оптимального управления решается аналогично [2].
Подставим ряд
0
)(2
r
r
ii GG в (27) и, приравнивая коэффициенты при оди-
наковых степенях , получим с учетом (46) уравнения
,0)(
)0()0()0(1)0()0()0(
iij
l
ij
ijiiiiiiiii CqGGGBDBGGAAG (57)
,)(
~~ )()()()()( r
iij
l
ij
r
i
r
j
r
iii
r
i qGGGAAG Φ
(58)
где
,
~ )0(1
iiiiii GBDBAA
Проблемы управления и информатики, 2008, № 3 19
,
1
2211
)(1
1
1
)()(
ij
l
ij
s
N
s
r
jsij
r
jijij
r
j
r
jij
pr
iiii
r
p
p
i
r
i
qGGGG
GBDBG
QQKKKK
Φ
причем 0
)(
p
iG при .0p
Справедливо такое утверждение [2].
Теорема 6. Пусть:
1) система матричных уравнений (57) имеет единственное положительно-оп-
ределенное решение ,0
)0(
iG ;,1 li
2) скачки фазового вектора mtx R)( удовлетворяют условиям (46).
Тогда при 02 A линейно-квадратичная задача оптимальной стабилиза-
ции (17), (19) минимизации функционала (19) имеет единственное решение в виде
сходящихся рядов (47), (48), причем матрицы ,
)(r
iG ,,1 li ,1r — единствен-
ное решение линейных матричных уравнений (58).
Заметим, что решение задачи оптимизации для импульсных ДРУ (17)–(19) с
минимизацией функционала (21) требует применения современных компьютер-
ных технологий с использованием методов статистического моделирования [17].
В.С. Королюк, В.І. Мусурівський, В.К. Ясинський
СТАБІЛІЗАЦІЯ ІМПУЛЬСНИХ ДИНАМІЧНИХ
СИСТЕМ ЗІ СКІНЧЕНОЮ ПІСЛЯДІЄЮ
ЗА НАЯВНОСТІ МАРКОВСЬКИХ ПАРАМЕТРІВ.
Частина 2
Розглянуто задачу побудови імпульсної динамічної системи зі скінченою піс-
лядією з урахуванням марковських збурень. Ця система випадкової структури
повинна мати властивість асимптотичної стійкості за ймовірністю та забезпе-
чувати наперед задану оптимальність перехідного процесу.
V.S. Korolyuk, V.I. Musurivskiy, V.K. Yasinskiy
STABILIZATION OF IMPULSE
DYNAMICAL SYSTEMS WITH FINITE
AFTEREFFECT IN THE PRESENCE
OF MARKOFF PARAMETERS.
Part II
The problem of creation of impulse dynamical system with finite aftereffect in the con-
sideration of Markoff disturbance is considered. This system of random structure
must be asymptotically stable by the probability and provide preassigned optimal-
ity of a transient process.
1. Королюк В.С., Мусуривский В.И., Ясинский В.К. Стабилизация импульсных динамических
систем с конечным последействием при наличии марковских параметров. Ч. 1 // Проблемы
управления и информатики. — 2008. — № 1. — С. 16–35.
20 ISSN 0572-2691
2. Кац И.Я. Метод функций Ляпунова в задачах устойчивости и стабилизации систем случай-
ной структуры. — Екатеринбург : Изд-во Уральской государственной академии путей со-
общения, 1998. — 222 с.
3. Жакод Ж., Ширяев А.Н. Предельные теоремы для случайных процессов. Т. 1. — М. : Нау-
ка, 1994. — 544 с.
4. Жакод Ж., Ширяев А.Н. Предельные теоремы для случайных процессов. Т. 2. — М. : Нау-
ка, 1994. — 473 с.
5. Казаков Н.Е., Артемьев В.М. Оптимизация динамических систем случайной структуры. —
М. : Наука, 1980. — 382 с.
6. Беллман Р. Динамическое программирование. — М. : Изд-во иностр. лит., 1960. — 324 с.
7. Красовский Н.Н., Летов А.М. К теории аналитического конструирования регуляторов //
Автоматика и телемеханика. — 1962. — 23, № 6. — С. 11–18.
8. Красовский Н.Н., Лидский Э.А. Аналитическое конструирование регуляторов в системах
со случайными свойствами // Там же. — 1961. — 22, № 9. — С. 1145–1150, № 10. —
С. 1273–1278, № 11. — С. 1425–1431.
9. Кац И.Я., Красовский Н.Н. Об устойчивости систем со случайными параметрами // ПММ. —
1960. — 24, вып. 5. — C. 809–823.
10. Дынкин Е.Б. Марковские процессы. — М. : Наука, 1969. — 859 с.
11. Андреева Е.А., Колмановский В.Б., Шайхет Л.Е. Управление системами с последействием. —
М. : Наука, 1992. — 336 с.
12. Вернигора I.В., Ясинська Л.І., Ясинський В.К. Властивості розв’язків динамічних систем
випадкової структури // Наук. вісн. Чернівецького національного ун-ту. Сер. Математичні
науки. — 2005. — Вип. 239. — С. 19-24.
13. Красовский Н.Н. Проблемы стабилизации управляемых движений. Дополнение к книге
Малкина Н.Г. «Теория устойчивости движения». — М. : Наука, 1966. — 530 с.
14. Биллингсли П. Сходимость вероятностных мер. — М. : Наука, 1977. — 352 с.
15. Королюк В.С., Мусуривский В.И., Юрченко И.В. Устойчивость динамических систем с по-
следействием с учетом марковских возмущений // Кибернетика и системный анализ. —
2007. — № 6. — C. 134–146.
16. Тихонов В.И., Миронов М.А. Марковские процессы. — М. : Наука, 1981. — 423 с.
17. Ясинський В.К., Ясинська Л.І., Юрченко І.В. Методи стохастичного моделювання систем. —
Чернівці : Прут, 2002. — 416 с.
Получено 14.01.2008
|