Принцип растяжения времени в эволюционных играх сближения
Встановлено, що еволюційна гра зближення зi змінним запізненням інформації еквівалентна деякій грі з повною інформацією, але з іншими динамікою та термінальною множиною. Цей факт послужив обгрунтуванням принципу розтягування часу, сформульованого в роботі, який значно розширює сферу застосування пер...
Saved in:
| Published in: | Проблемы управления и информатики |
|---|---|
| Date: | 2016 |
| Main Author: | |
| Format: | Article |
| Language: | Russian |
| Published: |
Інститут кібернетики ім. В.М. Глушкова НАН України
2016
|
| Subjects: | |
| Online Access: | https://nasplib.isofts.kiev.ua/handle/123456789/208170 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| Journal Title: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Cite this: | Принцип растяжения времени в эволюционных играх сближения / Г.Ц. Чикрий // Проблемы управления и информатики. — 2016. — № 3. — С. 35-48. — Бібліогр.: 15 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| id |
nasplib_isofts_kiev_ua-123456789-208170 |
|---|---|
| record_format |
dspace |
| spelling |
Чикрий Г.Ц. 2025-10-20T14:00:59Z 2016 Принцип растяжения времени в эволюционных играх сближения / Г.Ц. Чикрий // Проблемы управления и информатики. — 2016. — № 3. — С. 35-48. — Бібліогр.: 15 назв. — рос. 0572-2691 https://nasplib.isofts.kiev.ua/handle/123456789/208170 517.977 10.1615/JAutomatInfScien.v48.i5.20 Встановлено, що еволюційна гра зближення зi змінним запізненням інформації еквівалентна деякій грі з повною інформацією, але з іншими динамікою та термінальною множиною. Цей факт послужив обгрунтуванням принципу розтягування часу, сформульованого в роботі, який значно розширює сферу застосування першого прямого методу Понтрягіна. Для ілюстрації запропонованої методики розглянуто модельний приклад диференціальної гри про м’яку зустріч двох об’єктів другого порядку з різною динамікою. It is established that the evolutionary game of approach with variable information delay is equivalent to certain game with perfect information under other dynamics and terminal set. This fact substantiates the time dilatation principle formulated in the paper, which essentially extends the range of applications of the Pontryagin first direct method. To illustrate suggested technique, the model differential game on soft meeting of two second order objects, having different dynamics, is analyzed. ru Інститут кібернетики ім. В.М. Глушкова НАН України Проблемы управления и информатики Конфликтно-управляемые процессы и методы принятия решений Принцип растяжения времени в эволюционных играх сближения Принцип розтягування часу в еволюційних іграх зближення Principle of time dilatation in evolutionary games of approach Article published earlier |
| institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| collection |
DSpace DC |
| title |
Принцип растяжения времени в эволюционных играх сближения |
| spellingShingle |
Принцип растяжения времени в эволюционных играх сближения Чикрий Г.Ц. Конфликтно-управляемые процессы и методы принятия решений |
| title_short |
Принцип растяжения времени в эволюционных играх сближения |
| title_full |
Принцип растяжения времени в эволюционных играх сближения |
| title_fullStr |
Принцип растяжения времени в эволюционных играх сближения |
| title_full_unstemmed |
Принцип растяжения времени в эволюционных играх сближения |
| title_sort |
принцип растяжения времени в эволюционных играх сближения |
| author |
Чикрий Г.Ц. |
| author_facet |
Чикрий Г.Ц. |
| topic |
Конфликтно-управляемые процессы и методы принятия решений |
| topic_facet |
Конфликтно-управляемые процессы и методы принятия решений |
| publishDate |
2016 |
| language |
Russian |
| container_title |
Проблемы управления и информатики |
| publisher |
Інститут кібернетики ім. В.М. Глушкова НАН України |
| format |
Article |
| title_alt |
Принцип розтягування часу в еволюційних іграх зближення Principle of time dilatation in evolutionary games of approach |
| description |
Встановлено, що еволюційна гра зближення зi змінним запізненням інформації еквівалентна деякій грі з повною інформацією, але з іншими динамікою та термінальною множиною. Цей факт послужив обгрунтуванням принципу розтягування часу, сформульованого в роботі, який значно розширює сферу застосування першого прямого методу Понтрягіна. Для ілюстрації запропонованої методики розглянуто модельний приклад диференціальної гри про м’яку зустріч двох об’єктів другого порядку з різною динамікою.
It is established that the evolutionary game of approach with variable information delay is equivalent to certain game with perfect information under other dynamics and terminal set. This fact substantiates the time dilatation principle formulated in the paper, which essentially extends the range of applications of the Pontryagin first direct method. To illustrate suggested technique, the model differential game on soft meeting of two second order objects, having different dynamics, is analyzed.
|
| issn |
0572-2691 |
| url |
https://nasplib.isofts.kiev.ua/handle/123456789/208170 |
| citation_txt |
Принцип растяжения времени в эволюционных играх сближения / Г.Ц. Чикрий // Проблемы управления и информатики. — 2016. — № 3. — С. 35-48. — Бібліогр.: 15 назв. — рос. |
| work_keys_str_mv |
AT čikriigc principrastâženiâvremenivévolûcionnyhigrahsbliženiâ AT čikriigc principroztâguvannâčasuvevolûcíinihígrahzbližennâ AT čikriigc principleoftimedilatationinevolutionarygamesofapproach |
| first_indexed |
2025-11-27T07:57:45Z |
| last_indexed |
2025-11-27T07:57:45Z |
| _version_ |
1850804481628831744 |
| fulltext |
© Г.Ц. ЧИКРИЙ, 2016
Международный научно-технический журнал
«Проблемы управления и информатики», 2016, № 3 35
КОНФЛИКТНО-УПРАВЛЯЕМЫЕ ПРОЦЕССЫ
И МЕТОДЫ ПРИНЯТИЯ РЕШЕНИЙ
УДК 517.977
Г.Ц. Чикрий
ПРИНЦИП РАСТЯЖЕНИЯ ВРЕМЕНИ
В ЭВОЛЮЦИОННЫХ ИГРАХ СБЛИЖЕНИЯ
Введение
Работа посвящена изложению некоторого подхода к решению эволюционных
игр сближения, для которых не выполнено условие Л.С. Понтрягина, лежащее в ос-
нове прямых методов [1, 2]. Анализ этого условия в случае линейных дифференци-
альных игр был проведен М.С. Никольским [3]. Д. Зонневенд предложил некоторое
его обобщение, используя информацию об управлении противника в прошлом [4].
Суть подхода состоит в искусственном ухудшении информационных возможно-
стей преследователя, а именно в переходе от исходной игры с полной информацией
к дифференциальной игре с той же динамикой и тем же терминальным множеством,
но с запаздыванием информации специального вида, убывающим по мере прибли-
жения траектории игры к терминальному множеству и обращающимся в нуль при
попадании на него. Полученная таким образом игра с запаздыванием информации
исследуется на основе ее эквивалентности некоторой игре с полной информацией
с несколько видоизмененными динамикой и терминальным множеством.
Ключевым моментом является введение числовой функции )(tI , которая
по смыслу является функцией растяжения времени. Схему игрового подхода,
в котором модифицированное условие Понтрягина использует функцию )(tI ,
будем называть принципом растяжения времени. В случае дифференциальной
игры он продемонстрировал свою эффективность при решении задач о мяг-
кой встрече для систем второго порядка, когда функцию )(tI удается найти в
явном виде [4–7]. Рассматривается случай динамики, описываемый эволюци-
онной системой общего вида, охватывающей широкий класс функционально -
дифференциальных систем [8, 9].
1. Эффект запаздывания информации в эволюционных играх
Пусть траектория конфликтно-управляемого процесса задана в виде
dvtfutftgtz
t
t
)))(,,())(,,(()()( 21
0
, ),[ 0 tt , (1)
где nRtz )( , :g
nRt ),[ 0 , — непрерывная вектор-функция. Управле-
ния u и v выбираются игроками из множеств U и ;V ),(, nRKVU а их реа-
36 ISSN 0572-2691
лизации во времени являются измеримыми функциями. Функции ),,(1 utf и
),,(2 vtf , ,)(: 01
nRUtf ,)(: 02
nRVtf почти всюду ограничены и
измеримы по t и , непрерывны по u и v соответственно; :),({)( 0 tt
}.0 0 tt
Примером конфликтно-управляемого процесса (1) является процесс, описы-
ваемый линейной системой дифференциальных уравнений
)()()()( tvtutAztz , 0)0( zz . (2)
Здесь 0)( zetg At , ),,(1 utf ue tA )( , ),,(2 vtf ve tA )( .
Кроме того, задано терминальное множество M цилиндрического вида
,0 MMM (3)
где 0M — линейное подпространство, а M — выпуклый компакт из ортого-
нального дополнения к 0M в ,nR т. е. )(LcoKM ,
0ML .
Игра рассматривается с позиции преследователя ( u ), цель которого — вывод
за конечное время траектории (1) на терминальное множество M при любом
противодействии убегающего ( v ). Предполагается, что Mtg )( 0 .
Пусть — оператор ортогонального проектирования из nR на ,L LRn : .
Тогда выход траектории на терминальное множество в момент t означает вы-
полнение включения .)( Mtz
Задача преследователя усложнена тем, что информация о состоянии игры посту-
пает к преследователю с запаздыванием во времени )(t , где : Rt ),[ 00 —
кусочно-непрерывная функция, 000 )( t , имеющая не более, чем счетное
число разрывов первого рода, и абсолютно непрерывная на интервалах своей не-
прерывности. Кроме того, предполагается, что 1)( t в точках существования
производной )(t (последнее условие обеспечивает поступление свежей инфор-
мации в течение игры).
Предполагается, что игрокам известны параметры конфликтно-управляемого
процесса (1), (3), вектор-функции )(tg , ),,(1 utf и ),,(2 vtf , области управле-
ний U , V и терминальное множество .M
Игра начинается в момент времени ,0t но информацию об управлении убе-
гающего преследователь начинает получать с момента 00 t , где .00 В ходе
игры, т.е. в каждый текущий момент времени ,, 00 ttt к преследователю по-
ступает информация об управлении убегающего в момент )(tt , т.е. ему известно
управление убегающего на отрезке ])(,[ 0 ttt .
Обозначим U , V совокупность измеримых функций со значениями из
,U V соответственно. С позиции информированности преследователя множество
достижимости процесса (1) в момент t при уже реализованных управлениях иг-
роков )(u на ],[ 0 tt и )(v на )](,[ 0 ttt представимо в виде
dvtfdutftgzztZ
tt
t
t
t
))(,,())(,,()(: 21
00
Международный научно-технический журнал
«Проблемы управления и информатики», 2016, № 3 37
. )(,))(,,( V112
vdvtf
t
tt
(4)
Игра с запаздыванием информации считается законченной в момент ,t если
выполняется включение MtZ )( .
Введем следующие обозначения:
)(~ tg )(tg
dutf
t
t
))(,,(1
00
0
,
V
t
tt
vdvtfxxtV )(,))(,,(:))(( 2 . (5)
Пусть на начальном полуинтервале времени ),[ 000 tt преследователь ис-
пользовал некоторое допустимое управление )(00
t
u , U
t
u
)(00 . Введем
вспомогательную переменную:
)(~ tz )(~ tg
dutf
t
t
))(,,(1
00
dvtf
tt
t
))(,,(2
0
. (6)
Сделаем во втором интеграле в выражении (6) для )(~ tz замену переменных
)( 11 и учитывая, что 000 )( t и 0)( ttt при 00 tt , получим
,)))((),(,())(1())(,,()(~)(~
21
0000
dvtfdutftgtz
t
t
t
t
(7)
00 tt .
Из формул (4)–(6) следует, что
)).(()(~)( tVtztZ (8)
Введем в рассмотрение многозначные отображения
,))(())(( tVMtM (9)
))(()( 0 tMMtM . (10)
В (9) была использована операция геометрической разности множеств:
)(}:{ yXXYzzYX
Yy
, nRX , nRY .
Из (8) видно, что если MtZ )( , то )()(~ tMtz и наоборот.
Рассмотрим игру сближения с полной информацией, в которой текущее со-
стояние объекта определяется выражением (7), с терминальным множеством
)(tM (10), имеющим переменную телесную составляющую (9).
Условие 1. Многозначное отображение ))(( tM имеет непустые образы по-
чти при всех .00 tt
Из предыдущих рассуждений следует теорема.
Теорема 1. Пусть в игре (1), (3) с переменным запаздыванием информа-
ции )(t выполнено условие 1 и на полуинтервале [ 000, tt ) преследователь
38 ISSN 0572-2691
применил управление 00 t
u (). Игра (1), (3) может быть завершена в момент ,T
,00 tT тогда и только тогда, когда игра (7), (10) с полной информацией мо-
жет быть завершена в тот же момент времени .T
Будем говорить, что упомянутые игровые задачи эквивалентны.
В случае линейной дифференциальной игры (2) [10] фазовая переменная эк-
вивалентной игры с полной информацией
)(
0
)()(
0
0 )()()(~
tt
AtAt
t
tA dveduezetz
п.в. на полуоси ),[ 0 удовлетворяет дифференциальному уравнению
))(())(1()()(~)(~ )( ttvettutzAtz At
с начальным условием
duezezz
AA )(
0
000
0
0
0)(~~ .
При этом множество ))(( tV в формуле (9) приобретает вид
V
A
t
vdvexxtV )(,)(:))((
)(
0
.
2. Принцип растяжения времени в эволюционных играх
В основе первого прямого метода [1], сформулированного для линейной
дифференциальной игры с полной информацией (2), лежит условие Понтрягина,
отражающее преимущество преследователя над убегающим в ресурсах управле-
ния в терминах параметров игры
VeUetW tAtA)( .0t
Ниже приведено его обобщение на случай динамики (1).
Условие 2. Образы многозначного отображения ),( tW — непустые множе-
ства, т.е.
),,(),,(),( 0201 VttfUttftW )(),( 0tt .
Определение. Функцией растяжения времени назовем скалярную неотрица-
тельную монотонно возрастающую функцию времени )(tI , )[0, t , 0)0( I ,
ttI )( при 0t , которая может иметь не более, чем счетное число разрывов
первого рода, абсолютно непрерывную на интервалах своей непрерывности и та-
кую, что
)(sup
\)[0,
tI
t
, где — множество точек разрыва и недифферен-
цируемости )(tI .
Условие 3. Существует функция растяжения времени )(tI такая, что много-
значное отображение
)),()(),(()(),)(),((),( 0020011 VItIttItfIUtIttItftW
имеет непустые образы почти при всех )(),( 0tt .
Международный научно-технический журнал
«Проблемы управления и информатики», 2016, № 3 39
Далее будет использоваться интеграл Ауманна от многозначного отображе-
ния. Приведем его определение.
Пусть )(tF — измеримое отображение, )(],[: 0
nRPTtF , где )( nRP —
совокупность всех замкнутих подмножеств пространства nR . Интеграл Ауманна
от многозначного отображения )(tF определяется следующим образом [11]:
,)()(
00
)()(
dttfdttF
T
tFf
T
t
где объединение берется по всем измеримым селекторам отображения )(tF .
Теорема 2. Пусть для эволюционной игры (1), (3) с полной информацией вы-
полнено условие 3 и для заданного начального положения )( 0tg существует ко-
нечный момент времени 1t :
,0:min1
ttt
.),(,),())(( 1
0
01
)(
0
0
0
dtWMdUtItftItg
tttIt
t
(11)
Тогда траектория процесса (1) может быть приведена преследователем на
терминальное множество M (3) в момент времени )( 10 tIt при любых допу-
стимых управлениях убегающего.
Доказательство. Разделим отрезок времени ])(,[ 100 tItt на две части —
начальный полуинтервал ),[ 000 tt , где 110 )( ttI , и отрезок
])(,[ 1000 tItt . В силу предположений о непустоте пересечения в определе-
нии времени 1t (11) и непустоте образов многозначного отображения ),(1 tW
существуют допустимое управление )(00
t
u , ),[ 000 tt , точка Mm и
измеримый селектор ),( 11 t , ),(),( 1111 tWt , ),0[ 1t , многозначного
отображения ),( 11 tW , при которых выполняется равенство
dtmdutItftItg
t
t
ttIt
t
),())(,),(())(( 11
0
101
)(
10
1
00
110
0
. (12)
Предлагается следующий способ построения управления преследователя на
отрезке времени )](,[ 10 tIt . На начальном участке времени управление преследо-
вателя положим равным )(00
t
u , ),[ 000 tt . На участке ])(,[ 1000 tItt
траектория системы (1) может быть представлена следующим образом:
))(,,(()()( 0000001
0
0000 tutttfttgttz
t
.)))(,,( 0000002 dtvtttf
40 ISSN 0572-2691
Пусть в каждый момент времени ,00 t ],0[ 1t , управление пресле-
дователя строится не по текущему управлению убегающего, а по его управлению
в момент времени )()( 110 tItIt , где
),)()(()()( 1100110 ttIttItIt
т.е. по управлению убегающего на время )()( 11 ttI раньше. Таким обра-
зом, на отрезке )](,[ 1000 tItt осуществлен переход от исходной игры с пол-
ной информацией к вспомогательной игре с теми же динамикой и терминальным
множеством, но с переменным запаздыванием информации
)()()( 1100 ttIt , ],0[ 1t . (13)
Согласно теореме 1 описанная дифференциальная игра с запаздыванием инфор-
мации эквивалентна игре с полной информацией, в которой траектория задается
уравнением
dtutttfttgttz
t
))(,,()(~)(~
0000001
0
0000
,)))()((),()(),(()( 110110021
0
dtItItvtItIttItftI
t
(14)
)(~
00 ttg )( 00 ttg
duttf
t
t
t
))(,,( 00
00
0
001 .
При этом в соответствии с формулами (9), (10) терминальное множество эк-
вивалентной игры с полной информацией имеет вид
),)(()( 00000 ttMMttM
))()(())(())(( 110000 ttttIVMttVMttM .
Так как согласно (13) 0)())(( 10010 tttIt , то ввиду (5), (9), (10)
MtItM ))(( 10 .
Предпишем преследователю на отрезке ])(,[ 1000 tItt строить свое
управление в виде измеримого решения уравнения
),()(),(()(,),( 11010210000101 tItIttItftItuttItf
],0[,),()))()(( 1111110 ttttItItv , (15)
существование которого обеспечивает теорема Филиппова–Кастена об изме-
римом выборе [12].
Из формул (14) и (12) с учетом выбора управления преследователем (15) сле-
дует, что mtItz ))((~
10 , .Mm Это означает, что преследователь, строя свое
управление по управлению противника в прошлом (15), выведет траекторию ис-
ходной игры (1) с полной информацией из точки 0z на терминальное множество M
в момент времени )( 10 tIt при любых допустимых управлениях убегающего.
Теорема доказана.
Международный научно-технический журнал
«Проблемы управления и информатики», 2016, № 3 41
В случае динамики (2) условие 3 приобретает следующий вид.
Условие 4. Существует функция растяжения времени )(tI , такая что
VetIUetW AtItA )(
1 )()( .\),0[ t
Следствие [4]. Пусть для дифференциальной игры (2), (3) выполнено условие 4
и для заданного начального положения 0z существует конечный момент времени
.)(:0min)(
0
1
))((
)(
0
0
)(
011
t
AtI
ttI
AtI dWMUdezetztt (16)
Тогда из начального состояния 0z игра может быть завершена в момент
времени )( 1tI при любых допустимых управлениях убегающего.
При этом на полуинтервале времени ),0[ 0 управление преследователя при-
нимается равным )(0
u , ),0[ 0 , а на отрезке времени ],[ 100 tt оно стро-
ится в виде измеримого решения уравнения
],0[),())()(()()( 11111
)(
10
)( 11 tttItIvetIue
AtIAt
, (17)
где управление )(0
u , ),0[ 0 , и измеримый селектор )(1 , ],0[ 1t , мно-
гозначного отображения )(1 W определяются условием (16).
3. Пример. Мягкое сближение разнотипных объектов
Пусть движение преследователя описывается системой уравнений
uxx , nRx , 1u , (18)
а объект, уклоняющийся от встречи, совершает колебательные движения согласно
динамике
,2 2 vyyhy ,nRy 1v , (19)
где .0,,,, h
В отсутствие управляющего воздействия (v = 0) поведение системы (19)
определяется корнями характеристического уравнения .02 22 hss Рассмат-
ривается случай малого вязкого трения, когда ,22 h где параметр h — интен-
сивность уменьшения амплитуды колебаний системы, а 22 h — демпфи-
рованная угловая частота колебаний системы с вязким трением. Такая система
описывает затухающие колебания [13].
Заданы начальные положения и скорости объектов:
,)0( 0xx ,)0( 0xx ,)0( 0yy .)0( 0yy
Цель преследователя — достичь в некоторый конечный момент времени
совпадения геометрических положений и скоростей объектов, т.е. их «мягкой
встречи» [14].
42 ISSN 0572-2691
Положив ,),,,(),,,( 4
2121
nRyyxxyyxxz сведем уравнения (18), (19)
к виду (2), где
hEEOO
EOOO
OOEO
OOEO
A
22
,
O
O
S
O
U ,
S
O
O
O
V ,
0
0
0
0
0
y
y
x
x
z
.
Здесь O и E — нулевая и единичная nn матрицы, S — единичный шар в R
n
с центром в нуле. Фундаментальная матрица объединенной системы имеет вид
Ett
h
etEeOO
tEeEtt
h
eOO
OOEeO
OOE
e
E
e
htht
htht
t
t
tA
cossinsin
sin
1
cossin
1
2
.
Теперь запишем условие 4 для рассматриваемой дифференциальной игры:
1 )(
)(
1
1
)(cos)(sin)(
)(sin)(
1
)(
v thIt
thI
t
u vtItI
h
etIue
vtIetIu
e
tW .0t (20)
Оно выполняется, если существует пара n -мерных векторов ,)(1 td )(1 td [3]
таких, что для каждого вектора ,v ,nRv ,1v найдется вектор ,u ,nRu
,1u для которых одновременно удовлетворяются следующие равенства:
.)()(cos)(sin)(
,
1
)()(sin)(
2
)(
1
)(
uetdvtItI
h
etI
u
e
tdvtIetI
tthI
t
thI
(21)
В частности, уравнения (21) должны выполняться при ,0v поэтому имеем
,
1
)( 01 u
e
td
t
02 )( uetd t ,
где 0u — управление, соответствующее .0v Подставив )(1 td , )(2 td в си-
стему (21), получим равенства
),(
1
)(sin)( 0
)( uu
e
vtIetI
t
thI
.)(cossin)( 0
)( uuevtItI
h
etI tthI
Международный научно-технический журнал
«Проблемы управления и информатики», 2016, № 3 43
Из них следует соотношение, которому должна удовлетворять функция
растяжения времени )(tI :
te1
)(cos)(sin ttI
h
)(sin tI
e t . (22)
Функцию )(tI , ),0[ t , будем строить поэтапно с помощью некоторой
вспомогательной функции )(tJ , ),0[ t . Пусть )(tJ удовлетворяет (22),
принимает значения на полуинтервале
2
,0 , где ,0)(cos tJ ,0)(sin tJ
и такая, что
.0)(cos)(sin
tJtJ
h
Тогда знаком модуля в равенстве (22) можно пренебречь и получить
уравнение для )(tJ :
)(tg tJ
1
1
1
t
t
e
h
e
. (23)
Отсюда имеем
.
1
1
1
arctg
1
)(
t
t
e
h
e
tJ (24)
Видим, что на всем промежутке времени ),0[ функция )(tJ монотонно
возрастает, ,0)0( J при этом
.arctg
1
)(
h
tJ
t
Поскольку
h
arctg
1
является конечной величиной, требование ttJ )(
,0t которому, согласно определению, должна удовлетворять функция
растяжения времени, не выполняется. Вычислим производную функции )(tJ :
2
2
2
11
1
)(
tt
t
ee
h
e
tJ . (25)
Легко убедиться, что 1)0( J и при условии
h2 (26)
1)( tJ при ),0( tt , 1)( tJ при tt ,
)2(1ln
1
2
ht .
44 ISSN 0572-2691
Это означает, что функция )(tJ на полуинтервале ),0[ t растет быстрее,
а при tt — медленнее времени .t Поэтому ввиду того, что 0)0( J ,
h
tJ
arctg
1
)(
t
и того, что в силу предположения (26)
,arctg
1
21
1
1arctg
1
21
2
1
arctg
1
)(
22
2
hh
h
h
h
h
h
tJ
график функции )(tJ обязательно пересечет луч ty в некоторый конечный
момент времени ttt 11, .
Приступим к построению функции растяжения времени )(tI на всем
промежутке времени ),,0[ используя многозначность функции арктангенса.
Сначала положим )()( tJtI , ),0[ 1tt , где момент времени 1t определяется
равенством 11)( ttJ . Далее, пусть
)()( tJtI , ),[ 21 ttt ,
где момент времени 2t находится из равенства 22 )( ttJ
. Продолжая
аналогичным образом построение функции )(tI , получим
)1()()( ktJtI , ),[ 1 kk ttt , ...,,1k , (27)
где 00 t , а моменты времени ,kt ...,,1k , удовлетворяют равенству
kk tktJ
)1()( . (28)
Из приведенных выше рассуждений следует существование последовательности
моментов времени ...,,1,, 1 kttt kkk , которые удовлетворяют уравнению (28),
к тому же, как видно из формул (27), (28),
k
kt .
Построенная функция )(tI является положительной, полунепрерывной
сверху, монотонно возрастающей, 0)0( I , ttI )( 0t . Поскольку она имеет
разрывы только в точках последовательности ,kt ...,,1k , составляющих счетное
множество точек, то функция )(tI кусочно-непрерывна. Более того, функция )(tI
непрерывно дифференцируема на полуинтервалах своей непрерывности.
Обозначим объединение полуинтервалов времени, на которых функция )(tI
непрерывна и дифференцируема, т.е. ),[ 1
1
kk
k
tt
, где ,00 t а моменты
времени ,kt ...,,1k , определены формулами (27), (28). Отметим, что
)()( tJtI , t .
Покажем, что при некотором дополнительном предположении
)(sup tI
t
.
Перепишем формулу (25) таким образом:
Международный научно-технический журнал
«Проблемы управления и информатики», 2016, № 3 45
,
)(
)(
2
t
t
e
tf
e
tJ
где
.
11
1)(
2
2
2
tt ee
htf
Представив )(tf в виде
tt ee
hh
tf
2
2
2
2
2
2
22
21)( ,
заметим, что при условии
h2 (29)
при t0 имеет место оценка
2
22
)(
tf
e t
(30)
и поэтому
2
2
)(sup
tI
t
.
Из вышеизложенного следует, что построенная функция удовлетворяет всем
требованиям, предъявляемым к функции растяжения времени.
Выведем условия на параметры систем (18), (19), которые обеспечивают
выполнение условия 4. Из формулы (23) имеем соотношение
1
1
1
)(tg
t
t
e
h
e
tI , t . (31)
Продифференцировав его, получим
,
1
1
)(
)(cos
1
22
t
t
e
h
e
tI
tI
t .
Отсюда имеем
1
1))(()(cos 2
1
2
tt
e
htIetI , t ,
что вместе с формулой (31) дает равенство
1
))(()(sin
1 2
1
2
tt
e
tIetI . (32)
Из соотношений (22) и (32) следуют формулы, имеющие место при t :
te
tktI
1
)()(sin
1
, (33)
tetktItI
h
)()(cos)(sin , (34)
46 ISSN 0572-2691
где
2
1
2 )()( Ietk
t
. (35)
Из построения функции )(tI следует, что знаком модуля в формуле для
)(1 tW (20) можно пренебречь.
Ввиду соотношений (33)–(35) здесь выполняется равенство
UetkVe AttAI )()( , t ,
поэтому неравенство
0))(( 2
3
2)(
tIee
t
thI t (36)
обеспечивает выполнение условия 4 . Так как
2
3
1
2 ))(( tIe
t
t
t
e
tf
e
2
3
3
))((
, t ,
то в силу оценки (30)
.))((sup
3
3
2
3
2)(
tIee
t
thI
t
Отсюда и из предположений (26), (29) следует, что условия
h
h
2,max,
2
33
(37)
гарантируют выполнение неравенства (36), а следовательно, и условия 4.
Покажем, что существует конечный момент времени 11, tt , в который
выполняется включение
dWze
t
AtI
)(1
0
0
)(
1
1 . (38)
Заметим, что в силу соотношений (33)–(35) и из предыдущих рассуждений
следует, что множество dW
t
)(1
0
содержит в себе выпуклое множество
udue
ud
e
tS
t
t
u
Ru n
0
0
1
3
3
1
)( .
Согласно теореме Ляпунова о векторных мерах [15] возможна перестановка
операций максимума и минимума с интегралом и, следовательно, опорная функция
множества )(tS в направлении вектора ,,),,( 2121
nn RpRpppp имеет вид
duep
e
ppC
u
Ru
t
tS
n
,
1
max)( 21
1
0
3
3
Международный научно-технический журнал
«Проблемы управления и информатики», 2016, № 3 47
dep
e
p
t
21
0
3
3 1
.
Отсюда
t
tS pC )()(
0
0
1
2
3
3
1
p
p
p
.
Это означает, что при t множество )(tS превращается в n2 -мерный
цилиндр S бесконечной высоты с n -мерным шаром с центром в начале коорди-
нат радиуса
3
31
в качестве основания.
С другой стороны, ввиду формы фундаментальной матрицы Ate для
произвольных точек ,, 4
00
nRzz
0
0
20
1
0
)(
x
x
ze
t
AtI .
Поскольку вектор
0
0
20
1
x
x
будет обязательно поглощен множеством S
в некоторый конечный момент времени, то существует момент времени ,1t при
котором окажется справедливым включение (38).
Опишем способ управления преследователя, приводящий к цели. На
полуинтервале ),0[ 0 , где 110 )( ttI , положим его тождественно равным нулю.
Тогда ввиду справедливости включения (38) выполнено предположение (16)
следствия теоремы 2, из которого следует, что если параметры игры удовлетворяют
условиям (37), то при любых начальных геометрических положениях и скоростях
объектов преследователь в момент времени )( 1tI может осуществить мягкую
встречу с убегающим при произвольных допустимых управлениях убегающего.
При этом на отрезке ),[ 100 t преследователь выбирает свое управление по
управлению убегающего в прошлом согласно формуле (17).
Заключение
Показана эквивалентность эволюционной игры сближения с переменным
запаздыванием информации некоторой игре с полной информацией, но с видо-
измененной динамикой и иным терминальным множеством. Это послужило
обоснованием принципа растяжения времени, сформулированного в работе,
значительно расширяющего сферу применения первого прямого метода Понт-
рягина. В качестве иллюстрации рассмотрен модельный пример дифферен-
циальной игры о мягкой встрече двух разнотипных объектов.
Г.Ц. Чикрій
ПРИНЦИП РОЗТЯГУВАННЯ ЧАСУ
В ЕВОЛЮЦІЙНИХ ІГРАХ ЗБЛИЖЕННЯ
Встановлено, що еволюційна гра зближення зi змінним запізненням інформації
еквівалентна деякій грі з повною інформацією, але з іншими динамікою та
48 ISSN 0572-2691
термінальною множиною. Цей факт послужив обгрунтуванням принципу
розтягування часу, сформульованого в роботі, який значно розширює сферу
застосування першого прямого методу Понтрягіна. Для ілюстрації запропо-
нованої методики розглянуто модельний приклад диференціальної гри про
м’яку зустріч двох об’єктів другого порядку з різною динамікою.
G.Ts. Chikrii
PRINCIPLE OF TIME DILATATION
IN EVOLUTIONARY GAMES OF APPROACH
It is established that the evolutionary game of approach with variable information
delay is equivalent to certain game with perfect information under other dynamics
and terminal set. This fact substantiates the time dilatation principle formulated in the
paper, which essentially extends the range of applications of the Pontryagin first
direct method. To illustrate suggested technique, the model differential game on soft
meeting of two second order objects, having different dynamics, is analyzed.
1. Понтрягин Л.С. Избранные научные труды. Т. 2. — М.: Наука, 1988. –– 576 с.
2. Chikrii A.A. Conflict-сontrolled processes. — Springer Science and Business Media, 2013. — 424 p.
3. Никольский М.С. О применении первого прямого метода в линейных дифференциальных
играх // Изв. АН СССР. Сер. техн. кибернетики. — 1972. — № 10. — С. 51–56.
4. Зонневенд Д. Об одном методе преследования // ДАН СССР. — 1972. — 204, № 6. —
С. 1296–1299.
5. Chikrii G.Ts. One approach to solution of complex game problems for some quasilinear
evolutionary systems // Journal of Mathematics, Game Theory and Algebra: Nova Science
Publishers, Inc. — 2004. — 14, N 4. — P. 307–314.
6. Чикрий Г.Ц. Использование эффекта запаздывания информации в дифференциальных иг-
рах преследования // Кибернетика и системный анализ. — 2007. — № 2. — С. 90–105.
7. Чикрий Г.Ц. Об одной задаче сближения для затухающих колебаний // Проблемы управле-
ния и информатики. — 2009. — № 5. — С. 5–12.
8. Chikrii A.A., Eidelman S.D. Game problems for fractional quasilinear systems // Computers аnd
Mathematics with Applications. — 2002. — 44. — P. 835–851.
9. Chikrii A.A., Eidelman S.D. Generalized Mittag-Leffler function in game problems for
evolutionary equations of fractional order // Cybernetics and Systems Analysis. — 2000. — 36,
N 3. — P. 315–338.
10. Chikriy G.Ts. An approach to the solution of linear differential games with variable information
delay // Journal of Automation and Information Sciences. — 1995. — 27 (3&4). —
P. 163–170.
11. Aumann R.J. Integrals of set-valued functions // J. Math. Anal. Appl. — 1965. — 12. — P. 1–12.
12. Филиппов А.Ф. Дифференциальные уравнения с разрывной правой частью. — М.: Наука, 1985.
— 255 с.
13. Василенко Н.В. Теория колебаний. — Киев: Вища школа, 1992. — 430 с.
14. Albus J., Meystel A., Chikrii A.A., Belousov A.A., Kozlov A.I. Analytic method for solution of the
game problem of soft landing for moving objects // Cybernetics and Systems Analysis. —
2001. — 37, N 1. — P. 75–91.
15. Иоффе А.Д., Тихомиров В.М. Теория экстремальных задач. — М.: Наука. — 1974. — 480 с.
Получено 22.02.2016
|