Метод разрешающих функций в задаче группового преследования с терминальной функцией платы и интегральными ограничениями на управления
В работе рассматриваются линейные дифференциальные игры группового преследования с терминальной функцией платы и интегральными ограничениями на управления. Сформулированы достаточные условия окончания игры за конечное гарантированное время в случае, когда справедливо условие М.С. Никольского. Предло...
Saved in:
| Published in: | Проблемы управления и информатики |
|---|---|
| Date: | 2019 |
| Main Author: | |
| Format: | Article |
| Language: | Russian |
| Published: |
Інститут кібернетики ім. В.М. Глушкова НАН України
2019
|
| Subjects: | |
| Online Access: | https://nasplib.isofts.kiev.ua/handle/123456789/180779 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| Journal Title: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Cite this: | Метод разрешающих функций в задаче группового преследования с терминальной функцией платы и интегральными ограничениями на управлени / И.С. Раппопорт // Проблемы управления и информатики. — 2019. — № 2. — С. 8-25. — Бібліогр.: 36 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| id |
nasplib_isofts_kiev_ua-123456789-180779 |
|---|---|
| record_format |
dspace |
| spelling |
Раппопорт, И.С. 2021-10-18T18:47:40Z 2021-10-18T18:47:40Z 2019 Метод разрешающих функций в задаче группового преследования с терминальной функцией платы и интегральными ограничениями на управлени / И.С. Раппопорт // Проблемы управления и информатики. — 2019. — № 2. — С. 8-25. — Бібліогр.: 36 назв. — рос. 0572-2691 https://nasplib.isofts.kiev.ua/handle/123456789/180779 517.977 В работе рассматриваются линейные дифференциальные игры группового преследования с терминальной функцией платы и интегральными ограничениями на управления. Сформулированы достаточные условия окончания игры за конечное гарантированное время в случае, когда справедливо условие М.С. Никольского. Предложена модифицированная схема метода разрешающих функций, которая обеспечивает окончание игры за определенное гарантированное время в классе стробоскопических стратегий Хайека. Показано, что без дополнительных предположений это время совпадает с гарантированным временем в классе квазистратегий. Дано сравнение гарантированных времен. Запропоновано метод вирішення ігрових завдань динаміки з термінальною функцією плати і інтегральними обмеженнями на керування, який полягає в систематичному використанні ідей Фенхеля–Моро стосовно загальної схеми методу розв’язувальних функцій. Сутність запропонованого методу в тому, що розв’язувальну функцію вдається виразити через спряжену до функції плати і, використовуючи інволютивність оператора сполучення для опуклої замкнутої функції, отримати гарантовану оцінку термінального значення функції плати, яку представлено через значення плати в початковий момент і інтеграл від розв’язувальної функції. Головною особливістю методу є накопичувальний принцип, який використовується в поточному підсумовуванні розв’язувальної функції для оцінки якості гри аж до досягнення деякого порогового значення. Розглянуто лінійні диференціальні ігри групового переслідування з термінальною функцією плати та інтегральними обмеженнями на керування. Сформульовано достатні умови закінчення гри за кінцевий гарантований час у класі квазістратегій. Запропоновано дві схеми методу розв’язувальних функцій, що забезпечують без додаткових припущень завершення гри за кінцевий гарантований час у класі стробоскопічних стратегій. Показано результати порівняння гарантованих часів різних схем методу розв’язувальних функцій. A method is proposed for solving game dynamics problems with a terminal pay off function and integral constraints on controls, which consists in systematically using the ideas of Fenhel-Moreau in relation to the general scheme of the method of resolving functions. The essence of the proposed method lies in the fact that the resolving function can be expressed through the function conjugate to the pay off function and, using the involute of the conjugation operator for a convex closed function, to obtain a guaranteed estimate of the terminal value of the pay off function, which is represented through the paying off value at the initial time and the integral of the resolving function. The main feature of the method is the cumulative principle, which is used in the current summation of the resolving function for assessing the quality of the game until a certain threshold value is reached. The paper considers linear differential games of group pursuit with a terminal pay off function and integral constraints on controls. Sufficient conditions for termination of the game for a finite guaranteed time in the class of quasi-strategies are formulated. Two schemes of the method of resolving functions are proposed that ensure without additional assumptions the completion of the game for the final guaranteed time in the class of stroboscopic strategies. The guaranteed times for various schemes of the resolving-functions method are compared. ru Інститут кібернетики ім. В.М. Глушкова НАН України Проблемы управления и информатики Конфликтно-управляемые процессы и методы принятия решений Метод разрешающих функций в задаче группового преследования с терминальной функцией платы и интегральными ограничениями на управления Метод розв’язувальних функцій в задачі групового переслідування з термінальною функцією плати та інтегральними обмеженнями на керування Method of resolving functions in the group pursuit problem with a terminal pay off function and integral constraints on controls Article published earlier |
| institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| collection |
DSpace DC |
| title |
Метод разрешающих функций в задаче группового преследования с терминальной функцией платы и интегральными ограничениями на управления |
| spellingShingle |
Метод разрешающих функций в задаче группового преследования с терминальной функцией платы и интегральными ограничениями на управления Раппопорт, И.С. Конфликтно-управляемые процессы и методы принятия решений |
| title_short |
Метод разрешающих функций в задаче группового преследования с терминальной функцией платы и интегральными ограничениями на управления |
| title_full |
Метод разрешающих функций в задаче группового преследования с терминальной функцией платы и интегральными ограничениями на управления |
| title_fullStr |
Метод разрешающих функций в задаче группового преследования с терминальной функцией платы и интегральными ограничениями на управления |
| title_full_unstemmed |
Метод разрешающих функций в задаче группового преследования с терминальной функцией платы и интегральными ограничениями на управления |
| title_sort |
метод разрешающих функций в задаче группового преследования с терминальной функцией платы и интегральными ограничениями на управления |
| author |
Раппопорт, И.С. |
| author_facet |
Раппопорт, И.С. |
| topic |
Конфликтно-управляемые процессы и методы принятия решений |
| topic_facet |
Конфликтно-управляемые процессы и методы принятия решений |
| publishDate |
2019 |
| language |
Russian |
| container_title |
Проблемы управления и информатики |
| publisher |
Інститут кібернетики ім. В.М. Глушкова НАН України |
| format |
Article |
| title_alt |
Метод розв’язувальних функцій в задачі групового переслідування з термінальною функцією плати та інтегральними обмеженнями на керування Method of resolving functions in the group pursuit problem with a terminal pay off function and integral constraints on controls |
| description |
В работе рассматриваются линейные дифференциальные игры группового преследования с терминальной функцией платы и интегральными ограничениями на управления. Сформулированы достаточные условия окончания игры за конечное гарантированное время в случае, когда справедливо условие М.С. Никольского. Предложена модифицированная схема метода разрешающих функций, которая обеспечивает окончание игры за определенное гарантированное время в классе стробоскопических стратегий Хайека. Показано, что без дополнительных предположений это время совпадает с гарантированным временем в классе квазистратегий. Дано сравнение гарантированных времен.
Запропоновано метод вирішення ігрових завдань динаміки з термінальною функцією плати і інтегральними обмеженнями на керування, який полягає в систематичному використанні ідей Фенхеля–Моро стосовно загальної схеми методу розв’язувальних функцій. Сутність запропонованого методу в тому, що розв’язувальну функцію вдається виразити через спряжену до функції плати і, використовуючи інволютивність оператора сполучення для опуклої замкнутої функції, отримати гарантовану оцінку термінального значення функції плати, яку представлено через значення плати в початковий момент і інтеграл від розв’язувальної функції. Головною особливістю методу є накопичувальний принцип, який використовується в поточному підсумовуванні розв’язувальної функції для оцінки якості гри аж до досягнення деякого порогового значення. Розглянуто лінійні диференціальні ігри групового переслідування з термінальною функцією плати та інтегральними обмеженнями на керування. Сформульовано достатні умови закінчення гри за кінцевий гарантований час у класі квазістратегій. Запропоновано дві схеми методу розв’язувальних функцій, що забезпечують без додаткових припущень завершення гри за кінцевий гарантований час у класі стробоскопічних стратегій. Показано результати порівняння гарантованих часів різних схем методу розв’язувальних функцій.
A method is proposed for solving game dynamics problems with a terminal pay off function and integral constraints on controls, which consists in systematically using the ideas of Fenhel-Moreau in relation to the general scheme of the method of resolving functions. The essence of the proposed method lies in the fact that the resolving function can be expressed through the function conjugate to the pay off function and, using the involute of the conjugation operator for a convex closed function, to obtain a guaranteed estimate of the terminal value of the pay off function, which is represented through the paying off value at the initial time and the integral of the resolving function. The main feature of the method is the cumulative principle, which is used in the current summation of the resolving function for assessing the quality of the game until a certain threshold value is reached. The paper considers linear differential games of group pursuit with a terminal pay off function and integral constraints on controls. Sufficient conditions for termination of the game for a finite guaranteed time in the class of quasi-strategies are formulated. Two schemes of the method of resolving functions are proposed that ensure without additional assumptions the completion of the game for the final guaranteed time in the class of stroboscopic strategies. The guaranteed times for various schemes of the resolving-functions method are compared.
|
| issn |
0572-2691 |
| url |
https://nasplib.isofts.kiev.ua/handle/123456789/180779 |
| citation_txt |
Метод разрешающих функций в задаче группового преследования с терминальной функцией платы и интегральными ограничениями на управлени / И.С. Раппопорт // Проблемы управления и информатики. — 2019. — № 2. — С. 8-25. — Бібліогр.: 36 назв. — рос. |
| work_keys_str_mv |
AT rappoportis metodrazrešaûŝihfunkciivzadačegruppovogopresledovaniâsterminalʹnoifunkcieiplatyiintegralʹnymiograničeniâminaupravleniâ AT rappoportis metodrozvâzuvalʹnihfunkcíivzadačígrupovogopereslíduvannâztermínalʹnoûfunkcíêûplatitaíntegralʹnimiobmežennâminakeruvannâ AT rappoportis methodofresolvingfunctionsinthegrouppursuitproblemwithaterminalpayofffunctionandintegralconstraintsoncontrols |
| first_indexed |
2025-11-25T21:29:36Z |
| last_indexed |
2025-11-25T21:29:36Z |
| _version_ |
1850558121845456896 |
| fulltext |
© И.С. РАППОПОРТ, 2019
8 ISSN 0572-2691
КОНФЛИКТНО-УПРАВЛЯЕМЫЕ ПРОЦЕССЫ И МЕТОДЫ
ПРИНЯТИЯ РЕШЕНИЙ
УДК 517.977
И.С. Раппопорт
МЕТОД РАЗРЕШАЮЩИХ ФУНКЦИЙ
В ЗАДАЧЕ ГРУППОВОГО ПРЕСЛЕДОВАНИЯ
С ТЕРМИНАЛЬНОЙ ФУНКЦИЕЙ
ПЛАТЫ И ИНТЕГРАЛЬНЫМИ
ОГРАНИЧЕНИЯМИ НА УПРАВЛЕНИЯ
Ключевые слова: линейная дифференциальная игра, терминальная функция
платы, интегральные ограничения, многозначное отображение, измеримый се-
лектор, стробоскопическая стратегия, групповое преследование.
Введение
Работа посвящена исследованию подхода к решению игровых задач дина-
мики с терминальной функцией платы [1–5] и интегральными ограничениями
на управления [6–10] применительно к общей схеме метода разрешающих
функций [11, 12]. Рассматривается задача группового преследования в линейной
дифференциальной игре с терминальной функцией платы и интегральными
ограничениями на управления в случае, когда справедливо условие М.С. Ни-
кольского [6]. Предложены две схемы метода разрешающих функций, построены
соответствующие стратегии группового преследования и дано сравнение гаран-
тированных времен.
Важной особенностью общей схемы метода разрешающих функций является
использование при построении управляющего воздействия информации о поведении
противника в прошлом, которая необходима лишь для определения некоторого
момента переключения, разделяющего активный и пассивный интервалы развития
игры. На самих интервалах преследователь применяет контруправление, которое
определяется стробоскопической стратегией Хайека [13]. Одним из основных
результатов настоящей работы является то, что для реализации гарантированного
времени окончания линейной дифференциальной игры группового преследования
можно ограничиться лишь контруправлением без дополнительных условий.
Работа является развитием идей [1–12], дополняет исследования [14–32]
и указывает на новые возможности применения метода разрешающих функций
к решению игровых задач динамики.
Постановка задачи, общая схема метода
Рассмотрим конфликтно-управляемый процесс, эволюция которого описыва-
ется системой линейных дифференциальных уравнений
vCuBzAz iiiiii , in
i Rz . (1)
Международный научно-технический журнал
«Проблемы управления и информатики», 2019, № 2 9
Здесь и в дальнейшем Ni ...,,1 , in
R — евклидово in -мерное пространство;
im
i Ru , kRv , 1in , 1im , 1k ; iii CBA ,, — постоянные прямоугольные
матрицы порядка ii nn , ii mn , kni соответственно; iu — управляющий па-
раметр первого игрока; v — управляющий параметр второго игрока. Параметры
iu и v выбираются в виде измеримых функций )( ii uu и )( vv из классов
],0[ TL im
p и ],0[ TLk
p соответственно, 1p , ,0T и удовлетворяют ограничениям
p
i
p
i
T
du )(
0
, 0i , (2)
p
T
p
dv
0
)( , 0 . (3)
Такие управления назовем допустимыми. Символом ],,0[ TL im
p ,1p обо-
значим банахово пространство измеримых по Лебегу отображений отрезка
],0[ T в im
R , для которых интеграл
T
p
i du
0
)( конечен. Значение символа
],0[ TLk
p аналогично.
Кроме процесса (1), задана терминальная функция платы )(z , которая
определяет момент окончания игры и представляется в виде
)(min)(
...,,1
ii
Ni
zz
, ,{ izz in
i Rz , }...,,1 Ni , :i
1RR in
. (4)
Игру группового преследования для конфликтно-управляемого процесса (1)–(4)
из начального положения ,{ 00
izz in
i Rz 0 , }...,,1 Ni будем считать окончен-
ной в момент )( 0zTT , если по любой допустимой функции )(tv , ],0[ Tt ,
можно построить набор допустимых функций
),({)( tutu i )),(,,()( 0 tiii vztutu }...,,1 Ni , ],0[ Tt , (5)
где }],0[),({)( tvvt , или набор допустимых контруправлений
),({)( tutu i )),(,,()( 0 tvztutu iii }...,,1 Ni , ],0[ Tt , (6)
такие что для абсолютно непрерывного решения задачи Коши
)({)( tztz i , )()( tvCtuBzAz iiiiii ,
0)0( ii zz , Ni ...,,1 }
выполняется неравенство
0))(( Tz . (7)
Считается, что набор допустимых управлений вида (5) реализует квазистра-
тегию [11], а набор допустимых контруправлений [23] вида (6) является проявле-
нием стробоскопической стратегии Хайека [13].
Предположим, что функции )( ii z — собственные выпуклые замкнутые
ограниченные снизу по iz функции [33]. Согласно определению сопряженной
функции и с учетом теоремы Фенхеля–Моро [33] имеем
10 ISSN 0572-2691
)](),[(max)( iiii
dom
ii zz
ii
,
где
)](),[(sup)( iiii
Rz
ii zz
in
i
. (8)
Функция )( ii собственная замкнутая и выпуклая [33]. Эффективное множе-
ство функции )( ii имеет вид })(:{
ii
n
ii
iRdom . В силу огра-
ниченности снизу собственной функции )( ii z и соотношения (8) получим
)(inf)0( z
in
Rz
i
, а значит idom0 .
Будем считать, что iL — линейная оболочка множества idom (пересечение
всех линейных подпространств, которые содержат множество idom ). Тогда она
является линейным подпространством. Обозначим i оператор ортогонального
проектирования из in
R на iL . Справедливо соотношение )()( iiiii zz , in
i Rz .
Рассмотрим линейные отображения i
m
i
tA
i LRBe ii , i
k
i
tA
i LRÑe ii ,
0t , iB — постоянная прямоугольная матрица порядка ii mn .
Условие 1. Уравнение i
tA
ii
tA
i CeFBe ii имеет решение ),(tFF i которое
является непрерывной неособой матрицей при всех t , 0t .
Рассмотрим функцию [6]
t
p
i
d
p
i dtFt
t
0
1)(
)()(sup)(
0
, где )( —
произвольная измеримая функция из пространства ),0[ tLk
p с указанным ограни-
чением, а imk RRF :)( — некоторая непрерывная неособая матрица, удовле-
творяющая условию 1.
С помощью функции )(t
p
i определим величину [6] )(sup
0
t
p
i
t
p
i
.
Условие 2. Справедливо неравенство 0ˆ
p
i
pp
ii .
Пусть справедливы условия 1, 2. Рассмотрим многозначные отображения
})ˆ(:{)(
1
1 pi
iti
m
ii uRutW и обозначим )}()(:)({)( tWtt iiii
совокупность измеримых селекторов отображения )(tWi . Если )()( tii , то
)(i — измеримая функция из класса ],0[ tL im
p , 1p , которая удовлетворяет
ограничению i
T
iT
T
p
i dd ˆˆ)(
0
1
0
.
Обозначим для }0:),{(),( ttt , kRv
pi
it
p
ii
m
ii vtFuRuvtU
1
)ˆ)((:{),,( 1 .
Отображение ),,( vtUi является выпуклозначным компактнозначным мно-
гозначным отображением [33].
Зафиксируем некоторый селектор )(i , )()( tii , и положим
Международный научно-технический журнал
«Проблемы управления и информатики», 2019, № 2 11
dBezeztt i
t
i
At
ii
tA
iiiii
ii )())(,,()(
0
)(00
, ),(t , in
i Rz 0 .
Рассмотрим для ),(t , kRv , in
i Rz 0 , многозначное отображение
),,,( 0
ii zvt :0{ i
),,(
inf
vtUu ii ii dom
max
)]([,[(
)(
tuBe iii
At
ii
i
0)]]())(,[()
)(
iiiiii
At
i tvCe i . (9)
Пусть справедливы условия 1, 2. Нетрудно показать, что для любого селекто-
ра )(i , )()( tii , на множестве kR имеет место неравенство
),,(
inf
vtUu ii ii dom
max )]([,[(
)(
tuBe iii
At
ii
i 0)]
)(
vCe i
At
i
i . (10)
Поэтому, если справедливы условия 1, 2, то в силу неравенства (10) для лю-
бого селектора )(i , ),()( tii и любого начального положения in
i Rz 0
на
множестве kR имеет место условие ),,,,(0 0
ii zvt и поэтому многознач-
ное отображение ),,,( 0
ii zvt не пусто.
Введем разрешающие функции ),,,( 0
ii zvt = )},,,(:sup{ 0
iiii zvt ,
где kRvt ),,( , in
i Rz 0 . Отметим, что при условии 0)))(,,(( 0 iii zt
функции ),,,( 0
ii zvt для всех kRvt ),,( . Если же для некоторых
0t , in
i Rz 0 , )()( tii , 0)))(,,(( 0 iii zt , то разрешающие функции
),,,( 0
ii zvt принимают конечные значения и равномерно по ],0[ t , kRv
ограничены. Можно показать [12], что многозначные отображения ),,,( 0
ii zvt
являются выпуклозначными замкнутозначными BL -измеримыми по совокуп-
ности ),( v , ],0[ t , kRv , так что разрешающие функции ),,,( 0
ii zvt яв-
ляются BL -измеримыми по совокупности ),( v , ],0[ t , kRv . Поэтому
они суперпозиционно измеримы [12], т.е. )),(,,( 0
ii zvt измеримы по ,
],0[ t , при любой допустимой измеримой функции )(v , ],0[)( tVv . Здесь и
всюду далее ],0[ tV = )({v ],0[ tLk
p :
p
t
p
dv
0
)( }.
Рассмотрим для некоторого начального положения ,{ 00
izz in
i Rz 0
,
}...,,1 Ni и набора селекторов )( ={ )(i , )()( tii , }...,,1 Ni множество
))(,( 0 zT = { 0t :
NitVv ...,,1],0[)(
maxinf
t
ii dzvt
0
0 1)),(,,( } (11)
и его наименьший элемент
))(,( 0 zt = :inf{t ))(,( 0 zTt }.
12 ISSN 0572-2691
Если при некоторых t , 0t , ),,,( 0
ii zvt для ],0[ t , kRv ,
,0 in
i Rz то в этом случае значение интеграла в фигурных скобках соотношения (11)
естественно положить равным и ))(,( 0 zTt . В случае, когда неравенство
в соотношении (11) не выполняется при всех 0t , положим ))(,( 0zT и,
соответственно, ))(,( 0zt .
Теорема 1. Пусть справедливы условия 1, 2, функции )( ii z являются соб-
ственными выпуклыми замкнутыми ограниченными снизу по iz функциями и для
некоторого начального положения ,{ 00
izz in
i Rz 0 , }...,,1 Ni и набора селек-
торов )( = { )(i , )()( tii , }...,,1 Ni множество ))(,( 0 zT не пусто и
))(,( 0 zTT . Тогда игру группового преследования для конфликтно-
управляемого процесса (1)–(4) можно окончить в момент T с использованием
управления вида (5).
Доказательство. Пусть )(v — произвольное допустимое управление убега-
ющего, для которого выполняется ограничение (3).
Рассмотрим случай )))(,,(( 0 zT >0, ))(,,( 0 zT ={ ))(,,( 0 iii zT , i
}...,,1 N и введем контрольную функцию
)(th = 1
Ni ...,,1
max
t
ii dzvT
0
0)),(,,( , ],0[ Tt .
Функции ),,,( 0
ii zvT BL -измеримы по совокупности ),( v , ],0[ T ,
kRv , и поэтому они суперпозиционно измеримы, т.е. функции )),(,,( 0
ii zvT
измеримы по , ],0[ T . По определению T имеем 1)0( h ,
T
ii
Ni
dzvTTh
0
0
...,,1
)),(,,(max1)(
T
ii
NiTVv
dzvT
0
0
...,,1],0[)(
.0)),(,,(maxinf1
Поэтому в силу непрерывности функции )(th существует такой момент вре-
мени t , ],0( Tt , что
0)( th . (12)
Отметим, что момент переключения t зависит от предыстории управления
убегающего игрока ]},0[),({)(
tvvt .
Рассмотрим многозначные отображения при kRv , ],0[ t
),(1 vUi ={ ),,( vTUu ii :
ii dom
max
)]([,[(
)(
TuBe iii
AT
ii
i
)
)(
vCe i
AT
i
i .0)]]())(,)[(,,,( 0
iiiiii tzvT (13)
Международный научно-технический журнал
«Проблемы управления и информатики», 2019, № 2 13
В силу свойств параметров процесса (1), функций )( ii z и ),,,( 0
ii zvT отоб-
ражения ),(1 vUi BL -измеримы [12] и компактнозначны при ],0[ t , kRv .
В работе [34] впервые введено понятие лексикографического максимума по
ортогональому базису mee ...,,1 от компакта )( mRKA по следующей формуле:
Alex
mee ...,,1
max =
m
r
rA
0
,
где AA 0 , rA ={ 1 rAx : ),( rex = ),( 1 rAc }, ),( 1 rAc — опорная функция
множества 1rA [33], mr ...,,1 . Множество Alex
mee ...,,1
max состоит из одной точки,
принадлежащей множеству крайних точек выпуклой оболочки множества A [35].
При этом, если взять многозначные отображения ),(1 vUi и ортогональные
базисы, такие что iie 1 , imi R , 0i , то выполняется равенство из [35]
)),,(max( 1
...,,1
ii
ee
vUlex
m
= )),,(( 1
ii vUc .
Поэтому в силу теоремы об опорной функции [36] многозначные отобра-
жения ),(1 vUi содержат BL -измеримые селекторы ),(1 vui = ),(max 1
...,,1
vUlex i
ee N
,
которые являются суперпозиционно измеримыми функциями [12] и ),(1 vui =
= p
iT
p
i vTF
1
)ˆ)(( 1 , ],0[ t , kRv . Управление преследователей на ин-
тервале ],0[ t положим равным
)(iu = ))(,(1 vui . (14)
Из равенства (12) следует, что существует такой номер j , Nj 1 , что
t
ij dzvT
0
0 )),(,,(1 = 0. (15)
Рассмотрим для kRv , ],[ Tt многозначное отображение
),(2 vU j = { ),,( vTUu jj :
jii dom
max )]([,[(
)(
TuBe jjj
AT
jj
ji 0)]
)(
vCe j
AT
j
j }. (16)
В силу свойств параметров процесса (1) на основании теоремы об обратном
образе [12, 36] можно заключить, что отображение ),(2 vU j BL -измеримо и
компактнозначно при kRv , ],[ Tt . Поэтому в силу теоремы об опорной
функции [36] многозначное отображение ),(2 vU j содержит BL -измеримый
селектор ),(2 vu j = ),(max 2
...,,1
vUlex j
ee N
. Для номера ,, jii положим ),(2 vui =
),,(max
...,,1
vTUlex i
ee N
. Селекторы ),(2 vui при всех Ni ...,,1 являются суперпози-
14 ISSN 0572-2691
ционно измеримыми функциями [12], и справедливо условие ),(2 vui =
p
iT
p
i vTF
1
)ˆ)(( 1 , ],[ Tt , kRv . Управление преследователей на ин-
тервале ],[ Tt положим равным
)(iu = ))(,(2 vui . (17)
Из формулы Коши для процесса (1) при выбранных управлениях номера j ,
Nj 1 , имеем
)(Tz jj = ))(,,( 0 jjj zT +
+
T
j
0
[ )]()([
)(
TuBe jjj
AT j
dvCe j
AT
j
j )](
)(
. (18)
Принимая во внимание равенство ))(())(( TzTz jjjjj , формулу (18) и
определение сопряженной функции, при выбранных управлениях получим
))(( Tz jj =
ji dom
max [ )))(,,(,( 0 jjjj zT +
j
AT
T
jj Be j)(
0
,[(
)]()([ Tu jj
dvCe j
AT
j
j ))](
)(
)( jj ]. (19)
Прибавим и вычтем в квадратных скобках выражения (19) величину
[ )))(,,(,( 0 jjjj zT )( jj ]
t
ij dzvT
0
0 )),(,,( .
Тогда, учитывая соотношения (13)–(17), получим
))(( Tz jj =
ji dom
max {[ )))(,,(,( 0 jjjj zT )( jj ] )( th +
+
t
jj
0
,[( )]()([ 1)(
TuBe jjj
AT j ))(
)(
vCe j
AT
j
j +
+ )),(,,( 0
ij zvT [ ))(,,(,( 0 jjjj zT djj )]]( ]+
+
T
t
jj ,( )]()([ 2)(
TuBe jjj
AT j
dvCe j
AT
j
j ))(
)(
}.
Отсюда следует, что группа преследователей может гарантировать в момент T
выполнение неравенства
))(( Tz ))(( Tz jj )()))(,,(( 0
thzT jjjj = 0.
Проверим допустимость управлений )(iu , ],0[ T . По построению спра-
ведливы соотношения
T
p
i du
0
)( =
t
p
i du
0
1 )( +
T
t
p
i du )(2 =
Международный научно-технический журнал
«Проблемы управления и информатики», 2019, № 2 15
T
iT
p
i dTF
0
1 ]ˆ)([
p
ii
p
i
p ˆ .
Для случая 0)))(,,(( 0 zT существует такой номер q , Nq 1 , что
0)))(,,(( 0 zTqq . Рассмотрим для kRv , ],0[ T многозначное отображение
),(2 vUq = {
q
AT
qq
dom
qq BevTUu qi
éq
)(
,[(max:),,(
)]([ Tu qq 0)]
)(
vCe q
AT
q
q }. (20)
В силу свойств параметров процесса (1) на основании теоремы об обратном
образе [12, 36] можно заключить, что отображение ),(2 vUq BL -измеримо и
компактнозначно при kRv , ],0[ T . Поэтому в силу теоремы об опорной
функции [36] многозначное отображение ),(2 vUq содержит BL -измеримый
селектор ),(2 vuq = ),(max 2
...,,1
vUlex q
ee N
. Для номера ,, qii положим ),(2 vui =
= ),,(max
...,,1
vTUlex i
ee N
. Селекторы ),(2 vui при всех Ni ...,,1 являются суперпо-
зиционно измеримыми функциями [12], и справедливо условие ),(2 vui =
= p
iT
p
i vTF
1
)ˆ)(( 1 , ],0[ T , kRv . Управление преследователей на ин-
тервале ],0[ T положим равным )(iu = ))(,(2 vui .
Тогда при выбранных управлениях с учетом соотношений (19), (20) группа
преследователей может гарантировать в момент T выполнение неравенства
))(( Tz ))(( Tzqq 0)))(,,(( 0 qqqq zT .
Проверим допустимость управлений )(iu , ],0[ T . По построению спра-
ведливы соотношения
T
p
i du
0
)( =
T
iT
p
i dTF
0
1 ]ˆ)([
p
ii
p
i
p ˆ .
Теорема доказана.
Рассмотрим для некоторого начального положения ,{ 00
izz ,0 in
i Rz
}...,,1 Ni и набора селекторов )( ={ )(i , )()( tii , }...,,1 Ni множество
))(,( 0 zT = { 0t :
Ni ...,,1
max
1),,,(inf 0
0
dzvt ii
Rv
t
k
} (21)
и его наименьший элемент
))(,( 0 zt = :inf{t ))(,( 0 zTt }.
Если при некоторых ,t ,0t
),,,(inf 0
ii
Rv
zvt
k
для ],0[ t , kRv ,
in
i Rz 0
, то в этом случае значение интеграла в фигурных скобках соотношения (21)
16 ISSN 0572-2691
естественно положить равным и ))(,( 0 zTt . В случае, когда неравенство
в соотношении (21) не выполняется при всех ,0t положим ))(,( 0zT и,
соответственно, ))(,( 0zt .
Следствие 1. Пусть справедливы условия 1, 2, функции )( ii z являются соб-
ственными выпуклыми замкнутыми ограниченными снизу по iz функциями и для
некоторого начального положения ,{ 00
izz in
i Rz 0 , },...,1 Ni и набора селек-
торов )( = { )(i , )()( tii , }...,,1 Ni множество ))(,( 0 zT не пусто и
)).(,( 0 zTT Тогда ))(,())(,( 00
zTzT и игру группового преследования
для конфликтно-управляемого процесса (1)–(4) можно окончить в момент T
с использованием управления вида (5).
Доказательство. Имеют место следующие соотношения:
NiTVv ...,,1],0[)(
maxinf
T
ii dzvT
0
0 )),(,,(
],0[)(...,,1
infmax
TVvNi
T
ii dzvT
0
0 )),(,,(
Ni ...,,1
max
T
ii
Rv
dzvT
k
0
0 )),(,,(inf 1.
Таким образом, ))(,())(,( 00
zTzT и осталось применить теорему 1.
Следствие 2. Пусть справедливы условия 1, 2, функции )( ii z являются соб-
ственными выпуклыми замкнутыми ограниченными снизу по iz функциями и для
некоторого начального положения ,{ 00
izz in
i Rz 0 , }...,,1 Ni и набора селекто-
ров )( = { )(i , )()( tii , }...,,1 Ni справедливо условие ))(,( 0zt .
Тогда, если группа преследователей использует законы управления вида (5),
описанные при доказательстве теоремы 1, то для любого ,T T0 ))(,( 0 zt ,
существует такой номер j , Nj 1 , что справедлива оценка
))((sup
],0[)(
Tz
TVv
)))(,,(( 0 jjjj zT [1
NiTVv ...,,1],0[)(
maxinf
T
ii dzvT
0
0 )),(,,( ].
Доказательство аналогично доказательству теоремы 1 , при условии что
контрольную функцию следует задать в виде
)(th =
NiTVv ...,,1],0[)(
maxinf
T
ii dzvT
0
0 )),(,,(
Ni ...,,1
max
t
ii dzvT
0
0 )),(,,( .
Схемы метода для класса стробоскопических стратегий
Из доказательства теоремы 1 видно, что преследователь в момент t использует
информацию о )(tv , причем она необходима лишь для определения момента пе-
реключения t , который разделяет активный и пассивный интервалы. На самих
интервалах преследователь применяет контруправление, которое определяется
стробоскопической стратегией. Далее показано, что для реализации гаранти-
рованного времени можно ограничиться контруправлением с переключением,
Международный научно-технический журнал
«Проблемы управления и информатики», 2019, № 2 17
момент которого не зависит от предыстории управления. Затем продемонстрировано,
что для реализации гарантированного времени можно ограничиться контруправ-
лением без переключения.
Теорема 2. Пусть справедливы условия 1, 2, функции )( ii z являются соб-
ственными выпуклыми замкнутыми ограниченными снизу по iz функциями и для
некоторого начального положения ,{ 00
izz in
i Rz 0 , }...,,1 Ni и набора селек-
торов )( = { )(i , )()( tii , }...,,1 Ni множество ))(,( 0 zT не пусто и
))(,( 0 zTT . Тогда игру группового преследования для конфликтно-управ-
ляемого процесса (1)–(4) можно окончить в момент T с использованием контр-
управления вида (6) с переключением, момент которого не зависит от предыс-
тории управления.
Доказательство. Пусть )(v — произвольное допустимое управление убе-
гающего, для которого выполняется ограничение (3).
Рассмотрим случай ...,1)),(,,({))(,,(,0)))(,,(( 000 izTzTzT iii
}..., N и введем контрольную функцию
)(th = 1
Ni ...,,1
max
t
ii
Rv
dzvT
k
0
0 ),,,(inf , ],0[ Tt .
Функции
kRv
inf ),,,( 0
ii zvT L -измеримы по , ],0[ T [10]. По определе-
нию T имеем
1)0( h , )(Th = 1
Ni ...,,1
max
T
ii
Rv
dzvT
k
0
0 ),,,(inf 0.
Поэтому в силу непрерывности функции )(th существует такой момент вре-
мени t , ],0( Tt , что
0)( th . (22)
Отметим, что момент переключения t не зависит от предыстории управле-
ния убегающего игрока ]},0[),({)(
tvvt .
Выпуклозначные отображения ),,,( 0
ii zvT можно записать в виде
)].,,,(,0[),,,( 00
iiii zvTzvT Поскольку ),,,(),,,(inf0 00
iiii
Rv
zvTzvT
k
,
справедливо условие
kRv
inf ),,,( 0
ii zvT ),,,( 0
ii zvT , ],0[ T , kRv .
Рассмотрим многозначные отображения при kRv , ],0[ t ,
),(1 vUi = { ),,( vTUu ii :
)]([,[(max
)(
TuBe iii
AT
ii
dom
i
ii
)
)(
vCe i
AT
i
i .0)]]())(,[(),,,(inf 0
iiiiii
Rv
tzvT
k
(23)
В силу свойств параметров процесса (1), функций )( ii z и
),,,(inf 0
ii
Rv
zvT
k
отображения ),(1 vUi BL -измеримы [12] и компактнозначны
18 ISSN 0572-2691
при ],0[ t , kRv . Поэтому в силу теоремы об опорной функции [36] много-
значные отображения ),(1 vUi содержат BL -измеримые селекторы
),(1 vui = ),(max 1
...,,1
vUlex i
ee N
, которые являются суперпозиционно измеримыми
функциями [12] и ),(1 vui = p
iT
p
i vTF
1
)ˆ)(( 1 , ],0[ t , kRv . Управле-
ние преследователей на интервале ],0[ t положим равным
)(iu = ))(,(1 vui . (24)
Из равенства (22) следует, что существует такой номер j , Nj 1 , что
t
jj
Rv
dzvT
k
0
0 ),,,(inf1 = 0. (25)
Рассмотрим для kRv , ],[ Tt многозначное отображение
),(2 vU j = { ),,( vTUu jj :
jj dom
max )]([,[(
)(
TuBe jjj
AT
jj
ji 0)]
)(
vCe j
AT
j
j }. (26)
В силу свойств параметров процесса (1) на основании теоремы об обратном
образе [12, 36] можно заключить, что отображение ),(2 vU j BL -измеримо и
компактнозначно при kRv , ],[ Tt . Поэтому в силу теоремы об опорной
функции [36] многозначное отображение ),(2 vU j содержит BL -измеримый
селектор ),(2 vu j = ),(max 2
...,,1
vUlex j
ee N
. Для номера ,, jii положим ),(2 vui =
),,(max
...,,1
vTUlex i
ee N
. Селекторы ),(2 vui при всех Ni ...,,1 являются суперпо-
зиционно измеримыми функциями [12], и справедливо условие ),(2 vui =
p
iT
p
i vTF
1
)ˆ)(( 1 , ],[ Tt , kRv . Управление преследователей на ин-
тервале ],[ Tt положим равным
)(iu = ))(,(2 vui . (27)
Принимая во внимание равенство ))(())(( TzTz jjjjj , формулу (18) при
выбранных управлениях и определение сопряженной функции, имеем
))(( Tz jj =
jj dom
max [ )))(,,(,( 0 jjjj zT +
+
T
jj
0
,[( )]()([
)(
TuBe jjj
AT j
dvCe j
AT
j
j ))](
)(
)( jj ]. (28)
Прибавим и вычтем в квадратных скобках выражения (28) величину
Международный научно-технический журнал
«Проблемы управления и информатики», 2019, № 2 19
[ )))(,,(,( 0 jjjj zT )( jj ]
t
jj
Rv
dzvT
k
0
0 ),,,(inf .
Тогда, учитывая соотношения (23)–(27), получим
))(( Tz jj =
jj dom
max {[ )))(,,(,( 0 jjjj zT )( jj ] )( th +
+
t
jj
0
,[( )]()([ 1)(
TuBe jjj
AT j ))(
)(
vCe j
AT
j
j +
+ ),,,(inf 0
jj
Rv
zvT
k
[ ))(,,(,( 0 jjjj zT djj )]]( ]+
+
T
t
jj ,( )]()([ 2)(
TuBe jjj
AT j
dvCe j
AT
j
j ))(
)(
}.
Отсюда следует, что группа преследователей может гарантировать в момент T
выполнение неравенства
))(( Tz ))(( Tz jj )()))(,,(( 0
thzT jjjj = 0.
Проверим допустимость управлений )(iu , ],0[ T . По построению спра-
ведливы соотношения
T
p
i du
0
)( =
t
p
i du
0
1 )( +
T
t
p
i du )(2 =
p
ii
p
i
p
T
iT
p
i dTF ˆ]ˆ)([
0
1 .
Случай 0)))(,,(( 0 zT можно рассмотреть так же, как в теореме 1.
Теорема доказана.
Обозначим ),,( zt =
NiRv k ...,,1
maxinf
),,,( ii zvt , ],0[ t , ,{ izz in
i Rz ,
}...,,1 Ni .
Лемма. Функция ),,( zt =
NiRv k ...,,1
maxinf
),,,( ii zvt , ],0[ t , является
измеримой по , при каждом t , 0t , функцией.
Доказательство. Рассмотрим для каждого 1R и ],0[ t многозначное
отображение )(G = { kRv :
Ni ...,,1
max
),,,( ii zvt < }, которое имеет открытые
значения в силу полунепрерывности сверху по kRv функции
Ni ...,,1
max
),,,( ii zvt при любом ],0[ t . График этого отображения )(tgrG =
{ ),( v : )( Gv , ],0[ t }, будет BL -измерим по совокупности ),( v ,
)( Gv , ],0[ t , для любого t , поскольку функция
Ni ...,,1
max
),,,( ii zvt
20 ISSN 0572-2691
BL -измерима по совокупности ),( v [12]. Тогда по теореме об измеримости
проекции [36] множество { ],0[ t : ),( v )(tgrG для некоторого )( Gv }
будет L -измеримо.
Пусть Q — счетное плотное множество в kR [36]. Для любого 1R имеем
{ ],0[ t :
NiRv k ...,,1
maxinf
),,,( ii zvt < }={ ],0[ t : )(G }=
= { ],0[ t : ),( v )(tgrG для некоторого )( Gv } =
= { ],0[ t : ),( q )(tgrG для некоторого QGq )( } =
=
QGq
)(
{ ],0[ t : ),( q )(tgrG .
Но, как отмечалось выше, множество { ],0[ t : ),( q )(tgrG для неко-
торого QGq )( } измеримо, и поэтому функция ),,( zt
NiRv k ...,,1
maxinf
),,,( ii zvt является измеримой по , ],0[ t .
Рассмотрим для некоторого начального положения ,{ 00
izz in
i Rz 0 ,
}...,,1 Ni и набора селекторов )( ={ )(i , )()( tii , }...,,1 Ni множество
))(,( 0 zTN = { 0t :
t
Ndzt
0
0 ),,( } (29)
и его наименьший элемент
))(,( 0 ztN = :inf{t ))(,( 0 zTt N }.
Если для ],0[ t и ,{ 00
izz in
i Rz 0 , }...,,1 Ni , ),,( 0zt , то в
этом случае значение интеграла в фигурных скобках соотношения (29) естествен-
но положить равным и ))(,( 0 zTt N . В случае, когда неравенство в соот-
ношении (29) не выполняется при всех 0t , положим ))(,( 0zTN и, соот-
ветственно, ))(,( 0ztN .
Следствие 3. Пусть справедливы условия 1, 2, функции )( ii z являются соб-
ственными выпуклыми замкнутыми ограниченными снизу по iz функциями и для
некоторого начального положения ,{ 00
izz in
i Rz 0
, }...,,1 Ni и набора селек-
торов )( = { )(i , )()( tii , }...,,1 Ni множество ))(,( 0 zTN не пусто и
))(,( 0 zTT N . Тогда ))(,())(,( 00 zTzTN и игру группового преследова-
ния для конфликтно-управляемого процесса (1)–(4) можно окончить в момент T
с использованием контруправления вида (6) с переключением, момент которого
не зависит от предыстории управления.
Доказательство. Имеют место следующие соотношения:
Ni ...,,1
max
T
ii
Rv
dzvT
k
0
0),,,(inf
N
i
T
ii
Rv
N
dzvT
k
1 0
01 ),,,(inf
Международный научно-технический журнал
«Проблемы управления и информатики», 2019, № 2 21
=
N
1
T N
i
ii
Rv
dzvT
k
0 1
0 ),,,(inf
T
N
dzT
0
01 1),,( .
Таким образом, ))(,())(,( 00 zTzTN и осталось применить теорему 2.
Следствие 4. Пусть справедливы условия 1, 2, функции )( ii z являются
собственными выпуклыми замкнутыми ограниченными снизу по iz функция-
ми и для некоторого начального положения ,{ 00
izz in
i Rz 0 , }...,,1 Ni
и набора селекторов )( = { )(i , )()( tii , }...,,1 Ni справедливо условие
))(,( 0zt . Тогда, если группа преследователей использует законы
управления вида (6), описанные при доказательстве теоремы 2, то для любого
,T T0 ))(,( 0 zt , существует такой номер j , Nj 1 , что справедлива
оценка
))((sup
],0[)(
Tz
TVv
)))(,,(( 0 jjjj zT [1
Ni ...,,1
max
T
ii
Rv
dzvT
k
0
0 ),,,(inf ].
Доказательство аналогично доказательству теоремы 2, при условии что кон-
трольную функцию следует задать в виде
)(th =
Ni ...,,1
max
T
ii
Rv
dzvT
k
0
0 ),,,(inf ]
Ni ...,,1
max
t
ii
Rv
dzvT
k
0
0 ),,,(inf .
Теорема 3. Пусть справедливы условия 1, 2, функции )( ii z являются соб-
ственными выпуклыми замкнутыми ограниченными снизу по iz функциями и для
некоторого начального положения ,{ 00
izz in
i Rz 0
, }...,,1 Ni и набора селек-
торов )( = { )(i , )()( tii , }...,,1 Ni множество ))(,( 0 zT не пусто и
))(,( 0 zTT . Тогда игру группового преследования для конфликтно-управ-
ляемого процесса (1)–(4) можно окончить в момент T с использованием
контруправления вида (6) без переключения.
Доказательство. Пусть )(v — произвольное допустимое управление убе-
гающего, для которого выполняется ограничение (3).
Рассмотрим случай )))(,,(( 0 zT >0, ))(,,( 0 zT ={ ))(,,( 0 iii zT ,
}...,,1 Ni .
Положим для ],0[ T
),( 0zT =
Ni ...,,1
max
T
ii
Rv
dzvT
k
0
0 ),,,(inf ,
),,( 0
ii zT =
),(
1
0zT
),,,(inf 0
ii
Rv
zvT
k
.
Для Ni ...,,1 рассмотрим интегралы
T
ii dzT
0
0),,( . Тогда по построению су-
ществует номер Njj 1, , такой что .1),,(
0
0
T
jj dzT Поскольку 1),( 0 zT ,
то ),,( 0
jj zT ),,,(),,,(inf 00
jjjj
Rv
zvTzvT
k
, ],0[ T , kRv .
22 ISSN 0572-2691
Таким образом, в силу выпуклозначности множества ),,,( 0
jj zvt имеем
),,( 0
jj zT ),,,( 0
jj zvt , ],0[ T , kRv .
Рассмотрим многозначное отображение при kRv , ],0[ T ,
),( vU j ={ ),,( vTUu jj :
jji dom
max
)]([,[(
)(
TuBe jjj
AT
jj
j
)
)(
vCe j
AT
j
j .0)]]())(,[(),,( 0
jjjjjj tzT (30)
В силу свойств параметров процесса (1), функций )( jj z и ),,( 0
jj zT
отображение ),( vU j BL -измеримо [12] и компактнозначно при ],0[ T ,
kRv . Поэтому в силу теоремы об опорной функции [36] многозначное отобра-
жение ),( vU j содержит BL -измеримый селектор ),( vu j = ),(max
...,,1
vUlex j
ee N
.
Для номера ,, jii положим ),( vui = ),,(max
...,,1
vTUlex i
ee N
. Селекторы ),( vui
при всех Ni ...,,1 являются суперпозиционно измеримыми функциями [12],
и справедливо условие ),( vui = p
iT
p
i vTF
1
)ˆ)(( 1 , ],0[ T , kRv .
Управление преследователей на интервале ],0[ T положим равным
)(iu = ))(,( vui . (31)
Принимая во внимание равенство ))(())(( TzTz jjjjj , формулу (18) при
выбранных управлениях и определение сопряженной функции, имеем
))(( Tz jj =
jji dom
max [ )))(,,(,( 0 jjjj zT +
+
T
jj
0
,[( )]()([
)(
TuBe jjj
AT j
dvCe j
AT
j
j ))](
)(
)( jj ]. (32)
Прибавим и вычтем в квадратных скобках выражения (32) величину
[ )))(,,(,( 0 jjjj zT )( jj ]
T
jj dzT
0
0 ),,( .
Тогда, учитывая соотношения (30), (31), получим
))(( Tz jj =
jji dom
max {[ )))(,,(,( 0 jjjj zT )( jj ] (1
T
jj dzT
0
0 ),,( )+
+
T
jj
0
,[( )]()([
)(
TuBe jjj
AT j ))(
)(
vCe j
AT
j
j +
+ ),,( 0
jj zT [ ))(,,(,( 0 jjjj zT djj )]]( ]}.
Международный научно-технический журнал
«Проблемы управления и информатики», 2019, № 2 23
Отсюда следует, что группа преследователей может гарантировать в момент T
выполнение неравенства
))(( Tz ))(( Tz jj )))(,,(( 0 jjjj zT (1
T
jj dzT
0
0 ),,( ) = 0.
Проверим допустимость управлений )(iu , Ni ...,,1 , ],0[ T . По постро-
ению справедливы соотношения
T
p
i du
0
)( =
T
iT
p
i dTF
0
1 ]ˆ)([
p
ii
p
i
p ˆ .
Случай 0)))(,,(( 0 zT можно рассмотреть так же, как в теореме 1.
Теорема доказана.
Теорема 4. Пусть справедливы условия 1, 2, функции )( ii z являются соб-
ственными выпуклыми замкнутыми ограниченными снизу по iz функциями и
для некоторого начального положения ,{ 00
izz in
i Rz 0 , }...,,1 Ni и набора
селекторов )( = { )(i , )()( tii , }...,,1 Ni множество ))(,( 0 zTN не пусто.
Тогда имеют место следующие включения ))(,())(,())(,( 000
zTzTzTN
и неравенства ))(,())(,())(,( 000
ztztztN .
Доказательство непосредственно следует из соответствующих определений
и теорем.
Заключение
В работе рассматриваются линейные дифференциальные игры группового
преследования с терминальной функцией платы и интегральными ограничени-
ями на управления. Сформулированы достаточные условия окончания игры за
конечное гарантированное время в случае, когда справедливо условие
М.С. Никольского [6]. Предложена модифицированная схема метода разрешаю-
щих функций, которая обеспечивает окончание игры за определенное гарантиро-
ванное время в классе стробоскопических стратегий Хайека [13]. Показано, что
без дополнительных предположений это время совпадает с гарантированным
временем в классе квазистратегий. Дано сравнение гарантированных времен.
Й.С. Раппопорт
МЕТОД РОЗВ’ЯЗУВАЛЬНИХ ФУНКЦІЙ
В ЗАДАЧІ ГРУПОВОГО ПЕРЕСЛІДУВАННЯ
З ТЕРМІНАЛЬНОЮ ФУНКЦІЄЮ
ПЛАТИ ТА ІНТЕГРАЛЬНИМИ
ОБМЕЖЕННЯМИ НА КЕРУВАННЯ
Запропоновано метод вирішення ігрових завдань динаміки з термінальною фу-
нкцією плати і інтегральними обмеженнями на керування, який полягає в сис-
тематичному використанні ідей Фенхеля–Моро стосовно загальної схеми
методу розв’язувальних функцій. Сутність запропонованого методу в тому, що
розв’язувальну функцію вдається виразити через спряжену до функції плати і,
використовуючи інволютивність оператора сполучення для опуклої замкнутої
24 ISSN 0572-2691
функції, отримати гарантовану оцінку термінального значення функції плати,
яку представлено через значення плати в початковий момент і інтеграл від
розв’язувальної функції. Головною особливістю методу є накопичувальний
принцип, який використовується в поточному підсумовуванні розв’язувальної
функції для оцінки якості гри аж до досягнення деякого порогового значення.
Розглянуто лінійні диференціальні ігри групового переслідування з терміналь-
ною функцією плати та інтегральними обмеженнями на керування. Сформу-
льовано достатні умови закінчення гри за кінцевий гарантований час у класі
квазістратегій. Запропоновано дві схеми методу розв’язувальних функцій, що
забезпечують без додаткових припущень завершення гри за кінцевий гаранто-
ваний час у класі стробоскопічних стратегій. Показано результати порівняння
гарантованих часів різних схем методу розв’язувальних функцій.
Ключові слова: лінійна диференціальна гра, термінальна функція плати, інтег-
ральні обмеження, багатозначне відображення, вимірний селектор, стробоско-
пічна стратегія, групове переслідування.
J.S. Rappoport
METHOD OF RESOLVING FUNCTIONS
IN THE GROUP PURSUIT PROBLEM
WITH A TERMINAL PAY OFF FUNCTION
AND INTEGRAL CONSTRAINTS ON CONTROLS
A method is proposed for solving game dynamics problems with a terminal pay off
function and integral constraints on controls, which consists in systematically using
the ideas of Fenhel-Moreau in relation to the general scheme of the method of resolv-
ing functions. The essence of the proposed method lies in the fact that the resolving
function can be expressed through the function conjugate to the pay off function and,
using the involute of the conjugation operator for a convex closed function, to obtain
a guaranteed estimate of the terminal value of the pay off function, which is repre-
sented through the paying off value at the initial time and the integral of the resolving
function. The main feature of the method is the cumulative principle, which is used in
the current summation of the resolving function for assessing the quality of the game
until a certain threshold value is reached. The paper considers linear differential
games of group pursuit with a terminal pay off function and integral constraints on
controls. Sufficient conditions for termination of the game for a finite guaranteed
time in the class of quasi-strategies are formulated. Two schemes of the method of
resolving functions are proposed that ensure without additional assumptions the
completion of the game for the final guaranteed time in the class of stroboscopic
strategies. The guaranteed times for various schemes of the resolving-functions
method are compared.
Keywords: linear differential game, terminal pay off function, integral constraints,
multivalued mapping, measurable selector, stroboscopic strategy, group approach.
1. Раппопорт И.С., Чикрий А.А. О гарантированном результате в дифференциальной игре с тер-
минальной функцией платы. Прикладная математика и механика. 1995. 59, № 5. С. 714–720.
2. Раппопорт И.С., Чикрий А.А. Гарантированный результат в дифференциальной игре груп-
пового преследования с терминальной функцией платы. Прикладная математика и меха-
ника. 1997. 61, № 4. С. 584–594.
3. Раппопорт И.С. Метод разрешающих функций в теории конфликтно-управляемых процес-
сов с терминальной функцией платы. «Международный научно-технический журнал «Про-
блемы управления и информатики». 2016. № 3. С. 49–58.
4. Раппопорт И.С. О стробоскопической стратегии в методе разрешающих функций для
игровых задач управления с терминальной функцией платы. Кибернетика и системный
анализ. 2016. 52, № 4. С. 90–102.
5. Раппопорт И.С. Достаточные условия гарантированного результата в дифференциальной
игре с терминальной функцией платы. «Международный научно-технический журнал «Про-
блемы управления и информатики». 2018. № 1. С. 72–84.
Международный научно-технический журнал
«Проблемы управления и информатики», 2019, № 2 25
6. Никольский М.С. Прямой метод в линейных дифференциальных играх с интегральными
ограничениями. Управляемые системы. 1969. Вып. 2. С. 49–59.
7. Чикрий А.А., Безмагорычный В.В. Метод разрешающих функций в линейных дифферен-
циальных играх с интегральными ограничениями. Автоматика. 1993. № 4. С. 26–36.
8. Чикрий А.А., Белоусов А.А. О линейных дифференциальных играх с интегральными огра-
ничениями сближения. Тр. ИММ УрО РАН. 2009. 15, № 4. С. 290–301.
9. Саматов Б.Т. О задачах группового преследования при интегральных ограничениях на
управления. I. Кибернетика и системный анализ. 2013. 49, № 5. С. 132–145.
10. Раппопорт И.С. Метод разрешающих функций для игровых задач управления с интеграль-
ными ограничениями. Кибернетика и системный анализ. 2018. 54, № 5. С. 109–127.
11. Chikrii A.A. Conflict controlled processes. Dordrecht; Boston; London: Springer Science and
Business Media, 2013. 424 p.
12. Чикрий А.А., Раппопорт И.С. Метод разрешающих функций в теории конфликтно-
управляемых процессов. Кибернетика и системный анализ. 2012. 48, № 4. С. 40–64.
13. Hajek O. Pursuit Games. New York: Academic Press, 1975. 12. 266 p.
14. Пшеничный Б.Н. Простое преследование несколькими объектами. Кибернетика. 1976.
№ 3. С. 145–146.
15. Пшеничный Б.Н., Раппопорт И.С. Об одной задаче группового преследования. Кибернети-
ка. 1979. № 6. С. 145–146.
16. Пшеничный Б.Н., Чикрий А.А., Раппопорт И.С. Эффективный метод решения дифферен-
циальных игр со многими преследователями. Докл. АН СССР. 1981. 256, № 3. С. 530–535.
17. Пшеничный Б.Н., Чикрий А.А., Раппопорт И.С. Преследование несколькими управля-
емыми объектами при наличии фазовых ограничений. Докл. АН СССР. 1981. 259,
№ 4. С. 785–788.
18. Пшеничный Б.Н., Чикрий А.А., Раппопорт И.С. Групповое преследование в дифференци-
альных играх. Techische Hochschul Leipzig, Wissenshaftliche Zeitschriff. 1982. № 1. С. 13–27.
19. Раппопорт И.С. Стратегии группового сближения в методе разрешающих функций для
квазилинейных конфликтно-управляемых процессов. Кибернетика и системный анализ.
2019. 55, № 1. С. 149–163.
20. Пилипенко Ю.В., Чикрий А.А. Колебательные кофликтно-управляемые процессы. Прикл.
математика и механика. 1993. 57, № 3. С. 3–14.
21. Chikrii A.A., Eidelman S.D. Game problems for fractional quasilinear systems. Int. J. Computers
and Mathematics with Applications. 2002. 44, N 7. P. 835–852.
22. Chikrii A.A., Chikrii G.T. Matrix resolving functions in game problems of dynamics. Proceed-
ings of the Steklov Institute of Mathematics. 2015. 291. P. 56–65.
23. Никольский М.С. Первый прямой метод Л.С. Понтрягина в дифференциальных играх. М. :
Изд-во МГУ, 1984. 65 с.
24. Григоренко Н.Л. Математические методы управления несколькими динамическими про-
цессами. М. : Изд-во МГУ, 1990. 198 с.
25. Пшеничный Б.Н., Остапенко В.В. Дифференциальные игры. Киев. : Наук. думка, 1992. 260 с.
26. Pittsyk M.V., Chikrii A.A. On group pursuit problem. Journal of Applied Mathematics and Me-
chanics. 1982. 46, N 5. P. 584–589.
27. Chikrii A.A. Game dynamic problems for systems with fractional derivatives. Pareto optimality,
Game Theory and Equilibria, Springer Optimization and its Applications. 2008. 17. P. 349–387.
28. Chikrii A.A. Multivalued mappings and their selections in game control problems. Journal of Au-
tomation and Information Sciences. 1995. 27, N 1. P. 27–38.
29. Chikrii A.A. An analytical method in dynamic pursuit games. Proceedings of the Steklov Institute
of Mathematics. 2010. 271. P. 69–85.
30. Chikrii A.A., Kalashnikova S.F. Pursuit of a group of evaders by a single controlled object. Cy-
bernetics. 1987. 23, N 4. P. 437–445.
31. Чикрий А.А., Эйдельман С.Д. Обобщенные матричные функции Миттаг–Леффлера в игро-
вых задачах для эволюционных уравнений дробного порядка. Кибернетика и системный
анализ. 2000. 36, № 3. С. 3–32.
32. Analytical method for solution of the game problem of soft landing for moving object. J. Albus,
A. Meystel, A.A. Chikrii, A.A. Belousov, A.J. Kozlov. Cybernetics and Systems Analisis. 2001.
37, N 1. P. 75–91.
33. Рокафеллар Р. Выпуклый анализ. М. : Мир, 1973. 470 с.
34. Филиппов А.Ф.. О некоторых вопросах теории оптимального регулирования. Вестн. МГУ.
Сер. математика, механика, астрономия, физика, химия. 1959. № 2. С. 25–32.
35. Половинкин Е.С. Элементы теории многозначных отображений. М. : Изд-во МФТИ, 1982. 127 с.
36. Aubin J.-P., Frankowska H. Set-valued analysis. Boston; Basel; Berlin : Birkhauser. 1990. 461 p.
Получено 10.01.2019
|