Наближені методи розв’язування диференціальних ігор із випадковим збуренням
Differential games in which the role of the second player is played with a casual noise are investigated. The methods are developed, allowing to approximate guaranteed prizes of players and to build the appropriate strategy. For a substantiation of methods the concept of almost convex function is en...
Gespeichert in:
| Datum: | 2019 |
|---|---|
| Hauptverfasser: | , , |
| Format: | Artikel |
| Sprache: | Russisch |
| Veröffentlicht: |
The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute"
2019
|
| Online Zugang: | https://journal.iasa.kpi.ua/article/view/165555 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
| Назва журналу: | System research and information technologies |
| Завантажити файл: | |
Institution
System research and information technologies| _version_ | 1867334357016903680 |
|---|---|
| author | Ostapenko, V. V. Ostapenko, E. V. Amirgalieva, S. N. |
| author_facet | Ostapenko, V. V. Ostapenko, E. V. Amirgalieva, S. N. |
| author_institution_txt_mv | [
{
"author": "V. V. Ostapenko",
"institution": null
},
{
"author": "E. V. Ostapenko",
"institution": null
},
{
"author": "S. N. Amirgalieva",
"institution": null
}
] |
| author_sort | Ostapenko, V. V. |
| baseUrl_str | http://journal.iasa.kpi.ua/oai |
| collection | OJS |
| datestamp_date | 2019-04-25T16:24:40Z |
| description | Differential games in which the role of the second player is played with a casual noise are investigated. The methods are developed, allowing to approximate guaranteed prizes of players and to build the appropriate strategy. For a substantiation of methods the concept of almost convex function is entered and investigated. |
| first_indexed | 2025-07-17T10:24:56Z |
| format | Article |
| fulltext |
© В.В. Остапенко, Е.В. Остапенко, С.Н. Амиргалиева, 2005
Системні дослідження та інформаційні технології, 2005, № 4 65
TIДC
МЕТОДИ ОПТИМІЗАЦІЇ, ОПТИМАЛЬНЕ
УПРАВЛІННЯ І ТЕОРІЯ ІГОР
УДК 518.9
ПРИБЛИЖЕННЫЕ МЕТОДЫ РЕШЕНИЯ
ДИФФЕРЕНЦИАЛЬНЫХ ИГР СО СЛУЧАЙНОЙ ПОМЕХОЙ
В.В. ОСТАПЕНКО, Е.В. ОСТАПЕНКО, С.Н. АМИРГАЛИЕВА
Рассматриваются дифференциальные игры, в которых роль одного из игроков
играет случайная помеха. Предлагается приближенный метод решения таких
игр. Для его описания вводится и исследуется новое понятие почти выпуклой
функции.
ВВЕДЕНИЕ
В классической теории дифференциальных игр игроки не знают действия
противника в будущем и выбирают управления, основываясь на текущем
или прошедшем состоянии динамической системы. В некоторых подходах
допускается определенная информационная дискриминация одного из игро-
ков. Так, например, если догоняющий игрок P играет в ε -стратегиях [1, 2],
то он выбирает свое управление, зная управление убегающего игрока E на
время ε вперед. Величину ε выбирает игрок E .
В ряде прикладных задач в качестве игрока E выступает некоторая
помеха. Если помеха является случайной величиной и игроку P известны ее
вероятностные характеристики, то он может использовать эту информацию
о возможном будущем управлении противника для построения своей стра-
тегии.
В работе [3] описана структура дифференциальной игры со случайной
помехой и детально изучен некоторый класс линейных игр. В данной статье
рассматриваются игры в общем линейном и нелинейном случаях и приво-
дится приближенный метод их решения, для обоснования которого исполь-
зуются элементы выпуклого и обобщенного выпуклого анализа. Вводится
новое понятие выпуклой функции, обобщающее классическое, и исследуют-
ся ее свойства.
Приближенные методы для решения классических дифференциальных
игр изложены в работах [2, 4–6].
ПОСТАНОВКА ЗАДАЧИ
Рассмотрим управляемый объект, динамика которого описывается уравне-
нием
В.В. Остапенко, Е.В. Остапенко, С.Н. Амиргалиева
ISSN 1681–6048 System Research & Information Technologies, 2005, № 4 66
),,( vuzfz = , (1)
где nEz∈ , Uu∈ , Vv∈ , nE — n -мерное евклидово пространство; U —
компакт из евклидова пространства; V — измеримое подмножество евкли-
дова пространства.
На функцию f и множество U налагаем ограничения:
1) ),,( vuzf — непрерывна по совокупности переменных;
2) )1)((),,( zvCvuzf +≤ , где )(vC — непрерывная функция;
3) ),,( vUzf — выпуклое множество.
Параметром u распоряжается игрок P , параметр v является случай-
ной помехой с функцией распределения )(⋅µ .
Пусть θ — фиксированный момент времени; Φ — непрерывный
функционал, определенный на nE .
Рассмотрим задачу минимизации игроком P функции ))(( θzΦ , где
)(⋅z — решение уравнения (1).
Опишем стратегию игрока P . Пусть { }θτττω =<<<== k...0 10 —
конечное разбиение интервала ],0[ θ , 1−−= iii ττδ . Будем считать, что при
фиксированном разбиении ω функция )(tv является кусочно-постоянной с
интервалами постоянства ),[ 1 ii ττ − , ki ,...,1= . Игрок P в начальный момент
00 =τ знает начальную позицию 0)0( zz = , величину 1δ , значение помехи
1v на интервале ),[ 10 ττ и выбирает свое управление )(tu на ),[ 10 ττ . Анало-
гично в момент времени 1−iτ игрок P знает )( 1−iz τ , величину iδ , значение
помехи iv на интервале ),[ 1 ii ττ − и выбирает свое управление )(tui ,
),[ 1 iit ττ −∈ . Кроме того, игрок P знает функцию распределения )(⋅µ .
Описанную стратегию игрока P назовем ε -стратегией и обозначим
PΓ . Она является аналогом ε -стратегии [1,2]. Игрок P при этом не знает
заранее разбиения ω , и ему лишь по ходу игры становятся известными зна-
чения длин интервалов iδ . Поэтому естественно ввести второго игрока E и
оставить за ним право выбора разбиения ω .
Обозначим εR оператор, ставящий в соответствие каждой непрерыв-
ной функции )(xψ функцию
∫ ⋅=
⋅
V
U
dvxvuzx )()),),(|((inf)(
)(
µεψψ ε , (2)
где ),),(|( xvutz ⋅ — решение (1), соответствующее управлениям vu ),(⋅ и
начальной позиции x . Инфинум в (2) берется по всем допустимым управле-
ниям игрока P на интервале ],0[ ε , т.е. по всем измеримым функциям на
],0[ ε со значениями в U . Отметим, что в силу ограничений на функцию f
и непрерывности ψ инфинум в (2) достигается.
Положим
Φ=Φ
k
RRR δδ
ω ...
1
, Φ=Φ ω
ω
θ RR sup~ ,
Приближенные методы решения дифференциальных игр со случайной помехой
Системні дослідження та інформаційні технології, 2005, № 4 67
где супремум берется по всем разбиениям ω интервала ],0[ θ .
Будем считать, что при фиксированном ω значения помехи iv на ин-
тервалах );[ 1 ii ττ − являются независимыми случайными величинами. Пред-
положим, что игрок P выбрал некоторую стратегию PΓ , описанную выше.
Это означает, что его управления )(⋅iu на интервалах );[ 1 ii ττ − зависят от
реализации случайных помех iv и текущих значений )( 1−iz τ . Обозначим
),,...,,|( 1 xvvz kPΓθ решение (1), соответствующее стратегии PΓ и реализа-
циям kvv ,...,1 при начальном условии xz =0 . Тогда
∫∫ ΓΦ=ΓΦ
V
kkP
V
P dvdvxvvzxzM )()...(),,...,,|((...)),|((( 11 µµθθω (3)
является математическим ожиданием значения функционала Φ на конце
траектории )(θz , соответствующее ε -стратегии PΓ и разбиению ω .
Цель игрока P — минимизировать функционал (3).
Теорема 1. Для любого 0>ε существует стратегия *
PΓ игрока P та-
кая, что для любого разбиения ω
εθ θω +Φ≤ΓΦ )(~)),|(( * xRxzM P .
Для любого 0>ε существует разбиение εω такое, что для любой
стратегии PΓ
εθ θωε −Φ≥ΓΦ )(~)),|(( xRxzM P .
Из теоремы 1 следует, что для описания гарантированного математиче-
ского ожидания минимума функционала ))(( θzΦ и построения стратегии
*
PΓ можно использовать оператор θR~ .
ПОЧТИ ВЫПУКЛЫЕ ФУНКЦИИ
Пусть K — выпуклое подмножество пространства nE .
Определение 1. Функция )(xϕ называется слабо почти выпуклой с
константой 0≥κ , если для любых векторов Kxi ∈ и чисел 0≥iλ , Ii∈ ,
1=∑
∈Ii
iλ , I — произвольное конечное множество индексов, выполняется
2)( rxx
Ii
ii
Ii
ii κϕλλϕ +≤⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
∑∑
∈∈
,
где ji
Iji
xxr −=
∈,
max .
Определение 2. Функция )(xϕ называется сильно почти выпуклой с
константой 0≥κ , если для любых Kxi ∈ , 0≥iλ , Ii∈ , 1=∑
∈Ii
iλ сущест-
вует такое Ky∈ , что
В.В. Остапенко, Е.В. Остапенко, С.Н. Амиргалиева
ISSN 1681–6048 System Research & Information Technologies, 2005, № 4 68
2rxy
Ii
ii κλ ≤−∑
∈
, ∑
∈
≤
Ii
ii xy )()( ϕλϕ ,
где ji
Iji
xxr −=
∈,
max .
Лемма 1. Пусть )(xϕ удовлетворяет условию Липшица с константой
L и является сильно почти выпуклой с константой κ . Тогда )(xϕ — слабо
почти выпуклая функция с константой κL .
Доказательство. Обозначим ∑
∈
=
Ii
ii xx λ . В силу условий леммы
2)()()( rLxxyLyx
Ii
ii κϕλϕϕ +≤−+≤ ∑
∈
,
что и доказывает слабую почти выпуклость функции ϕ . Величины ix , iλ ,
y и r взяты из определения 2.
Обозначим { }γϕγϕ ≤∈∈= + )(,:),(epi 1 xKxEx n надграфик функции ϕ .
Определение 3. Множество nEM ⊂ называется почти выпуклым с
константой 0≥κ , если для любых Mxi ∈ , 0≥iλ , 1=∑
∈Ii
iλ выполняется
SrMx
Ii
ii
2κλ +∈∑
∈
,
где ji
Iji
xxr −=
∈,
max , { }1: ≤∈= xExS n — единичный шар.
Обычная выпуклость функции ϕ связана с выпуклостью множества
ϕepi . Посмотрим, что происходит в случае почти выпуклости.
Лемма 2. Пусть ϕ — слабо почти выпуклая с константой κ функция.
Тогда ϕepi — почти выпуклое с константой κ множество.
Доказательство. Пусть ϕγ epi),( ∈iix , 0≥iλ , Ii∈ , 1=∑
∈Ii
iλ . Тогда
iix γϕ ≤)( , Ii∈ . Положим ∑
∈
=
Ii
ii xx λ , ∑
∈
=
Ii
iix γγ . Из слабой почти вы-
пуклости следует µκγκγλκϕλϕ =+=+≤+≤ ∑∑
∈∈
222)()( rrrxx
Ii
ii
Ii
ii .
Отсюда ϕµ epi),( ∈x . С другой стороны, 2),(),( rxx κµγ ≤− . Это и
означает почти выпуклость с константой κ множества ϕepi .
Лемма 3. Пусть функция ϕ удовлетворяет условию Липшица с кон-
стантой L , ϕepi — почти выпуклое множество с константой κ . Тогда
функция ϕ — слабо почти выпукла с константой )( κκ L+ .
Доказательство. Пусть Kxi ∈ , 0≥iλ , Ii∈ , 1=∑
∈Ii
iλ , )( ii xϕγ = ,
∑
∈
=
Ii
ii xx λ , ∑
∈
=
Ii
iiγλγ .
Приближенные методы решения дифференциальных игр со случайной помехой
Системні дослідження та інформаційні технології, 2005, № 4 69
Так как ϕγ epi),( ∈iix , то существует пара ϕµ epi),( ∈y такая, что
2),(),( ryx κµγ ≤− .
Отсюда 2ryx κ≤− , 2rκµγ ≤− . В результате получаем
2)()( rxy
Ii
ii κϕλµϕ +≤≤ ∑
∈
.
В силу условия Липшица 222)()( rLrrLyx κκγκϕϕ ++≤+≤ .
Лемма 4. Пусть функция ϕ — дважды непрерывно дифференцируемая
в окрестности множества K и ∞<=
∈
)(sup 2
2
x
dx
d
Kx
ϕκ . Тогда ϕ — слабо поч-
ти выпукла с константой κ .
Доказательство. Пусть Kxi ∈ , 0≥iλ , 1=∑
∈ Ii
iλ , ∑
∈
=
Ii
ii xx λ , =r
ji
Iji
xx −=
∈,
max . По формуле Тейлора )())(()()( xxoxxxxx iii −+−′+= ϕϕϕ ,
где 2)( rxxo i κ≤− . Отсюда, так как
22)()( rrxxoxxo
Ii
i
Ii
ii
Ii
ii κκλλλ =≤−≤− ∑∑∑
∈∈∈
,
то
+⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
−′+= ∑∑
∈∈
xxxxx
Ii
ii
Ii
ii λϕϕϕλ )()()( 2)()( rxxxo
Ii
ii κϕλ −≥−∑
∈
.
Пусть nn EEf →: — непрерывно дифференцируемая функция; U —
выпуклый компакт в пространстве nE ; 0>h — число.
Рассмотрим функцию
))((min)( huhxfxx
Uu
++=
∈
ϕψ . (4)
Лемма 5. Пусть ϕ удовлетворяет условию Липшица с константой L и
является слабо почти выпуклой с константой κ ; )(sup 2
2
xf
dx
dD
Kx∈
= . Тогда
функция ψ — слабо почти выпукла с константой hDL+κ .
Доказательство. Пусть Kxi ∈ , 0≥iλ , 1=∑
∈ Ii
iλ , ∑
∈
=
Ii
ii xx λ ,
ji
Iji
xxr −=
∈,
max . По формуле Тейлора +−′+= )()()()( xxxfxfxf ii
)( xxo i −+ , где 2)( rDxxo i ≤− . Из (4) следует существование таких
Uui ∈ , что ))(()( huhxfxx iiii ++=ϕψ . Поскольку U выпукло, то суще-
ствует Uu ∈ такое, что uu
Ii
ii =∑
∈
λ .
В.В. Остапенко, Е.В. Остапенко, С.Н. Амиргалиева
ISSN 1681–6048 System Research & Information Technologies, 2005, № 4 70
Отсюда
( )≥+−+−′++=∑∑
∈∈ Ii
iiixii
Ii
ii huhxxohxxxfhxfxx )()()()()( ϕλψλ
( ) ≥−+−++≥ 2)()( rhuhxxohxfx i κϕ
( ) 22)( rhLDrhuhxfx −−++≥ κϕ .
ПРИБЛИЖЕННЫЙ МЕТОД
Будем предполагать, что множество V — компакт, а функция )(zΦ удовле-
творяет условию Липшица с константой KL на каждом компакте K . В этом
случае функцию ΦθR~ можно представить следующим образом.
Обозначим
m
hh
m
h RRR ...= . Так же, как и в работе [2], доказывается
Теорема 2. Φ=Φ
=
m
h
mh
RR
θ
θ sup~ и последовательность { }Φm
hR , ,...2,1=m
равномерно на каждом компакте сходится в функции ΦθR~ .
Обозначим hχ оператор, который ставит в соответствие каждой непре-
рывной функции )(xϕ функцию ( ) )(),,(min)( dvhvuxfxx
V
Uu
µϕψ ∫ +=
∈
.
В данном пункте рассмотрены вопросы приближения оператора tR~
оператором tmhm
h =,χ , где
m
hh
m
h χχχ ...= . Пусть K — компакт из nE . По-
ложим
∪ ∪
],0[ )(
)(
0
0
)),(),(|(co)(
tt
Kx
v
u
xvutztK
∈
∈
⋅
⋅
⋅⋅= ,
где объединение берется по всем измеримым функциям )(⋅u и )(⋅v со зна-
чениями соответственно U и V . Так же, как и в работе [2], доказывается
Лемма 6. Существует константа 01 ≥C , зависящая только от )( 0tK ,
такая, что для всех Kx∈ , m и h таких, что 0thm ≤ , выполняется
hCxRx m
h
m
h 1)()( ≤Φ−Φχ .
Из теоремы 2 и леммы 6 следует
Теорема 3. Последовательности функций { }tmhm
h =Φ,χ равномерно на
каждом компакте сходятся к функции ΦtR~ , ],0[ 0tt∈ .
Теорема 4. Пусть )(xΦ слабо почти выпукла с константой κ на мно-
жестве )( 0tK , 00 ≥t . Тогда существует константа 02 ≥C , зависящая только
от )( 0tK , такая, что для всех 0tt ≤ и Kx∈ выполняется −Φ )(~ xRt
2
2)( tCxt ≤Φ− χ .
Приближенные методы решения дифференциальных игр со случайной помехой
Системні дослідження та інформаційні технології, 2005, № 4 71
Доказательство. Обозначим
⎭
⎬
⎫
⎩
⎨
⎧
∈∈∈
∂
∂
= VvUutKzvuzf
z
F ,),(:),,(max 01 ,
2F — константа такая, что для всех 0tt ≤
2
2
0
))(),(,()),(),(|( tFdvuxfxxvutz
t
≤
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
+−⋅⋅ ∫ τττ ,
21FFF = , { }VvUutKzvuzfF ∈∈∈= ,),(:),,(max2 03 .
Поскольку функция )(xΦ ограничена снизу на компакте )( 0tK , то, не
ограничивая общности, можно считать, что )(xΦ неотрицательна на )( 0tK .
Пусть m и h такие, что thm = . Тогда справедливы следующие цепоч-
ки неравенств:
×⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
+Φ≥Φ ∫ ∑∫∫
=∈∈∈
V
m
i
ii
Uu
V
Uu
V
Uu
m
h hvuxfxx
m 1
),,(min...minmin)(
21
χ
≥−× 2
12 )()(...)( tFvdvdvd m µµµ
≥−⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
+Φ≥ ∫ ∑∫
=∈
=
2
1
1
)(...)(),,(min...
,...,1
tFvdvdhvuxfx m
V
m
i
iiUu
V mi
i
µµ
=−⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
+Φ≥ ∫ ∑
=∈
=
2
1
)(),,(min
,...,1
tFvdhvuxfx
V
m
i
iiUu
mi
i
µ
( ) 22 )()(),,(min tFxtFvdtvuxfx t
V
Uu
−Φ=−+Φ= ∫ ∈
χµ ,
×⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
+Φ≤Φ ∫ ∑∫∫
=∈∈∈
V
m
i
ii
Uu
V
Uu
V
Uu
m
h hvuxfxx
m 1
),,(min...minmin)(
21
χ
=+× 2
12 )()(...)( tFvdvdvd m µµµ
≤+⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
+Φ= ∫ ∑∫
=
=
2
1
1
1),...,(
)(...)()),,...,(,(...min
,...,1
1
tFvdvdhvvvuxfx m
V
m
i
iii
V
vvu
mi
ii
µµ
≤+⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
+Φ≤ ∫ ∑∫
=
=
2
1
1)(
)(...)()),(,(...min
,...,1
tFvdvdhvvuxfx m
V
m
i
iii
V
vu
mi
ii
µµ
[ ]∫∫ ×+Φ+++Φ≤
= V
mm
V
vu
tvvuxfxtvvuxfx
t
h
mi
i
))),(,((...))),(,((...min 11)(
,...,1
В.В. Остапенко, Е.В. Остапенко, С.Н. Амиргалиева
ISSN 1681–6048 System Research & Information Technologies, 2005, № 4 72
=++× 222
31)(...)( tFtFvdvd m κµµ
( ) =+++Φ= ∫ 22
3
)(
)())),(,((min tFFdvtvvuxfx
V
vu
κµ
22
3 )()( tFFxt ++Φ= χχ .
Здесь минимумы по ),...,( 1 ii vvu и )(vu берутся по всем измеримым
отображениям со значениями в U .
Из полученных неравенств, произвольности m и h , а также теоремы 3
следует справедливость теоремы 4.
Предположение 1. Существуют константы 00 >t и 0≥κ такие, что
функции Φk
hχ слабо почти выпуклые на K для всех k и h таких, что
0thk ≤ .
Теорема 5. Пусть выполняется предположение 1, тогда существует
константа 03 ≥C такая, что для всех 0tt ≤ , m и h , thm = , Kx∈ выполня-
ется
hCxxR m
ht 3)()(~
≤Φ−Φ χ .
Доказательство. Из теоремы 4 следует, что 2
2)()(~ hCxxR hh +Φ≤Φ χ .
Отсюда
2
2
22
2
2
22 2)()(~))((~)(~ hCxhCxRhCxRxR hhhhhh +Φ≤+Φ=+Φ≤Φ χχχ .
Продолжая этот процесс, получаем
htCxhtCxxR m
h
m
ht 022 )()()(~
+Φ≤+Φ≤Φ χχ .
Аналогично доказывается неравенство в другую сторону.
Приведем случай дифференциальной игры, для которой выполняется
предположение 1.
Предположение 2. Функция f имеет вид ),(),(),,( 21 vufvzfvuzf += .
Функция )(xΦ слабо почти выпуклая с константой κ на множестве )( 0tK и
Dvzf
z
Vv
tKz
≤
∂
∂
∈
∈
),(max 12
2
)( 0
.
Теорема 6. Из предположения 2 следует предположение 1.
Доказательство. Из леммы 5 следует, что функция )(xhΦχ слабо поч-
ти выпукла на множестве K с константой )( )( 0
hDL tK+κ . Продолжая про-
цесс, нетрудно увидеть, что функция )(xk
hΦχ слабо почти выпукла на K с
константой
0)()( 00
tLDhkDL tKtK +≤+ κκ .
Почти выпуклость служит обобщением понятия выпуклости функции.
Для линейного случая можно ограничиться обычной выпуклостью для
функций.
Приближенные методы решения дифференциальных игр со случайной помехой
Системні дослідження та інформаційні технології, 2005, № 4 73
Предположение 3. Функция f имеет вид ),()(),,( vuBzvAvuzf += ,
где )(vA — матрица, непрерывная по v ; ),( vuB — непрерывная функция;
)(xϕ — выпуклая функция.
Лемма 7. Пусть функция ),( uxϕ выпукла по совокупности перемен-
ных; Uu ∈ , U — выпуклый компакт. Тогда функция ),(min)( uxx
Uu
ϕψ
∈
= яв-
ляется выпуклой по x .
Доказательство. Пусть nExx ∈21, , 0, 21 ≥λλ , 121 =+ λλ . Существует
iu , 2,1=i , такие, что ),()( iii uxx ϕψ = . Отсюда
≥+=+ ),(),()()( 2221112211 uxuxxx ϕλϕλψλψλ
)(),(min),( 2211221122112211 xxuxxuuxx
Uu
λλψλλϕλλλλϕ +=+≥++≥
∈
,
что и означает выпуклость функции )(xψ .
Из леммы 7 и того, что ),( vUB — выпуклый компакт, следует
Теорема 7. При выполнении предположения 3 функция )(xhΦχ вы-
пукла.
Рассмотрим построение стратегии игрока P , решающую приближенно
дифференциальную игру. Предположим, что выполняется предположение 1
и 0t≤θ , θ=mh .
На первом шаге игрок P знает начальную позицию 0z и строит функ-
цию )(
0
vuz как решение задачи минимизации
))),(,(()),,((min
000
1
00
1 hvvuzfzhvuzfz z
m
h
m
h
Uu
+Φ=+Φ −−
∈
χχ .
Поскольку таких решений может быть много, то выбираем в качестве
)(
0
vuz минимальное в лексикографическом смысле. Если помеха имеет
конкретную реализацию *v на некотором подынтервале ],0[),[ 21 h⊂ττ , то
игрок P выбирает на ),[ 21 ττ управление *)(
0
vuz . Пусть )(tv , ),0[ ht ∈ —
функция, составленная из реализаций помехи на интервале ),0[ h ; )(tu —
соответствующее управление игрока P . Обозначим )),(),(|( 01 zvuhzz ⋅⋅= .
На k -м шаге игрок P знает позицию 1−kz и строит функцию
1−kzu как ре-
шение задачи минимизации
))),(,(()),,((min
11111 hvvuzfzhvuzfz
kzkk
km
hkk
km
hUu −−−
−
−−
−
∈
+Φ=+Φ χχ .
Как и ранее, )(
1
vu
kz −
— решение минимальное в лексикографическом
смысле. Пусть )(tv , ),)1[( khhkt −∈ — функция, составленная из реализа-
ций помехи на интервале ),)1[( khhk − ; )(tu — соответствующее управле-
ние игрока P . Положим ))1(()( hktutuk −−= , ))1(()( hktvtvk −−= ,
),)1[( khhkt −∈ , )),(),(|( 1−⋅⋅= kkkk zvuhzz и продолжим процесс. Обозначим
построенную таким образом стратегию игрока P через h
PΓ .
В.В. Остапенко, Е.В. Остапенко, С.Н. Амиргалиева
ISSN 1681–6048 System Research & Information Technologies, 2005, № 4 74
Пользуясь теоремой 5 и аппаратом, разработанным в работах [2, 4], по-
лучаем следующий результат.
Теорема 8. Существуют константа 04 ≥C и для каждого h стратегия
h
PΓ такие, что для любого ω
hCzRzzM h
P 400 )(~)),|(( +Φ≤ΓΦ θω θ .
Игрок E в качестве разбиения может выбрать равномерное разбиение
{ }θω =<<<<= hmhhh ...20 . Из теоремы 5 следует
Теорема 9. Существует константа 05 ≥C такая, что для любой страте-
гии PΓ игрока P
hCzRzzM Ph 500 )(~)),|(( −Φ≥ΓΦ θω θ .
ВЫВОДЫ
Построены приближенные методы решения дифференциальной игры со
случайной помехой, которые позволяют аппроксимировать гарантирован-
ные выигрыши убегающего и догоняющего игроков, а также строить соот-
ветствующие стратегии.
При определенных предположениях получены оценки близости точно-
го и приближенного решений. Эти результаты можно развить на ситуации,
когда помеха описывается некоторым случайным процессом.
ЛИТЕРАТУРА
1. Пшеничный Б.Н. Структура дифференциальных игр // ДАН СССР. — 1969. —
184, № 2. — С. 285–287.
2. Пшеничный Б.Н., Остапенко В.В. Дифференциальные игры. — Киев: Наук.
думка, 1992. — 260 с.
3. Остапенко В.В., Тимошенко О.М. Методы решения дифференциальных игр
при различных стратегиях игроков // Докл. НАН Украины. — 1995. —
№ 6. — С. 5–7.
4. Остапенко В.В. Приближение основного оператора в дифференциальных
играх с фиксированным временем окончания // Кибернетика. — 1984. —
№ 1. — С. 85–89.
5. Ушаков В.Е. К задаче построения стабильных мостов в дифференциальных иг-
рах сближения–уклонения // Изв. АН СССР. Сер. Техн. кибернетика. —
1980. — № 4. — С. 29–36.
6. Алгоритмы и программы решения линейных дифференциальных игр / Под.
ред. А.И. Субботина, В.С. Пацко. — Свердловск: УНЦ АН СССР, 1984. —
295 с.
Поступила 19.03.2004
|
| id | journaliasakpiua-article-165555 |
| institution | System research and information technologies |
| keywords_txt_mv | keywords |
| language | Russian |
| last_indexed | 2025-07-17T10:24:56Z |
| publishDate | 2019 |
| publisher | The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" |
| record_format | ojs |
| resource_txt_mv | journaliasakpiua/22/fb61622c7c73667b390c66e1237d5522.pdf |
| spelling | journaliasakpiua-article-1655552019-04-25T16:24:40Z The approached methods of the decision of differential games with a casual noise Приближенные методы решения дифференциальных игр со случайной помехой Наближені методи розв’язування диференціальних ігор із випадковим збуренням Ostapenko, V. V. Ostapenko, E. V. Amirgalieva, S. N. Differential games in which the role of the second player is played with a casual noise are investigated. The methods are developed, allowing to approximate guaranteed prizes of players and to build the appropriate strategy. For a substantiation of methods the concept of almost convex function is entered and investigated. Рассматриваются дифференциальные игры, в которых роль одного из игроков играет случайная помеха. Предлагается приближенный метод решения таких игр. Для его описания вводится и исследуется новое понятие почти выпуклой функции. Розглянуто диференціальні ігри, в яких роль одного із гравців грає випадкове збурення. Запропоновано наближений метод рішення таких ігор. Для його опису вводиться та досліджується нове поняття майже опуклих функцій. The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2019-04-25 Article Article application/pdf https://journal.iasa.kpi.ua/article/view/165555 System research and information technologies; No. 4 (2005); 65-74 Системные исследования и информационные технологии; № 4 (2005); 65-74 Системні дослідження та інформаційні технології; № 4 (2005); 65-74 2308-8893 1681-6048 ru https://journal.iasa.kpi.ua/article/view/165555/164757 Copyright (c) 2021 System research and information technologies |
| spellingShingle | Ostapenko, V. V. Ostapenko, E. V. Amirgalieva, S. N. Наближені методи розв’язування диференціальних ігор із випадковим збуренням |
| title | Наближені методи розв’язування диференціальних ігор із випадковим збуренням |
| title_alt | The approached methods of the decision of differential games with a casual noise Приближенные методы решения дифференциальных игр со случайной помехой |
| title_full | Наближені методи розв’язування диференціальних ігор із випадковим збуренням |
| title_fullStr | Наближені методи розв’язування диференціальних ігор із випадковим збуренням |
| title_full_unstemmed | Наближені методи розв’язування диференціальних ігор із випадковим збуренням |
| title_short | Наближені методи розв’язування диференціальних ігор із випадковим збуренням |
| title_sort | наближені методи розв’язування диференціальних ігор із випадковим збуренням |
| url | https://journal.iasa.kpi.ua/article/view/165555 |
| work_keys_str_mv | AT ostapenkovv theapproachedmethodsofthedecisionofdifferentialgameswithacasualnoise AT ostapenkoev theapproachedmethodsofthedecisionofdifferentialgameswithacasualnoise AT amirgalievasn theapproachedmethodsofthedecisionofdifferentialgameswithacasualnoise AT ostapenkovv približennyemetodyrešeniâdifferencialʹnyhigrsoslučajnojpomehoj AT ostapenkoev približennyemetodyrešeniâdifferencialʹnyhigrsoslučajnojpomehoj AT amirgalievasn približennyemetodyrešeniâdifferencialʹnyhigrsoslučajnojpomehoj AT ostapenkovv nabliženímetodirozvâzuvannâdiferencíalʹnihígorízvipadkovimzburennâm AT ostapenkoev nabliženímetodirozvâzuvannâdiferencíalʹnihígorízvipadkovimzburennâm AT amirgalievasn nabliženímetodirozvâzuvannâdiferencíalʹnihígorízvipadkovimzburennâm AT ostapenkovv approachedmethodsofthedecisionofdifferentialgameswithacasualnoise AT ostapenkoev approachedmethodsofthedecisionofdifferentialgameswithacasualnoise AT amirgalievasn approachedmethodsofthedecisionofdifferentialgameswithacasualnoise |