Приближенные методы решения дифференциальных игр со случайной помехой
Рассматриваются дифференциальные игры, в которых роль одного из игроков играет случайная помеха. Предлагается приближенный метод решения таких игр. Для его описания вводится и исследуется новое понятие почти выпуклой функции. Differential games in which the role of the second player is played with a...
Saved in:
| Date: | 2005 |
|---|---|
| Main Authors: | , , |
| Format: | Article |
| Language: | Russian |
| Published: |
Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України
2005
|
| Subjects: | |
| Online Access: | https://nasplib.isofts.kiev.ua/handle/123456789/13874 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| Journal Title: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Cite this: | Приближенные методы решения дифференциальных игр со случайной помехой / В.В. Остапенко, Е.В. Остапенко, С.Н. Амиргалиева // Систем. дослідж. та інформ. технології. — 2005. — № 4. — С. 65-74. — Бібліогр.: 6 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| id |
nasplib_isofts_kiev_ua-123456789-13874 |
|---|---|
| record_format |
dspace |
| spelling |
Остапенко, В.В. Остапенко, Е.В. Амиргалиева, С.Н. 2010-12-06T11:26:18Z 2010-12-06T11:26:18Z 2005 Приближенные методы решения дифференциальных игр со случайной помехой / В.В. Остапенко, Е.В. Остапенко, С.Н. Амиргалиева // Систем. дослідж. та інформ. технології. — 2005. — № 4. — С. 65-74. — Бібліогр.: 6 назв. — рос. 1681–6048 https://nasplib.isofts.kiev.ua/handle/123456789/13874 518.9 Рассматриваются дифференциальные игры, в которых роль одного из игроков играет случайная помеха. Предлагается приближенный метод решения таких игр. Для его описания вводится и исследуется новое понятие почти выпуклой функции. Differential games in which the role of the second player is played with a casual noise are investigated. The methods are developed, allowing to approximate guaranteed prizes of players and to build the appropriate strategy. For a substantiation of methods the concept of almost convex function is entered and investigated. Розглянуто диференціальні ігри, в яких роль одного із гравців грає випадкове збурення. Запропоновано наближений метод рішення таких ігор. Для його опису вводиться та досліджується нове поняття майже опуклих функцій. ru Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України Методи оптимізації, оптимальне управління і теорія ігор Приближенные методы решения дифференциальных игр со случайной помехой The approached methods of the decision of differential games with a casual noise Наближені методи розв’язування диференціальних ігор із випадковим збуренням Article published earlier |
| institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| collection |
DSpace DC |
| title |
Приближенные методы решения дифференциальных игр со случайной помехой |
| spellingShingle |
Приближенные методы решения дифференциальных игр со случайной помехой Остапенко, В.В. Остапенко, Е.В. Амиргалиева, С.Н. Методи оптимізації, оптимальне управління і теорія ігор |
| title_short |
Приближенные методы решения дифференциальных игр со случайной помехой |
| title_full |
Приближенные методы решения дифференциальных игр со случайной помехой |
| title_fullStr |
Приближенные методы решения дифференциальных игр со случайной помехой |
| title_full_unstemmed |
Приближенные методы решения дифференциальных игр со случайной помехой |
| title_sort |
приближенные методы решения дифференциальных игр со случайной помехой |
| author |
Остапенко, В.В. Остапенко, Е.В. Амиргалиева, С.Н. |
| author_facet |
Остапенко, В.В. Остапенко, Е.В. Амиргалиева, С.Н. |
| topic |
Методи оптимізації, оптимальне управління і теорія ігор |
| topic_facet |
Методи оптимізації, оптимальне управління і теорія ігор |
| publishDate |
2005 |
| language |
Russian |
| publisher |
Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України |
| format |
Article |
| title_alt |
The approached methods of the decision of differential games with a casual noise Наближені методи розв’язування диференціальних ігор із випадковим збуренням |
| description |
Рассматриваются дифференциальные игры, в которых роль одного из игроков играет случайная помеха. Предлагается приближенный метод решения таких игр. Для его описания вводится и исследуется новое понятие почти выпуклой функции.
Differential games in which the role of the second player is played with a casual noise are investigated. The methods are developed, allowing to approximate guaranteed prizes of players and to build the appropriate strategy. For a substantiation of methods the concept of almost convex function is entered and investigated.
Розглянуто диференціальні ігри, в яких роль одного із гравців грає випадкове збурення. Запропоновано наближений метод рішення таких ігор. Для його опису вводиться та досліджується нове поняття майже опуклих функцій.
|
| issn |
1681–6048 |
| url |
https://nasplib.isofts.kiev.ua/handle/123456789/13874 |
| citation_txt |
Приближенные методы решения дифференциальных игр со случайной помехой / В.В. Остапенко, Е.В. Остапенко, С.Н. Амиргалиева // Систем. дослідж. та інформ. технології. — 2005. — № 4. — С. 65-74. — Бібліогр.: 6 назв. — рос. |
| work_keys_str_mv |
AT ostapenkovv približennyemetodyrešeniâdifferencialʹnyhigrsoslučainoipomehoi AT ostapenkoev približennyemetodyrešeniâdifferencialʹnyhigrsoslučainoipomehoi AT amirgalievasn približennyemetodyrešeniâdifferencialʹnyhigrsoslučainoipomehoi AT ostapenkovv theapproachedmethodsofthedecisionofdifferentialgameswithacasualnoise AT ostapenkoev theapproachedmethodsofthedecisionofdifferentialgameswithacasualnoise AT amirgalievasn theapproachedmethodsofthedecisionofdifferentialgameswithacasualnoise AT ostapenkovv nabliženímetodirozvâzuvannâdiferencíalʹnihígorízvipadkovimzburennâm AT ostapenkoev nabliženímetodirozvâzuvannâdiferencíalʹnihígorízvipadkovimzburennâm AT amirgalievasn nabliženímetodirozvâzuvannâdiferencíalʹnihígorízvipadkovimzburennâm |
| first_indexed |
2025-11-26T13:18:31Z |
| last_indexed |
2025-11-26T13:18:31Z |
| _version_ |
1850622444105105408 |
| fulltext |
В.В. Остапенко, Е.В. Остапенко, С.Н. Амиргалиева, 2005
Системні дослідження та інформаційні технології, 2005, № 4 65
TIДC
МЕТОДИ ОПТИМІЗАЦІЇ, ОПТИМАЛЬНЕ
УПРАВЛІННЯ І ТЕОРІЯ ІГОР
УДК 518.9
ПРИБЛИЖЕННЫЕ МЕТОДЫ РЕШЕНИЯ
ДИФФЕРЕНЦИАЛЬНЫХ ИГР СО СЛУЧАЙНОЙ ПОМЕХОЙ
В.В. ОСТАПЕНКО, Е.В. ОСТАПЕНКО, С.Н. АМИРГАЛИЕВА
Рассматриваются дифференциальные игры, в которых роль одного из игроков
играет случайная помеха. Предлагается приближенный метод решения таких
игр. Для его описания вводится и исследуется новое понятие почти выпуклой
функции.
ВВЕДЕНИЕ
В классической теории дифференциальных игр игроки не знают действия
противника в будущем и выбирают управления, основываясь на текущем
или прошедшем состоянии динамической системы. В некоторых подходах
допускается определенная информационная дискриминация одного из игро-
ков. Так, например, если догоняющий игрок P играет в ε -стратегиях [1, 2],
то он выбирает свое управление, зная управление убегающего игрока E на
время ε вперед. Величину ε выбирает игрок E .
В ряде прикладных задач в качестве игрока E выступает некоторая
помеха. Если помеха является случайной величиной и игроку P известны ее
вероятностные характеристики, то он может использовать эту информацию
о возможном будущем управлении противника для построения своей стра-
тегии.
В работе [3] описана структура дифференциальной игры со случайной
помехой и детально изучен некоторый класс линейных игр. В данной статье
рассматриваются игры в общем линейном и нелинейном случаях и приво-
дится приближенный метод их решения, для обоснования которого исполь-
зуются элементы выпуклого и обобщенного выпуклого анализа. Вводится
новое понятие выпуклой функции, обобщающее классическое, и исследуют-
ся ее свойства.
Приближенные методы для решения классических дифференциальных
игр изложены в работах [2, 4–6].
ПОСТАНОВКА ЗАДАЧИ
Рассмотрим управляемый объект, динамика которого описывается уравне-
нием
В.В. Остапенко, Е.В. Остапенко, С.Н. Амиргалиева
ISSN 1681–6048 System Research & Information Technologies, 2005, № 4 66
),,( vuzfz = , (1)
где nEz ∈ , Uu ∈ , Vv∈ , nE — n -мерное евклидово пространство; U —
компакт из евклидова пространства; V — измеримое подмножество евкли-
дова пространства.
На функцию f и множество U налагаем ограничения:
1) ),,( vuzf — непрерывна по совокупности переменных;
2) )1)((),,( zvCvuzf +≤ , где )(vC — непрерывная функция;
3) ),,( vUzf — выпуклое множество.
Параметром u распоряжается игрок P , параметр v является случай-
ной помехой с функцией распределения )(⋅µ .
Пусть θ — фиксированный момент времени; Φ — непрерывный
функционал, определенный на nE .
Рассмотрим задачу минимизации игроком P функции ))(( θzΦ , где
)(⋅z — решение уравнения (1).
Опишем стратегию игрока P . Пусть { }θτττω =<<<== k...0 10 —
конечное разбиение интервала ],0[ θ , 1−−= iii ττδ . Будем считать, что при
фиксированном разбиении ω функция )(tv является кусочно-постоянной с
интервалами постоянства ),[ 1 ii ττ − , ki ,...,1= . Игрок P в начальный момент
00 =τ знает начальную позицию 0)0( zz = , величину 1δ , значение помехи
1v на интервале ),[ 10 ττ и выбирает свое управление )(tu на ),[ 10 ττ . Анало-
гично в момент времени 1−iτ игрок P знает )( 1−iz τ , величину iδ , значение
помехи iv на интервале ),[ 1 ii ττ − и выбирает свое управление )(tui ,
),[ 1 iit ττ −∈ . Кроме того, игрок P знает функцию распределения )(⋅µ .
Описанную стратегию игрока P назовем ε -стратегией и обозначим
PΓ . Она является аналогом ε -стратегии [1,2 ]. Игрок P при этом не знает
заранее разбиения ω , и ему лишь по ходу игры становятся известными зна-
чения длин интервалов iδ . Поэтому естественно ввести второго игрока E и
оставить за ним право выбора разбиения ω .
Обозначим εR оператор, ставящий в соответствие каждой непрерыв-
ной функции )(xψ функцию
∫ ⋅=
⋅
V
U
dvxvuzx )()),),(|((inf)(
)(
µεψψ ε , (2)
где ),),(|( xvutz ⋅ — решение (1), соответствующее управлениям vu ),(⋅ и
начальной позиции x . Инфинум в (2) берется по всем допустимым управле-
ниям игрока P на интервале ],0[ ε , т.е. по всем измеримым функциям на
],0[ ε со значениями в U . Отметим, что в силу ограничений на функцию f
и непрерывности ψ инфинум в (2) достигается.
Положим
Φ=Φ
k
RRR δδ
ω ...
1
, Φ=Φ ω
ω
θ RR sup~ ,
Приближенные методы решения дифференциальных игр со случайной помехой
Системні дослідження та інформаційні технології, 2005, № 4 67
где супремум берется по всем разбиениям ω интервала ],0[ θ .
Будем считать, что при фиксированном ω значения помехи iv на ин-
тервалах );[ 1 ii ττ − являются независимыми случайными величинами. Пред-
положим, что игрок P выбрал некоторую стратегию PΓ , описанную выше.
Это означает, что его управления )(⋅iu на интервалах );[ 1 ii ττ − зависят от
реализации случайных помех iv и текущих значений )( 1−iz τ . Обозначим
),,...,,|( 1 xvvz kPΓθ решение (1), соответствующее стратегии PΓ и реализа-
циям kvv ,...,1 при начальном условии xz =0 . Тогда
∫∫ ΓΦ=ΓΦ
V
kkP
V
P dvdvxvvzxzM )()...(),,...,,|((...)),|((( 11 µµθθω (3)
является математическим ожиданием значения функционала Φ на конце
траектории )(θz , соответствующее ε -стратегии PΓ и разбиению ω .
Цель игрока P — минимизировать функционал (3).
Теорема 1. Для любого 0>ε существует стратегия *
PΓ игрока P та-
кая, что для любого разбиения ω
εθ θω +Φ≤ΓΦ )(~)),|(( * xRxzM P .
Для любого 0>ε существует разбиение εω такое, что для любой
стратегии PΓ
εθ θωε −Φ≥ΓΦ )(~)),|(( xRxzM P .
Из теоремы 1 следует, что для описания гарантированного математиче-
ского ожидания минимума функционала ))(( θzΦ и построения стратегии
*
PΓ можно использовать оператор θR~ .
ПОЧТИ ВЫПУКЛЫЕ ФУНКЦИИ
Пусть K — выпуклое подмножество пространства nE .
Определение 1. Функция )(xϕ называется слабо почти выпуклой с
константой 0≥κ , если для любых векторов Kxi ∈ и чисел 0≥iλ , Ii∈ ,
1=∑
∈Ii
iλ , I — произвольное конечное множество индексов, выполняется
2)( rxx
Ii
ii
Ii
ii κϕλλϕ +≤
∑∑
∈∈
,
где ji
Iji
xxr −=
∈,
max .
Определение 2. Функция )(xϕ называется сильно почти выпуклой с
константой 0≥κ , если для любых Kxi ∈ , 0≥iλ , Ii∈ , 1=∑
∈Ii
iλ сущест-
вует такое Ky∈ , что
В.В. Остапенко, Е.В. Остапенко, С.Н. Амиргалиева
ISSN 1681–6048 System Research & Information Technologies, 2005, № 4 68
2rxy
Ii
ii κλ ≤−∑
∈
, ∑
∈
≤
Ii
ii xy )()( ϕλϕ ,
где ji
Iji
xxr −=
∈,
max .
Лемма 1. Пусть )(xϕ удовлетворяет условию Липшица с константой
L и является сильно почти выпуклой с константой κ . Тогда )(xϕ — слабо
почти выпуклая функция с константой κL .
Доказательство. Обозначим ∑
∈
=
Ii
ii xx λ . В силу условий леммы
2)()()( rLxxyLyx
Ii
ii κϕλϕϕ +≤−+≤ ∑
∈
,
что и доказывает слабую почти выпуклость функции ϕ . Величины ix , iλ ,
y и r взяты из определения 2.
Обозначим { }γϕγϕ ≤∈∈= + )(,:),(epi 1 xKxEx n надграфик функции ϕ .
Определение 3. Множество nEM ⊂ называется почти выпуклым с
константой 0≥κ , если для любых Mxi ∈ , 0≥iλ , 1=∑
∈Ii
iλ выполняется
SrMx
Ii
ii
2κλ +∈∑
∈
,
где ji
Iji
xxr −=
∈,
max , { }1: ≤∈= xExS n — единичный шар.
Обычная выпуклость функции ϕ связана с выпуклостью множества
ϕepi . Посмотрим, что происходит в случае почти выпуклости.
Лемма 2. Пусть ϕ — слабо почти выпуклая с константой κ функция.
Тогда ϕepi — почти выпуклое с константой κ множество.
Доказательство. Пусть ϕγ epi),( ∈iix , 0≥iλ , Ii∈ , 1=∑
∈Ii
iλ . Тогда
iix γϕ ≤)( , Ii∈ . Положим ∑
∈
=
Ii
ii xx λ , ∑
∈
=
Ii
iix γγ . Из слабой почти вы-
пуклости следует µκγκγλκϕλϕ =+=+≤+≤ ∑∑
∈∈
222)()( rrrxx
Ii
ii
Ii
ii .
Отсюда ϕµ epi),( ∈x . С другой стороны, 2),(),( rxx κµγ ≤− . Это и
означает почти выпуклость с константой κ множества ϕepi .
Лемма 3. Пусть функция ϕ удовлетворяет условию Липшица с кон-
стантой L , ϕepi — почти выпуклое множество с константой κ . Тогда
функция ϕ — слабо почти выпукла с константой )( κκ L+ .
Доказательство. Пусть Kxi ∈ , 0≥iλ , Ii∈ , 1=∑
∈Ii
iλ , )( ii xϕγ = ,
∑
∈
=
Ii
ii xx λ , ∑
∈
=
Ii
iiγλγ .
Приближенные методы решения дифференциальных игр со случайной помехой
Системні дослідження та інформаційні технології, 2005, № 4 69
Так как ϕγ epi),( ∈iix , то существует пара ϕµ epi),( ∈y такая, что
2),(),( ryx κµγ ≤− .
Отсюда 2ryx κ≤− , 2rκµγ ≤− . В результате получаем
2)()( rxy
Ii
ii κϕλµϕ +≤≤ ∑
∈
.
В силу условия Липшица 222)()( rLrrLyx κκγκϕϕ ++≤+≤ .
Лемма 4. Пусть функция ϕ — дважды непрерывно дифференцируемая
в окрестности множества K и ∞<=
∈
)(sup 2
2
x
dx
d
Kx
ϕκ . Тогда ϕ — слабо поч-
ти выпукла с константой κ .
Доказательство. Пусть Kxi ∈ , 0≥iλ , 1=∑
∈ Ii
iλ , ∑
∈
=
Ii
ii xx λ , =r
ji
Iji
xx −=
∈,
max . По формуле Тейлора )())(()()( xxoxxxxx iii −+−′+= ϕϕϕ ,
где 2)( rxxo i κ≤− . Отсюда, так как
22)()( rrxxoxxo
Ii
i
Ii
ii
Ii
ii κκλλλ =≤−≤− ∑∑∑
∈∈∈
,
то
+
−′+= ∑∑
∈∈
xxxxx
Ii
ii
Ii
ii λϕϕϕλ )()()( 2)()( rxxxo
Ii
ii κϕλ −≥−∑
∈
.
Пусть nn EEf →: — непрерывно дифференцируемая функция; U —
выпуклый компакт в пространстве nE ; 0>h — число.
Рассмотрим функцию
))((min)( huhxfxx
Uu
++=
∈
ϕψ . (4)
Лемма 5. Пусть ϕ удовлетворяет условию Липшица с константой L и
является слабо почти выпуклой с константой κ ; )(sup 2
2
xf
dx
dD
Kx∈
= . Тогда
функция ψ — слабо почти выпукла с константой hDL+κ .
Доказательство. Пусть Kxi ∈ , 0≥iλ , 1=∑
∈ Ii
iλ , ∑
∈
=
Ii
ii xx λ ,
ji
Iji
xxr −=
∈,
max . По формуле Тейлора +−′+= )()()()( xxxfxfxf ii
)( xxo i −+ , где 2)( rDxxo i ≤− . Из (4) следует существование таких
Uui ∈ , что ))(()( huhxfxx iiii ++=ϕψ . Поскольку U выпукло, то суще-
ствует Uu ∈ такое, что uu
Ii
ii =∑
∈
λ .
В.В. Остапенко, Е.В. Остапенко, С.Н. Амиргалиева
ISSN 1681–6048 System Research & Information Technologies, 2005, № 4 70
Отсюда
( )≥+−+−′++=∑∑
∈∈ Ii
iiixii
Ii
ii huhxxohxxxfhxfxx )()()()()( ϕλψλ
( ) ≥−+−++≥ 2)()( rhuhxxohxfx i κϕ
( ) 22)( rhLDrhuhxfx −−++≥ κϕ .
ПРИБЛИЖЕННЫЙ МЕТОД
Будем предполагать, что множество V — компакт, а функция )(zΦ удовле-
творяет условию Липшица с константой KL на каждом компакте K . В этом
случае функцию ΦθR~ можно представить следующим образом.
Обозначим
m
hh
m
h RRR ...= . Так же, как и в работе [2], доказывается
Теорема 2. Φ=Φ
=
m
h
mh
RR
θ
θ sup~ и последовательность { }Φm
hR , ,...2,1=m
равномерно на каждом компакте сходится в функции ΦθR~ .
Обозначим hχ оператор, который ставит в соответствие каждой непре-
рывной функции )(xϕ функцию ( ) )(),,(min)( dvhvuxfxx
V
Uu
µϕψ ∫ +=
∈
.
В данном пункте рассмотрены вопросы приближения оператора tR~
оператором tmhm
h =,χ , где
m
hh
m
h χχχ ...= . Пусть K — компакт из nE . По-
ложим
],0[ )(
)(
0
0
)),(),(|(co)(
tt
Kx
v
u
xvutztK
∈
∈
⋅
⋅
⋅⋅= ,
где объединение берется по всем измеримым функциям )(⋅u и )(⋅v со зна-
чениями соответственно U и V . Так же, как и в работе [2], доказывается
Лемма 6. Существует константа 01 ≥C , зависящая только от )( 0tK ,
такая, что для всех Kx∈ , m и h таких, что 0thm ≤ , выполняется
hCxRx m
h
m
h 1)()( ≤Φ−Φχ .
Из теоремы 2 и леммы 6 следует
Теорема 3. Последовательности функций { }tmhm
h =Φ,χ равномерно на
каждом компакте сходятся к функции ΦtR~ , ],0[ 0tt∈ .
Теорема 4. Пусть )(xΦ слабо почти выпукла с константой κ на мно-
жестве )( 0tK , 00 ≥t . Тогда существует константа 02 ≥C , зависящая только
от )( 0tK , такая, что для всех 0tt ≤ и Kx∈ выполняется −Φ )(~ xRt
2
2)( tCxt ≤Φ− χ .
Приближенные методы решения дифференциальных игр со случайной помехой
Системні дослідження та інформаційні технології, 2005, № 4 71
Доказательство. Обозначим
∈∈∈
∂
∂
= VvUutKzvuzf
z
F ,),(:),,(max 01 ,
2F — константа такая, что для всех 0tt ≤
2
2
0
))(),(,()),(),(|( tFdvuxfxxvutz
t
≤
+−⋅⋅ ∫ τττ ,
21FFF = , { }VvUutKzvuzfF ∈∈∈= ,),(:),,(max2 03 .
Поскольку функция )(xΦ ограничена снизу на компакте )( 0tK , то, не
ограничивая общности, можно считать, что )(xΦ неотрицательна на )( 0tK .
Пусть m и h такие, что thm = . Тогда справедливы следующие цепоч-
ки неравенств:
×
+Φ≥Φ ∫ ∑∫∫
=∈∈∈
V
m
i
iiUu
V
Uu
V
Uu
m
h hvuxfxx
m 1
),,(min...minmin)(
21
χ
≥−× 2
12 )()(...)( tFvdvdvd m µµµ
≥−
+Φ≥ ∫ ∑∫
=∈
=
2
1
1
)(...)(),,(min...
,...,1
tFvdvdhvuxfx m
V
m
i
iiUu
V mi
i
µµ
=−
+Φ≥ ∫ ∑
=∈
=
2
1
)(),,(min
,...,1
tFvdhvuxfx
V
m
i
iiUu
mi
i
µ
( ) 22 )()(),,(min tFxtFvdtvuxfx t
V
Uu
−Φ=−+Φ= ∫ ∈
χµ ,
×
+Φ≤Φ ∫ ∑∫∫
=∈∈∈
V
m
i
iiUu
V
Uu
V
Uu
m
h hvuxfxx
m 1
),,(min...minmin)(
21
χ
=+× 2
12 )()(...)( tFvdvdvd m µµµ
≤+
+Φ= ∫ ∑∫
=
=
2
1
1
1),...,(
)(...)()),,...,(,(...min
,...,1
1
tFvdvdhvvvuxfx m
V
m
i
iii
V
vvu
mi
ii
µµ
≤+
+Φ≤ ∫ ∑∫
=
=
2
1
1)(
)(...)()),(,(...min
,...,1
tFvdvdhvvuxfx m
V
m
i
iii
V
vu
mi
ii
µµ
[ ]∫∫ ×+Φ+++Φ≤
= V
mm
V
vu
tvvuxfxtvvuxfx
t
h
mi
i
))),(,((...))),(,((...min 11)(
,...,1
В.В. Остапенко, Е.В. Остапенко, С.Н. Амиргалиева
ISSN 1681–6048 System Research & Information Technologies, 2005, № 4 72
=++× 222
31)(...)( tFtFvdvd m κµµ
( ) =+++Φ= ∫ 22
3)(
)())),(,((min tFFdvtvvuxfx
V
vu
κµ
22
3 )()( tFFxt ++Φ= χχ .
Здесь минимумы по ),...,( 1 ii vvu и )(vu берутся по всем измеримым
отображениям со значениями в U .
Из полученных неравенств, произвольности m и h , а также теоремы 3
следует справедливость теоремы 4.
Предположение 1. Существуют константы 00 >t и 0≥κ такие, что
функции Φk
hχ слабо почти выпуклые на K для всех k и h таких, что
0thk ≤ .
Теорема 5. Пусть выполняется предположение 1, тогда существует
константа 03 ≥C такая, что для всех 0tt ≤ , m и h , thm = , Kx∈ выполня-
ется
hCxxR m
ht 3)()(~
≤Φ−Φ χ .
Доказательство. Из теоремы 4 следует, что 2
2)()(~ hCxxR hh +Φ≤Φ χ .
Отсюда
2
2
22
2
2
22 2)()(~))((~)(~ hCxhCxRhCxRxR hhhhhh +Φ≤+Φ=+Φ≤Φ χχχ .
Продолжая этот процесс, получаем
htCxhtCxxR m
h
m
ht 022 )()()(~
+Φ≤+Φ≤Φ χχ .
Аналогично доказывается неравенство в другую сторону.
Приведем случай дифференциальной игры, для которой выполняется
предположение 1.
Предположение 2. Функция f имеет вид ),(),(),,( 21 vufvzfvuzf += .
Функция )(xΦ слабо почти выпуклая с константой κ на множестве )( 0tK и
Dvzf
z
Vv
tKz
≤
∂
∂
∈
∈
),(max 12
2
)( 0
.
Теорема 6. Из предположения 2 следует предположение 1.
Доказательство. Из леммы 5 следует, что функция )(xhΦχ слабо поч-
ти выпукла на множестве K с константой )( )( 0
hDL tK+κ . Продолжая про-
цесс, нетрудно увидеть, что функция )(xk
hΦχ слабо почти выпукла на K с
константой
0)()( 00
tLDhkDL tKtK +≤+ κκ .
Почти выпуклость служит обобщением понятия выпуклости функции.
Для линейного случая можно ограничиться обычной выпуклостью для
функций.
Приближенные методы решения дифференциальных игр со случайной помехой
Системні дослідження та інформаційні технології, 2005, № 4 73
Предположение 3. Функция f имеет вид ),()(),,( vuBzvAvuzf += ,
где )(vA — матрица, непрерывная по v ; ),( vuB — непрерывная функция;
)(xϕ — выпуклая функция.
Лемма 7. Пусть функция ),( uxϕ выпукла по совокупности перемен-
ных; Uu ∈ , U — выпуклый компакт. Тогда функция ),(min)( uxx
Uu
ϕψ
∈
= яв-
ляется выпуклой по x .
Доказательство. Пусть nExx ∈21, , 0, 21 ≥λλ , 121 =+ λλ . Существует
iu , 2,1=i , такие, что ),()( iii uxx ϕψ = . Отсюда
≥+=+ ),(),()()( 2221112211 uxuxxx ϕλϕλψλψλ
)(),(min),( 2211221122112211 xxuxxuuxx
Uu
λλψλλϕλλλλϕ +=+≥++≥
∈
,
что и означает выпуклость функции )(xψ .
Из леммы 7 и того, что ),( vUB — выпуклый компакт, следует
Теорема 7. При выполнении предположения 3 функция )(xhΦχ вы-
пукла.
Рассмотрим построение стратегии игрока P , решающую приближенно
дифференциальную игру. Предположим, что выполняется предположение 1
и 0t≤θ , θ=mh .
На первом шаге игрок P знает начальную позицию 0z и строит функ-
цию )(
0
vuz как решение задачи минимизации
))),(,(()),,((min
000
1
00
1 hvvuzfzhvuzfz z
m
h
m
hUu
+Φ=+Φ −−
∈
χχ .
Поскольку таких решений может быть много, то выбираем в качестве
)(
0
vuz минимальное в лексикографическом смысле. Если помеха имеет
конкретную реализацию *v на некотором подынтервале ],0[),[ 21 h⊂ττ , то
игрок P выбирает на ),[ 21 ττ управление *)(
0
vuz . Пусть )(tv , ),0[ ht ∈ —
функция, составленная из реализаций помехи на интервале ),0[ h ; )(tu —
соответствующее управление игрока P . Обозначим )),(),(|( 01 zvuhzz ⋅⋅= .
На k -м шаге игрок P знает позицию 1−kz и строит функцию
1−kzu как ре-
шение задачи минимизации
))),(,(()),,((min
11111 hvvuzfzhvuzfz
kzkk
km
hkk
km
hUu −−−
−
−−
−
∈
+Φ=+Φ χχ .
Как и ранее, )(
1
vu
kz −
— решение минимальное в лексикографическом
смысле. Пусть )(tv , ),)1[( khhkt −∈ — функция, составленная из реализа-
ций помехи на интервале ),)1[( khhk − ; )(tu — соответствующее управле-
ние игрока P . Положим ))1(()( hktutuk −−= , ))1(()( hktvtvk −−= ,
),)1[( khhkt −∈ , )),(),(|( 1−⋅⋅= kkkk zvuhzz и продолжим процесс. Обозначим
построенную таким образом стратегию игрока P через h
PΓ .
В.В. Остапенко, Е.В. Остапенко, С.Н. Амиргалиева
ISSN 1681–6048 System Research & Information Technologies, 2005, № 4 74
Пользуясь теоремой 5 и аппаратом, разработанным в работах [2, 4], по-
лучаем следующий результат.
Теорема 8. Существуют константа 04 ≥C и для каждого h стратегия
h
PΓ такие, что для любого ω
hCzRzzM h
P 400 )(~)),|(( +Φ≤ΓΦ θω θ .
Игрок E в качестве разбиения может выбрать равномерное разбиение
{ }θω =<<<<= hmhhh ...20 . Из теоремы 5 следует
Теорема 9. Существует константа 05 ≥C такая, что для любой страте-
гии PΓ игрока P
hCzRzzM Ph 500 )(~)),|(( −Φ≥ΓΦ θω θ .
ВЫВОДЫ
Построены приближенные методы решения дифференциальной игры со
случайной помехой, которые позволяют аппроксимировать гарантирован-
ные выигрыши убегающего и догоняющего игроков, а также строить соот-
ветствующие стратегии.
При определенных предположениях получены оценки близости точно-
го и приближенного решений. Эти результаты можно развить на ситуации,
когда помеха описывается некоторым случайным процессом.
ЛИТЕРАТУРА
1. Пшеничный Б.Н. Структура дифференциальных игр // ДАН СССР. — 1969. —
184, № 2. — С. 285–287.
2. Пшеничный Б.Н., Остапенко В.В. Дифференциальные игры. — Киев: Наук.
думка, 1992. — 260 с.
3. Остапенко В.В., Тимошенко О.М. Методы решения дифференциальных игр
при различных стратегиях игроков // Докл. НАН Украины. — 1995. —
№ 6. — С. 5–7.
4. Остапенко В.В. Приближение основного оператора в дифференциальных
играх с фиксированным временем окончания // Кибернетика. — 1984. —
№ 1. — С. 85–89.
5. Ушаков В.Е. К задаче построения стабильных мостов в дифференциальных иг-
рах сближения–уклонения // Изв. АН СССР. Сер. Техн. кибернетика. —
1980. — № 4. — С. 29–36.
6. Алгоритмы и программы решения линейных дифференциальных игр / Под.
ред. А.И. Субботина, В.С. Пацко. — Свердловск: УНЦ АН СССР, 1984. —
295 с.
Поступила 19.03.2004
МЕТОДИ ОПТИМІЗАЦІЇ, ОПТИМАЛЬНЕ УПРАВЛІННЯ І ТЕОРІЯ ІГОР
ПРИБЛИЖЕННЫЕ МЕТОДЫ РЕШЕНИЯ ДИФФЕРЕНЦИАЛЬНЫХ ИГР СО СЛУЧАЙНОЙ ПОМЕХОЙ
В.В. Остапенко, Е.В. Остапенко, С.Н. Амиргалиева
ВВЕДЕНИЕ
ПОСТАНОВКА ЗАДАЧИ
ПОЧТИ ВЫПУКЛЫЕ ФУНКЦИИ
ПРИБЛИЖЕННЫЙ МЕТОД
ВЫВОДЫ
|