Наближені методи розв’язування диференціальних ігор із випадковим збуренням

Differential games in which the role of the second player is played with a casual noise are investigated. The methods are developed, allowing to approximate guaranteed prizes of players and to build the appropriate strategy. For a substantiation of methods the concept of almost convex function is en...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Datum:2019
Hauptverfasser: Ostapenko, V. V., Ostapenko, E. V., Amirgalieva, S. N.
Format: Artikel
Sprache:Russisch
Veröffentlicht: The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2019
Online Zugang:https://journal.iasa.kpi.ua/article/view/165555
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:System research and information technologies
Завантажити файл: Pdf

Institution

System research and information technologies
_version_ 1867334357016903680
author Ostapenko, V. V.
Ostapenko, E. V.
Amirgalieva, S. N.
author_facet Ostapenko, V. V.
Ostapenko, E. V.
Amirgalieva, S. N.
author_institution_txt_mv [ { "author": "V. V. Ostapenko", "institution": null }, { "author": "E. V. Ostapenko", "institution": null }, { "author": "S. N. Amirgalieva", "institution": null } ]
author_sort Ostapenko, V. V.
baseUrl_str http://journal.iasa.kpi.ua/oai
collection OJS
datestamp_date 2019-04-25T16:24:40Z
description Differential games in which the role of the second player is played with a casual noise are investigated. The methods are developed, allowing to approximate guaranteed prizes of players and to build the appropriate strategy. For a substantiation of methods the concept of almost convex function is entered and investigated.
first_indexed 2025-07-17T10:24:56Z
format Article
fulltext © В.В. Остапенко, Е.В. Остапенко, С.Н. Амиргалиева, 2005 Системні дослідження та інформаційні технології, 2005, № 4 65 TIДC МЕТОДИ ОПТИМІЗАЦІЇ, ОПТИМАЛЬНЕ УПРАВЛІННЯ І ТЕОРІЯ ІГОР УДК 518.9 ПРИБЛИЖЕННЫЕ МЕТОДЫ РЕШЕНИЯ ДИФФЕРЕНЦИАЛЬНЫХ ИГР СО СЛУЧАЙНОЙ ПОМЕХОЙ В.В. ОСТАПЕНКО, Е.В. ОСТАПЕНКО, С.Н. АМИРГАЛИЕВА Рассматриваются дифференциальные игры, в которых роль одного из игроков играет случайная помеха. Предлагается приближенный метод решения таких игр. Для его описания вводится и исследуется новое понятие почти выпуклой функции. ВВЕДЕНИЕ В классической теории дифференциальных игр игроки не знают действия противника в будущем и выбирают управления, основываясь на текущем или прошедшем состоянии динамической системы. В некоторых подходах допускается определенная информационная дискриминация одного из игро- ков. Так, например, если догоняющий игрок P играет в ε -стратегиях [1, 2], то он выбирает свое управление, зная управление убегающего игрока E на время ε вперед. Величину ε выбирает игрок E . В ряде прикладных задач в качестве игрока E выступает некоторая помеха. Если помеха является случайной величиной и игроку P известны ее вероятностные характеристики, то он может использовать эту информацию о возможном будущем управлении противника для построения своей стра- тегии. В работе [3] описана структура дифференциальной игры со случайной помехой и детально изучен некоторый класс линейных игр. В данной статье рассматриваются игры в общем линейном и нелинейном случаях и приво- дится приближенный метод их решения, для обоснования которого исполь- зуются элементы выпуклого и обобщенного выпуклого анализа. Вводится новое понятие выпуклой функции, обобщающее классическое, и исследуют- ся ее свойства. Приближенные методы для решения классических дифференциальных игр изложены в работах [2, 4–6]. ПОСТАНОВКА ЗАДАЧИ Рассмотрим управляемый объект, динамика которого описывается уравне- нием В.В. Остапенко, Е.В. Остапенко, С.Н. Амиргалиева ISSN 1681–6048 System Research & Information Technologies, 2005, № 4 66 ),,( vuzfz = , (1) где nEz∈ , Uu∈ , Vv∈ , nE — n -мерное евклидово пространство; U — компакт из евклидова пространства; V — измеримое подмножество евкли- дова пространства. На функцию f и множество U налагаем ограничения: 1) ),,( vuzf — непрерывна по совокупности переменных; 2) )1)((),,( zvCvuzf +≤ , где )(vC — непрерывная функция; 3) ),,( vUzf — выпуклое множество. Параметром u распоряжается игрок P , параметр v является случай- ной помехой с функцией распределения )(⋅µ . Пусть θ — фиксированный момент времени; Φ — непрерывный функционал, определенный на nE . Рассмотрим задачу минимизации игроком P функции ))(( θzΦ , где )(⋅z — решение уравнения (1). Опишем стратегию игрока P . Пусть { }θτττω =<<<== k...0 10 — конечное разбиение интервала ],0[ θ , 1−−= iii ττδ . Будем считать, что при фиксированном разбиении ω функция )(tv является кусочно-постоянной с интервалами постоянства ),[ 1 ii ττ − , ki ,...,1= . Игрок P в начальный момент 00 =τ знает начальную позицию 0)0( zz = , величину 1δ , значение помехи 1v на интервале ),[ 10 ττ и выбирает свое управление )(tu на ),[ 10 ττ . Анало- гично в момент времени 1−iτ игрок P знает )( 1−iz τ , величину iδ , значение помехи iv на интервале ),[ 1 ii ττ − и выбирает свое управление )(tui , ),[ 1 iit ττ −∈ . Кроме того, игрок P знает функцию распределения )(⋅µ . Описанную стратегию игрока P назовем ε -стратегией и обозначим PΓ . Она является аналогом ε -стратегии [1,2]. Игрок P при этом не знает заранее разбиения ω , и ему лишь по ходу игры становятся известными зна- чения длин интервалов iδ . Поэтому естественно ввести второго игрока E и оставить за ним право выбора разбиения ω . Обозначим εR оператор, ставящий в соответствие каждой непрерыв- ной функции )(xψ функцию ∫ ⋅= ⋅ V U dvxvuzx )()),),(|((inf)( )( µεψψ ε , (2) где ),),(|( xvutz ⋅ — решение (1), соответствующее управлениям vu ),(⋅ и начальной позиции x . Инфинум в (2) берется по всем допустимым управле- ниям игрока P на интервале ],0[ ε , т.е. по всем измеримым функциям на ],0[ ε со значениями в U . Отметим, что в силу ограничений на функцию f и непрерывности ψ инфинум в (2) достигается. Положим Φ=Φ k RRR δδ ω ... 1 , Φ=Φ ω ω θ RR sup~ , Приближенные методы решения дифференциальных игр со случайной помехой Системні дослідження та інформаційні технології, 2005, № 4 67 где супремум берется по всем разбиениям ω интервала ],0[ θ . Будем считать, что при фиксированном ω значения помехи iv на ин- тервалах );[ 1 ii ττ − являются независимыми случайными величинами. Пред- положим, что игрок P выбрал некоторую стратегию PΓ , описанную выше. Это означает, что его управления )(⋅iu на интервалах );[ 1 ii ττ − зависят от реализации случайных помех iv и текущих значений )( 1−iz τ . Обозначим ),,...,,|( 1 xvvz kPΓθ решение (1), соответствующее стратегии PΓ и реализа- циям kvv ,...,1 при начальном условии xz =0 . Тогда ∫∫ ΓΦ=ΓΦ V kkP V P dvdvxvvzxzM )()...(),,...,,|((...)),|((( 11 µµθθω (3) является математическим ожиданием значения функционала Φ на конце траектории )(θz , соответствующее ε -стратегии PΓ и разбиению ω . Цель игрока P — минимизировать функционал (3). Теорема 1. Для любого 0>ε существует стратегия * PΓ игрока P та- кая, что для любого разбиения ω εθ θω +Φ≤ΓΦ )(~)),|(( * xRxzM P . Для любого 0>ε существует разбиение εω такое, что для любой стратегии PΓ εθ θωε −Φ≥ΓΦ )(~)),|(( xRxzM P . Из теоремы 1 следует, что для описания гарантированного математиче- ского ожидания минимума функционала ))(( θzΦ и построения стратегии * PΓ можно использовать оператор θR~ . ПОЧТИ ВЫПУКЛЫЕ ФУНКЦИИ Пусть K — выпуклое подмножество пространства nE . Определение 1. Функция )(xϕ называется слабо почти выпуклой с константой 0≥κ , если для любых векторов Kxi ∈ и чисел 0≥iλ , Ii∈ , 1=∑ ∈Ii iλ , I — произвольное конечное множество индексов, выполняется 2)( rxx Ii ii Ii ii κϕλλϕ +≤⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ ∑∑ ∈∈ , где ji Iji xxr −= ∈, max . Определение 2. Функция )(xϕ называется сильно почти выпуклой с константой 0≥κ , если для любых Kxi ∈ , 0≥iλ , Ii∈ , 1=∑ ∈Ii iλ сущест- вует такое Ky∈ , что В.В. Остапенко, Е.В. Остапенко, С.Н. Амиргалиева ISSN 1681–6048 System Research & Information Technologies, 2005, № 4 68 2rxy Ii ii κλ ≤−∑ ∈ , ∑ ∈ ≤ Ii ii xy )()( ϕλϕ , где ji Iji xxr −= ∈, max . Лемма 1. Пусть )(xϕ удовлетворяет условию Липшица с константой L и является сильно почти выпуклой с константой κ . Тогда )(xϕ — слабо почти выпуклая функция с константой κL . Доказательство. Обозначим ∑ ∈ = Ii ii xx λ . В силу условий леммы 2)()()( rLxxyLyx Ii ii κϕλϕϕ +≤−+≤ ∑ ∈ , что и доказывает слабую почти выпуклость функции ϕ . Величины ix , iλ , y и r взяты из определения 2. Обозначим { }γϕγϕ ≤∈∈= + )(,:),(epi 1 xKxEx n надграфик функции ϕ . Определение 3. Множество nEM ⊂ называется почти выпуклым с константой 0≥κ , если для любых Mxi ∈ , 0≥iλ , 1=∑ ∈Ii iλ выполняется SrMx Ii ii 2κλ +∈∑ ∈ , где ji Iji xxr −= ∈, max , { }1: ≤∈= xExS n — единичный шар. Обычная выпуклость функции ϕ связана с выпуклостью множества ϕepi . Посмотрим, что происходит в случае почти выпуклости. Лемма 2. Пусть ϕ — слабо почти выпуклая с константой κ функция. Тогда ϕepi — почти выпуклое с константой κ множество. Доказательство. Пусть ϕγ epi),( ∈iix , 0≥iλ , Ii∈ , 1=∑ ∈Ii iλ . Тогда iix γϕ ≤)( , Ii∈ . Положим ∑ ∈ = Ii ii xx λ , ∑ ∈ = Ii iix γγ . Из слабой почти вы- пуклости следует µκγκγλκϕλϕ =+=+≤+≤ ∑∑ ∈∈ 222)()( rrrxx Ii ii Ii ii . Отсюда ϕµ epi),( ∈x . С другой стороны, 2),(),( rxx κµγ ≤− . Это и означает почти выпуклость с константой κ множества ϕepi . Лемма 3. Пусть функция ϕ удовлетворяет условию Липшица с кон- стантой L , ϕepi — почти выпуклое множество с константой κ . Тогда функция ϕ — слабо почти выпукла с константой )( κκ L+ . Доказательство. Пусть Kxi ∈ , 0≥iλ , Ii∈ , 1=∑ ∈Ii iλ , )( ii xϕγ = , ∑ ∈ = Ii ii xx λ , ∑ ∈ = Ii iiγλγ . Приближенные методы решения дифференциальных игр со случайной помехой Системні дослідження та інформаційні технології, 2005, № 4 69 Так как ϕγ epi),( ∈iix , то существует пара ϕµ epi),( ∈y такая, что 2),(),( ryx κµγ ≤− . Отсюда 2ryx κ≤− , 2rκµγ ≤− . В результате получаем 2)()( rxy Ii ii κϕλµϕ +≤≤ ∑ ∈ . В силу условия Липшица 222)()( rLrrLyx κκγκϕϕ ++≤+≤ . Лемма 4. Пусть функция ϕ — дважды непрерывно дифференцируемая в окрестности множества K и ∞<= ∈ )(sup 2 2 x dx d Kx ϕκ . Тогда ϕ — слабо поч- ти выпукла с константой κ . Доказательство. Пусть Kxi ∈ , 0≥iλ , 1=∑ ∈ Ii iλ , ∑ ∈ = Ii ii xx λ , =r ji Iji xx −= ∈, max . По формуле Тейлора )())(()()( xxoxxxxx iii −+−′+= ϕϕϕ , где 2)( rxxo i κ≤− . Отсюда, так как 22)()( rrxxoxxo Ii i Ii ii Ii ii κκλλλ =≤−≤− ∑∑∑ ∈∈∈ , то +⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ −′+= ∑∑ ∈∈ xxxxx Ii ii Ii ii λϕϕϕλ )()()( 2)()( rxxxo Ii ii κϕλ −≥−∑ ∈ . Пусть nn EEf →: — непрерывно дифференцируемая функция; U — выпуклый компакт в пространстве nE ; 0>h — число. Рассмотрим функцию ))((min)( huhxfxx Uu ++= ∈ ϕψ . (4) Лемма 5. Пусть ϕ удовлетворяет условию Липшица с константой L и является слабо почти выпуклой с константой κ ; )(sup 2 2 xf dx dD Kx∈ = . Тогда функция ψ — слабо почти выпукла с константой hDL+κ . Доказательство. Пусть Kxi ∈ , 0≥iλ , 1=∑ ∈ Ii iλ , ∑ ∈ = Ii ii xx λ , ji Iji xxr −= ∈, max . По формуле Тейлора +−′+= )()()()( xxxfxfxf ii )( xxo i −+ , где 2)( rDxxo i ≤− . Из (4) следует существование таких Uui ∈ , что ))(()( huhxfxx iiii ++=ϕψ . Поскольку U выпукло, то суще- ствует Uu ∈ такое, что uu Ii ii =∑ ∈ λ . В.В. Остапенко, Е.В. Остапенко, С.Н. Амиргалиева ISSN 1681–6048 System Research & Information Technologies, 2005, № 4 70 Отсюда ( )≥+−+−′++=∑∑ ∈∈ Ii iiixii Ii ii huhxxohxxxfhxfxx )()()()()( ϕλψλ ( ) ≥−+−++≥ 2)()( rhuhxxohxfx i κϕ ( ) 22)( rhLDrhuhxfx −−++≥ κϕ . ПРИБЛИЖЕННЫЙ МЕТОД Будем предполагать, что множество V — компакт, а функция )(zΦ удовле- творяет условию Липшица с константой KL на каждом компакте K . В этом случае функцию ΦθR~ можно представить следующим образом. Обозначим m hh m h RRR ...= . Так же, как и в работе [2], доказывается Теорема 2. Φ=Φ = m h mh RR θ θ sup~ и последовательность { }Φm hR , ,...2,1=m равномерно на каждом компакте сходится в функции ΦθR~ . Обозначим hχ оператор, который ставит в соответствие каждой непре- рывной функции )(xϕ функцию ( ) )(),,(min)( dvhvuxfxx V Uu µϕψ ∫ += ∈ . В данном пункте рассмотрены вопросы приближения оператора tR~ оператором tmhm h =,χ , где m hh m h χχχ ...= . Пусть K — компакт из nE . По- ложим ∪ ∪ ],0[ )( )( 0 0 )),(),(|(co)( tt Kx v u xvutztK ∈ ∈ ⋅ ⋅ ⋅⋅= , где объединение берется по всем измеримым функциям )(⋅u и )(⋅v со зна- чениями соответственно U и V . Так же, как и в работе [2], доказывается Лемма 6. Существует константа 01 ≥C , зависящая только от )( 0tK , такая, что для всех Kx∈ , m и h таких, что 0thm ≤ , выполняется hCxRx m h m h 1)()( ≤Φ−Φχ . Из теоремы 2 и леммы 6 следует Теорема 3. Последовательности функций { }tmhm h =Φ,χ равномерно на каждом компакте сходятся к функции ΦtR~ , ],0[ 0tt∈ . Теорема 4. Пусть )(xΦ слабо почти выпукла с константой κ на мно- жестве )( 0tK , 00 ≥t . Тогда существует константа 02 ≥C , зависящая только от )( 0tK , такая, что для всех 0tt ≤ и Kx∈ выполняется −Φ )(~ xRt 2 2)( tCxt ≤Φ− χ . Приближенные методы решения дифференциальных игр со случайной помехой Системні дослідження та інформаційні технології, 2005, № 4 71 Доказательство. Обозначим ⎭ ⎬ ⎫ ⎩ ⎨ ⎧ ∈∈∈ ∂ ∂ = VvUutKzvuzf z F ,),(:),,(max 01 , 2F — константа такая, что для всех 0tt ≤ 2 2 0 ))(),(,()),(),(|( tFdvuxfxxvutz t ≤ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ +−⋅⋅ ∫ τττ , 21FFF = , { }VvUutKzvuzfF ∈∈∈= ,),(:),,(max2 03 . Поскольку функция )(xΦ ограничена снизу на компакте )( 0tK , то, не ограничивая общности, можно считать, что )(xΦ неотрицательна на )( 0tK . Пусть m и h такие, что thm = . Тогда справедливы следующие цепоч- ки неравенств: ×⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ +Φ≥Φ ∫ ∑∫∫ =∈∈∈ V m i ii Uu V Uu V Uu m h hvuxfxx m 1 ),,(min...minmin)( 21 χ ≥−× 2 12 )()(...)( tFvdvdvd m µµµ ≥−⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ +Φ≥ ∫ ∑∫ =∈ = 2 1 1 )(...)(),,(min... ,...,1 tFvdvdhvuxfx m V m i iiUu V mi i µµ =−⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ +Φ≥ ∫ ∑ =∈ = 2 1 )(),,(min ,...,1 tFvdhvuxfx V m i iiUu mi i µ ( ) 22 )()(),,(min tFxtFvdtvuxfx t V Uu −Φ=−+Φ= ∫ ∈ χµ , ×⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ +Φ≤Φ ∫ ∑∫∫ =∈∈∈ V m i ii Uu V Uu V Uu m h hvuxfxx m 1 ),,(min...minmin)( 21 χ =+× 2 12 )()(...)( tFvdvdvd m µµµ ≤+⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ +Φ= ∫ ∑∫ = = 2 1 1 1),...,( )(...)()),,...,(,(...min ,...,1 1 tFvdvdhvvvuxfx m V m i iii V vvu mi ii µµ ≤+⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ +Φ≤ ∫ ∑∫ = = 2 1 1)( )(...)()),(,(...min ,...,1 tFvdvdhvvuxfx m V m i iii V vu mi ii µµ [ ]∫∫ ×+Φ+++Φ≤ = V mm V vu tvvuxfxtvvuxfx t h mi i ))),(,((...))),(,((...min 11)( ,...,1 В.В. Остапенко, Е.В. Остапенко, С.Н. Амиргалиева ISSN 1681–6048 System Research & Information Technologies, 2005, № 4 72 =++× 222 31)(...)( tFtFvdvd m κµµ ( ) =+++Φ= ∫ 22 3 )( )())),(,((min tFFdvtvvuxfx V vu κµ 22 3 )()( tFFxt ++Φ= χχ . Здесь минимумы по ),...,( 1 ii vvu и )(vu берутся по всем измеримым отображениям со значениями в U . Из полученных неравенств, произвольности m и h , а также теоремы 3 следует справедливость теоремы 4. Предположение 1. Существуют константы 00 >t и 0≥κ такие, что функции Φk hχ слабо почти выпуклые на K для всех k и h таких, что 0thk ≤ . Теорема 5. Пусть выполняется предположение 1, тогда существует константа 03 ≥C такая, что для всех 0tt ≤ , m и h , thm = , Kx∈ выполня- ется hCxxR m ht 3)()(~ ≤Φ−Φ χ . Доказательство. Из теоремы 4 следует, что 2 2)()(~ hCxxR hh +Φ≤Φ χ . Отсюда 2 2 22 2 2 22 2)()(~))((~)(~ hCxhCxRhCxRxR hhhhhh +Φ≤+Φ=+Φ≤Φ χχχ . Продолжая этот процесс, получаем htCxhtCxxR m h m ht 022 )()()(~ +Φ≤+Φ≤Φ χχ . Аналогично доказывается неравенство в другую сторону. Приведем случай дифференциальной игры, для которой выполняется предположение 1. Предположение 2. Функция f имеет вид ),(),(),,( 21 vufvzfvuzf += . Функция )(xΦ слабо почти выпуклая с константой κ на множестве )( 0tK и Dvzf z Vv tKz ≤ ∂ ∂ ∈ ∈ ),(max 12 2 )( 0 . Теорема 6. Из предположения 2 следует предположение 1. Доказательство. Из леммы 5 следует, что функция )(xhΦχ слабо поч- ти выпукла на множестве K с константой )( )( 0 hDL tK+κ . Продолжая про- цесс, нетрудно увидеть, что функция )(xk hΦχ слабо почти выпукла на K с константой 0)()( 00 tLDhkDL tKtK +≤+ κκ . Почти выпуклость служит обобщением понятия выпуклости функции. Для линейного случая можно ограничиться обычной выпуклостью для функций. Приближенные методы решения дифференциальных игр со случайной помехой Системні дослідження та інформаційні технології, 2005, № 4 73 Предположение 3. Функция f имеет вид ),()(),,( vuBzvAvuzf += , где )(vA — матрица, непрерывная по v ; ),( vuB — непрерывная функция; )(xϕ — выпуклая функция. Лемма 7. Пусть функция ),( uxϕ выпукла по совокупности перемен- ных; Uu ∈ , U — выпуклый компакт. Тогда функция ),(min)( uxx Uu ϕψ ∈ = яв- ляется выпуклой по x . Доказательство. Пусть nExx ∈21, , 0, 21 ≥λλ , 121 =+ λλ . Существует iu , 2,1=i , такие, что ),()( iii uxx ϕψ = . Отсюда ≥+=+ ),(),()()( 2221112211 uxuxxx ϕλϕλψλψλ )(),(min),( 2211221122112211 xxuxxuuxx Uu λλψλλϕλλλλϕ +=+≥++≥ ∈ , что и означает выпуклость функции )(xψ . Из леммы 7 и того, что ),( vUB — выпуклый компакт, следует Теорема 7. При выполнении предположения 3 функция )(xhΦχ вы- пукла. Рассмотрим построение стратегии игрока P , решающую приближенно дифференциальную игру. Предположим, что выполняется предположение 1 и 0t≤θ , θ=mh . На первом шаге игрок P знает начальную позицию 0z и строит функ- цию )( 0 vuz как решение задачи минимизации ))),(,(()),,((min 000 1 00 1 hvvuzfzhvuzfz z m h m h Uu +Φ=+Φ −− ∈ χχ . Поскольку таких решений может быть много, то выбираем в качестве )( 0 vuz минимальное в лексикографическом смысле. Если помеха имеет конкретную реализацию *v на некотором подынтервале ],0[),[ 21 h⊂ττ , то игрок P выбирает на ),[ 21 ττ управление *)( 0 vuz . Пусть )(tv , ),0[ ht ∈ — функция, составленная из реализаций помехи на интервале ),0[ h ; )(tu — соответствующее управление игрока P . Обозначим )),(),(|( 01 zvuhzz ⋅⋅= . На k -м шаге игрок P знает позицию 1−kz и строит функцию 1−kzu как ре- шение задачи минимизации ))),(,(()),,((min 11111 hvvuzfzhvuzfz kzkk km hkk km hUu −−− − −− − ∈ +Φ=+Φ χχ . Как и ранее, )( 1 vu kz − — решение минимальное в лексикографическом смысле. Пусть )(tv , ),)1[( khhkt −∈ — функция, составленная из реализа- ций помехи на интервале ),)1[( khhk − ; )(tu — соответствующее управле- ние игрока P . Положим ))1(()( hktutuk −−= , ))1(()( hktvtvk −−= , ),)1[( khhkt −∈ , )),(),(|( 1−⋅⋅= kkkk zvuhzz и продолжим процесс. Обозначим построенную таким образом стратегию игрока P через h PΓ . В.В. Остапенко, Е.В. Остапенко, С.Н. Амиргалиева ISSN 1681–6048 System Research & Information Technologies, 2005, № 4 74 Пользуясь теоремой 5 и аппаратом, разработанным в работах [2, 4], по- лучаем следующий результат. Теорема 8. Существуют константа 04 ≥C и для каждого h стратегия h PΓ такие, что для любого ω hCzRzzM h P 400 )(~)),|(( +Φ≤ΓΦ θω θ . Игрок E в качестве разбиения может выбрать равномерное разбиение { }θω =<<<<= hmhhh ...20 . Из теоремы 5 следует Теорема 9. Существует константа 05 ≥C такая, что для любой страте- гии PΓ игрока P hCzRzzM Ph 500 )(~)),|(( −Φ≥ΓΦ θω θ . ВЫВОДЫ Построены приближенные методы решения дифференциальной игры со случайной помехой, которые позволяют аппроксимировать гарантирован- ные выигрыши убегающего и догоняющего игроков, а также строить соот- ветствующие стратегии. При определенных предположениях получены оценки близости точно- го и приближенного решений. Эти результаты можно развить на ситуации, когда помеха описывается некоторым случайным процессом. ЛИТЕРАТУРА 1. Пшеничный Б.Н. Структура дифференциальных игр // ДАН СССР. — 1969. — 184, № 2. — С. 285–287. 2. Пшеничный Б.Н., Остапенко В.В. Дифференциальные игры. — Киев: Наук. думка, 1992. — 260 с. 3. Остапенко В.В., Тимошенко О.М. Методы решения дифференциальных игр при различных стратегиях игроков // Докл. НАН Украины. — 1995. — № 6. — С. 5–7. 4. Остапенко В.В. Приближение основного оператора в дифференциальных играх с фиксированным временем окончания // Кибернетика. — 1984. — № 1. — С. 85–89. 5. Ушаков В.Е. К задаче построения стабильных мостов в дифференциальных иг- рах сближения–уклонения // Изв. АН СССР. Сер. Техн. кибернетика. — 1980. — № 4. — С. 29–36. 6. Алгоритмы и программы решения линейных дифференциальных игр / Под. ред. А.И. Субботина, В.С. Пацко. — Свердловск: УНЦ АН СССР, 1984. — 295 с. Поступила 19.03.2004
id journaliasakpiua-article-165555
institution System research and information technologies
keywords_txt_mv keywords
language Russian
last_indexed 2025-07-17T10:24:56Z
publishDate 2019
publisher The National Technical University of Ukraine &quot;Igor Sikorsky Kyiv Polytechnic Institute&quot;
record_format ojs
resource_txt_mv journaliasakpiua/22/fb61622c7c73667b390c66e1237d5522.pdf
spelling journaliasakpiua-article-1655552019-04-25T16:24:40Z The approached methods of the decision of differential games with a casual noise Приближенные методы решения дифференциальных игр со случайной помехой Наближені методи розв’язування диференціальних ігор із випадковим збуренням Ostapenko, V. V. Ostapenko, E. V. Amirgalieva, S. N. Differential games in which the role of the second player is played with a casual noise are investigated. The methods are developed, allowing to approximate guaranteed prizes of players and to build the appropriate strategy. For a substantiation of methods the concept of almost convex function is entered and investigated. Рассматриваются дифференциальные игры, в которых роль одного из игроков играет случайная помеха. Предлагается приближенный метод решения таких игр. Для его описания вводится и исследуется новое понятие почти выпуклой функции. Розглянуто диференціальні ігри, в яких роль одного із гравців грає випадкове збурення. Запропоновано наближений метод рішення таких ігор. Для його опису вводиться та досліджується нове поняття майже опуклих функцій. The National Technical University of Ukraine &quot;Igor Sikorsky Kyiv Polytechnic Institute&quot; 2019-04-25 Article Article application/pdf https://journal.iasa.kpi.ua/article/view/165555 System research and information technologies; No. 4 (2005); 65-74 Системные исследования и информационные технологии; № 4 (2005); 65-74 Системні дослідження та інформаційні технології; № 4 (2005); 65-74 2308-8893 1681-6048 ru https://journal.iasa.kpi.ua/article/view/165555/164757 Copyright (c) 2021 System research and information technologies
spellingShingle Ostapenko, V. V.
Ostapenko, E. V.
Amirgalieva, S. N.
Наближені методи розв’язування диференціальних ігор із випадковим збуренням
title Наближені методи розв’язування диференціальних ігор із випадковим збуренням
title_alt The approached methods of the decision of differential games with a casual noise
Приближенные методы решения дифференциальных игр со случайной помехой
title_full Наближені методи розв’язування диференціальних ігор із випадковим збуренням
title_fullStr Наближені методи розв’язування диференціальних ігор із випадковим збуренням
title_full_unstemmed Наближені методи розв’язування диференціальних ігор із випадковим збуренням
title_short Наближені методи розв’язування диференціальних ігор із випадковим збуренням
title_sort наближені методи розв’язування диференціальних ігор із випадковим збуренням
url https://journal.iasa.kpi.ua/article/view/165555
work_keys_str_mv AT ostapenkovv theapproachedmethodsofthedecisionofdifferentialgameswithacasualnoise
AT ostapenkoev theapproachedmethodsofthedecisionofdifferentialgameswithacasualnoise
AT amirgalievasn theapproachedmethodsofthedecisionofdifferentialgameswithacasualnoise
AT ostapenkovv približennyemetodyrešeniâdifferencialʹnyhigrsoslučajnojpomehoj
AT ostapenkoev približennyemetodyrešeniâdifferencialʹnyhigrsoslučajnojpomehoj
AT amirgalievasn približennyemetodyrešeniâdifferencialʹnyhigrsoslučajnojpomehoj
AT ostapenkovv nabliženímetodirozvâzuvannâdiferencíalʹnihígorízvipadkovimzburennâm
AT ostapenkoev nabliženímetodirozvâzuvannâdiferencíalʹnihígorízvipadkovimzburennâm
AT amirgalievasn nabliženímetodirozvâzuvannâdiferencíalʹnihígorízvipadkovimzburennâm
AT ostapenkovv approachedmethodsofthedecisionofdifferentialgameswithacasualnoise
AT ostapenkoev approachedmethodsofthedecisionofdifferentialgameswithacasualnoise
AT amirgalievasn approachedmethodsofthedecisionofdifferentialgameswithacasualnoise