Приближенные методы решения дифференциальных игр со случайной помехой

Рассматриваются дифференциальные игры, в которых роль одного из игроков играет случайная помеха. Предлагается приближенный метод решения таких игр. Для его описания вводится и исследуется новое понятие почти выпуклой функции. Differential games in which the role of the second player is played with a...

Full description

Saved in:
Bibliographic Details
Date:2005
Main Authors: Остапенко, В.В., Остапенко, Е.В., Амиргалиева, С.Н.
Format: Article
Language:Russian
Published: Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України 2005
Subjects:
Online Access:https://nasplib.isofts.kiev.ua/handle/123456789/13874
Tags: Add Tag
No Tags, Be the first to tag this record!
Journal Title:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Cite this:Приближенные методы решения дифференциальных игр со случайной помехой / В.В. Остапенко, Е.В. Остапенко, С.Н. Амиргалиева // Систем. дослідж. та інформ. технології. — 2005. — № 4. — С. 65-74. — Бібліогр.: 6 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id nasplib_isofts_kiev_ua-123456789-13874
record_format dspace
spelling Остапенко, В.В.
Остапенко, Е.В.
Амиргалиева, С.Н.
2010-12-06T11:26:18Z
2010-12-06T11:26:18Z
2005
Приближенные методы решения дифференциальных игр со случайной помехой / В.В. Остапенко, Е.В. Остапенко, С.Н. Амиргалиева // Систем. дослідж. та інформ. технології. — 2005. — № 4. — С. 65-74. — Бібліогр.: 6 назв. — рос.
1681–6048
https://nasplib.isofts.kiev.ua/handle/123456789/13874
518.9
Рассматриваются дифференциальные игры, в которых роль одного из игроков играет случайная помеха. Предлагается приближенный метод решения таких игр. Для его описания вводится и исследуется новое понятие почти выпуклой функции.
Differential games in which the role of the second player is played with a casual noise are investigated. The methods are developed, allowing to approximate guaranteed prizes of players and to build the appropriate strategy. For a substantiation of methods the concept of almost convex function is entered and investigated.
Розглянуто диференціальні ігри, в яких роль одного із гравців грає випадкове збурення. Запропоновано наближений метод рішення таких ігор. Для його опису вводиться та досліджується нове поняття майже опуклих функцій.
ru
Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України
Методи оптимізації, оптимальне управління і теорія ігор
Приближенные методы решения дифференциальных игр со случайной помехой
The approached methods of the decision of differential games with a casual noise
Наближені методи розв’язування диференціальних ігор із випадковим збуренням
Article
published earlier
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
title Приближенные методы решения дифференциальных игр со случайной помехой
spellingShingle Приближенные методы решения дифференциальных игр со случайной помехой
Остапенко, В.В.
Остапенко, Е.В.
Амиргалиева, С.Н.
Методи оптимізації, оптимальне управління і теорія ігор
title_short Приближенные методы решения дифференциальных игр со случайной помехой
title_full Приближенные методы решения дифференциальных игр со случайной помехой
title_fullStr Приближенные методы решения дифференциальных игр со случайной помехой
title_full_unstemmed Приближенные методы решения дифференциальных игр со случайной помехой
title_sort приближенные методы решения дифференциальных игр со случайной помехой
author Остапенко, В.В.
Остапенко, Е.В.
Амиргалиева, С.Н.
author_facet Остапенко, В.В.
Остапенко, Е.В.
Амиргалиева, С.Н.
topic Методи оптимізації, оптимальне управління і теорія ігор
topic_facet Методи оптимізації, оптимальне управління і теорія ігор
publishDate 2005
language Russian
publisher Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України
format Article
title_alt The approached methods of the decision of differential games with a casual noise
Наближені методи розв’язування диференціальних ігор із випадковим збуренням
description Рассматриваются дифференциальные игры, в которых роль одного из игроков играет случайная помеха. Предлагается приближенный метод решения таких игр. Для его описания вводится и исследуется новое понятие почти выпуклой функции. Differential games in which the role of the second player is played with a casual noise are investigated. The methods are developed, allowing to approximate guaranteed prizes of players and to build the appropriate strategy. For a substantiation of methods the concept of almost convex function is entered and investigated. Розглянуто диференціальні ігри, в яких роль одного із гравців грає випадкове збурення. Запропоновано наближений метод рішення таких ігор. Для його опису вводиться та досліджується нове поняття майже опуклих функцій.
issn 1681–6048
url https://nasplib.isofts.kiev.ua/handle/123456789/13874
citation_txt Приближенные методы решения дифференциальных игр со случайной помехой / В.В. Остапенко, Е.В. Остапенко, С.Н. Амиргалиева // Систем. дослідж. та інформ. технології. — 2005. — № 4. — С. 65-74. — Бібліогр.: 6 назв. — рос.
work_keys_str_mv AT ostapenkovv približennyemetodyrešeniâdifferencialʹnyhigrsoslučainoipomehoi
AT ostapenkoev približennyemetodyrešeniâdifferencialʹnyhigrsoslučainoipomehoi
AT amirgalievasn približennyemetodyrešeniâdifferencialʹnyhigrsoslučainoipomehoi
AT ostapenkovv theapproachedmethodsofthedecisionofdifferentialgameswithacasualnoise
AT ostapenkoev theapproachedmethodsofthedecisionofdifferentialgameswithacasualnoise
AT amirgalievasn theapproachedmethodsofthedecisionofdifferentialgameswithacasualnoise
AT ostapenkovv nabliženímetodirozvâzuvannâdiferencíalʹnihígorízvipadkovimzburennâm
AT ostapenkoev nabliženímetodirozvâzuvannâdiferencíalʹnihígorízvipadkovimzburennâm
AT amirgalievasn nabliženímetodirozvâzuvannâdiferencíalʹnihígorízvipadkovimzburennâm
first_indexed 2025-11-26T13:18:31Z
last_indexed 2025-11-26T13:18:31Z
_version_ 1850622444105105408
fulltext  В.В. Остапенко, Е.В. Остапенко, С.Н. Амиргалиева, 2005 Системні дослідження та інформаційні технології, 2005, № 4 65 TIДC МЕТОДИ ОПТИМІЗАЦІЇ, ОПТИМАЛЬНЕ УПРАВЛІННЯ І ТЕОРІЯ ІГОР УДК 518.9 ПРИБЛИЖЕННЫЕ МЕТОДЫ РЕШЕНИЯ ДИФФЕРЕНЦИАЛЬНЫХ ИГР СО СЛУЧАЙНОЙ ПОМЕХОЙ В.В. ОСТАПЕНКО, Е.В. ОСТАПЕНКО, С.Н. АМИРГАЛИЕВА Рассматриваются дифференциальные игры, в которых роль одного из игроков играет случайная помеха. Предлагается приближенный метод решения таких игр. Для его описания вводится и исследуется новое понятие почти выпуклой функции. ВВЕДЕНИЕ В классической теории дифференциальных игр игроки не знают действия противника в будущем и выбирают управления, основываясь на текущем или прошедшем состоянии динамической системы. В некоторых подходах допускается определенная информационная дискриминация одного из игро- ков. Так, например, если догоняющий игрок P играет в ε -стратегиях [1, 2], то он выбирает свое управление, зная управление убегающего игрока E на время ε вперед. Величину ε выбирает игрок E . В ряде прикладных задач в качестве игрока E выступает некоторая помеха. Если помеха является случайной величиной и игроку P известны ее вероятностные характеристики, то он может использовать эту информацию о возможном будущем управлении противника для построения своей стра- тегии. В работе [3] описана структура дифференциальной игры со случайной помехой и детально изучен некоторый класс линейных игр. В данной статье рассматриваются игры в общем линейном и нелинейном случаях и приво- дится приближенный метод их решения, для обоснования которого исполь- зуются элементы выпуклого и обобщенного выпуклого анализа. Вводится новое понятие выпуклой функции, обобщающее классическое, и исследуют- ся ее свойства. Приближенные методы для решения классических дифференциальных игр изложены в работах [2, 4–6]. ПОСТАНОВКА ЗАДАЧИ Рассмотрим управляемый объект, динамика которого описывается уравне- нием В.В. Остапенко, Е.В. Остапенко, С.Н. Амиргалиева ISSN 1681–6048 System Research & Information Technologies, 2005, № 4 66 ),,( vuzfz = , (1) где nEz ∈ , Uu ∈ , Vv∈ , nE — n -мерное евклидово пространство; U — компакт из евклидова пространства; V — измеримое подмножество евкли- дова пространства. На функцию f и множество U налагаем ограничения: 1) ),,( vuzf — непрерывна по совокупности переменных; 2) )1)((),,( zvCvuzf +≤ , где )(vC — непрерывная функция; 3) ),,( vUzf — выпуклое множество. Параметром u распоряжается игрок P , параметр v является случай- ной помехой с функцией распределения )(⋅µ . Пусть θ — фиксированный момент времени; Φ — непрерывный функционал, определенный на nE . Рассмотрим задачу минимизации игроком P функции ))(( θzΦ , где )(⋅z — решение уравнения (1). Опишем стратегию игрока P . Пусть { }θτττω =<<<== k...0 10 — конечное разбиение интервала ],0[ θ , 1−−= iii ττδ . Будем считать, что при фиксированном разбиении ω функция )(tv является кусочно-постоянной с интервалами постоянства ),[ 1 ii ττ − , ki ,...,1= . Игрок P в начальный момент 00 =τ знает начальную позицию 0)0( zz = , величину 1δ , значение помехи 1v на интервале ),[ 10 ττ и выбирает свое управление )(tu на ),[ 10 ττ . Анало- гично в момент времени 1−iτ игрок P знает )( 1−iz τ , величину iδ , значение помехи iv на интервале ),[ 1 ii ττ − и выбирает свое управление )(tui , ),[ 1 iit ττ −∈ . Кроме того, игрок P знает функцию распределения )(⋅µ . Описанную стратегию игрока P назовем ε -стратегией и обозначим PΓ . Она является аналогом ε -стратегии [1,2 ]. Игрок P при этом не знает заранее разбиения ω , и ему лишь по ходу игры становятся известными зна- чения длин интервалов iδ . Поэтому естественно ввести второго игрока E и оставить за ним право выбора разбиения ω . Обозначим εR оператор, ставящий в соответствие каждой непрерыв- ной функции )(xψ функцию ∫ ⋅= ⋅ V U dvxvuzx )()),),(|((inf)( )( µεψψ ε , (2) где ),),(|( xvutz ⋅ — решение (1), соответствующее управлениям vu ),(⋅ и начальной позиции x . Инфинум в (2) берется по всем допустимым управле- ниям игрока P на интервале ],0[ ε , т.е. по всем измеримым функциям на ],0[ ε со значениями в U . Отметим, что в силу ограничений на функцию f и непрерывности ψ инфинум в (2) достигается. Положим Φ=Φ k RRR δδ ω ... 1 , Φ=Φ ω ω θ RR sup~ , Приближенные методы решения дифференциальных игр со случайной помехой Системні дослідження та інформаційні технології, 2005, № 4 67 где супремум берется по всем разбиениям ω интервала ],0[ θ . Будем считать, что при фиксированном ω значения помехи iv на ин- тервалах );[ 1 ii ττ − являются независимыми случайными величинами. Пред- положим, что игрок P выбрал некоторую стратегию PΓ , описанную выше. Это означает, что его управления )(⋅iu на интервалах );[ 1 ii ττ − зависят от реализации случайных помех iv и текущих значений )( 1−iz τ . Обозначим ),,...,,|( 1 xvvz kPΓθ решение (1), соответствующее стратегии PΓ и реализа- циям kvv ,...,1 при начальном условии xz =0 . Тогда ∫∫ ΓΦ=ΓΦ V kkP V P dvdvxvvzxzM )()...(),,...,,|((...)),|((( 11 µµθθω (3) является математическим ожиданием значения функционала Φ на конце траектории )(θz , соответствующее ε -стратегии PΓ и разбиению ω . Цель игрока P — минимизировать функционал (3). Теорема 1. Для любого 0>ε существует стратегия * PΓ игрока P та- кая, что для любого разбиения ω εθ θω +Φ≤ΓΦ )(~)),|(( * xRxzM P . Для любого 0>ε существует разбиение εω такое, что для любой стратегии PΓ εθ θωε −Φ≥ΓΦ )(~)),|(( xRxzM P . Из теоремы 1 следует, что для описания гарантированного математиче- ского ожидания минимума функционала ))(( θzΦ и построения стратегии * PΓ можно использовать оператор θR~ . ПОЧТИ ВЫПУКЛЫЕ ФУНКЦИИ Пусть K — выпуклое подмножество пространства nE . Определение 1. Функция )(xϕ называется слабо почти выпуклой с константой 0≥κ , если для любых векторов Kxi ∈ и чисел 0≥iλ , Ii∈ , 1=∑ ∈Ii iλ , I — произвольное конечное множество индексов, выполняется 2)( rxx Ii ii Ii ii κϕλλϕ +≤        ∑∑ ∈∈ , где ji Iji xxr −= ∈, max . Определение 2. Функция )(xϕ называется сильно почти выпуклой с константой 0≥κ , если для любых Kxi ∈ , 0≥iλ , Ii∈ , 1=∑ ∈Ii iλ сущест- вует такое Ky∈ , что В.В. Остапенко, Е.В. Остапенко, С.Н. Амиргалиева ISSN 1681–6048 System Research & Information Technologies, 2005, № 4 68 2rxy Ii ii κλ ≤−∑ ∈ , ∑ ∈ ≤ Ii ii xy )()( ϕλϕ , где ji Iji xxr −= ∈, max . Лемма 1. Пусть )(xϕ удовлетворяет условию Липшица с константой L и является сильно почти выпуклой с константой κ . Тогда )(xϕ — слабо почти выпуклая функция с константой κL . Доказательство. Обозначим ∑ ∈ = Ii ii xx λ . В силу условий леммы 2)()()( rLxxyLyx Ii ii κϕλϕϕ +≤−+≤ ∑ ∈ , что и доказывает слабую почти выпуклость функции ϕ . Величины ix , iλ , y и r взяты из определения 2. Обозначим { }γϕγϕ ≤∈∈= + )(,:),(epi 1 xKxEx n надграфик функции ϕ . Определение 3. Множество nEM ⊂ называется почти выпуклым с константой 0≥κ , если для любых Mxi ∈ , 0≥iλ , 1=∑ ∈Ii iλ выполняется SrMx Ii ii 2κλ +∈∑ ∈ , где ji Iji xxr −= ∈, max , { }1: ≤∈= xExS n — единичный шар. Обычная выпуклость функции ϕ связана с выпуклостью множества ϕepi . Посмотрим, что происходит в случае почти выпуклости. Лемма 2. Пусть ϕ — слабо почти выпуклая с константой κ функция. Тогда ϕepi — почти выпуклое с константой κ множество. Доказательство. Пусть ϕγ epi),( ∈iix , 0≥iλ , Ii∈ , 1=∑ ∈Ii iλ . Тогда iix γϕ ≤)( , Ii∈ . Положим ∑ ∈ = Ii ii xx λ , ∑ ∈ = Ii iix γγ . Из слабой почти вы- пуклости следует µκγκγλκϕλϕ =+=+≤+≤ ∑∑ ∈∈ 222)()( rrrxx Ii ii Ii ii . Отсюда ϕµ epi),( ∈x . С другой стороны, 2),(),( rxx κµγ ≤− . Это и означает почти выпуклость с константой κ множества ϕepi . Лемма 3. Пусть функция ϕ удовлетворяет условию Липшица с кон- стантой L , ϕepi — почти выпуклое множество с константой κ . Тогда функция ϕ — слабо почти выпукла с константой )( κκ L+ . Доказательство. Пусть Kxi ∈ , 0≥iλ , Ii∈ , 1=∑ ∈Ii iλ , )( ii xϕγ = , ∑ ∈ = Ii ii xx λ , ∑ ∈ = Ii iiγλγ . Приближенные методы решения дифференциальных игр со случайной помехой Системні дослідження та інформаційні технології, 2005, № 4 69 Так как ϕγ epi),( ∈iix , то существует пара ϕµ epi),( ∈y такая, что 2),(),( ryx κµγ ≤− . Отсюда 2ryx κ≤− , 2rκµγ ≤− . В результате получаем 2)()( rxy Ii ii κϕλµϕ +≤≤ ∑ ∈ . В силу условия Липшица 222)()( rLrrLyx κκγκϕϕ ++≤+≤ . Лемма 4. Пусть функция ϕ — дважды непрерывно дифференцируемая в окрестности множества K и ∞<= ∈ )(sup 2 2 x dx d Kx ϕκ . Тогда ϕ — слабо поч- ти выпукла с константой κ . Доказательство. Пусть Kxi ∈ , 0≥iλ , 1=∑ ∈ Ii iλ , ∑ ∈ = Ii ii xx λ , =r ji Iji xx −= ∈, max . По формуле Тейлора )())(()()( xxoxxxxx iii −+−′+= ϕϕϕ , где 2)( rxxo i κ≤− . Отсюда, так как 22)()( rrxxoxxo Ii i Ii ii Ii ii κκλλλ =≤−≤− ∑∑∑ ∈∈∈ , то +        −′+= ∑∑ ∈∈ xxxxx Ii ii Ii ii λϕϕϕλ )()()( 2)()( rxxxo Ii ii κϕλ −≥−∑ ∈ . Пусть nn EEf →: — непрерывно дифференцируемая функция; U — выпуклый компакт в пространстве nE ; 0>h — число. Рассмотрим функцию ))((min)( huhxfxx Uu ++= ∈ ϕψ . (4) Лемма 5. Пусть ϕ удовлетворяет условию Липшица с константой L и является слабо почти выпуклой с константой κ ; )(sup 2 2 xf dx dD Kx∈ = . Тогда функция ψ — слабо почти выпукла с константой hDL+κ . Доказательство. Пусть Kxi ∈ , 0≥iλ , 1=∑ ∈ Ii iλ , ∑ ∈ = Ii ii xx λ , ji Iji xxr −= ∈, max . По формуле Тейлора +−′+= )()()()( xxxfxfxf ii )( xxo i −+ , где 2)( rDxxo i ≤− . Из (4) следует существование таких Uui ∈ , что ))(()( huhxfxx iiii ++=ϕψ . Поскольку U выпукло, то суще- ствует Uu ∈ такое, что uu Ii ii =∑ ∈ λ . В.В. Остапенко, Е.В. Остапенко, С.Н. Амиргалиева ISSN 1681–6048 System Research & Information Technologies, 2005, № 4 70 Отсюда ( )≥+−+−′++=∑∑ ∈∈ Ii iiixii Ii ii huhxxohxxxfhxfxx )()()()()( ϕλψλ ( ) ≥−+−++≥ 2)()( rhuhxxohxfx i κϕ ( ) 22)( rhLDrhuhxfx −−++≥ κϕ . ПРИБЛИЖЕННЫЙ МЕТОД Будем предполагать, что множество V — компакт, а функция )(zΦ удовле- творяет условию Липшица с константой KL на каждом компакте K . В этом случае функцию ΦθR~ можно представить следующим образом. Обозначим  m hh m h RRR ...= . Так же, как и в работе [2], доказывается Теорема 2. Φ=Φ = m h mh RR θ θ sup~ и последовательность { }Φm hR , ,...2,1=m равномерно на каждом компакте сходится в функции ΦθR~ . Обозначим hχ оператор, который ставит в соответствие каждой непре- рывной функции )(xϕ функцию ( ) )(),,(min)( dvhvuxfxx V Uu µϕψ ∫ += ∈ . В данном пункте рассмотрены вопросы приближения оператора tR~ оператором tmhm h =,χ , где  m hh m h χχχ ...= . Пусть K — компакт из nE . По- ложим   ],0[ )( )( 0 0 )),(),(|(co)( tt Kx v u xvutztK ∈ ∈ ⋅ ⋅ ⋅⋅= , где объединение берется по всем измеримым функциям )(⋅u и )(⋅v со зна- чениями соответственно U и V . Так же, как и в работе [2], доказывается Лемма 6. Существует константа 01 ≥C , зависящая только от )( 0tK , такая, что для всех Kx∈ , m и h таких, что 0thm ≤ , выполняется hCxRx m h m h 1)()( ≤Φ−Φχ . Из теоремы 2 и леммы 6 следует Теорема 3. Последовательности функций { }tmhm h =Φ,χ равномерно на каждом компакте сходятся к функции ΦtR~ , ],0[ 0tt∈ . Теорема 4. Пусть )(xΦ слабо почти выпукла с константой κ на мно- жестве )( 0tK , 00 ≥t . Тогда существует константа 02 ≥C , зависящая только от )( 0tK , такая, что для всех 0tt ≤ и Kx∈ выполняется −Φ )(~ xRt 2 2)( tCxt ≤Φ− χ . Приближенные методы решения дифференциальных игр со случайной помехой Системні дослідження та інформаційні технології, 2005, № 4 71 Доказательство. Обозначим       ∈∈∈ ∂ ∂ = VvUutKzvuzf z F ,),(:),,(max 01 , 2F — константа такая, что для всех 0tt ≤ 2 2 0 ))(),(,()),(),(|( tFdvuxfxxvutz t ≤         +−⋅⋅ ∫ τττ , 21FFF = , { }VvUutKzvuzfF ∈∈∈= ,),(:),,(max2 03 . Поскольку функция )(xΦ ограничена снизу на компакте )( 0tK , то, не ограничивая общности, можно считать, что )(xΦ неотрицательна на )( 0tK . Пусть m и h такие, что thm = . Тогда справедливы следующие цепоч- ки неравенств: ×        +Φ≥Φ ∫ ∑∫∫ =∈∈∈ V m i iiUu V Uu V Uu m h hvuxfxx m 1 ),,(min...minmin)( 21 χ ≥−× 2 12 )()(...)( tFvdvdvd m µµµ ≥−        +Φ≥ ∫ ∑∫ =∈ = 2 1 1 )(...)(),,(min... ,...,1 tFvdvdhvuxfx m V m i iiUu V mi i µµ =−        +Φ≥ ∫ ∑ =∈ = 2 1 )(),,(min ,...,1 tFvdhvuxfx V m i iiUu mi i µ ( ) 22 )()(),,(min tFxtFvdtvuxfx t V Uu −Φ=−+Φ= ∫ ∈ χµ , ×        +Φ≤Φ ∫ ∑∫∫ =∈∈∈ V m i iiUu V Uu V Uu m h hvuxfxx m 1 ),,(min...minmin)( 21 χ =+× 2 12 )()(...)( tFvdvdvd m µµµ ≤+        +Φ= ∫ ∑∫ = = 2 1 1 1),...,( )(...)()),,...,(,(...min ,...,1 1 tFvdvdhvvvuxfx m V m i iii V vvu mi ii µµ ≤+        +Φ≤ ∫ ∑∫ = = 2 1 1)( )(...)()),(,(...min ,...,1 tFvdvdhvvuxfx m V m i iii V vu mi ii µµ [ ]∫∫ ×+Φ+++Φ≤ = V mm V vu tvvuxfxtvvuxfx t h mi i ))),(,((...))),(,((...min 11)( ,...,1 В.В. Остапенко, Е.В. Остапенко, С.Н. Амиргалиева ISSN 1681–6048 System Research & Information Technologies, 2005, № 4 72 =++× 222 31)(...)( tFtFvdvd m κµµ ( ) =+++Φ= ∫ 22 3)( )())),(,((min tFFdvtvvuxfx V vu κµ 22 3 )()( tFFxt ++Φ= χχ . Здесь минимумы по ),...,( 1 ii vvu и )(vu берутся по всем измеримым отображениям со значениями в U . Из полученных неравенств, произвольности m и h , а также теоремы 3 следует справедливость теоремы 4. Предположение 1. Существуют константы 00 >t и 0≥κ такие, что функции Φk hχ слабо почти выпуклые на K для всех k и h таких, что 0thk ≤ . Теорема 5. Пусть выполняется предположение 1, тогда существует константа 03 ≥C такая, что для всех 0tt ≤ , m и h , thm = , Kx∈ выполня- ется hCxxR m ht 3)()(~ ≤Φ−Φ χ . Доказательство. Из теоремы 4 следует, что 2 2)()(~ hCxxR hh +Φ≤Φ χ . Отсюда 2 2 22 2 2 22 2)()(~))((~)(~ hCxhCxRhCxRxR hhhhhh +Φ≤+Φ=+Φ≤Φ χχχ . Продолжая этот процесс, получаем htCxhtCxxR m h m ht 022 )()()(~ +Φ≤+Φ≤Φ χχ . Аналогично доказывается неравенство в другую сторону. Приведем случай дифференциальной игры, для которой выполняется предположение 1. Предположение 2. Функция f имеет вид ),(),(),,( 21 vufvzfvuzf += . Функция )(xΦ слабо почти выпуклая с константой κ на множестве )( 0tK и Dvzf z Vv tKz ≤ ∂ ∂ ∈ ∈ ),(max 12 2 )( 0 . Теорема 6. Из предположения 2 следует предположение 1. Доказательство. Из леммы 5 следует, что функция )(xhΦχ слабо поч- ти выпукла на множестве K с константой )( )( 0 hDL tK+κ . Продолжая про- цесс, нетрудно увидеть, что функция )(xk hΦχ слабо почти выпукла на K с константой 0)()( 00 tLDhkDL tKtK +≤+ κκ . Почти выпуклость служит обобщением понятия выпуклости функции. Для линейного случая можно ограничиться обычной выпуклостью для функций. Приближенные методы решения дифференциальных игр со случайной помехой Системні дослідження та інформаційні технології, 2005, № 4 73 Предположение 3. Функция f имеет вид ),()(),,( vuBzvAvuzf += , где )(vA — матрица, непрерывная по v ; ),( vuB — непрерывная функция; )(xϕ — выпуклая функция. Лемма 7. Пусть функция ),( uxϕ выпукла по совокупности перемен- ных; Uu ∈ , U — выпуклый компакт. Тогда функция ),(min)( uxx Uu ϕψ ∈ = яв- ляется выпуклой по x . Доказательство. Пусть nExx ∈21, , 0, 21 ≥λλ , 121 =+ λλ . Существует iu , 2,1=i , такие, что ),()( iii uxx ϕψ = . Отсюда ≥+=+ ),(),()()( 2221112211 uxuxxx ϕλϕλψλψλ )(),(min),( 2211221122112211 xxuxxuuxx Uu λλψλλϕλλλλϕ +=+≥++≥ ∈ , что и означает выпуклость функции )(xψ . Из леммы 7 и того, что ),( vUB — выпуклый компакт, следует Теорема 7. При выполнении предположения 3 функция )(xhΦχ вы- пукла. Рассмотрим построение стратегии игрока P , решающую приближенно дифференциальную игру. Предположим, что выполняется предположение 1 и 0t≤θ , θ=mh . На первом шаге игрок P знает начальную позицию 0z и строит функ- цию )( 0 vuz как решение задачи минимизации ))),(,(()),,((min 000 1 00 1 hvvuzfzhvuzfz z m h m hUu +Φ=+Φ −− ∈ χχ . Поскольку таких решений может быть много, то выбираем в качестве )( 0 vuz минимальное в лексикографическом смысле. Если помеха имеет конкретную реализацию *v на некотором подынтервале ],0[),[ 21 h⊂ττ , то игрок P выбирает на ),[ 21 ττ управление *)( 0 vuz . Пусть )(tv , ),0[ ht ∈ — функция, составленная из реализаций помехи на интервале ),0[ h ; )(tu — соответствующее управление игрока P . Обозначим )),(),(|( 01 zvuhzz ⋅⋅= . На k -м шаге игрок P знает позицию 1−kz и строит функцию 1−kzu как ре- шение задачи минимизации ))),(,(()),,((min 11111 hvvuzfzhvuzfz kzkk km hkk km hUu −−− − −− − ∈ +Φ=+Φ χχ . Как и ранее, )( 1 vu kz − — решение минимальное в лексикографическом смысле. Пусть )(tv , ),)1[( khhkt −∈ — функция, составленная из реализа- ций помехи на интервале ),)1[( khhk − ; )(tu — соответствующее управле- ние игрока P . Положим ))1(()( hktutuk −−= , ))1(()( hktvtvk −−= , ),)1[( khhkt −∈ , )),(),(|( 1−⋅⋅= kkkk zvuhzz и продолжим процесс. Обозначим построенную таким образом стратегию игрока P через h PΓ . В.В. Остапенко, Е.В. Остапенко, С.Н. Амиргалиева ISSN 1681–6048 System Research & Information Technologies, 2005, № 4 74 Пользуясь теоремой 5 и аппаратом, разработанным в работах [2, 4], по- лучаем следующий результат. Теорема 8. Существуют константа 04 ≥C и для каждого h стратегия h PΓ такие, что для любого ω hCzRzzM h P 400 )(~)),|(( +Φ≤ΓΦ θω θ . Игрок E в качестве разбиения может выбрать равномерное разбиение { }θω =<<<<= hmhhh ...20 . Из теоремы 5 следует Теорема 9. Существует константа 05 ≥C такая, что для любой страте- гии PΓ игрока P hCzRzzM Ph 500 )(~)),|(( −Φ≥ΓΦ θω θ . ВЫВОДЫ Построены приближенные методы решения дифференциальной игры со случайной помехой, которые позволяют аппроксимировать гарантирован- ные выигрыши убегающего и догоняющего игроков, а также строить соот- ветствующие стратегии. При определенных предположениях получены оценки близости точно- го и приближенного решений. Эти результаты можно развить на ситуации, когда помеха описывается некоторым случайным процессом. ЛИТЕРАТУРА 1. Пшеничный Б.Н. Структура дифференциальных игр // ДАН СССР. — 1969. — 184, № 2. — С. 285–287. 2. Пшеничный Б.Н., Остапенко В.В. Дифференциальные игры. — Киев: Наук. думка, 1992. — 260 с. 3. Остапенко В.В., Тимошенко О.М. Методы решения дифференциальных игр при различных стратегиях игроков // Докл. НАН Украины. — 1995. — № 6. — С. 5–7. 4. Остапенко В.В. Приближение основного оператора в дифференциальных играх с фиксированным временем окончания // Кибернетика. — 1984. — № 1. — С. 85–89. 5. Ушаков В.Е. К задаче построения стабильных мостов в дифференциальных иг- рах сближения–уклонения // Изв. АН СССР. Сер. Техн. кибернетика. — 1980. — № 4. — С. 29–36. 6. Алгоритмы и программы решения линейных дифференциальных игр / Под. ред. А.И. Субботина, В.С. Пацко. — Свердловск: УНЦ АН СССР, 1984. — 295 с. Поступила 19.03.2004 МЕТОДИ ОПТИМІЗАЦІЇ, ОПТИМАЛЬНЕ УПРАВЛІННЯ І ТЕОРІЯ ІГОР ПРИБЛИЖЕННЫЕ МЕТОДЫ РЕШЕНИЯ ДИФФЕРЕНЦИАЛЬНЫХ ИГР СО СЛУЧАЙНОЙ ПОМЕХОЙ В.В. Остапенко, Е.В. Остапенко, С.Н. Амиргалиева ВВЕДЕНИЕ ПОСТАНОВКА ЗАДАЧИ ПОЧТИ ВЫПУКЛЫЕ ФУНКЦИИ ПРИБЛИЖЕННЫЙ МЕТОД ВЫВОДЫ