Задача утримання у диференціальних іграх

Differential games of retention are considered, in which the purpose of a catching player is to keep the trajectory of the controlled differential equation in the given closed subset of the euclidian space. The purpose of an escaping player is opposite. Cases of simple movement and movement with a s...

Full description

Saved in:

Bibliographic Details
Date:	2019
Main Authors:	Amirhalieva, S. N., Ostapenko, V. V., Tereshchenko, I. N.
Format:	Article
Language:	Russian
Published:	The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2019
Online Access:	https://journal.iasa.kpi.ua/article/view/173799
Tags:	Add Tag No Tags, Be the first to tag this record!
Journal Title:	System research and information technologies
Download file:

Institution

System research and information technologies

_version_	1867334381910097920
author	Amirhalieva, S. N. Ostapenko, V. V. Tereshchenko, I. N.
author_facet	Amirhalieva, S. N. Ostapenko, V. V. Tereshchenko, I. N.
author_institution_txt_mv	[ { "author": "S. N. Amirhalieva", "institution": null }, { "author": "V. V. Ostapenko", "institution": null }, { "author": "I. N. Tereshchenko", "institution": null } ]
author_sort	Amirhalieva, S. N.
baseUrl_str	http://journal.iasa.kpi.ua/oai
collection	OJS
datestamp_date	2019-07-23T14:06:30Z
description	Differential games of retention are considered, in which the purpose of a catching player is to keep the trajectory of the controlled differential equation in the given closed subset of the euclidian space. The purpose of an escaping player is opposite. Cases of simple movement and movement with a simple matrix have been investigated. In the general linear case, the H-convex sets method is applied.
first_indexed	2025-07-17T10:25:47Z
format	Article
fulltext	© С.Н. Амиргалиева, В.В. Остапенко, И.Н. Терещенко, 2003 Системні дослідження та інформаційні технології, 2003, № 3 75 УДК 518.9 ЗАДАЧА УДЕРЖАНИЯ В ДИФФЕРЕНЦИАЛЬНЫХ ИГРАХ С. Н. АМИРГАЛИЕВА, В. В. ОСТАПЕНКО, И. Н. ТЕРЕЩЕНКО Рассмотрены дифференциальные игры убегания, в которых цель догоняющего игрока удержать траекторию управляемого дифференциального уравнения в заданном замкнутом подмножестве евклидового пространства. Изучены слу- чаи простого движения, движения с простой матрицей. В общем линейном случае применен метод −H выпуклых множеств. ВВЕДЕНИЕ Современная теория дифференциальных игр рассматривает либо отдельно задачу преследования и задачу убегания (при этом используются совер- шенно разные методы решения), либо объединенную задачу сближения- уклонения [1–5]. Задача сближения-уклонения может изучаться на фиксированном интер- вале времени ],0[ θ . При этом существует две постановки: 1 — время окон- чания игры фиксировано и равно θ ; 2 — игра может закончиться раньше θ . Игру ведут два игрока: P (догоняющий) и E (убегающий). Цель игро- ка P — попасть (в конце игры) на терминальное множество M . При этом он должен удержать траекторию во множестве фазовых ограничений N . Естественно предположить, что NM ⊂ . Рассмотрим игру с фиксированным временем окончания при условии NM = . В этом случае цель игрока P — удержать траекторию динамиче- ской системы во множестве M на всем интервале ],0[ θ . Такая задача удер- жания является частным случаем задачи сближения-уклонения с фиксиро- ванным временем окончания. В данной статье рассматривается более сложный случай, когда цель иг- рока P — удержать траекторию во множестве M на всей полуоси ],0[ ∞+ . Исследование дифференциальной игры удержания актуально, посколь- ку моделирует процесс удержания в заданных пределах параметров функ- ционирующего во времени объекта при наличии неопределенных помех. 1. ПОСТАНОВКА ЗАДАЧИ Рассмотрим дифференциальную игру, описываемую динамикой ),,( vuzfz = , где nEz∈ ; Uu∈ ; Vv∈ ; nE — n -мерное евклидово пространство; U и V — компакты в евклидовых пространствах. Функция f удовлетворяет условиям [1], которые обеспечивают суще- ствование, продолжаемость, единственность траектории и компактность пучка траекторий: С. Н. Амиргалиева, В. В. Остапенко, И. Н. Терещенко ISSN 1681–6048 System Research & Information Technologies, 2003, № 3 76 1) ),,( vuzf — непрерывна по совокупности переменных и локально Липшицева по z ; 2) существует константа C такая, что zCvuzf ≤),,( для всех nEz∈ , Uu∈ , Vv∈ ; 3) множество ),,( vuzf выпукло для всех nEz∈ , Vv∈ . Допустимыми управлениями игроков P и E являются измеримые функции со значениями соответственно U и V . Игра ведется в ε -стратегиях или в вольтерровских отображениях [1]. При ε -стратегиях игрок E выбирает в начальный момент 0t разбиение { }θω =≤≤≤≤== ktttt …210 0 отрезка ],0[ θ . В каждый момент it игрок E , зная )( itz , выбирает допусти- мое управление )(tvi , ),[ 1+∈ ii ttt . Игрок P в каждый момент времени it , зная )( itz и управление )(tvi , ),[ 1+∈ ii ttt , выбирает свое управление )(tui , ),[ 1+∈ ii ttt . Когда игрок P строит свое управление с помощью вольтерровских отображений, то он для выбора )(tu использует информацию о )0(0 zz = и обо всей предыстории )(sv , ts ≤≤0 . Пусть nEM ⊂ — замкнутое множество, которое будем называть тер- минальным. Цель игрока P добиться включения Mtz ∈)( , ),0[ +∞∈t , ис- пользуя те или иные стратегии. Цель игрока E — противоположная. 2. ОБЩЕЕ РЕШЕНИЕ Задача сближения-уклонения с фиксированным временем окончания описы- вается следующими операторами: MPN ε, , MPN ω , MPN θ, ~ , которые ставят в соответствие множеству M некоторое множество начальных позиций. Множество MPN ε, является множеством начальных позиций Nz ∈0 таких, что для любого допустимого )(tv , ],0[ ε∈t существует допустимое )(tu , ],0[ ε∈t такое, что для соответствующей траектории )(tz с началом в 0z выполняется включение Mz ∈)(ε . Пусть ω — некоторое разбиение ин- тервала ],0[ θ . Обозначим 1−−= iii ttε , ki …1= . Положим MPPPMP kN εεε ω … 21 = , ∩ ω ω θ MPMP NN =, ~ , где пересечение берется по всем разбиениям ω . В работе [1] показано, что если MPz N θ,0 ~ ∈ , то игрок P , пользуясь ε - стратегиями (или вольтерровскими отображениями), может добиться того, что для соответствующей траектории )(tz выполняются включения Задача удержания в дифференциальных играх Системні дослідження та інформаційні технології, 2003, № 3 77 Mz ∈)(θ , Ntz ∈)( для всех ],0[ θ∈t . Если MPz N θ,0 ~ ∉ , то либо Mz ∉)(θ , либо Ntz ∉)( для некоторого ],0[ θ∈t . Положим MN = . Множество MPM θ, ~ описывает множество всех на- чальных позиций, из которых игрок P может удержать траекторию )(tz во множестве M на всем интервале ],0[ θ . Выше определялись ε -стратегии на конечном отрезке ],0[ θ . Их не- трудно обобщить на полуось ),0[ +∞ , считая, что { ≤≤≤== 210 0 tttω }…… 1+≤≤≤ kk tt является разбиением полуоси ),0[ +∞ , которое не имеет точек сгущения. Положим ∩ 0 , ~~ ≥ = t tM MPMP . Множество MP~ — множество всех на- чальных позиций, из которых игрок P может удержать траекторию )(tz во множестве M на всей полуоси ),0[ +∞ . Если ∅=MP~ , то представляет интерес задача нахождения максималь- ного ),0[ ∞∈∗t такого, что 0~ , ≠MP tM для всех ],0[ ∗∈ tt . 3. ЛИНЕЙНЫЕ ИГРЫ С ПРОСТОЙ МАТРИЦЕЙ В данном случае динамика игры описывается уравнением vuzaz +−= , где a — число. Рассмотрим случай, когда M — выпуклое компактное множество, M∈0 , MU α= , MV β= , αβ ≥ , r=−αβ , 0<a . В этом случае получаем [1] ∩ ∪ Mv Mu t taat tM MvudezeMzMP β α τ τ ∈ ∈ − ⎪⎭ ⎪ ⎬ ⎫ ⎪⎩ ⎪ ⎨ ⎧ ∈+−+∈= ∫ 0 )( 00, )(:~ . Отсюда ∩MMdeMdeMeMP t a t aat tM ⎪⎭ ⎪ ⎬ ⎫ ⎪⎩ ⎪ ⎨ ⎧ − ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎣ ⎡ += ∫∫ −−− 0 * 0 , ~ τβτα ττ . Для t , для которых функция 0)1(1)( ≥−−= −− re a etf atat , множество MP tM , ~ имеет вид ∩MMre a eMP atat tM ⎭ ⎬ ⎫ ⎩ ⎨ ⎧ ⎥⎦ ⎤ ⎢⎣ ⎡ −−= −− )1(1~ , . Напомним, что ∩ 0 , ~~ ≥ = t tM MPMP . Так как M∈0 , то множества MP tM , ~ , 0≥t вложены друг в друга. Поэтому для получения MP~ надо найти мини- мум функции )(tf . Возьмем производную ateratf −−−=′ )()( . С. Н. Амиргалиева, В. В. Остапенко, И. Н. Терещенко ISSN 1681–6048 System Research & Information Technologies, 2003, № 3 78 Если ra ≥− , то функция )(tf не убывает. Поэтому ее минимум нахо- дится в точке 0=t . Поскольку 1)0( =f , то получаем MMP = ~ . Если ra <− , то функция )(tf убывает. Поскольку 0>− a , а функцию )(tf можно записать в виде ⎥⎦ ⎤ ⎢⎣ ⎡ − −+−= − a rer a tf at 11)( , то, учитывая, что ra <− , получаем −∞= ∞→ )(lim tf t . Поэтому в таком случае можно рассмотреть задачу нахождения макси- мального t , при котором 0~ , ≠MP tM , для чего достаточно найти корень уравнения 0)( =tf . Очевидно, он равен 1 1 2 ln1 − ∗ ⎥⎦ ⎤ ⎢⎣ ⎡ + − = a a t . Теперь остановимся на случае βα ≥ , βα −=r , 0>a . Здесь ∩MMre a eMP atat tM ⎭ ⎬ ⎫ ⎩ ⎨ ⎧ ⎥⎦ ⎤ ⎢⎣ ⎡ −+= −− )1(1~ , . Для решения поставленных задач нужно найти минимум функции )1(1)( atat e a etg −− −+= . Возьмем производную ateratg −+−=′ )()( . Если ra > , то функция )(tg убывает. При этом a rtg t += ∞→ 1)(lim . Но поскольку MMP ⊂ ~ , то получаем MMP = ~ . Если ra ≤ , то функция не убывает. Поэтому минимум достигается при 0=t . При этом 1)0( =g и, следовательно, MMP = ~ . 4. МЕТОД H - ВЫПУКЛЫХ МНОЖЕСТВ ДЛЯ РЕШЕНИЯ ЛИНЕЙНЫХ ИГР Напомним определение понятия H -выпуклых множеств [1]. Определение 1. Пусть { }1: =∈⊂ xExH n . Множество M называется H -выпуклым, если оно представимо в виде ( ){ }∩ Hx n xcxxExM ∈ ∗∗ ∗ ≤∈= ,: , Задача удержания в дифференциальных играх Системні дослідження та інформаційні технології, 2003, № 3 79 где )( ∗xc может принимать значение ∞+ . В качестве числа )( ∗xc можно взять значение опорной функции множества M , т. е. ∗ ∈ ∗∗ == xxxWxc Mx M ,sup)()( . Рассмотрим игру с динамикой vuAzz +−= , где nn EEA →: — линейный оператор; Uu∈ ; Vv∈ , где U и V — ком- пакты. В качестве H выберем множество собственных вещественных векто- ров оператора ∗A . Считаем, что множества M , U и V — H -выпуклы. Тогда ( ){ }∩ Hx M n xWxxExM ∈ ∗∗ ∗ ≤∈= ,: , ( ){ }∩ Hx U n xWxxExU ∈ ∗∗ ∗ ≤∈= ,: , ( ){ }∩ Hx V n xWxxExV ∈ ∗∗ ∗ ≤∈= ,: , из [1] ∩ ∪ Vv Uu t tAAt tM MvudezeMzMP ∈ ∈ − = ⎪⎭ ⎪ ⎬ ⎫ ⎪⎩ ⎪ ⎨ ⎧ ∈+−+∈= ∫ 0 )( 00, )(:~ ττ ∩MVdeUdeMe t A t AAt ⎪⎭ ⎪ ⎬ ⎫ ⎪⎩ ⎪ ⎨ ⎧ − ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎣ ⎡ += ∫∫ −−− 0 * 0 ττ ττ . Предположим, что имеет место полное выметание множества ∫ − t A Vde 0 ττ из множества ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎣ ⎡ + ∫ −− t AAt UdeMe 0 ττ , т. е., если обозначить через D множество ∫∫ −−− − ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎣ ⎡ += t A t AAt VdeUdeMeD 0 * 0 ττ ττ , то DVdeUdeMe t A t AAt += ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎣ ⎡ + ∫∫ −−− 00 ττ ττ . В этом случае MPx tM , ~ ∈ тогда и только тогда, когда для любого Hx ∈∗ = ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ +⎟ ⎠ ⎞⎜ ⎝ ⎛≤ ∫∫ ∗−∗−∗−∗ ∗∗∗ t A V t A U tA M xdeWxdeWxeWxx 00 , ττ ττ С. Н. Амиргалиева, В. В. Остапенко, И. Н. Терещенко ISSN 1681–6048 System Research & Information Technologies, 2003, № 3 80 ∫∫ ∗−∗−∗− ∗∗∗ −+= t V x t U x M tx xWdexWdexWe 0 )( 0 )()( )()()( ττ τλτλλ , где )( ∗xλ — собственное число оператора ∗A , соответствующее собственному вектору ∗x , и правая часть в данной формуле неотрицательна для всех Hx ∈∗ . Так же, как и в п. 3, рассмотрим различные случаи. Обозначим через −H множество всех собственных единичных векторов ∗A , для которых соответст- вующие собственные числа меньше нуля; +H — множество всех собственных векторов ∗A , для которых соответствующие собственные числа не меньше нуля. Если для всех − ∗ ∈Hx выполняется )()( ∗∗ ≥ xWxW UV и ≥− ∗∗ )()( xWx Mλ )()( ∗∗ −≥ xWxW UV , то MMP = ~ . Если )()()()( ∗∗∗∗ −<− xWxWxWx UVMλ для некоторых ∗x , то 0~ =MP , и максимальное ∗t , при котором 0~ , ≠tMP , ищется как минимальное реше- ние уравнения [ ] 0)()( 0 )()( =−+ ∫ ∗∗−− ∗∗ t VU x M tx xWxWdeWe ττλλ , где минимум берется по указанным ∗x . ВЫВОДЫ Поставлена новая задача удержания в дифференциальных играх. Рассмотрен общий случай, когда игроки играют в ε -стратегиях, и структура игры описывается операторными конструкциями Б. Н. Пшеничного. Изучен линейный случай с простой и произвольной матрицами. В по- следнем случае используется метод H -выпуклых множеств. В перспективе разработка достаточно конструктивных приближенных методов решения задач удержания в нелинейных дифференциальных играх. ЛИТЕРАТУРА 1. Пшеничный Б.Н., Остапенко В. В. Дифференциальные игры. — Киев: Наук. думка, 1991. — 264 с. 2. Понтрягин Л.С. Линейные дифференциальные игры преследования // Мат. сб. — 1980. — 112, № 3. — С. 307–330. 3. Понтрягин Л.С. Линейные дифференциальные игры убегания // Тр. МИ АН СССР. — 1971. — 112. — С. 30–63. 4. Красовский Н.Н., Субботин А. И. Позиционные дифференциальные игры. — М.: Наука, 1977. — 456 с. 5. Чикрий А.А. Конфликтно управляемые процессы. — Киев: Наук. думка, 1992. — 382 с. Поступила 02.06.2003
id	journaliasakpiua-article-173799
institution	System research and information technologies
keywords_txt_mv	keywords
language	Russian
last_indexed	2025-07-17T10:25:47Z
publishDate	2019
publisher	The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute"
record_format	ojs
resource_txt_mv	journaliasakpiua/54/50175c0c55d20035b79c68f92066a154.pdf
spelling	journaliasakpiua-article-1737992019-07-23T14:06:30Z Problem of retention in differential games Задача удержания в дифференциальных играх Задача утримання у диференціальних іграх Amirhalieva, S. N. Ostapenko, V. V. Tereshchenko, I. N. Differential games of retention are considered, in which the purpose of a catching player is to keep the trajectory of the controlled differential equation in the given closed subset of the euclidian space. The purpose of an escaping player is opposite. Cases of simple movement and movement with a simple matrix have been investigated. In the general linear case, the H-convex sets method is applied. Рассмотрены дифференциальные игры убегания, в которых цель догоняющего игрока удержать траекторию управляемого дифференциального уравнения в заданном замкнутом подмножестве евклидового пространства. Изучены случаи простого движения, движения с простой матрицей. В общем линейном случае применен метод H-выпуклых множеств. Розглянуто диференціальні ігри утікання, в яких мета гравця, що наздоганяє, утримати траєкторію керованого диференціального рівняння в заданій замкненій підмножині євклідового простору. Мета того, що утікає, протилежна. Вивчено випадки простого руху, а також руху з простою матрицею. У загальному лінійному випадку застосовано метод H-опуклих множин. The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2019-07-23 Article Article application/pdf https://journal.iasa.kpi.ua/article/view/173799 System research and information technologies; No. 3 (2003); 75-80 Системные исследования и информационные технологии; № 3 (2003); 75-80 Системні дослідження та інформаційні технології; № 3 (2003); 75-80 2308-8893 1681-6048 ru https://journal.iasa.kpi.ua/article/view/173799/173677 Copyright (c) 2021 System research and information technologies
spellingShingle	Amirhalieva, S. N. Ostapenko, V. V. Tereshchenko, I. N. Задача утримання у диференціальних іграх
title	Задача утримання у диференціальних іграх
title_alt	Problem of retention in differential games Задача удержания в дифференциальных играх
title_full	Задача утримання у диференціальних іграх
title_fullStr	Задача утримання у диференціальних іграх
title_full_unstemmed	Задача утримання у диференціальних іграх
title_short	Задача утримання у диференціальних іграх
title_sort	задача утримання у диференціальних іграх
url	https://journal.iasa.kpi.ua/article/view/173799
work_keys_str_mv	AT amirhalievasn problemofretentionindifferentialgames AT ostapenkovv problemofretentionindifferentialgames AT tereshchenkoin problemofretentionindifferentialgames AT amirhalievasn zadačauderžaniâvdifferencialʹnyhigrah AT ostapenkovv zadačauderžaniâvdifferencialʹnyhigrah AT tereshchenkoin zadačauderžaniâvdifferencialʹnyhigrah AT amirhalievasn zadačautrimannâudiferencíalʹnihígrah AT ostapenkovv zadačautrimannâudiferencíalʹnihígrah AT tereshchenkoin zadačautrimannâudiferencíalʹnihígrah

Задача утримання у диференціальних іграх

Institution

Similar Items