Принцип растяжения времени в эволюционных играх сближения

Встановлено, що еволюційна гра зближення зi змінним запізненням інформації еквівалентна деякій грі з повною інформацією, але з іншими динамікою та термінальною множиною. Цей факт послужив обгрунтуванням принципу розтягування часу, сформульованого в роботі, який значно розширює сферу застосування пер...

Full description

Saved in:

Bibliographic Details
Published in:	Проблемы управления и информатики
Date:	2016
Main Author:	Чикрий Г.Ц.
Format:	Article
Language:	Russian
Published:	Інститут кібернетики ім. В.М. Глушкова НАН України 2016
Subjects:	Конфликтно-управляемые процессы и методы принятия решений
Online Access:	https://nasplib.isofts.kiev.ua/handle/123456789/208170
Tags:	Add Tag No Tags, Be the first to tag this record!
Journal Title:	Digital Library of Periodicals of National Academy of Sciences of Ukraine
Cite this:	Принцип растяжения времени в эволюционных играх сближения / Г.Ц. Чикрий // Проблемы управления и информатики. — 2016. — № 3. — С. 35-48. — Бібліогр.: 15 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine

id	nasplib_isofts_kiev_ua-123456789-208170
record_format	dspace
spelling	Чикрий Г.Ц. 2025-10-20T14:00:59Z 2016 Принцип растяжения времени в эволюционных играх сближения / Г.Ц. Чикрий // Проблемы управления и информатики. — 2016. — № 3. — С. 35-48. — Бібліогр.: 15 назв. — рос. 0572-2691 https://nasplib.isofts.kiev.ua/handle/123456789/208170 517.977 10.1615/JAutomatInfScien.v48.i5.20 Встановлено, що еволюційна гра зближення зi змінним запізненням інформації еквівалентна деякій грі з повною інформацією, але з іншими динамікою та термінальною множиною. Цей факт послужив обгрунтуванням принципу розтягування часу, сформульованого в роботі, який значно розширює сферу застосування першого прямого методу Понтрягіна. Для ілюстрації запропонованої методики розглянуто модельний приклад диференціальної гри про м’яку зустріч двох об’єктів другого порядку з різною динамікою. It is established that the evolutionary game of approach with variable information delay is equivalent to certain game with perfect information under other dynamics and terminal set. This fact substantiates the time dilatation principle formulated in the paper, which essentially extends the range of applications of the Pontryagin first direct method. To illustrate suggested technique, the model differential game on soft meeting of two second order objects, having different dynamics, is analyzed. ru Інститут кібернетики ім. В.М. Глушкова НАН України Проблемы управления и информатики Конфликтно-управляемые процессы и методы принятия решений Принцип растяжения времени в эволюционных играх сближения Принцип розтягування часу в еволюційних іграх зближення Principle of time dilatation in evolutionary games of approach Article published earlier
institution	Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection	DSpace DC
title	Принцип растяжения времени в эволюционных играх сближения
spellingShingle	Принцип растяжения времени в эволюционных играх сближения Чикрий Г.Ц. Конфликтно-управляемые процессы и методы принятия решений
title_short	Принцип растяжения времени в эволюционных играх сближения
title_full	Принцип растяжения времени в эволюционных играх сближения
title_fullStr	Принцип растяжения времени в эволюционных играх сближения
title_full_unstemmed	Принцип растяжения времени в эволюционных играх сближения
title_sort	принцип растяжения времени в эволюционных играх сближения
author	Чикрий Г.Ц.
author_facet	Чикрий Г.Ц.
topic	Конфликтно-управляемые процессы и методы принятия решений
topic_facet	Конфликтно-управляемые процессы и методы принятия решений
publishDate	2016
language	Russian
container_title	Проблемы управления и информатики
publisher	Інститут кібернетики ім. В.М. Глушкова НАН України
format	Article
title_alt	Принцип розтягування часу в еволюційних іграх зближення Principle of time dilatation in evolutionary games of approach
description	Встановлено, що еволюційна гра зближення зi змінним запізненням інформації еквівалентна деякій грі з повною інформацією, але з іншими динамікою та термінальною множиною. Цей факт послужив обгрунтуванням принципу розтягування часу, сформульованого в роботі, який значно розширює сферу застосування першого прямого методу Понтрягіна. Для ілюстрації запропонованої методики розглянуто модельний приклад диференціальної гри про м’яку зустріч двох об’єктів другого порядку з різною динамікою. It is established that the evolutionary game of approach with variable information delay is equivalent to certain game with perfect information under other dynamics and terminal set. This fact substantiates the time dilatation principle formulated in the paper, which essentially extends the range of applications of the Pontryagin first direct method. To illustrate suggested technique, the model differential game on soft meeting of two second order objects, having different dynamics, is analyzed.
issn	0572-2691
url	https://nasplib.isofts.kiev.ua/handle/123456789/208170
citation_txt	Принцип растяжения времени в эволюционных играх сближения / Г.Ц. Чикрий // Проблемы управления и информатики. — 2016. — № 3. — С. 35-48. — Бібліогр.: 15 назв. — рос.
work_keys_str_mv	AT čikriigc principrastâženiâvremenivévolûcionnyhigrahsbliženiâ AT čikriigc principroztâguvannâčasuvevolûcíinihígrahzbližennâ AT čikriigc principleoftimedilatationinevolutionarygamesofapproach
first_indexed	2025-11-27T07:57:45Z
last_indexed	2025-11-27T07:57:45Z
_version_	1850804481628831744
fulltext	© Г.Ц. ЧИКРИЙ, 2016 Международный научно-технический журнал «Проблемы управления и информатики», 2016, № 3 35 КОНФЛИКТНО-УПРАВЛЯЕМЫЕ ПРОЦЕССЫ И МЕТОДЫ ПРИНЯТИЯ РЕШЕНИЙ УДК 517.977 Г.Ц. Чикрий ПРИНЦИП РАСТЯЖЕНИЯ ВРЕМЕНИ В ЭВОЛЮЦИОННЫХ ИГРАХ СБЛИЖЕНИЯ Введение Работа посвящена изложению некоторого подхода к решению эволюционных игр сближения, для которых не выполнено условие Л.С. Понтрягина, лежащее в ос- нове прямых методов [1, 2]. Анализ этого условия в случае линейных дифференци- альных игр был проведен М.С. Никольским [3]. Д. Зонневенд предложил некоторое его обобщение, используя информацию об управлении противника в прошлом [4]. Суть подхода состоит в искусственном ухудшении информационных возможно- стей преследователя, а именно в переходе от исходной игры с полной информацией к дифференциальной игре с той же динамикой и тем же терминальным множеством, но с запаздыванием информации специального вида, убывающим по мере прибли- жения траектории игры к терминальному множеству и обращающимся в нуль при попадании на него. Полученная таким образом игра с запаздыванием информации исследуется на основе ее эквивалентности некоторой игре с полной информацией с несколько видоизмененными динамикой и терминальным множеством. Ключевым моментом является введение числовой функции )(tI , которая по смыслу является функцией растяжения времени. Схему игрового подхода, в котором модифицированное условие Понтрягина использует функцию )(tI , будем называть принципом растяжения времени. В случае дифференциальной игры он продемонстрировал свою эффективность при решении задач о мяг- кой встрече для систем второго порядка, когда функцию )(tI удается найти в явном виде [4–7]. Рассматривается случай динамики, описываемый эволюци- онной системой общего вида, охватывающей широкий класс функционально - дифференциальных систем [8, 9]. 1. Эффект запаздывания информации в эволюционных играх Пусть траектория конфликтно-управляемого процесса задана в виде   dvtfutftgtz t t )))(,,())(,,(()()( 21 0 , ),[ 0  tt , (1) где nRtz )( , :g nRt  ),[ 0 , — непрерывная вектор-функция. Управле- ния u и v выбираются игроками из множеств U и ;V ),(, nRKVU  а их реа- 36 ISSN 0572-2691 лизации во времени являются измеримыми функциями. Функции ),,(1 utf  и ),,(2 vtf  , ,)(: 01 nRUtf  ,)(: 02 nRVtf  почти всюду ограничены и измеримы по t и , непрерывны по u и v соответственно; :),({)( 0  tt }.0 0  tt Примером конфликтно-управляемого процесса (1) является процесс, описы- ваемый линейной системой дифференциальных уравнений )()()()( tvtutAztz  , 0)0( zz  . (2) Здесь 0)( zetg At , ),,(1 utf  ue tA )(  , ),,(2 vtf  ve tA )(  . Кроме того, задано терминальное множество M цилиндрического вида ,0 MMM  (3) где 0M — линейное подпространство, а M — выпуклый компакт из ортого- нального дополнения к 0M в ,nR т. е. )(LcoKM  ,   0ML . Игра рассматривается с позиции преследователя ( u ), цель которого — вывод за конечное время траектории (1) на терминальное множество M при любом противодействии убегающего ( v ). Предполагается, что Mtg )( 0 . Пусть  — оператор ортогонального проектирования из nR на ,L LRn  : . Тогда выход траектории на терминальное множество в момент t означает вы- полнение включения .)( Mtz  Задача преследователя усложнена тем, что информация о состоянии игры посту- пает к преследователю с запаздыванием во времени )(t , где : Rt  ),[ 00 — кусочно-непрерывная функция, 000 )(  t , имеющая не более, чем счетное число разрывов первого рода, и абсолютно непрерывная на интервалах своей не- прерывности. Кроме того, предполагается, что 1)(  t в точках существования производной )(t (последнее условие обеспечивает поступление свежей инфор- мации в течение игры). Предполагается, что игрокам известны параметры конфликтно-управляемого процесса (1), (3), вектор-функции )(tg , ),,(1 utf  и ),,(2 vtf  , области управле- ний U , V и терминальное множество .M Игра начинается в момент времени ,0t но информацию об управлении убе- гающего преследователь начинает получать с момента 00 t , где .00  В ходе игры, т.е. в каждый текущий момент времени ,, 00  ttt к преследователю по- ступает информация об управлении убегающего в момент )(tt  , т.е. ему известно управление убегающего на отрезке ])(,[ 0 ttt  . Обозначим U , V совокупность измеримых функций со значениями из ,U V соответственно. С позиции информированности преследователя множество достижимости процесса (1) в момент t при уже реализованных управлениях иг- роков )(u на ],[ 0 tt и )(v на )](,[ 0 ttt  представимо в виде             dvtfdutftgzztZ tt t t t ))(,,())(,,()(: 21 00 Международный научно-технический журнал «Проблемы управления и информатики», 2016, № 3 37   . )(,))(,,( V112        vdvtf t tt (4) Игра с запаздыванием информации считается законченной в момент ,t если выполняется включение  MtZ )( . Введем следующие обозначения: )(~ tg )(tg    dutf t t ))(,,(1 00 0 ,               V t tt vdvtfxxtV )(,))(,,(:))(( 2 . (5) Пусть на начальном полуинтервале времени ),[ 000 tt преследователь ис- пользовал некоторое допустимое управление )(00  t u , U t u   )(00 . Введем вспомогательную переменную: )(~ tz )(~ tg    dutf t t ))(,,(1 00      dvtf tt t ))(,,(2 0 . (6) Сделаем во втором интеграле в выражении (6) для )(~ tz замену переменных )( 11  и учитывая, что 000 )(  t и 0)( ttt  при 00  tt , получим ,)))((),(,())(1())(,,()(~)(~ 21 0000    dvtfdutftgtz t t t t  (7) 00  tt . Из формул (4)–(6) следует, что )).(()(~)( tVtztZ  (8) Введем в рассмотрение многозначные отображения ,))(())(( tVMtM  (9) ))(()( 0 tMMtM  . (10) В (9) была использована операция геометрической разности множеств: )(}:{ yXXYzzYX Yy   , nRX  , nRY  . Из (8) видно, что если  MtZ )( , то )()(~ tMtz  и наоборот. Рассмотрим игру сближения с полной информацией, в которой текущее со- стояние объекта определяется выражением (7), с терминальным множеством )(tM (10), имеющим переменную телесную составляющую (9). Условие 1. Многозначное отображение ))(( tM  имеет непустые образы по- чти при всех .00  tt Из предыдущих рассуждений следует теорема. Теорема 1. Пусть в игре (1), (3) с переменным запаздыванием информа- ции )(t выполнено условие 1 и на полуинтервале [ 000, tt ) преследователь 38 ISSN 0572-2691 применил управление 00 t u (). Игра (1), (3) может быть завершена в момент ,T ,00  tT тогда и только тогда, когда игра (7), (10) с полной информацией мо- жет быть завершена в тот же момент времени .T Будем говорить, что упомянутые игровые задачи эквивалентны. В случае линейной дифференциальной игры (2) [10] фазовая переменная эк- вивалентной игры с полной информацией     )( 0 )()( 0 0 )()()(~ tt AtAt t tA dveduezetz п.в. на полуоси ),[ 0  удовлетворяет дифференциальному уравнению ))(())(1()()(~)(~ )( ttvettutzAtz At   с начальным условием        duezezz AA )( 0 000 0 0 0)(~~ . При этом множество ))(( tV  в формуле (9) приобретает вид             V A t vdvexxtV )(,)(:))(( )( 0 . 2. Принцип растяжения времени в эволюционных играх В основе первого прямого метода [1], сформулированного для линейной дифференциальной игры с полной информацией (2), лежит условие Понтрягина, отражающее преимущество преследователя над убегающим в ресурсах управле- ния в терминах параметров игры  VeUetW tAtA)( .0t Ниже приведено его обобщение на случай динамики (1). Условие 2. Образы многозначного отображения ),( tW — непустые множе- ства, т.е.  ),,(),,(),( 0201 VttfUttftW )(),( 0tt  . Определение. Функцией растяжения времени назовем скалярную неотрица- тельную монотонно возрастающую функцию времени )(tI , )[0, t , 0)0( I , ttI )( при 0t , которая может иметь не более, чем счетное число разрывов первого рода, абсолютно непрерывную на интервалах своей непрерывности и та- кую, что   )(sup \)[0, tI t  , где  — множество точек разрыва и недифферен- цируемости )(tI . Условие 3. Существует функция растяжения времени )(tI такая, что много- значное отображение )),()(),(()(),)(),((),( 0020011 VItIttItfIUtIttItftW   имеет непустые образы почти при всех )(),( 0tt  . Международный научно-технический журнал «Проблемы управления и информатики», 2016, № 3 39 Далее будет использоваться интеграл Ауманна от многозначного отображе- ния. Приведем его определение. Пусть )(tF — измеримое отображение, )(],[: 0 nRPTtF  , где )( nRP — совокупность всех замкнутих подмножеств пространства nR . Интеграл Ауманна от многозначного отображения )(tF определяется следующим образом [11]: ,)()( 00 )()( dttfdttF T tFf T t     где объединение берется по всем измеримым селекторам отображения )(tF . Теорема 2. Пусть для эволюционной игры (1), (3) с полной информацией вы- полнено условие 3 и для заданного начального положения )( 0tg существует ко- нечный момент времени 1t : ,0:min1       ttt   .),(,),())(( 1 0 01 )( 0 0 0                           dtWMdUtItftItg tttIt t  (11) Тогда траектория процесса (1) может быть приведена преследователем на терминальное множество M (3) в момент времени )( 10 tIt  при любых допу- стимых управлениях убегающего. Доказательство. Разделим отрезок времени ])(,[ 100 tItt  на две части — начальный полуинтервал ),[ 000 tt , где 110 )( ttI  , и отрезок ])(,[ 1000 tItt  . В силу предположений о непустоте пересечения в определе- нии времени 1t (11) и непустоте образов многозначного отображения ),(1 tW существуют допустимое управление )(00  t u , ),[ 000  tt , точка Mm и измеримый селектор ),( 11  t , ),(),( 1111  tWt , ),0[ 1t , многозначного отображения ),( 11 tW , при которых выполняется равенство               dtmdutItftItg t t ttIt t ),())(,),(())(( 11 0 101 )( 10 1 00 110 0 . (12) Предлагается следующий способ построения управления преследователя на отрезке времени )](,[ 10 tIt . На начальном участке времени управление преследо- вателя положим равным )(00  t u , ),[ 000  tt . На участке ])(,[ 1000 tItt  траектория системы (1) может быть представлена следующим образом:   ))(,,(()()( 0000001 0 0000 tutttfttgttz t .)))(,,( 0000002  dtvtttf 40 ISSN 0572-2691 Пусть в каждый момент времени ,00 t ],0[ 1t , управление пресле- дователя строится не по текущему управлению убегающего, а по его управлению в момент времени )()( 110  tItIt , где ),)()(()()( 1100110  ttIttItIt т.е. по управлению убегающего на время )()( 11  ttI раньше. Таким обра- зом, на отрезке )](,[ 1000 tItt  осуществлен переход от исходной игры с пол- ной информацией к вспомогательной игре с теми же динамикой и терминальным множеством, но с переменным запаздыванием информации )()()( 1100  ttIt , ],0[ 1t . (13) Согласно теореме 1 описанная дифференциальная игра с запаздыванием инфор- мации эквивалентна игре с полной информацией, в которой траектория задается уравнением   dtutttfttgttz t ))(,,()(~)(~ 0000001 0 0000 ,)))()((),()(),(()( 110110021 0   dtItItvtItIttItftI t  (14)  )(~ 00 ttg )( 00 ttg      duttf t t t ))(,,( 00 00 0 001 . При этом в соответствии с формулами (9), (10) терминальное множество эк- вивалентной игры с полной информацией имеет вид ),)(()( 00000 ttMMttM  ))()(())(())(( 110000 ttttIVMttVMttM  . Так как согласно (13) 0)())(( 10010  tttIt , то ввиду (5), (9), (10)   MtItM ))(( 10 . Предпишем преследователю на отрезке ])(,[ 1000 tItt  строить свое управление в виде измеримого решения уравнения    ),()(),(()(,),( 11010210000101  tItIttItftItuttItf  ],0[,),()))()(( 1111110 ttttItItv  , (15) существование которого обеспечивает теорема Филиппова–Кастена об изме- римом выборе [12]. Из формул (14) и (12) с учетом выбора управления преследователем (15) сле- дует, что mtItz  ))((~ 10 , .Mm Это означает, что преследователь, строя свое управление по управлению противника в прошлом (15), выведет траекторию ис- ходной игры (1) с полной информацией из точки 0z на терминальное множество M в момент времени )( 10 tIt  при любых допустимых управлениях убегающего. Теорема доказана. Международный научно-технический журнал «Проблемы управления и информатики», 2016, № 3 41 В случае динамики (2) условие 3 приобретает следующий вид. Условие 4. Существует функция растяжения времени )(tI , такая что  VetIUetW AtItA )( 1 )()(  .\),0[ t Следствие [4]. Пусть для дифференциальной игры (2), (3) выполнено условие 4 и для заданного начального положения 0z существует конечный момент времени .)(:0min)( 0 1 ))(( )( 0 0 )( 011                                 t AtI ttI AtI dWMUdezetztt  (16) Тогда из начального состояния 0z игра может быть завершена в момент времени )( 1tI при любых допустимых управлениях убегающего. При этом на полуинтервале времени ),0[ 0 управление преследователя при- нимается равным )(0   u , ),0[ 0 , а на отрезке времени ],[ 100 tt  оно стро- ится в виде измеримого решения уравнения ],0[),())()(()()( 11111 )( 10 )( 11 tttItIvetIue AtIAt    , (17) где управление )(0   u , ),0[ 0 , и измеримый селектор )(1  , ],0[ 1t , мно- гозначного отображения )(1 W определяются условием (16). 3. Пример. Мягкое сближение разнотипных объектов Пусть движение преследователя описывается системой уравнений uxx   , nRx , 1u , (18) а объект, уклоняющийся от встречи, совершает колебательные движения согласно динамике ,2 2 vyyhy   ,nRy 1v , (19) где .0,,,,  h В отсутствие управляющего воздействия (v = 0) поведение системы (19) определяется корнями характеристического уравнения .02 22  hss Рассмат- ривается случай малого вязкого трения, когда ,22 h где параметр h — интен- сивность уменьшения амплитуды колебаний системы, а 22 h — демпфи- рованная угловая частота колебаний системы с вязким трением. Такая система описывает затухающие колебания [13]. Заданы начальные положения и скорости объектов: ,)0( 0xx  ,)0( 0xx   ,)0( 0yy  .)0( 0yy   Цель преследователя — достичь в некоторый конечный момент времени совпадения геометрических положений и скоростей объектов, т.е. их «мягкой встречи» [14]. 42 ISSN 0572-2691 Положив ,),,,(),,,( 4 2121 nRyyxxyyxxz   сведем уравнения (18), (19) к виду (2), где                  hEEOO EOOO OOEO OOEO A 22 ,                   O O S O U ,                   S O O O V ,                    0 0 0 0 0 y y x x z   . Здесь O и E — нулевая и единичная nn матрицы, S — единичный шар в R n с центром в нуле. Фундаментальная матрица объединенной системы имеет вид                                                    Ett h etEeOO tEeEtt h eOO OOEeO OOE e E e htht htht t t tA cossinsin sin 1 cossin 1 2 . Теперь запишем условие 4 для рассматриваемой дифференциальной игры:                                  1 )( )( 1 1 )(cos)(sin)( )(sin)( 1 )( v thIt thI t u vtItI h etIue vtIetIu e tW .0t (20) Оно выполняется, если существует пара n -мерных векторов ,)(1 td )(1 td [3] таких, что для каждого вектора ,v ,nRv ,1v найдется вектор ,u ,nRu ,1u для которых одновременно удовлетворяются следующие равенства: .)()(cos)(sin)( , 1 )()(sin)( 2 )( 1 )( uetdvtItI h etI u e tdvtIetI tthI t thI              (21) В частности, уравнения (21) должны выполняться при ,0v поэтому имеем , 1 )( 01 u e td t     02 )( uetd t , где 0u — управление, соответствующее .0v Подставив )(1 td , )(2 td в си- стему (21), получим равенства ),( 1 )(sin)( 0 )( uu e vtIetI t thI             .)(cossin)( 0 )( uuevtItI h etI tthI     Международный научно-технический журнал «Проблемы управления и информатики», 2016, № 3 43 Из них следует соотношение, которому должна удовлетворять функция растяжения времени )(tI :    te1    )(cos)(sin ttI h   )(sin tI e t . (22) Функцию )(tI , ),0[ t , будем строить поэтапно с помощью некоторой вспомогательной функции )(tJ , ),0[ t . Пусть )(tJ удовлетворяет (22), принимает значения на полуинтервале         2 ,0 , где ,0)(cos  tJ ,0)(sin  tJ и такая, что .0)(cos)(sin    tJtJ h Тогда знаком модуля в равенстве (22) можно пренебречь и получить уравнение для )(tJ : )(tg tJ         1 1 1 t t e h e . (23) Отсюда имеем . 1 1 1 arctg 1 )(           t t e h e tJ (24) Видим, что на всем промежутке времени ),0[  функция )(tJ монотонно возрастает, ,0)0( J при этом .arctg 1 )( h tJ t     Поскольку h   arctg 1 является конечной величиной, требование ttJ )( ,0t которому, согласно определению, должна удовлетворять функция растяжения времени, не выполняется. Вычислим производную функции )(tJ : 2 2 2 11 1 )(                          tt t ee h e tJ . (25) Легко убедиться, что 1)0( J и при условии h2 (26) 1)( tJ при ),0(  tt , 1)( tJ при  tt ,               )2(1ln 1 2 ht . 44 ISSN 0572-2691 Это означает, что функция )(tJ на полуинтервале ),0[ t растет быстрее, а при  tt — медленнее времени .t Поэтому ввиду того, что 0)0( J , h tJ     arctg 1 )( t и того, что в силу предположения (26)       ,arctg 1 21 1 1arctg 1 21 2 1 arctg 1 )( 22 2 hh h h h h h tJ                               график функции )(tJ обязательно пересечет луч ty  в некоторый конечный момент времени  ttt 11, . Приступим к построению функции растяжения времени )(tI на всем промежутке времени ),,0[  используя многозначность функции арктангенса. Сначала положим )()( tJtI  , ),0[ 1tt , где момент времени 1t определяется равенством 11)( ttJ  . Далее, пусть    )()( tJtI , ),[ 21 ttt , где момент времени 2t находится из равенства 22 )( ttJ     . Продолжая аналогичным образом построение функции )(tI , получим    )1()()( ktJtI , ),[ 1 kk ttt  ,  ...,,1k , (27) где 00 t , а моменты времени ,kt  ...,,1k , удовлетворяют равенству kk tktJ     )1()( . (28) Из приведенных выше рассуждений следует существование последовательности моментов времени  ...,,1,, 1 kttt kkk , которые удовлетворяют уравнению (28), к тому же, как видно из формул (27), (28),  k kt . Построенная функция )(tI является положительной, полунепрерывной сверху, монотонно возрастающей, 0)0( I , ttI )( 0t . Поскольку она имеет разрывы только в точках последовательности ,kt  ...,,1k , составляющих счетное множество точек, то функция )(tI кусочно-непрерывна. Более того, функция )(tI непрерывно дифференцируема на полуинтервалах своей непрерывности. Обозначим  объединение полуинтервалов времени, на которых функция )(tI непрерывна и дифференцируема, т.е. ),[ 1 1 kk k tt      , где ,00 t а моменты времени ,kt  ...,,1k , определены формулами (27), (28). Отметим, что )()( tJtI   , t . Покажем, что при некотором дополнительном предположении   )(sup tI t  . Перепишем формулу (25) таким образом: Международный научно-технический журнал «Проблемы управления и информатики», 2016, № 3 45 , )( )( 2 t t e tf e tJ    где . 11 1)( 2 2 2                        tt ee htf Представив )(tf в виде tt ee hh tf                            2 2 2 2 2 2 22 21)( , заметим, что при условии  h2 (29) при  t0 имеет место оценка 2 22 )(     tf e t (30) и поэтому 2 2 )(sup     tI t  . Из вышеизложенного следует, что построенная функция удовлетворяет всем требованиям, предъявляемым к функции растяжения времени. Выведем условия на параметры систем (18), (19), которые обеспечивают выполнение условия 4. Из формулы (23) имеем соотношение         1 1 1 )(tg t t e h e tI , t . (31) Продифференцировав его, получим , 1 1 )( )(cos 1 22                t t e h e tI tI  t . Отсюда имеем              1 1))(()(cos 2 1 2 tt e htIetI  , t , что вместе с формулой (31) дает равенство       1 ))(()(sin 1 2 1 2 tt e tIetI  . (32) Из соотношений (22) и (32) следуют формулы, имеющие место при t :      te tktI 1 )()(sin 1 , (33) tetktItI h    )()(cos)(sin , (34) 46 ISSN 0572-2691 где 2 1 2 )()( Ietk t    . (35) Из построения функции )(tI следует, что знаком модуля в формуле для )(1 tW (20) можно пренебречь. Ввиду соотношений (33)–(35) здесь выполняется равенство UetkVe AttAI  )()( , t , поэтому неравенство 0))(( 2 3 2)(    tIee t thI  t (36) обеспечивает выполнение условия 4 . Так как   2 3 1 2 ))(( tIe t  t t e tf e    2 3 3 ))(( , t , то в силу оценки (30) .))((sup 3 3 2 3 2)(       tIee t thI t  Отсюда и из предположений (26), (29) следует, что условия                h h 2,max, 2 33 (37) гарантируют выполнение неравенства (36), а следовательно, и условия 4. Покажем, что существует конечный момент времени 11, tt , в который выполняется включение   dWze t AtI )(1 0 0 )( 1 1 . (38) Заметим, что в силу соотношений (33)–(35) и из предыдущих рассуждений следует, что множество  dW t )(1 0 содержит в себе выпуклое множество                                      udue ud e tS t t u Ru n 0 0 1 3 3 1 )(  . Согласно теореме Ляпунова о векторных мерах [15] возможна перестановка операций максимума и минимума с интегралом и, следовательно, опорная функция множества )(tS в направлении вектора ,,),,( 2121 nn RpRpppp  имеет вид                               duep e ppC u Ru t tS n , 1 max)( 21 1 0 3 3 Международный научно-технический журнал «Проблемы управления и информатики», 2016, № 3 47                  dep e p t 21 0 3 3 1 . Отсюда   t tS pC )()(                        0 0 1 2 3 3 1 p p p . Это означает, что при t множество )(tS превращается в n2 -мерный цилиндр S бесконечной высоты с n -мерным шаром с центром в начале коорди- нат радиуса             3 31 в качестве основания. С другой стороны, ввиду формы фундаментальной матрицы Ate для произвольных точек ,, 4 00 nRzz                0 0 20 1 0 )( x x ze t AtI . Поскольку вектор             0 0 20 1 x x будет обязательно поглощен множеством S в некоторый конечный момент времени, то существует момент времени ,1t при котором окажется справедливым включение (38). Опишем способ управления преследователя, приводящий к цели. На полуинтервале ),0[ 0 , где 110 )( ttI  , положим его тождественно равным нулю. Тогда ввиду справедливости включения (38) выполнено предположение (16) следствия теоремы 2, из которого следует, что если параметры игры удовлетворяют условиям (37), то при любых начальных геометрических положениях и скоростях объектов преследователь в момент времени )( 1tI может осуществить мягкую встречу с убегающим при произвольных допустимых управлениях убегающего. При этом на отрезке ),[ 100 t преследователь выбирает свое управление по управлению убегающего в прошлом согласно формуле (17). Заключение Показана эквивалентность эволюционной игры сближения с переменным запаздыванием информации некоторой игре с полной информацией, но с видо- измененной динамикой и иным терминальным множеством. Это послужило обоснованием принципа растяжения времени, сформулированного в работе, значительно расширяющего сферу применения первого прямого метода Понт- рягина. В качестве иллюстрации рассмотрен модельный пример дифферен- циальной игры о мягкой встрече двух разнотипных объектов. Г.Ц. Чикрій ПРИНЦИП РОЗТЯГУВАННЯ ЧАСУ В ЕВОЛЮЦІЙНИХ ІГРАХ ЗБЛИЖЕННЯ Встановлено, що еволюційна гра зближення зi змінним запізненням інформації еквівалентна деякій грі з повною інформацією, але з іншими динамікою та 48 ISSN 0572-2691 термінальною множиною. Цей факт послужив обгрунтуванням принципу розтягування часу, сформульованого в роботі, який значно розширює сферу застосування першого прямого методу Понтрягіна. Для ілюстрації запропо- нованої методики розглянуто модельний приклад диференціальної гри про м’яку зустріч двох об’єктів другого порядку з різною динамікою. G.Ts. Chikrii PRINCIPLE OF TIME DILATATION IN EVOLUTIONARY GAMES OF APPROACH It is established that the evolutionary game of approach with variable information delay is equivalent to certain game with perfect information under other dynamics and terminal set. This fact substantiates the time dilatation principle formulated in the paper, which essentially extends the range of applications of the Pontryagin first direct method. To illustrate suggested technique, the model differential game on soft meeting of two second order objects, having different dynamics, is analyzed. 1. Понтрягин Л.С. Избранные научные труды. Т. 2. — М.: Наука, 1988. –– 576 с. 2. Chikrii A.A. Conflict-сontrolled processes. — Springer Science and Business Media, 2013. — 424 p. 3. Никольский М.С. О применении первого прямого метода в линейных дифференциальных играх // Изв. АН СССР. Сер. техн. кибернетики. — 1972. — № 10. — С. 51–56. 4. Зонневенд Д. Об одном методе преследования // ДАН СССР. — 1972. — 204, № 6. — С. 1296–1299. 5. Chikrii G.Ts. One approach to solution of complex game problems for some quasilinear evolutionary systems // Journal of Mathematics, Game Theory and Algebra: Nova Science Publishers, Inc. — 2004. — 14, N 4. — P. 307–314. 6. Чикрий Г.Ц. Использование эффекта запаздывания информации в дифференциальных иг- рах преследования // Кибернетика и системный анализ. — 2007. — № 2. — С. 90–105. 7. Чикрий Г.Ц. Об одной задаче сближения для затухающих колебаний // Проблемы управле- ния и информатики. — 2009. — № 5. — С. 5–12. 8. Chikrii A.A., Eidelman S.D. Game problems for fractional quasilinear systems // Computers аnd Mathematics with Applications. — 2002. — 44. — P. 835–851. 9. Chikrii A.A., Eidelman S.D. Generalized Mittag-Leffler function in game problems for evolutionary equations of fractional order // Cybernetics and Systems Analysis. — 2000. — 36, N 3. — P. 315–338. 10. Chikriy G.Ts. An approach to the solution of linear differential games with variable information delay // Journal of Automation and Information Sciences. — 1995. — 27 (3&4). — P. 163–170. 11. Aumann R.J. Integrals of set-valued functions // J. Math. Anal. Appl. — 1965. — 12. — P. 1–12. 12. Филиппов А.Ф. Дифференциальные уравнения с разрывной правой частью. — М.: Наука, 1985. — 255 с. 13. Василенко Н.В. Теория колебаний. — Киев: Вища школа, 1992. — 430 с. 14. Albus J., Meystel A., Chikrii A.A., Belousov A.A., Kozlov A.I. Analytic method for solution of the game problem of soft landing for moving objects // Cybernetics and Systems Analysis. — 2001. — 37, N 1. — P. 75–91. 15. Иоффе А.Д., Тихомиров В.М. Теория экстремальных задач. — М.: Наука. — 1974. — 480 с. Получено 22.02.2016

Принцип растяжения времени в эволюционных играх сближения

Institution

Similar Items