Информационные процессы в повторяющейся игре с дополнительным платежом и возмущающим фактором

Цель данной статьи – выяснить, как влияет информация, получаемая игроками в ходе игры, на вид оптимальных режимов, а именно на количество моментов получения информации и расстояние между этими моментами....

Повний опис

Збережено в:
Бібліографічні деталі
Опубліковано в: :Культура народов Причерноморья
Дата:2011
Автори: Мохонько, Е.З., Носырев, А.В.
Формат: Стаття
Мова:Russian
Опубліковано: Кримський науковий центр НАН України і МОН України 2011
Теми:
Онлайн доступ:https://nasplib.isofts.kiev.ua/handle/123456789/52243
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Информационные процессы в повторяющейся игре с дополнительным платежом и возмущающим фактором / Е.З. Мохонько, А.В. Носырев // Культура народов Причерноморья. — 2011. — № 205. — С. 186-189. — Бібліогр.: 4 назв. — рос.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id nasplib_isofts_kiev_ua-123456789-52243
record_format dspace
spelling Мохонько, Е.З.
Носырев, А.В.
2013-12-29T02:15:35Z
2013-12-29T02:15:35Z
2011
Информационные процессы в повторяющейся игре с дополнительным платежом и возмущающим фактором / Е.З. Мохонько, А.В. Носырев // Культура народов Причерноморья. — 2011. — № 205. — С. 186-189. — Бібліогр.: 4 назв. — рос.
1562-0808
https://nasplib.isofts.kiev.ua/handle/123456789/52243
518.9
Цель данной статьи – выяснить, как влияет информация, получаемая игроками в ходе игры, на вид оптимальных режимов, а именно на количество моментов получения информации и расстояние между этими моментами.
ru
Кримський науковий центр НАН України і МОН України
Культура народов Причерноморья
Проблемы материальной культуры – ЭКОНОМИЧЕСКИЕ НАУКИ
Информационные процессы в повторяющейся игре с дополнительным платежом и возмущающим фактором
Інформаційні процеси в повторюваній грі з додатковим платежем і фактором, що обурює
Information processes in repeated game with additional payment and disturbance factor
Article
published earlier
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
title Информационные процессы в повторяющейся игре с дополнительным платежом и возмущающим фактором
spellingShingle Информационные процессы в повторяющейся игре с дополнительным платежом и возмущающим фактором
Мохонько, Е.З.
Носырев, А.В.
Проблемы материальной культуры – ЭКОНОМИЧЕСКИЕ НАУКИ
title_short Информационные процессы в повторяющейся игре с дополнительным платежом и возмущающим фактором
title_full Информационные процессы в повторяющейся игре с дополнительным платежом и возмущающим фактором
title_fullStr Информационные процессы в повторяющейся игре с дополнительным платежом и возмущающим фактором
title_full_unstemmed Информационные процессы в повторяющейся игре с дополнительным платежом и возмущающим фактором
title_sort информационные процессы в повторяющейся игре с дополнительным платежом и возмущающим фактором
author Мохонько, Е.З.
Носырев, А.В.
author_facet Мохонько, Е.З.
Носырев, А.В.
topic Проблемы материальной культуры – ЭКОНОМИЧЕСКИЕ НАУКИ
topic_facet Проблемы материальной культуры – ЭКОНОМИЧЕСКИЕ НАУКИ
publishDate 2011
language Russian
container_title Культура народов Причерноморья
publisher Кримський науковий центр НАН України і МОН України
format Article
title_alt Інформаційні процеси в повторюваній грі з додатковим платежем і фактором, що обурює
Information processes in repeated game with additional payment and disturbance factor
description Цель данной статьи – выяснить, как влияет информация, получаемая игроками в ходе игры, на вид оптимальных режимов, а именно на количество моментов получения информации и расстояние между этими моментами.
issn 1562-0808
url https://nasplib.isofts.kiev.ua/handle/123456789/52243
citation_txt Информационные процессы в повторяющейся игре с дополнительным платежом и возмущающим фактором / Е.З. Мохонько, А.В. Носырев // Культура народов Причерноморья. — 2011. — № 205. — С. 186-189. — Бібліогр.: 4 назв. — рос.
work_keys_str_mv AT mohonʹkoez informacionnyeprocessyvpovtorâûŝeisâigresdopolnitelʹnymplatežomivozmuŝaûŝimfaktorom
AT nosyrevav informacionnyeprocessyvpovtorâûŝeisâigresdopolnitelʹnymplatežomivozmuŝaûŝimfaktorom
AT mohonʹkoez ínformacíiníprocesivpovtorûvaníigrízdodatkovimplatežemífaktoromŝooburûê
AT nosyrevav ínformacíiníprocesivpovtorûvaníigrízdodatkovimplatežemífaktoromŝooburûê
AT mohonʹkoez informationprocessesinrepeatedgamewithadditionalpaymentanddisturbancefactor
AT nosyrevav informationprocessesinrepeatedgamewithadditionalpaymentanddisturbancefactor
first_indexed 2025-11-24T07:39:52Z
last_indexed 2025-11-24T07:39:52Z
_version_ 1850843706990526464
fulltext Мохонько Е.З., Носырев А.В. ИНФОРМАЦИОННЫЕ ПРОЦЕССЫ В ПОВТОРЯЮЩЕЙСЯ ИГРЕ С ДОПОЛНИТЕЛЬНЫМ ПЛАТЕЖОМ И ВОЗМУЩАЮЩИМ ФАКТОРОМ 186 Мохонько Е.З., Носырев А.В. УДК 518.9 ИНФОРМАЦИОННЫЕ ПРОЦЕССЫ В ПОВТОРЯЮЩЕЙСЯ ИГРЕ С ДОПОЛНИТЕЛЬНЫМ ПЛАТЕЖОМ И ВОЗМУЩАЮЩИМ ФАКТОРОМ 1. Введение В данной работе изучаются оптимальные режимы получения информации в неантагонистических повторяющихся играх с непрерывным временем и дополнительным платежом при условии, что информация о величине дополнительного платежа может измениться в ходе игры. В этих играх дополнительный платеж выплачивается в конце игры. В динамических играх часто используются стратегии, требующие непрерывного получения информации. В работах [1-3] продемонстрирована возможность замены таких стратегии стратегиями, требующими получение информации в отдельные моменты времени. При этом выигрыши игроков не изменяются и найденные режимы получения информации в каком-то смысле оптимальны. Оптимальное получение информации важно как в случае, когда информации много и она легкодоступна, так и тогда, когда она дорогостоящая, и ее мало. Вопросы оптимального получения информации интересуют не только узких специалистов, но и широкую общественность, например, пользователей интернета. Рассмотренная в данной работе игра является развитием игр, исследованных Кононенко А. Ф. в [1, с. 173-182]. Он рассмотрел непрерывную повторяющуюся неантагонистическую игру с фиксированным временем окончания. Игроки находятся на одном уровне иерархии. В этой игре были определены условия, при которых существует ситуация равновесия при непрерывном получении информации и использовании стратегий с памятью. Он также рассмотрел такого типа игру, в которой игроки могут получать информацию не только непрерывным, но и дискретным способом. Были найдены оптимальные дискретные режимы получения информации о действиях партнера. При этом сохраняется ситуация равновесия, существующая при непрерывном наблюдении. Найденные режимы получения информации оптимальны в том смысле, что для любых двух следующих друг за другом моментов получения информации расстояние между ними наибольшее. Если при фиксированном предыдущем моменте получения информации попытаться увеличить расстояние до последующего момента получения информации, то ситуация равновесия нарушится. В [3] рассмотрен усложненный вариант этой игры. В нем второй игрок в конце игры получает дополнительный платеж от первого игрока, если за всю игру ни разу не отклонился от договорной траектории. В данной работе рассматриваются такого типа игры при условии, что один раз за всю игру может подействовать возмущение, не зависящее от игроков. Оно изменяет величину дополнительного платежа и моделирует события во внешнем мире, на фоне которых происходит игровой конфликт. Например, экономический кризис, в результате которого уменьшается прибыль. Дополнительные платежи, как первоначально намечавшийся, так и измененный, совместно с договорной траекторией обеспечивают второму игроку выигрыш больше минимаксного. Его выигрыш не зависит от момента воздействия возмущения. Но зависит ли вид оптимального режима получения информации от момента воздействия возмущения и от информированности игроков об этом моменте? Цель данной статьи – выяснить, как влияет информация, получаемая игроками в ходе игры, на вид оптимальных режимов, а именно на количество моментов получения информации и расстояние между этими моментами. 2. Игровые модели воздействия возмущения Рассмотрим основную для данной работы игру, которую назовем игрой 1. Это игра двух лиц с непрерывным временем, протекающую на отрезке [0,1]. Множество выборов игроков ,2,1, iX t i описывается функциями вида   1 1 2 1 , 0, ( ), [0,1], , ,1 i i i i t t t t t x x x x              ,   1 1 2 1 2 3 2 , 0, ( ) , , , ,1 i i i i t t t t x x x x                  , Xx i j i  , .3,2,1j X i – замкнутые, ограниченные множества, 10 21   . Функции выигрыша игроков определяются равенствами       1 1 1 0 1 2 2 2 0 , ( (.,1)), x t dt x t dt U F M xF M          XXxx Xtx 2121 ,  .     ., ,0 , 1,2. i i t t ix x      Функции 2,1, iM i непрерывны. Проблемы материальной культуры – ЭКОНОМИЧЕСКИЕ НАУКИ 187 Дополнительный платеж U выплачивается или не выплачивается первым игроком второму в конце игры в зависимости от поведения второго игрока.     2 2 ( (., )) 0, 0,1 , ( (.,1)) ,0 , 0. U t t U U U x x     Рассмотрим класс стратегий вида    2 1 ., , 1 t txx  ,    1 2 ., , 2 t txx  ,  0,1t ,  1 2 , Xx x   . По определению при 0t положим xii  . Содержательно эти стратегии означают, что в любой момент времени t игрок знает о поведении партнера на интервале  0, t . Обозначим   1 1 ,U  ,            1 1 1 1 2 11 2 1 2 0 , ., , , ., ,t t t t dtx xF F M                       2 21 2 1 2 1 2 2 1 11 2 2 0 , , , ., , , ., , ., , U t t t t dt U t t F F x x xM            . Стратегии   0 0 0 00 1 2 1 2 ( , ) , ,U    образуют ситуацию равновесия, если            0 0 1 1 1 2 1 0 0 0 0 0 2 2 21 2 1 2 1 2 2 , , , , , , F F UF F F                 . Обозначим          1 2 0 0 1 2 20 0 2 2 21 21 1 2 , ., ., , , ., ,maxmin n t t t t Arg x x x x x x x xx x xM          ,          2 1 0 0 2 1 10 0 1 1 12 12 1 2 , ., ., , , ., ,maxmin n t t t t Arg x x x x x x x xx x xM          , 2 11 2 1 1 22 ,max maxmin min x xx x LL M M  ,     1 1 2 21 2 1 2 , , , U x X Ux x x xD M L M L     . Если множество UD  , 0 0 1 2 ( , ) Ux x D , то стратегии вида    0 0 21 ( ., , , )t tx U ,    0 12 ., ,t tx образуют ситуацию равновесия. Здесь     0 0 2 2 0 2 2 , .,1 0, : U t t x x U x x       . Действительно, пусть 1t – время начала отклонения игрока 2 от выбора 0 2x , то есть 0 2 2x x при  1 0,t t . Тогда выигрыш второго игрока оценивается следующим неравенством       1 1 1 0 0 0 0 2 2 21 2 0 , 0 t dt dt t U x xF M M                  0 0 0 0 2 2 2 2 21 1 1 1 1 1 U Ux t t x t x t xM L M M M         . Нарушение в момент 1t соглашения о выборе 0 2x приводит второго игрока к потере в выигрыше. Аналогичные выводы можно сделать и в отношении первого игрока. То есть, действительно, стратегии    0 0 21 ( ., , , )t tx U    0 12 ., ,t tx образуют ситуацию равновесия. При использовании этих стратегий игрок 1 получает информацию непрерывно. Оказывается такое непрерывное получение информации не нужно. Можно получать информацию в отдельные моменты времени kt . Мохонько Е.З., Носырев А.В. ИНФОРМАЦИОННЫЕ ПРОЦЕССЫ В ПОВТОРЯЮЩЕЙСЯ ИГРЕ С ДОПОЛНИТЕЛЬНЫМ ПЛАТЕЖОМ И ВОЗМУЩАЮЩИМ ФАКТОРОМ 188 Игра 2 – это модифицированная игра 1. В ней второй игрок получает информацию о выборах первого игрока непрерывно. Первый игрок получает информацию о выборах второго игрока дискретно. Обозначим          1 2 0 0 1 2 20 0 2 2 21 21 1 2 , ., ., , , ., ,maxmin k n k k k d t t t t Arg x x x x x x x xx x xM          . Покажем, как находить моменты времени 0 , 1,2,..., ( , ), 1 k K k K Ut x t  так, чтобы стратегии    0 0 21 ( ., , , )k k d t tx U ,    0 12 ., ,t tx образовывали ситуацию равновесия и порождали тот же самый выбор 0 x на протяжении всей игры, что и стратегии    0 0 21 ( ., , , )t tx U ,    0 12 ., ,t tx . Пусть в момент времени t первый игрок получил информацию о выборах второго игрока такую:   0 2 2 .,tx x . Для того, чтобы второму игроку было не выгодно отклоняться на интервале , c t t необходимо, чтобы выполнялось    0 * 0 2 2 2 2 1 c c t t Ut tM M L M      . И это максимально большой интервал с таким свойством. Здесь использовались обозначения  xMM 0 2 0 2  ,    xxMxMM x 2 0 12 0* 2 ,* 2 max 2  . Будем предполагать, что * 2 2M L . Получаем   * 0 0 2 2 2 2 * * * 2 2 2 2 2 2 с U t tM M M L t M L M L M L         . Обозначим   * 0 2 2 * *2 2 2 2 2 , U K UM Mq M L M L      . Получим   2 2 1 c t t Kq qt     . Если 0 0t  , то для  0* , 1,2,... , 1 k k Ut xK  по индукции получим следующую формулу        2 2 2 2 1 1 1 , 1 , 1 k k k K U K U k q q q q q t           . Моментов получения информации конечное число. Считаем, что  0* , 1 UxKt  . Найденный режим получения информации оптимален в том смысле, что расстояние между последующими моментами получения информации максимально большое. Если его увеличить, то ситуация равновесия, существующая при непрерывном наблюдении за действиями партнера, может не сохраниться при так измененном дискретном режиме получения информации. Рассмотрим похожую, но более сложную игру. Игра 3. Это такая модификация второй игры. Один раз за всю игру на дополнительный платеж может подействовать помеха, которая изменяет дополнительный платеж U на 1U . Так что в конце игры второй игрок получит не U , а 1U , если он не отклонялся от договорного выбора. Помеха может и не подействовать. Оба игрока знают о возможности того, что помеха подействует и о величинах U и 1U . Действие помехи будем описывать величиной  1,0 . Если   0 при  t,0 , то помеха в этот период не подействовала. Если   0 при   ,0 ,   1 при  t,  , то это значит, что в момент времени  помеха подействовала. Как и раньше, обозначим   1 1 ,U  ,            1 1 1 1 2 11 2 1 2 0 , ., , , ., ,t t t t dtx xF F M                         2 21 2 1 2 1 2 2 1 11 2 2 0 , , , ., , , ., , .,1 ,1 , .,1 ,1 U t t t t dt U F F x x xM             . Стратегии   0 0 0 00 1 2 1 2 ( , ) , ,U      образуют ситуацию равновесия, если Проблемы материальной культуры – ЭКОНОМИЧЕСКИЕ НАУКИ 189            0 0 1 1 1 2 1 0 0 0 0 0 2 2 21 2 1 2 1 2 2 , , , , , , , F F UF F F                    . Здесь                 0 2 2 00 11 2 22 0 2 2 , .,1 , .,1 0 .,1 ,1 , .,1 ,1 , .,1 , .,1 0 0, : U U U t t x x x x x x x               . Рассмотрим стратегии    1 21 ., ,t tx x  ,      12 .,1 ,1 , .,1 ,1U x  ,    1 2 ., , 2 t txx  , где     tt   0,., . Содержательно эти стратегии означают, что в любой момент времени t игроки знают о поведении партнера на  t,0 . В конце игры первый игрок знает, подействовала ли помеха или нет на  0,1 , а также момент воздействия помехи. Второй игрок также узнает в конце игры о помехе, получая тот или иной платеж в случае, если он всю игру не отклонялся от договорной траектории. Предположим, что 1 0 Ux D , где      1 1 1 2 21 2 1 2 1 , , ,x X U x x x x UD M L M L     . Тогда стратегии        0 00 2 11 2 ., , , , ., ,t t t tx U x    образуют ситуацию равновесия. Доказательство этого утверждения аналогично доказательству такого же типа утверждения, приведенного выше. Игра 4. Рассмотрим аналогичную игру, в которой первый игрок может получать информацию о ходе игры как непрерывным, так и дискретным способом. И пусть второй игрок не получает информацию о том, подействовало ли возмущение или нет до конца игры. Тогда первый игрок также может не получать информацию об  до конца игры. И только в конце игры игроки получают информацию о том, подействовала ли помеха или нет, а второй игрок в случае не отклонения от договорной траектории получает соответствующий дополнительный платеж. В этой игре стратегии   0 00 1 2 , , d U    образуют ситуацию равновесия. Эта игра показывает, что понятие равновесных стратегий и оптимальности режимов получения информации связано именно с субъективным представлением игроков об игре, а не с тем, что реально происходит в ходе игры. Субъективное представление складывается у них на основании получаемой в ходе игры информации. Если бы оба игрока получили информацию о том, что возмущение подействовало, то оптимальный режим был бы другим. Например, при уменьшении дополнительного платежа после воздействия помехи надо было бы получать информацию о действиях второго игрока чаще, чем в стратегии 0 1d  . В книге американских дипломатов [4,с.38,39] также говорится о субъективной природе конфликта. Позволим себе привести цитату из этой книги. “В конечном счете, однако, причиной конфликта является не объективная реальность, а происходящее в головах людей. Истина – это просто еще один дополнительный аргумент, возможно, хороший, а, возможно, и нет, который помогает справиться с расхождениями. А сами расхождения существуют постольку, поскольку они образуются в мышлении людей. С этой точки зрения опасения, даже необоснованные, являются реальными, и с ними необходимо разбираться….Каким бы полезным ни было обращение к объективным фактам, в конечном счете именно реальность в том виде, в котором видит ее каждая из сторон, составляет проблему переговоров и открывает путь к ее разрешению.” 3. Заключение Проведенный анализ игр показал, что вид оптимального режима получения информации о действиях игрока 2 зависит от того, получают ли оба игрока информацию о моменте воздействия возмущения или не получают. Используемыми в работе методами можно исследовать и более сложные игры, например, игры, в которых первый игрок получает дискретно не только информацию о действиях второго игрока, но и о моменте воздействия возмущения. Источники и литература: 1. Современное состояние теории исследования операций / под ред. Н. Н. Моисеева. – М. : Наука; Гл. ред. физ.-мат. литературы, 1976. – 464 с. 2. Черноусько Ф. Л. Игровые задачи управления и поиска / Ф. Л. Черноусько, А. А. Меликян. – М. : Наука, 1978. – 270 с. 3. Мохонько Е. З. Динамика информационных процессов в неантагонистических играх : дис. … докт. физ.-мат. наук : 05.13.17 / Е. З. Мохонько. – М., 1998. – 350 с. 4. Фишер Р. Путь к согласию или переговоры без поражения / Р. Фишер, У. Юрии ; пер. с англ. А. Гореловой.– М. : Наука, 1992. – 158 с.