Марковские игры с несколькими эргодическими классами

Розглянуто марковські ігри загального вигляду, які характеризуються тим, що при будь-яких стаціонарних стратегіях гравців множина станів гри розбивається на декілька ергодичних множин і незворотну множину, що можуть змінюватися в залежності від стратегії гравців. За критерій вибрано середній виграш...

Повний опис

Збережено в:
Бібліографічні деталі
Опубліковано в: :Український математичний журнал
Дата:2003
Автор: Ибрагимов, А.А.
Формат: Стаття
Мова:Russian
Опубліковано: Інститут математики НАН України 2003
Теми:
Онлайн доступ:https://nasplib.isofts.kiev.ua/handle/123456789/163903
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Марковские игры с несколькими эргодическими классами / А.А. Ибрагимов // Український математичний журнал. — 2003. — Т. 55, № 6. — С. 762–778. — Бібліогр.: 19 назв. — рос.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
Опис
Резюме:Розглянуто марковські ігри загального вигляду, які характеризуються тим, що при будь-яких стаціонарних стратегіях гравців множина станів гри розбивається на декілька ергодичних множин і незворотну множину, що можуть змінюватися в залежності від стратегії гравців. За критерій вибрано середній виграш першого гравця за одиницю часу. Доведено, що загальна марковська гра із скінченною множиною станів і розв'язків обох гравців має значення, а обидва гравці мають ε-оптимальні стаціонарні стратегії. Справедливість цього твердження продемонстровано на прикладі Блекуелла — „великий матч". We consider Markov games of the general form characterized by the property that, for all stationary strategies of players, the set of game states is partitioned into several ergodic sets and a transient set, which may vary depending on the strategies of players. As a criterion, we choose the mean payoff of the first player per unit time. It is proved that the general Markov game with a finite set of states and decisions of both players has a value, and both players have ε-optimal stationary strategies. The correctness of this statement is demonstrated on the well-known Blackwell's example (“Big Match”).
ISSN:1027-3190