О справедливом разделе выигрыша в одной игровой задаче оптимального выбора
Для задачи оптимального выбора рассмотрена игровая ситуация, в которой участвуют три игрока, осуществляющие свой выбор на одном множестве объектов один вслед за другим. С применением теории Шепли для кооперативных игр найдена стратегия взаимодействия игроков и механизм распределения выигрыша в случа...
Saved in:
| Published in: | Кибернетика и вычислительная техника |
|---|---|
| Date: | 2012 |
| Main Author: | |
| Format: | Article |
| Language: | Russian |
| Published: |
Міжнародний науково-навчальний центр інформаційних технологій і систем НАН України та МОН України
2012
|
| Subjects: | |
| Online Access: | https://nasplib.isofts.kiev.ua/handle/123456789/45751 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| Journal Title: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Cite this: | О справедливом разделе выигрыша в одной игровой задаче оптимального выбора / С.И. Доценко // Кибернетика и вычисл. техника. — 2012. — Вип. 167. — С. 87-96. — Бібліогр.: 6 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| _version_ | 1859605290577559552 |
|---|---|
| author | Доценко, С.И. |
| author_facet | Доценко, С.И. |
| citation_txt | О справедливом разделе выигрыша в одной игровой задаче оптимального выбора / С.И. Доценко // Кибернетика и вычисл. техника. — 2012. — Вип. 167. — С. 87-96. — Бібліогр.: 6 назв. — рос. |
| collection | DSpace DC |
| container_title | Кибернетика и вычислительная техника |
| description | Для задачи оптимального выбора рассмотрена игровая ситуация, в которой участвуют три игрока, осуществляющие свой выбор на одном множестве объектов один вслед за другим. С применением теории Шепли для кооперативных игр найдена стратегия взаимодействия игроков и механизм распределения выигрыша в случае нахождения наилучшего объекта.
|
| first_indexed | 2025-11-28T03:01:53Z |
| format | Article |
| fulltext |
87
Сложные системы управления
УДК 681.5
С.И.Доценко
О СПРАВЕДЛИВОМ РАЗДЕЛЕ ВЫИГРЫША В
ОДНОЙ ИГРОВОЙ ЗАДАЧЕ ОПТИМАЛЬНОГО
ВЫБОРА
Для задачи оптимального выбора рассмотрена игровая ситуация, в
которой участвуют три игрока, осуществляющие свой выбор на одном множестве
объектов один вслед за другим. С применением теории Шепли для кооперативных игр
найдена стратегия взаимодействия игроков и механизм распределения выигрыша в случае
нахождения наилучшего объекта.
Введение
Задача выбора наилучшего объекта на сегодняшний день является одной
из классических задач исследования операций, а именно стохаcтической
оптимизации. Изначально она была придумана Мартином Гарднером в
середине 20-го века как головоломка. В последствии оказалось, что данная
задача и ее множественные модификации могут служить иллюстративными
примерами в теории оптимальной остановки марковских процессов и теории
игр.
В [1] была рассмотрена задача выбора наилучшего объекта,
сформулированная следующим образом. Пусть некто в случайном порядке
знакомится с n объектами и хочет выбрать среди них наилучший. При этом
после ознакомления с очередным объектом нужно либо остановить на нем
свой выбор, либо отвергнуть его; возвращаться к ранее просмотренным
объектам нельзя. Объекты являются упорядоченными определенным образом
по качеству, т.е. качества любых двух объектов сравнимы между собой.
«Ознакомление в случайном порядке» означает, что изначально все n!
перестановок, задающих порядок просмотра объектов, равновероятны.
Объект, наилучший среди всех n, в дальнейшем будем называть
наилучшим, а объект, лучший среди k просмотренных, — максимальным.
Очевидно, что в ходе просмотра следует анализировать целесообразность
остановки выбора на некотором объекте, только если он является
максимальным. При этом оказывается, что лучший среди уже просмотренных
объектов является максимальным и индексы максимальных объектов
образуют цепь Маркова с переходными вероятностями
kj
jj
kjkp >
−
= ,
)1(
),( . Был ли k-й элемент максимальным или нет,
вероятность того, что среди элементов с индексами nk ,...,1+ минимальный
индекс максимального элемента будет j, равна kj
jj
k
>
−
,
)1(
и с
С.И.Доценко, 2012
ISSN 0452-9910. Кибернетика и вычисл. техника. 2012. Вып. 167
88
вероятностью
n
k в последовательности nk ,...,1+ не встретится ни одного
максимального элемента.
Доказано, что для того, чтобы выбрать наилучший объект из n, нужно
придерживаться такой стратегии: вначале пропустить все элементы с
индексами 1,...,1 * −k и затем остановить свой выбор на первом
максимальном элементе, индекс которого не меньше *k , где *k определяется
из двойного неравенства
1
1...
1
11
1
1...1
** −
++
−
≤≤
−
++
nknk
. Оказывается, что при ∞→n
en
k 1
→ , а вероятность выбора наилучшего объекта при соблюдении
описанной стратегии стремится к 1 / e. Множество индексов, на которых
возможна остановка, будем обозначать { }nkA ,...,** = .
Постановка и план решения задачи. Предположим теперь, что выбор
осуществляется тремя лицами, которых далее будем называть игроками.
Пусть каждый объект просматривается игроками при следующих условиях.
Как и в [1], каждый из игроков имеет возможность выбора —
останавливаться на текущем объекте или продолжать просмотр. И точно
также отсутствует возможность возврата к ранее просмотренным объектам.
Игрок, сделавший свой выбор, выбывает из игры. В конце игры, если
выбранный им объект оказался наилучшим среди всех, он получает
единичный выигрыш, в противном случае не получает ничего. Пусть три
игрока (назовем их А, В, С) имеют неравные права, а именно: В получает
право просмотра и выбора объектов, после того как из игры выбыл А, С
получает такое право только после выхода из игры А и В.
Целью данной статьи является нахождение оптимальных стратегий
игроков и соответствующих величин выигрыша в описанной выше игре в
случае корпоративного (т.е. когда игроки действуют сообща и стремятся
максимизировать суммарный выигрыш) и некорпоративного (т.е. каждый из
игроков эгоистично стремится максимизировать собственный выигрыш и
индифферентен к выигрышам других) поведения. На основании сравнения
данных величин выигрыша вычислена цена анархии. Для случая
корпоративного поведения с использованием подсчета справедливого
распределения выигрыша по Шепли найдена доля выигрыша каждого игрока.
Эгоистичное поведение. Пусть единичный выигрыш выплачивается
игроку, выбравшему наилучший элемент. Тогда каждый из игроков
стремится максимизировать свой выигрыш и безразличен к выигрышам
других. Согласно описанным выше правилам игры, игрок А может не
замечать В и С (они ему не мешают) и, таким образом, для него задача
свелась к классической, т.е А следует останавливаться на максимальных
элементах из },...,{ ** nkA = и его выигрыш стремится к 1 / e.
89
Проанализируем поведение В. После того как до него дойдет ход, ему
следует останавливаться на максимальных элементах из *A , однако если А
играл оптимальным для себя образом, то В получит возможность выбирать из
*A , начиная не с *k , а с некоторого другого элемента, большего, чем *k
(а если в последовательности },...,{ ** nkA = встретится не более одного
максимального элемента, то В и вовсе будет лишен возможности выбора).
Таким образом, вероятность выбора наилучшего элемента для В, согласно
формуле полной вероятности, составляет
~
1
1
1
11
)1()1(
1)(
* 1 * 1
**
∑ ∑ ∑ ∑
= += = += −−
−
=×
−−
−
=
n
kj
n
ji
n
kj
n
ji ijn
k
n
i
ii
j
jj
kBV
∫ ∫ =
1
/1
1
2
1111~
e t e
dtdu
ute .
Аналогично, у С ситуация еще хуже, поскольку он получает право
выбора только после того, как свой выбор сделают А и В (а может быть, и не
получит вовсе, если в последовательности },...,{ ** nkA = встретится не более
двух максимальных элементов), таким образом, вероятность выбора
наилучшего элемента для С составляет
∑ ∑ ∑
= += +=
=×
−−−
−
=
n
kj
n
ji
n
it n
t
tt
i
ii
j
jj
kCV
* 1 1
*
)1()1()1(
1)(
∑ ∑ ∑
= += += −−−
−
=
n
kj
n
ji
n
it tijn
k
& 1 1
*
~
1
1
1
1
1
11
∫ ∫ ∫
= =
=
1
/1
1 1
6
11111~
e uv vt e
dudvdt
tvue
.
Корпоративное поведение. Пусть теперь три игрока, в случае
нахождения наилучшего элемента одним из них, получают совместный
выигрыш. Тогда данная ситуация эквивалентна ситуации с одним лицом,
которое имеет возможность делать три остановки. Найдем номера элементов,
на которых следует делать эти остановки при условии, что эти элементы
окажутся максимальными. Множества номеров элементов будем обозначать
через 321
~,~,~ AAA . Найдем эти множества методом обратной индукции,
начиная с последнего.
Пусть после второй остановки появляется еще один максимальный
элемент. Тогда «полезность» второй остановки утрачивает силу и ситуация
становится эквивалентной классической задаче, поэтому *
3
~ AA = .
Найдем 2
~A . Обозначим ...)|(kπ условную вероятность выбора
наилучшего объекта при условии, что уже была сделана первая остановка, но
еще не было сделано второй остановки до k, просматривается k-й объект,
90
который является максимальным, и, возможно, других дополнительных
условиях, указанных после черты.
Очевидно, что 22
~)1(,~ AnAn ∈−∈ , поскольку
0)~|(1)~|( 22 =∉π>=∈π AnnAnn ,
nAnAnnAAAnn /1)~,~)1(|)1((1)~,~)1(|)1(( 22
*
32 =∈∉−−π>==∈−−π .
Предположим, что 2
~},...,1{ Ank ⊂+ , тогда
∑ ∑
=
−
−=
−
+=×
−
−
+==⊂π
n
*kj
n
*kj
**
*
jn
k
n
k
n
j
jj
k
n
kAA~,A~n,...,kk
1
1
32
11
)1(
1)}{|( ,
( ) ∑ ∑
−
+= =
+
×
−
−
+
−
==⊂+∉π
1*
1 *
*
*
322 )1(
1
)1(
~,~},...,1{,~|
k
kj
n
km n
m
mm
k
n
j
jj
kAAAnkAkk
×
−
+
−
−
−
+ ∑ ∑
−
= +=
1
* 1
*
* )1()1(
1
1
n
kj
n
jm n
m
mm
j
n
j
jj
k
k
k .
Условие
( ) ( )** AA~,A~n,...,k,A~k|kAA~,A~n,...,k|k =⊂+∉π≥=⊂π 32232 }1{}{
после эквивалентных преобразований сводится к неравенству
∑∑∑
−
+=
−
−=
−
=
+
−
−≥
1
1
2
1*
2* 11
1
111
n
jm
n
kj
k
kj mjnj
.
В левой части неравенства — константа, в правой — монотонно
убывающее по k выражение, значит неравенство выполняется начиная с
некоторого k. Найдем асимптотическое поведение k / n при n → ∞ ,
приравняв левую и правую части:
∑ ∫
=
−=
⇒−
−−=⇒
+
=
n
kj
e
n
kdt
t
t
n
k
j
n
jnk
nk
* 1
*
2
3ln)ln(ln11ln1
/
/ln1 .
Отсюда множество моментов второй остановки имеет вид
},...,{~ **
2 nkA = , где )/(n~k ** 23exp −× .
Построение множества моментов первой остановки происходит
несколько сложнее. Пусть k-й элемент является максимальным и еще не было
сделано первой остановки. Если **kk < , то, в случае если первую остановку
сделать на k-м элементе, а вторую и третью остановки делать согласно
оптимальным стратегиям, найденным выше, вероятность нахождения
наилучшего элемента близка к )1exp()2/3exp( −+−+
n
k . Продолжение
просмотра может спровоцировать «принцип домино». В данном случае это
означает, что момент первой остановки может затянуться и сдвинет вправо
91
момент второй остановки, что в свою очередь (возможно) сдвигает вправо
момент третьей остановки.
Далее разберемся во взаимных сдвигах моментов остановок при больших
n.
Пусть игрок не имеет помех и придерживается стратегии «остановиться
на первом максимальном элементе, начиная с k». Тогда для него вероятность
выбрать наилучший элемент составляет ∑ ∑
+= = −
=×
−
n
ki
n
ki in
k
n
i
ii
k
1 1
1
)1(
.
Обозначим tnk =/ , тогда предельным значением этого выражения будет
)ln()( tttg −= .
Пусть )(0 tCϕ - предельное значение величины выигрыша для С, если его
предшественник остановился на некотором элементе tnk = , и, таким
образом, для С стал доступным просмотр элементов, начиная с элемента
1+k . Тогда оптимальной стратегией С является остановка на ближайшем
максимальном элементе, если
e
nk ≥+1 , и на первом максимальном элементе,
начиная с
e
n , если
e
nk <+1 , и, таким образом,
≥⋅−
≤
=ϕ
e
ttt
e
t
etC 1),ln(
1,1
)(0 .
Обозначим )(1 tCϕ предельное значение выигрыша С, при условии, что
его предшественник (т.е. В) имеет намерение и возможность выбирать
максимальный элемент начиная с k , и только после этого у С появится
возможность выбора.
Пусть et /1< , тогда
( ) ( )∫
=
−=×−+×
−=ϕ
1
/1
2
0
2
11)ln(1
/1
1)(
eu
C t
e
duuu
u
t
ee
tt .
Пусть et /1≥ (т.е. *kk ≥ ). Тогда
∑ ∑∑ ∑
+= +=+= += −−
=×
−−
=
n
ki
n
ij
n
ki
n
ij
C jin
k
n
j
jj
i
ii
kkf
1 11 1
1
1
1
1
1
)1()1(
)( , отсюда
)(ln
2
1)ln()( 2
1
1 ttdu
u
utt
t
C =−=ϕ ∫ .
Таким образом,
≥×
≤−
=ϕ
e
t,tt
e
t,t
etC 1)(ln
2
1
1
2
11
)(
2
1 .
Аналогичным образом определим функции )(0 tBϕ и )(1 tBϕ .
92
−≥×−
−<−⋅
=ϕ
)2/3exp(),ln(
)2/3exp(),2/3exp(2/3
)(0
ttt
t
tB , тогда
∫ ϕ=ϕ
1
0
2
1 )()(
t
BB duu
u
tt .
Таким образом,
−≥
−<−
=ϕ
−
)2/3exp(,))(ln(
2
1
)2/3exp(,
8
3
2
3
)(
2
2/3
1
ttt
tte
tB .
Рассмотрим поведение игрока А. Он может создавать помехи для
просмотра для В и С, в то время как никто из игроков ему таких помех не
создает. Если А останавливается на максимальном элементе
nk ×−≤ )2/3exp( , то его ожидаемый выигрыш равен t. При этом выигрыши В
и С равны )2/3exp(
2
3)(0 −=ϕ tB и )2/3exp(
2
1)1exp())2/3(exp(1 −−−=−ϕC .
Пусть А придерживается стратегии «остановиться на ближайшем
максимальном элементе, начиная с k-го», тогда его выигрыш равен
)ln()( tttg −= .
При этом выигрыш В равен ttB 8
3)2/3exp(
2
3)(1 −−=ϕ ,
выигрыш С равен
( ) =ϕ+−ϕ⋅ ∫∫
−
−
duu
u
tdu
u
t
CC
t
)()2/3exp( 1
1
)2/3exp(
2
1
)2/3exp(
2
( ) ∫
−
+
−−−=
)2/3exp(
22/3exp
2
1)1exp(
t u
dut
∫∫
−
−
−
=
+
−+
1
)1exp(
2
2
)1exp(
)2/3exp(
)(ln
2
11
2
111 duuu
u
tduu
eu
t
t
12
7)2/3exp(
2
1)1exp( −−−−= ,
и, таким образом, суммарный выигрыш трех игроков составляет
ttttU
24
23)1exp()2/3exp()ln()(1 −−+−+−= .
Напомним, что предельное значение суммарного выигрыша, в случае
если А останавливается на максимальном элементе k tn,= равно
)1exp()2/3exp()(0 −+−+= ttU .
93
Из условия )()( 10 tUtU ≥ следует, что )24/47exp(−≥t , и, таким
образом, множество моментов первой остановки имеет вид },...,{~ *3
1 nkA = ,
где )2447exp(3 /n~k * −× , и, таким образом, суммарный выигрыш, в случае
если игроки образуют большую коалицию и, находясь в этой коалиции,
каждый из игроков выполняет свою роль оптимальным образом, равен
+−+−=−=− )2/3exp()1exp())24/47(exp())24/47(exp( 10 UU
732,0)24/47exp( ≈−+ .
Напомним, что в случае эгоистичного поведения игроков суммарный
выигрыш равен 613,0
6
1
2
11)1exp( ≈
++− .
При этом выигрыши отдельных игроков равны
e
CV
e
BV
e
AV
6
1)(,
2
1)(,1)( === .
Найдем выигрыши коалиций V(B, C); V(A, B); V(A, C). Здесь поведение
игроков подчинено общим закономерностям. Игрок, не входящий в
коалицию, ведет себя эгоистично. Это означает, что он будет останавливаться
на ближайшем максимальном элементе, начиная с *k и как только получит
право просмотра. Поскольку поведение С не влияет на выигрыши А и В, то
его оптимальное поведение всегда одинаково и подходит под определение
эгоистичного.
V(B, C). Поскольку А не входит в коалицию, то ведет себя эгоистично. В
этом случае для В и С оптимальными стратегиями будет остановиться на
первом встретившемся максимальном элементе, после того как до них дойдет
очередь для просмотра, т.е. поведение каждого из игроков не отличается от
поведения в ситуации эгоистичного поведения каждого из игроков, тогда
e
CVBVCBV
3
2)()(),( =+= .
V(A, B). Поскольку С не мешает выбору элементов игроками А и В, а
интересы С безразличны коалиции (A, B), то ситуация аналогична выбору
одним игроком с возможностью двух остановок. Тогда А должен выбирать
ближайший максимальный элемент, начиная с )/(n~k ** 23exp −× ,
а В — начиная с )1exp(~* −×nk . При этом их суммарный выигрыш равен
)2/3exp()1exp(),( −+−=BAV .
V(A, C). Как было отмечено выше, оптимальное поведение С всегда
одинаково. Найдем поведение А, максимизирующее V(А, С). Найдем такое t,
при котором А следует остановиться на первом макcимальном элементе,
начиная с tn. Пусть элемент k = tn является максимальным. Если А
остановится на этом элементе, то его выигрыш будет равен t. При этом В
будет вести себя эгоистично, т.е. будет выбирать первый максимальный
94
элемент, начиная с *k , и А не мешает В начать просмотр именно с *k , и,
таким образом, выигрыш С составит
e
eC 2
1)/1(1 =ϕ , и выигрыш (А, С) будет
равен
e
tU
2
1
0 += .
Пусть А придерживается стратегии остановиться на ближайшем
максимальном элементе после k. Тогда выигрыш А равен ).ln(tt ×− При этом
с вероятностью et−1 этот ближайший элемент будет меньше *k , что не
помешает начать В выбор, начиная с *k , и, таким образом, выигрыш С
составит
e
eC 2
1)/1(1 =ϕ . С дополнительной вероятностью сработает принцип
домино: A создаст дополнительные помехи для В, а В — для С. Тогда, исходя
из формулы полной вероятности, выигрыш С равен
( )
32
1)(ln
22
1)()/1(1
1
/1
21
/1
1
2
1 t
e
du
u
ut
e
etduu
u
teet
ee
CC −=+
−
=ϕ+ϕ− ∫∫
и суммарный выигрыш (А, С) будет равен
32
1)ln(1
t
e
ttU −+−= .
Условие 10 UU ≥ равносильно ).3/4exp(−≥t
Таким образом, оптимальной стратегией А, максимизирующей V(A, C)
будет останавливаться на первом максимальном элементе, начиная с
)4/3exp(−⋅n , и суммарный выигрыш составит 13/4
2
1),( −− += eeCAV .
Выпишем численные значения выигрышей всех возможных коалиций,
округленные до тысячных, построим вектор Шепли и покажем, что ядро
игры не пусто:
061,0)(;184,0)(;638,0)( ≈≈≈ CVBVAV
732,0),,(;448,0),(;591,0),( ≈≈≈ CBAVCAVBAV .
Таким образом, вектор распределения выигрышей имеет вид (0,417;
0,224; 0,091).
Процедура вычисления вектора Шепли представлена в следующей
таблице.
Таблица 1
Игроки Перестановки
A B C
(A, B, C) 0,368 0,223 0,141
(A, C, B) 0,368 0,284 0,080
(B, A, C) 0,407 0,184 0,141
(B, C, A) 0,487 0,184 0,061
(C, A, B) 0,387 0,284 0,061
(C, B, A) 0,487 0,184 0,061
∑ 2,504 1,343 0,545
∑ / 6 0,417 0,224 0,091
95
Достаточным условием того, что ядро игры не пусто, является
супермодулярность функции выигрыша V. Супермодулярность означает
такое требование, чтобы для любых двух коалиций S, T выполнялось условие
)()()()( TVSVTSVTSV +≥∩+∪ .
Оказывается, что условием, равносильным супермодулярности (однако
значительно более простым для проверки), является так называемый эффект
снежного кома (snowball effect). Этот эффект означает выполнение условий
( ) ( )( ))()()()(, TViTVSViSVTiTS −∪≤−∪∉∀⊂∀ .
Т.е. присоединение любого элемента к большей коалиции давало бы не
меньший прирост функции выигрыша (иначе говоря, к большему снежному
кому новые снежинки прилипают лучше, чем к меньшему).
Обозначим )()(),( TViTVTi −∪=Add прирост от присоединения
элемента i к коалиции T, тогда непосредственная проверка эффекта снежного
кома, с использованием приведенных выше табличных данных, показывает,
что
≤≤≤ )))(,(),(,(max()))(,()),(,(min()( CABACABAAV AddAddAddAdd
));C,B(,A(Add≤
;487,0)387,0;407,0max()387,0;407,0min(368,0 ≤≤≤
≤≤≤ ))(,()),(,(max()))(,()),(,(min()( CBABCBABBV AddAddAddAdd
));C,A(,B(Add≤
;284,0)184,0;223,0max()184,0;223,0min(184,0 ≤≤≤
≤≤≤ )))(,()),(,(max()))(,()),(,(min()( BCACBCACCV AddAddAddAdd
));B,A(,C(Add≤
.141,0)061,0;080,0max()061,0;080,0min(061,0 ≤≤≤
Выводы. Проведенные расчеты показывают, что поиск наилучшего
объекта в задаче оптимального выбора происходит более эффективно при
согласованных действиях игроков, чем при оптимальных эгоистических
действиях каждого (величина выигрыша составляет 0,732 против 0,613).
Цена анархии (т.е отношение суммарного выигрыша при корпоративном
поведении к выигрышу при эгоистичном поведении) равна 194,1
613,0
732,0
≈ .
Однако, несмотря на то что выигрыши игроков при эгоистическом
поведении являются гипотетическими величинами, они напрямую влияют на
доли выигрыша, которые должны выплачиваться игрокам в случае удачного
исхода поиска.
Механизм распределения выигрышей, при котором каждому из игроков
достается вычисленная доля, требует дополнительного уточнения. Вначале
три игрока должны действовать сообща, делая первый выбор для
n/k )2447exp(−≥ , второй — для nk )2/3exp(−≥ и третий — для enk /≥ . В
случае если совместные усилия привели к успеху (т.е. найден наилучший
96
элемент), выигрыш следует разделить в долях, пропорцинальных найденным
компонентам вектора Шепли, т.е.
).124,0306,0570,0(
732,0
091,0
732,0
224,0
732,0
417,0
=
Если же совместный выигрыш является неделимым (например, жена,
ведь изначальной фабулой задачи оптимального выбора был поиск
наилучшей жены), то найденный объект следует разыграть между игроками с
найденными вероятностями.
1. Дынкин Е.Б., Юшкевич А. Теоремы и задачи о процессах Маркова. — Москва: Наука,
1967. — С. 91–102.
2. Гусейн-Заде С.М. Задача выбора и оптимальное правило остановки
последовательности независимых испытаний // Теория вероятности и ее приложение
1966. — 11:3. — С. 534–537.
3. Мазалов В.В. Математическая теория игр и приложения. — СПб.: Лань, 2010. — 446 с.
4. Мазалов В.В. Игровые моменты остановки. — Новосибирск: Наука, 1987. — 191 с.
5. Доценко С. Задача выбора наилучшего объекта как игра двух лиц. Кибернетика и
вычислительная техника. — 2011. — Вып. 164. — С. 43–53.
6. Branzei, Dimitrov Models in cooperative game theory. — Springer, 2005. — 132 р.
Киевский национальный
университет имени Тараса Шевченко Получено 12.02.2012
|
| id | nasplib_isofts_kiev_ua-123456789-45751 |
| institution | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| issn | 0452-9910 |
| language | Russian |
| last_indexed | 2025-11-28T03:01:53Z |
| publishDate | 2012 |
| publisher | Міжнародний науково-навчальний центр інформаційних технологій і систем НАН України та МОН України |
| record_format | dspace |
| spelling | Доценко, С.И. 2013-06-18T09:49:26Z 2013-06-18T09:49:26Z 2012 О справедливом разделе выигрыша в одной игровой задаче оптимального выбора / С.И. Доценко // Кибернетика и вычисл. техника. — 2012. — Вип. 167. — С. 87-96. — Бібліогр.: 6 назв. — рос. 0452-9910 https://nasplib.isofts.kiev.ua/handle/123456789/45751 681.5 Для задачи оптимального выбора рассмотрена игровая ситуация, в которой участвуют три игрока, осуществляющие свой выбор на одном множестве объектов один вслед за другим. С применением теории Шепли для кооперативных игр найдена стратегия взаимодействия игроков и механизм распределения выигрыша в случае нахождения наилучшего объекта. ru Міжнародний науково-навчальний центр інформаційних технологій і систем НАН України та МОН України Кибернетика и вычислительная техника Сложные системы управления О справедливом разделе выигрыша в одной игровой задаче оптимального выбора Article published earlier |
| spellingShingle | О справедливом разделе выигрыша в одной игровой задаче оптимального выбора Доценко, С.И. Сложные системы управления |
| title | О справедливом разделе выигрыша в одной игровой задаче оптимального выбора |
| title_full | О справедливом разделе выигрыша в одной игровой задаче оптимального выбора |
| title_fullStr | О справедливом разделе выигрыша в одной игровой задаче оптимального выбора |
| title_full_unstemmed | О справедливом разделе выигрыша в одной игровой задаче оптимального выбора |
| title_short | О справедливом разделе выигрыша в одной игровой задаче оптимального выбора |
| title_sort | о справедливом разделе выигрыша в одной игровой задаче оптимального выбора |
| topic | Сложные системы управления |
| topic_facet | Сложные системы управления |
| url | https://nasplib.isofts.kiev.ua/handle/123456789/45751 |
| work_keys_str_mv | AT docenkosi ospravedlivomrazdelevyigryšavodnoiigrovoizadačeoptimalʹnogovybora |