Problem of optimal strategy in the models of conflict redistribution of the resource space
The theory of conflict dynamical systems is applied to finding of the optimal strategy in the problem of redistribution of the resource space between two opponents. In the case of infinite fractal division of the space, we deduce an explicit formula for finding the Lebesgue measure of the occupied t...
Saved in:
| Date: | 2017 |
|---|---|
| Main Authors: | , , , |
| Format: | Article |
| Language: | Ukrainian |
| Published: |
Institute of Mathematics, NAS of Ukraine
2017
|
| Online Access: | https://umj.imath.kiev.ua/index.php/umj/article/view/1745 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| Journal Title: | Ukrains’kyi Matematychnyi Zhurnal |
| Download file: | |
Institution
Ukrains’kyi Matematychnyi Zhurnal| _version_ | 1860507597428228096 |
|---|---|
| author | Verigina, I. V. Koshmanenko, V. D. Веригіна, І. В. Кошманенко, В. Д. |
| author_facet | Verigina, I. V. Koshmanenko, V. D. Веригіна, І. В. Кошманенко, В. Д. |
| author_sort | Verigina, I. V. |
| baseUrl_str | https://umj.imath.kiev.ua/index.php/umj/oai |
| collection | OJS |
| datestamp_date | 2019-12-05T09:25:34Z |
| description | The theory of conflict dynamical systems is applied to finding of the optimal strategy in the problem of redistribution of the
resource space between two opponents. In the case of infinite fractal division of the space, we deduce an explicit formula
for finding the Lebesgue measure of the occupied territory in terms of probability distributions. In particular, this formula
gives the optimal strategy for the occupation of the whole territory. The necessary and sufficient condition for the parity
distribution of the territory are presented. |
| first_indexed | 2026-03-24T02:11:51Z |
| format | Article |
| fulltext |
УДК 517.9
I. В. Веригiна (Нац. техн. ун-т України „КПI iм. I. Сiкорського”, Київ),
В. Д. Кошманенко (Iн-т математики НАН України, Київ)
ЗАДАЧА ПРО ОПТИМАЛЬНУ СТРАТЕГIЮ
В МОДЕЛЯХ КОНФЛIКТНОГО ПЕРЕРОЗПОДIЛУ
РЕСУРСНОГО ПРОСТОРУ
The theory of conflict dynamical systems is applied to finding of the optimal strategy in the problem of redistribution of the
resource space between two opponents. In the case of infinite fractal division of the space, we deduce an explicit formula
for finding the Lebesgue measure of the occupied territory in terms of probability distributions. In particular, this formula
gives the optimal strategy for the occupation of the whole territory. The necessary and sufficient condition for the parity
distribution of the territory are presented.
Теория динамических систем конфликта применяется для нахождения оптимальной стратегии в задаче перераспре-
деления ресурсного пространства между двумя оппонентами. В настоящей статье найдена явная формула для меры
Лебега оккупированной территории в терминах вероятностных распределений в случае бесконечного фрактального
разбиения пространства. В частности, она дает оптимальную стратегию для оккупации всей территории. Получены
необходимые и достаточные условия для паритетного распределения территории.
1. Постановка задачi. Розглянемо модель складної системи з двох протидiючих сторiн, на-
звемо їх опонентами A та B, якi ведуть конфлiктну боротьбу за певним фiксованим правилом
(законом) з метою захоплення максимальної територiї деякого ресурсного простору \Omega .
Задля спрощення покладаємо, що простором конфлiкту є вiдрiзок \Omega = [0, 1]. Природно
вважати, що цей простiр є структурованим, тобто подiленим на n регiонiв, \Omega =
\bigcup n
i=1\Omega i, де
2 \leq n < \infty є фiксованим. Бiльш того, будемо припускати, що задано iтерацiйний спосiб
подрiбнення простору, який застосовується у фрактальнiй геометрiї (див., наприклад, [1, 2]).
А саме, для фiксованого набору чисел q1, q2, . . . , qn, де qi > 0,
\sum n
i=1
qi = 1, покладаємо
\lambda (\Omega i) \equiv | \Omega i| = qi, де \lambda — мiра Лебега. Тодi на k-му кроцi подрiбнення, \Omega =
n\bigcup
i1,...,ik=1
\Omega i1...ik ,
k = 1, 2, . . . , мiра Лебега вiдрiзка \Omega i1...ik визначається за формулою
\lambda (\Omega i1...ik) =
\bigm| \bigm| \Omega i1...ik
\bigm| \bigm| = qm1
1 qm2
2 . . . qmn
n ,
n\sum
i=1
mi = k, (1)
де 0 \leq mi \leq k позначає кiлькiсть iндексiв в \Omega i1...ik , що дорiвнюють i.
Початковий (доконфлiктний) розподiл присутностi опонентiв A та B на \Omega задається довiль-
ними ймовiрнiсними мiрами \mu та \nu :
\mu (\Omega i1...ik) = pi1...ik , \nu (\Omega i1...ik) = ri1...ik ,
n\sum
i1,...,ik=1
pi1...ik =
n\sum
i1,...,ik=1
ri1...ik = 1. (2)
Згiдно з теорiєю динамiчних систем конфлiкту (див. [3 – 5]), при фiксованих правилах кон-
флiктної взаємодiї мiж опонентами еволюцiя складної системи вiдбувається таким чином, що
за умови pi1...ik > ri1...ik (стартового прiоритету А над В в \Omega i1...ik ) мiра присутностi опонента
А у цьому регiонi наближається до деякого ненульового значення, а мiра присутностi опонента
В у цьому ж регiонi стає нульовою. Тобто у регiонi \Omega i1...ik „перемагає” опонент А. У такому
c\bigcirc I. В. ВЕРИГIНА, В. Д. КОШМАНЕНКО 2017
ISSN 1027-3190. Укр. мат. журн., 2017, т. 69, № 7 905
906 I. В. ВЕРИГIНА, В. Д. КОШМАНЕНКО
випадку говоримо, що регiон \Omega i1...ik буде захоплений (окупований, контрольований) опонен-
том А. Позначимо такий регiон \Omega A
i1...ik
. I навпаки, якщо pi1...ik < ri1...ik (в \Omega i1...ik прiоритет
належить В), то регiон \Omega i1...ik буде захоплений (окупований) опонентом В. Позначимо такий
регiон \Omega B
i1...ik
. У випадку pi1...ik = ri1...ik (паритетний стартовий розподiл) обидва опоненти в
результатi конфлiктної взаємодiї з часом повнiстю втрачають свiй вплив у регiонi \Omega i1...ik . Такий
регiон не буде належати жодному з опонентiв, позначимо його \Omega A=B
i1...ik
. В загальному випадку
питання про граничнi (пiсляконфлiктнi) взаєморозподiли опонентiв є самостiйною задачею.
Абстрактнi результати в цьому напрямку одержано в [6, 7].
Стартовi прiоритети чи паритети у кожному з регiонiв залежать i визначаються стратегiями
опонентiв. У моделi, що розглядається, стратегiї опонентiв A, B фiксуються вiдповiдними
послiдовностями додатних чисел:
\alpha 1, . . . , \alpha n, \beta 1, . . . , \beta n,
n\sum
i=1
\alpha i =
n\sum
i=1
\beta i = 1.
Згiдно з цими стратегiями (якщо їх зафiксувати), числовi характеристики присутностi опонентiв
А та В в кожному з регiонiв на k-му кроцi подрiбнення визначаються за формулами
pi1...ik = \alpha m1
1 \alpha m2
2 . . . \alpha mn
n , ri1...ik = \beta m1
1 \beta m2
2 . . . \beta mn
n . (3)
Припускаємо, що стратегiї опонентiв не є тотожно рiвними, тобто iснують такi iндекси i, що
\alpha i \not = \beta i. Тому, взагалi, pi1...ik \not = ri1...ik . У роботах [8, 9] було виявлено цiкаву властивiсть. Якщо
на k-му кроцi подрiбнення у регiонi \Omega i1...ik „перемагає” опонент А, то через скiнченну кiлькiсть
крокiв подальшого подрiбнення в цьому регiонi з’являються меншi регiони, в яких А втрачає
прiоритет, i вони будуть контрольованi опонентом В. При наступних кроках подрiбнення в
цих регiонах, контрольованих опонентом В, з’являються ще меншi регiони, де знову перемагає
опонент А, i так далi.
Для врахування динамiки прiоритетiв та паритетiв на k-му кроцi подрiбнення зберемо
окремо всi регiони, що контролюються А або В, а також тi, де вони обидва втрачають свiй
вплив. Мiри Лебега цих територiй позначимо вiдповiдно так:
TA
k =
\sum \bigm| \bigm| \Omega A
i1...ik
\bigm| \bigm| , TB
k =
\sum \bigm| \bigm| \Omega B
i1...ik
\bigm| \bigm| , TA=B
k =
\sum \bigm| \bigm| \Omega A=B
i1...ik
\bigm| \bigm| . (4)
Нас цiкавить, як змiнюються значення цих мiр, коли k необмежено зростає. Їх граничнi значен-
ня позначимо таким чином:
TA = \mathrm{l}\mathrm{i}\mathrm{m}
k\rightarrow \infty
TA
k , TB = \mathrm{l}\mathrm{i}\mathrm{m}
k\rightarrow \infty
TB
k , TA=B = \mathrm{l}\mathrm{i}\mathrm{m}
k\rightarrow \infty
TA=B
k .
Ми доведемо, що цi границi iснують та їх можна явно обчислити.
2. Мiра Лебега захопленої територiї у ймовiрнiснiй формi. Щоб знайти явну залежнiсть
введених вище мiр територiй вiд фiксованих стратегiй, проведемо деякий аналiз.
На k-му кроцi подрiбнення вiдрiзок \Omega = [0, 1] є об’єднанням nk регiонiв: \Omega =
=
\bigcup n
i1,...,ik=1\Omega i1...ik . Згiдно з постановкою задачi, розподiли опонентiв у початковий момент
конфлiктної взаємодiї задано формулами (2), (3). Розглянемо регiони \Omega i1...ik , де мiра присут-
ностi опонента А є бiльшою, нiж мiра присутностi опонента В, тобто pi1...in > ri1...in . У
термiнах стратегiй це означає, що
ISSN 1027-3190. Укр. мат. журн., 2017, т. 69, № 7
ЗАДАЧА ПРО ОПТИМАЛЬНУ СТРАТЕГIЮ В МОДЕЛЯХ КОНФЛIКТНОГО ПЕРЕРОЗПОДIЛУ . . . 907
\alpha m1
1 \alpha m2
2 . . . \alpha mn
n > \beta m1
1 \beta m2
2 . . . \beta mn
n
або, еквiвалентно, \biggl(
\alpha 1
\beta 1
\biggr) m1
\biggl(
\alpha 2
\beta 2
\biggr) m2
. . .
\biggl(
\alpha n
\beta n
\biggr) mn
> 1.
Логарифмуючи цю нерiвнiсть, одержуємо
m1 \mathrm{l}\mathrm{n}
\alpha 1
\beta 1
+m2 \mathrm{l}\mathrm{n}
\alpha 2
\beta 2
+ . . .+mn \mathrm{l}\mathrm{n}
\alpha n
\beta n
> 0.
Знак нерiвностi не змiниться, якщо її подiлити на крок подрiбнення k. Введемо позначення
\theta k =
m1
k
\mathrm{l}\mathrm{n}
\alpha 1
\beta 1
+
m2
k
\mathrm{l}\mathrm{n}
\alpha 2
\beta 2
+ . . .+
mn
k
\mathrm{l}\mathrm{n}
\beta n
\alpha n
> 0.
Отже, виконання умови
\theta k =
n\sum
i=1
mi
k
\mathrm{l}\mathrm{n}
\alpha i
\beta i
> 0 (5)
забезпечує „перемогу” опонента А у регiонi \Omega i1...ik . Такий регiон ми позначили \Omega A
i1...ik
. Нага-
даємо, що mi — це кiлькiсть iндексiв в \Omega i1...ik , що дорiвнюють i. Тодi \omega i =
mi
k
називається
вiдносною частотою появи iндексу i у послiдовностi \{ i1, i2, . . . , ik\} .
Нехай (m1,m2, . . . ,mn) — такий набiр цiлих значень кiлькостi iндексiв, що дорiвнюють
1, 2, . . . , n, при якому виконується нерiвнiсть (5) за умови m1 + . . . + mn = k. Виходячи iз
способу фрактального подрiбнення вiдрiзка [0, 1], неважко зрозумiти, що кiлькiсть вiдповiдних
цьому набору регiонiв \Omega A
i1...ik
дорiвнює Cm1,...,mn
k =
k!
m1!m2! . . .mn!
, а завдяки (1) їх загальна
мiра Лебега дорiвнює добутку Cm1,...,mn
k qm1
1 . . . qmn
n . Нехай M позначає множину всiх набо-
рiв (m1,m2, . . . ,mn) при фiксованому k, для яких виконується нерiвнiсть (5). Отже, можемо
записати
TA
k =
\sum
(m1,m2,...,mn)\in M
\bigm| \bigm| \Omega A
i1...ik
\bigm| \bigm| = \sum
(m1,m2,...,mn)\in M
Cm1,m2,...,mn
k qm1
1 qm2
2 . . . qmn
n . (6)
Зазначимо, що компоненти останньої суми у рiвностi (6) в точностi збiгаються з iмовiрнос-
тями полiномiального розподiлу (див., наприклад, [10]). Дiйсно, будемо розглядати послiдов-
нiсть iндексiв \{ i1, i2, . . . , ik\} у нумерацiї певного регiону \Omega i1...ik як результат k незалежних
випробувань, у кожному з яких з’являється один з iндексiв \{ 1, 2, . . . , n\} . При цьому будемо
вважати, що ймовiрнiсть появи iндексу i у кожному з випробувань дорiвнює qi, записує-
мо \mathrm{P}\{ is = i\} = qi, i = 1, . . . , n. Саме така iнтерпретацiя приводить до полiномiального
розподiлу. Згiдно з результатами [10], якщо вiдбувається серiя k незалежних випробувань, у
кожному з яких можна спостерiгати лише одну з подiй A1, . . . , An з вiдповiдними ймовiрнос-
тями q1, . . . , qn (у даному випадку подiя Ai означає появу iндексу i), то ймовiрнiсть того,
що у серiї k випробувань подiї A1, A2, . . . , An з’являться вiдповiдно m1,m2, . . . ,mn разiв\Bigl( \sum n
i=1
mi = k
\Bigr)
, визначається формулою полiномiального розподiлу
\mathrm{P}k(m1, . . . ,mn) =
k!
m1!m2! . . .mn!
qm1
1 . . . qmn
n = Cm1,...,mn
k qm1
1 . . . qmn
n .
ISSN 1027-3190. Укр. мат. журн., 2017, т. 69, № 7
908 I. В. ВЕРИГIНА, В. Д. КОШМАНЕНКО
Порiвнюючи цю формулу з формулою (6), робимо висновок, що
TA
k =
\sum
(m1,m2,...,mn)\in M
\mathrm{P}k(m1, . . . ,mn).
У свою чергу остання сума полiномiальних iмовiрностей — це ймовiрнiсть того, що для набору
iндексiв \{ i1, i2, . . . , ik\} виконується умова (5). Отже, на k-му кроцi подрiбнення мiра Лебега
територiї, де перемагає опонент А, дорiвнює ймовiрностi того, що виконується умова (5):
TA
k = \mathrm{P}\{ \theta k > 0\} .
Аналогiчнi мiркування можна провести при оцiнюваннi лебегової мiри територiй TB
k та TA=B
k .
Отже, встановлено справедливiсть такого твердження.
Твердження 1. Величини, введенi в (4), допускають iмовiрнiсну iнтерпретацiю
TA
k = \mathrm{P}\{ \theta k > 0\} , TB
k = \mathrm{P}\{ \theta k < 0\} , TA=B
k = \mathrm{P}\{ \theta k = 0\} .
Наведемо кiлька зауважень. Згiдно з вказаною вище iнтерпретацiєю, випадкова величи-
на \theta k =
\sum n
i=1
mi
k
\mathrm{l}\mathrm{n}
\alpha i
\beta i
є лiнiйною комбiнацiєю випадкових величин \omega i =
mi
k
. Вiдомо
(див., наприклад, [10]), що математичне сподiвання таких величин визначається як \mathrm{M}\{ \omega i\} =
= \mathrm{M}
\Bigl\{ mi
k
\Bigr\}
= qi, а при великих k поведiнка випадкових величин \omega i =
mi
k
є нормально
розподiленою. Тому поведiнка випадкової величини \theta k, як лiнiйної комбiнацiї \omega i, при вели-
ких k також буде нормально розподiленою. Математичне сподiвання \mathrm{M}\{ \theta k\} цiєї випадкової
величини позначимо через \Theta . Отже,
\Theta := \mathrm{M}\{ \theta k\} =
n\sum
i=1
qi \mathrm{l}\mathrm{n}
\alpha i
\beta i
. (7)
Для подальшого важливо, що введена величина \Theta пов’язує алгоритм фрактального подiлу
простору \Omega на регiони iз спiввiдношеннями мiж початковими стратегiями опонентiв, тобто з
наборами \alpha 1, . . . , \alpha n та \beta 1, . . . , \beta n. Число \Theta визначається при постановцi задачi та не залежить
вiд кроку подрiбнення k.
3. Основний результат.
Теорема 1. При нескiнченному фрактальному подрiбненнi простору конфлiкту \Omega на регiо-
ни можливi лише три випадки граничних подiлiв простору мiж опонентами. А саме, залежно
вiд знака величини \Theta мiри Лебега вiдповiдних територiй мають такi значення:
1) якщо \Theta > 0, то TA = 1, TB = 0 i TA=B = 0;
2) якщо \Theta < 0, то TA = 0, TB = 1 i TA=B = 0;
3) якщо \Theta = 0, то TA =
1
2
, TB =
1
2
i TA=B = 0.
Доведення. Розглянемо перший випадок, коли \Theta > 0. Згiдно з теоремою Бернуллi (див. [10,
11]), \mathrm{l}\mathrm{i}\mathrm{m}k\rightarrow \infty \mathrm{P}
\Bigl\{ \bigm| \bigm| \bigm| mi
k
- qi
\bigm| \bigm| \bigm| < \varepsilon
\Bigr\}
= 1 для довiльного \varepsilon > 0. Це означає, що вiдносна частота
\omega i =
mi
k
збiгається за ймовiрнiстю до qi при зростаннi k. Враховуючи цей факт, легко бачити,
що для довiльного \varepsilon > 0
\mathrm{l}\mathrm{i}\mathrm{m}
k\rightarrow \infty
\mathrm{P}
\Biggl\{ \bigm| \bigm| \bigm| \bigm| \bigm|
n\sum
i=1
mi
k
\mathrm{l}\mathrm{n}
\alpha i
\beta i
-
n\sum
i=1
qi \mathrm{l}\mathrm{n}
\alpha i
\beta i
\bigm| \bigm| \bigm| \bigm| \bigm| < \varepsilon
\Biggr\}
= 1,
ISSN 1027-3190. Укр. мат. журн., 2017, т. 69, № 7
ЗАДАЧА ПРО ОПТИМАЛЬНУ СТРАТЕГIЮ В МОДЕЛЯХ КОНФЛIКТНОГО ПЕРЕРОЗПОДIЛУ . . . 909
або
\mathrm{l}\mathrm{i}\mathrm{m}
k\rightarrow \infty
\mathrm{P}
\bigl\{
| \theta k - \Theta | < \varepsilon
\bigr\}
= 1. (8)
Це означає, що при великих k величина \theta k збiгається за ймовiрнiстю до \Theta . Тому з умови
\Theta > 0 i завдяки (8) одержуємо \mathrm{l}\mathrm{i}\mathrm{m}k\rightarrow \infty \mathrm{P}\{ \theta k > 0\} = 1. Нагадаємо, що, згiдно з твердженням 1,
\mathrm{P}\{ \theta k > 0\} = TA
k . Тому
TA = \mathrm{l}\mathrm{i}\mathrm{m}
k\rightarrow \infty
TA
k = \mathrm{l}\mathrm{i}\mathrm{m}
k\rightarrow \infty
\mathrm{P}\{ \theta k > 0\} = 1.
Оскiльки TA
k +TB
k +TA=B
k = 1 для кожного k = 1, 2, . . . , то з iснування \mathrm{l}\mathrm{i}\mathrm{m}k\rightarrow \infty TA
k = TA = 1
випливає iснування \mathrm{l}\mathrm{i}\mathrm{m}k\rightarrow \infty TB
k = TB = 0 та \mathrm{l}\mathrm{i}\mathrm{m}k\rightarrow \infty TA=B
k = TA=B = 0. Теорему у першому
випадку доведено.
Доведення теореми у другому випадку (\Theta < 0) є аналогiчним.
Розглянемо третiй випадок, тобто коли \Theta = 0. Згiдно з твердженням 1, число TA
k = \mathrm{P}\{ \theta k >
> 0\} = \mathrm{P}\{ \theta k > \Theta \} — це ймовiрнiсть того, що випадкова величина \theta k набуває значень бiльших
за своє математичне сподiвання. Як було зазначено ранiше, при великих k поведiнка величини
\theta k є нормально розподiленою. Для нормально розподiленої величини, завдяки симетричностi
нормального розподiлу, ймовiрнiсть того, що величина набуває значень бiльших за своє середнє,
дорiвнює
1
2
. Тому TA
k при великих k збiгається до
1
2
: \mathrm{l}\mathrm{i}\mathrm{m}k\rightarrow \infty TA
k = TA =
1
2
. Аналогiчно,
TB =
1
2
. Як наслiдок, TA=B = 0.
Теорему повнiстю доведено.
Приклад 1. Нехай подрiбнення простору \Omega проведено при n = 2:
\Omega =
2\bigcup
i1,...,ik=1
\Omega i1...ik , k = 1, 2, . . . ,
а стратегiї опонентiв А та В задаються парами чисел \alpha = \{ \alpha i\} , \beta = \{ \beta i\} , i = 1, 2, таким
чином, щоб
0 < \alpha 1 = \alpha < 0,5, \alpha 2 = 1 - \alpha , \beta 1 = \beta , \beta 2 = 1 - \beta , \alpha < \beta .
Тодi, згiдно з формулою (7), \Theta = q1 \mathrm{l}\mathrm{n}
\alpha
\beta
+ (1 - q1) \mathrm{l}\mathrm{n}
1 - \alpha
1 - \beta
. Позначимо
\tau =
\mathrm{l}\mathrm{n}
1 - \alpha
1 - \beta
\mathrm{l}\mathrm{n}
1 - \alpha
1 - \beta
+ \mathrm{l}\mathrm{n}
\beta
\alpha
.
Неважко бачити, що умова \Theta < 0 рiвносильна нерiвностi \tau < q1, умова \Theta > 0 — нерiвностi
\tau > q1, а умова \Theta = 0 означає, що \tau = q1 . Застосовуючи теорему 1, отримуємо TA =
= 0, TA=B = 0, TB = 1 при \tau < q1; T
A = 1, TA=B = 0, TB = 0 при \tau > q1; T
A = TB =
=
1
2
, TA=B = 0 при \tau = q1. Це в точностi збiгається з результатом, отриманим у [9].
Приклад 2. Нехай спосiб подрiбнення простору \Omega та обранi стратегiї опонентiв А та В
є симетрично дзеркальними, тобто qi = qn - i+1, \alpha i = \beta n - i+1 при всiх i = 1, . . . , n. У цьому
випадку за формулою (7) отримуємо \Theta = 0. Тодi за теоремою 1 TA = TB = 1/2, а це означає,
що розподiл територiї мiж опонентами А та В з необхiднiстю є паритетним.
ISSN 1027-3190. Укр. мат. журн., 2017, т. 69, № 7
910 I. В. ВЕРИГIНА, В. Д. КОШМАНЕНКО
4. Порiвняння стратегiй опонентiв у термiнах ентропiї. Введемо величини
H(\alpha , q) = -
n\sum
i=1
qi \mathrm{l}\mathrm{n}\alpha i, H(\beta , q) = -
n\sum
i=1
qi \mathrm{l}\mathrm{n}\beta i.
Вони пов’язують набори \alpha = \{ \alpha i\} та \beta = \{ \beta i\} , що задають початковi стратегiї опонентiв A
та B, з набором чисел q = \{ qi\} , i = 1, . . . , n, який визначає фрактальне подрiбнення \Omega на
регiони. Нехай H(q) = H(q, q) = -
\sum n
i=1
qi \mathrm{l}\mathrm{n} qi. Зазначимо, що за умов розглядуваної задачi
цi величини є додатними: H(\alpha , q), H(\beta , q), H(q) > 0. У теорiї iнформацiї величина H(q) має
назву ентропiї (див., наприклад, [11]). Її змiст — мiра невизначеностi, нестачi iнформацiї про
систему. Величини H(\alpha , q), H(\beta , q) — це так званi перехреснi ентропiї, якi характеризують
зв’язок мiж розподiлами \alpha та q, \beta та q вiдповiдно. Чим менше рiзняться мiж собою розподiли
\alpha та q, тим меншою є перехресна ентропiя H(\alpha , q) розподiлу \alpha вiдносно розподiлу q. Цей
факт має точне формулювання.
Твердження 2. H(q) = \mathrm{m}\mathrm{i}\mathrm{n}
\alpha
H(\alpha , q).
Доведення. Розглянемо рiзницю
H(\alpha , q) - H(q) = -
n\sum
i=1
qi \mathrm{l}\mathrm{n}
\alpha i
qi
= -
n\sum
i=1
qi \mathrm{l}\mathrm{n}
\biggl(
1 +
\alpha i - qi
qi
\biggr)
.
Використовуючи нерiвнiсть \mathrm{l}\mathrm{n}(1 + x) \leq x для всiх x > - 1, де рiвнiсть можлива лише для
x = 0, маємо
H(\alpha , q) - H(q) \geq -
n\sum
i=1
qi
\alpha i - qi
qi
= -
n\sum
i=1
(\alpha i - qi) =
n\sum
i=1
qi -
n\sum
i=1
\alpha i = 1 - 1 = 0.
Отже, завжди H(\alpha , q) \geq H(q). Рiвнiсть H(\alpha , q) = H(q) можлива лише для таких розподiлiв,
коли \alpha i = qi для всiх i = 1, . . . , n. Тому мiнiмальним серед можливих значень H(\alpha , q) є
значення H(q).
Теорема 2. Якщо H(\alpha , q) < H(\beta , q), то TA = 1, TB = 0. Якщо H(\alpha , q) = H(\beta , q) (за
умови \alpha \not = \beta ), то TA = TB =
1
2
.
Доведення. Нехай H(\alpha , q) < H(\beta , q), тодi
\Theta =
n\sum
i=1
qi \mathrm{l}\mathrm{n}
\alpha i
\beta i
= -
n\sum
i=1
qi \mathrm{l}\mathrm{n}\beta i +
n\sum
i=1
qi \mathrm{l}\mathrm{n}\alpha i = H(\beta , q) - H(\alpha , q) > 0.
З огляду на теорему 1 робимо висновок, що в цьому випадку TA = 1, TB = 0, тобто опонент,
що має меншу перехресну ентропiю вiдносно розподiлу q, захоплює бiльшiсть територiї, тодi
як iнший опонент повнiстю її втрачає. Нехай H(\alpha , q) = H(\beta , q), тодi
\Theta =
n\sum
i=1
qi \mathrm{l}\mathrm{n}
\alpha i
\beta i
= -
n\sum
i=1
qi \mathrm{l}\mathrm{n}\beta i +
n\sum
i=1
qi \mathrm{l}\mathrm{n}\alpha i = H(\beta , q) - H(\alpha , q) = 0.
У цьому випадку TA = TB =
1
2
, тобто опоненти дiлять територiю порiвну.
ISSN 1027-3190. Укр. мат. журн., 2017, т. 69, № 7
ЗАДАЧА ПРО ОПТИМАЛЬНУ СТРАТЕГIЮ В МОДЕЛЯХ КОНФЛIКТНОГО ПЕРЕРОЗПОДIЛУ . . . 911
Теорема 3 ( про оптимальну стратегiю). Нехай \beta \not = \alpha . Якщо \alpha i = qi для всiх i = 1, . . . , n,
то TA = 1, TB = 0.
Доведення. Якщо розподiл опонента A є таким, що \alpha i = qi для всiх i = 1, . . . , n, то
H(\alpha , q) = H(q). За твердженням 2 значення H(q) є мiнiмальним серед усiх можливих значень
перехресних ентропiй вiдносно розподiлу q. Тодi при будь-якому розподiлi \beta опонента B, який
не збiгається з розподiлом \alpha опонента A, справджується нерiвнiсть H(\alpha , q) < H(\beta , q). За
теоремою 2 це означає, що TA = 1, TB = 0. Тобто вся територiя буде захоплена опонентом A.
Отже, стратегiя \alpha i = qi, i = 1, . . . , n, є оптимальною.
Теорему доведено.
Варто навести цiкавий факт, який випливає з останнiх теорем. При порiвняннi стратегiй
\alpha = (\alpha 1, . . . , \alpha n) та \beta = (\beta 1, . . . , \beta n) опонентiв A та B може виявитися, що у бiльшостi
регiонiв перевагу має B (можливо навiть, що \alpha i < \beta i в усiх регiонах \Omega i, за винятком лише
одного \Omega i0). Проте якщо для перехресних ентропiй виконується нерiвнiсть H(\alpha , q) < H(\beta , q)
(у можливостi такої ситуацiї неважко пересвiдчитись), то для всiх k починаючи з деякого k0
буде справджуватися нерiвнiсть TA
k > TB
k , що гарантує для опонента A остаточну перемогу:
TA = 1. При цьому стратегiя \alpha така, що \alpha i = qi, i = 1, . . . , n, є оптимальною для A. Це
означає, що TA
k \rightarrow 1 при будь-якiй iншiй стратегiї \beta \not = \alpha для B.
Насамкiнець зауважимо, що рiвнiсть TA = 1 можна довести iншим способом на основi
Qn-зображення дiйсних чисел, що випливає з робiт [1, 12, 13].
Лiтература
1. Працьовитий М. В. Фрактальний пiдхiд в дослiдженнях сингулярних розподiлiв. – Київ: Вид-во НПУ
iм. М. П. Драгоманова, 1998. – 296 с.
2. Koshmanenko V. The infinite direct products of probability measures and structural similarity // Meth. Funct. Anal.
and Top. – 2011. – 17, № 1. – P. 20 – 28.
3. Кошманенко В. Д. Теорема про конфликт для пары стохастических векторов // Укр. мат. журн. – 2003. – 55,
№ 4. – С. 555 – 560.
4. Koshmanenko V. Theorem of conflicts for a pair of probability measures // Math. Meth. Oper. Res. – 2004. – 59,
№ 2. – P. 303 – 313.
5. Кошманенко В. Д. Спектральна теорiя динамiчних систем конфлiкту. – Київ: Наук. думка, 2016. – 287 с.
6. Koshmanenko V. Existence theorems of the \omega -limit states for conflict dynamical systems // Meth. Funct. Anal. and
Top. – 2014. – 20, № 4. – P. 379 – 390.
7. Кошманенко В. Д., Петренко С. M. Розклад Гана – Жордана як рiвноважний стан системи конфлiкту // Укр.
мат. журн. – 2016. – 68, № 1. – С. 64 – 77.
8. Koshmanenko V., Verygina I. Dynamical systems of conflict in terms of structural measures // Meth. Funct. Anal. and
Top. – 2016. – 22, № 1. – P. 81 – 93.
9. Веригiна I. В. Порiвняння стратегiй пари опонентiв у задачi „захоплення” територiї // Доп. НАН України. –
2016. – 20, № 5. – С. 379 – 390.
10. Боровков А. А. Курс теории вероятностей. – М.: Наука, 1972. – 287 с.
11. Смирнов Н. В., Дунин-Барковский И. В. Курс теории вероятностей и математической статистики. – М.: Наука,
1965. – 512 с.
12. Замрiй I. В., Працьовитий М. В. Сингулярнiсть iнверсора цифр Q3 -зображення дробової частини дiйсного
числа, його фрактальнi та iнтегральнi властивостi // Нелiнiйнi коливання. – 2015. – 18, № 1. – С. 55 – 70.
13. Працьовитий М. В., Фещенко О. Ю. Математичнi моделi двостороннiх динамiчних конфлiктiв // Наук. зап.
НПУ iм. М. П. Драгоманова. Фiз.-мат. науки. – 2003. – 4. — С. 260 – 269.
Одержано 01.03.16
ISSN 1027-3190. Укр. мат. журн., 2017, т. 69, № 7
|
| id | umjimathkievua-article-1745 |
| institution | Ukrains’kyi Matematychnyi Zhurnal |
| keywords_txt_mv | keywords |
| language | Ukrainian |
| last_indexed | 2026-03-24T02:11:51Z |
| publishDate | 2017 |
| publisher | Institute of Mathematics, NAS of Ukraine |
| record_format | ojs |
| resource_txt_mv | umjimathkievua/25/57e6ad06f0b887060405f0f70913f325.pdf |
| spelling | umjimathkievua-article-17452019-12-05T09:25:34Z Problem of optimal strategy in the models of conflict redistribution of the resource space Задача про оптимальну стратегію в моделях конфліктного перерозподілу ресурсного простору Verigina, I. V. Koshmanenko, V. D. Веригіна, І. В. Кошманенко, В. Д. The theory of conflict dynamical systems is applied to finding of the optimal strategy in the problem of redistribution of the resource space between two opponents. In the case of infinite fractal division of the space, we deduce an explicit formula for finding the Lebesgue measure of the occupied territory in terms of probability distributions. In particular, this formula gives the optimal strategy for the occupation of the whole territory. The necessary and sufficient condition for the parity distribution of the territory are presented. Теория динамических систем конфликта применяется для нахождения оптимальной стратегии в задаче перераспре- деления ресурсного пространства между двумя оппонентами. В настоящей статье найдена явная формула для меры Лебега оккупированной территории в терминах вероятностных распределений в случае бесконечного фрактального разбиения пространства. В частности, она дает оптимальную стратегию для оккупации всей территории. Получены необходимые и достаточные условия для паритетного распределения территории. Institute of Mathematics, NAS of Ukraine 2017-07-25 Article Article application/pdf https://umj.imath.kiev.ua/index.php/umj/article/view/1745 Ukrains’kyi Matematychnyi Zhurnal; Vol. 69 No. 7 (2017); 905-911 Український математичний журнал; Том 69 № 7 (2017); 905-911 1027-3190 uk https://umj.imath.kiev.ua/index.php/umj/article/view/1745/727 Copyright (c) 2017 Verigina I. V.; Koshmanenko V. D. |
| spellingShingle | Verigina, I. V. Koshmanenko, V. D. Веригіна, І. В. Кошманенко, В. Д. Problem of optimal strategy in the models of conflict redistribution of the resource space |
| title | Problem of optimal strategy in the models of conflict
redistribution of the resource space |
| title_alt | Задача про оптимальну стратегію в моделях конфліктного
перерозподілу ресурсного простору |
| title_full | Problem of optimal strategy in the models of conflict
redistribution of the resource space |
| title_fullStr | Problem of optimal strategy in the models of conflict
redistribution of the resource space |
| title_full_unstemmed | Problem of optimal strategy in the models of conflict
redistribution of the resource space |
| title_short | Problem of optimal strategy in the models of conflict
redistribution of the resource space |
| title_sort | problem of optimal strategy in the models of conflict
redistribution of the resource space |
| url | https://umj.imath.kiev.ua/index.php/umj/article/view/1745 |
| work_keys_str_mv | AT veriginaiv problemofoptimalstrategyinthemodelsofconflictredistributionoftheresourcespace AT koshmanenkovd problemofoptimalstrategyinthemodelsofconflictredistributionoftheresourcespace AT verigínaív problemofoptimalstrategyinthemodelsofconflictredistributionoftheresourcespace AT košmanenkovd problemofoptimalstrategyinthemodelsofconflictredistributionoftheresourcespace AT veriginaiv zadačaprooptimalʹnustrategíûvmodelâhkonflíktnogopererozpodíluresursnogoprostoru AT koshmanenkovd zadačaprooptimalʹnustrategíûvmodelâhkonflíktnogopererozpodíluresursnogoprostoru AT verigínaív zadačaprooptimalʹnustrategíûvmodelâhkonflíktnogopererozpodíluresursnogoprostoru AT košmanenkovd zadačaprooptimalʹnustrategíûvmodelâhkonflíktnogopererozpodíluresursnogoprostoru |