Аналіз кластерної структури Інтернет-мереж на основі випадкових матриць
Основна увага надається оцінці оптимальної кількості кластерів для системи, що задається матрицею суміжності A з N вузлами при N→∞ . Розглянуто асимптотичний розподіл власних значень стохастичної випадкової матриці без умов незалежності елементів, спектр якої можна розкласти на регулярну частину та...
Saved in:
| Published in: | Проблемы управления и информатики |
|---|---|
| Date: | 2022 |
| Main Authors: | , , |
| Format: | Article |
| Language: | Ukrainian |
| Published: |
Інститут кібернетики ім. В.М. Глушкова НАН України
2022
|
| Subjects: | |
| Online Access: | https://nasplib.isofts.kiev.ua/handle/123456789/210862 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| Journal Title: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Cite this: | Аналіз кластерної структури Інтернет-мереж на основі випадкових матриць / О.Л. Кириченко, І.В. Малик, С.Е. Остапов // Проблеми керування та інформатики. — 2022. — № 1. — С. 37-46. — Бібліогр.: 12 назв. — укр. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| _version_ | 1859460046351499264 |
|---|---|
| author | Кириченко, О.Л. Малик, І.В Остапов, С.Е. |
| author_facet | Кириченко, О.Л. Малик, І.В Остапов, С.Е. |
| citation_txt | Аналіз кластерної структури Інтернет-мереж на основі випадкових матриць / О.Л. Кириченко, І.В. Малик, С.Е. Остапов // Проблеми керування та інформатики. — 2022. — № 1. — С. 37-46. — Бібліогр.: 12 назв. — укр. |
| collection | DSpace DC |
| container_title | Проблемы управления и информатики |
| description | Основна увага надається оцінці оптимальної кількості кластерів для системи, що задається матрицею суміжності A з N вузлами при N→∞ . Розглянуто асимптотичний розподіл власних значень стохастичної випадкової матриці без умов незалежності елементів, спектр якої можна розкласти на регулярну частину та викиди. На основі припущень про однотипність зв’язків у кластері зроблено висновок про оптимальну кількість кластерів для різних прикладних задач. Проведено моделювання мережі зв’язків, що розподілені за законом Пуассона, та знайдено оптимальну кількість кластерів. Результати моделювання вказують на високу точність визначення оптимальної кількості кластерів. У основній теоремі важливим є припущення про існування моменту вище другого для кожного елементу матриці A. Проте, з урахуванням нормалізації, цю умову можна послабити до існування математичного сподівання матриці. Дане послаблення умов збіжності дає можливість використання доведеного твердження на ширший клас прикладних задач, де наявність скінченної дисперсії не вимагається. Зазначимо, що викиди є дійсними власними значеннями для нормалізованої матриці, що дозволяє швидко локалізувати викиди зі складністю O(N), де N — кількість вузлів системи. Отже, вдалося послабити два важливі припущення щодо розподілу елементів випадкової матриці, а саме припущення про рівність нулю математичних сподівань елементів матриці та про незалежність елементів матриці. Крім того, незалежність елементів можна замінити слабкою незалежністю, яка зберігає збіжність до середнього значення в законі великих чисел.
Основна увага надається оцінці оптимальної кількості кластерів для системи, що задається матрицею суміжності A з N вузлами при N→∞ . Розглянуто асимптотичний розподіл власних значень стохастичної випадкової матриці без умов незалежності елементів, спектр якої можна розкласти на регулярну частину та викиди. На основі припущень про однотипність зв’язків у кластері зроблено висновок про оптимальну кількість кластерів для різних прикладних задач. Проведено моделювання мережі зв’язків, що розподілені за законом Пуассона, та знайдено оптимальну кількість кластерів. Результати моделювання вказують на високу точність визначення оптимальної кількості кластерів. У основній теоремі важливим є припущення про існування моменту вище другого для кожного елементу матриці A. Проте, з урахуванням нормалізації, цю умову можна послабити до існування математичного сподівання матриці. Дане послаблення умов збіжності дає можливість використання доведеного твердження на ширший клас прикладних задач, де наявність скінченної дисперсії не вимагається. Зазначимо, що викиди є дійсними власними значеннями для нормалізованої матриці, що дозволяє швидко локалізувати викиди зі складністю O(N), де N — кількість вузлів системи. Отже, вдалося послабити два важливі припущення щодо розподілу елементів випадкової матриці, а саме припущення про рівність нулю математичних сподівань елементів матриці та про незалежність елементів матриці. Крім того, незалежність елементів можна замінити слабкою незалежністю, яка зберігає збіжність до середнього значення в законі великих чисел.
|
| first_indexed | 2026-03-12T12:41:28Z |
| format | Article |
| fulltext |
© О.Л. КИРИЧЕНКО, І.В. МАЛИК, С.Е. ОСТАПОВ, 2022
Міжнародний науково-технічний журнал
«Проблеми керування та інформатики», 2022, № 1 37
СТОХАСТИЧНІ СИСТЕМИ, НЕЧІТКІ МНОЖИНИ
УДК 004.942, 519.177, 519.217
О.Л. Кириченко, І.В. Малик, С.Е. Остапов
АНАЛІЗ КЛАСТЕРНОЇ СТРУКТУРИ ІНТЕРНЕТ-МЕРЕЖ
НА ОСНОВІ ВИПАДКОВИХ МАТРИЦЬ
Ключові слова: стохастична випадкова матриця, спектр матриці, власні зна-
чення, оптимальне число кластерів, марковський алгоритм кластеризації.
Keywords: stochastic random matrix, matrix spectrum, eigenvalues, optimal number
of clusters, Markov clustering algorithm.
Вступ
Аналізу великих даних за допомогою розбиття на групи присвячено багато
робіт. Основні роботи в даному напрямку зосереджені на задачах кластеризації та
пошуку структури розумних мереж (Smart Grid) [1]. Для дослідження мереж Smart
Grid за останні роки більшість робіт присвячено спектральному аналізу матриці
переходів ,A матриці зв’язків або їхніх похідних [1, 2]. Основні роботи з аналізу
матриць великих розмірностей з випадковими елементами ґрунтуються на осно-
воположній роботі Марченка–Пастура [3], у якій основну увагу приділено аналізу
матриць вигляду
T ,A X X= (1)
де X — випадкова матриця розмірності ,n N елементами якої є незалежні ви-
падкові величини з нульовим середнім та скінченною дисперсією:
0,ijEX =
2 , 1,..., , 1,..., .ijDX i n j N= = = (2)
У результаті даного дослідження було знайдено, що власні значення матри-
ці A підпорядковуються так званому розподілу Марченка–Пастура з щільністю
розподілу власних значень [4]
2
1
( ) ( )( ), ( , ),
2
Af x a x x a x a a
c
+ − − += − −
де ,a − ,a + c — параметри розподілу, які визначаються наступними співвідно-
шеннями:
,
n
c
N
= 2 21 .a c=
У загальному випадку закони розподілу для власних значень (1) називаються
напівколовими розподілами Вінгера [5–7]. Зрозуміло, що граничний розподіл за-
лежить від перетворення матриці .X Основні перетворення та відповідні їм гра-
ничні розподіли можна знайти в [8, 9]. Більшість робіт, у яких досліджуються
властивості випадкових матриць, ґрунтується на понятті ермітової матриці, яке у
38 ISSN 1028-0979
випадку дійснозначних величин ijX визначає симетричну матрицю. Дане спро-
щення ґрунтується на тому, що всі власні значення належать множині дійсних чи-
сел, що суттєво полегшує дослідження. Крім того, припущення про рівність 0 ма-
тематичних сподівань у (2) відіграє одну із ключових ролей при використанні ме-
тоду моментів чи перетворення Стілтьєса [8, 10]. У нашому дослідженні
розглянуті матриці не володіють цією властивістю. За рахунок цього спектр мат-
риці не підпорядковується круговому розподілу в одиничному колі на комплекс-
ній множині ,C оскільки містить викиди [8] порядку ( ).O N
Постановка задачі
Основна увага в даній роботі присвячена властивостям нормованих мат-
риць ,N NA де кожен елемент рівний ймовірності переходу із однієї вершини Ін-
тернет-мережі в іншу [9, 10]. Основна проблема буде ґрунтуватися на спектраль-
ному аналізі матриці перехідних ймовірностей. Точніше кажучи, ми будемо аналі-
зувати викиди (власні значення поза основним носієм) та робити висновок про
оптимальну кількість кластерів, ґрунтуючись на кількості викидів. Нормалізація
матриці проводиться для того, щоб локалізувати потрібні нам викиди. Згідно з те-
оремою Перрона–Фробеніуса [11] для довільної квадратної матриці A з не-
від’ємними елементами, існує власне значення ( ),A таке що
( ) ( ).i A A
Крім того, дане власне значення задовольняє нерівності
1 1 1 1
max min , min ( ) min max , max .
N N N N
ij ji ij ji
i i i ij j j j
A A A A A
= = = =
Використовуючи означення стохастичної матриці, яку будемо досліджувати
надалі в якості нормалізованої матриці, приходимо до висновку, що
( ) 1.A =
Таким чином, нас будуть цікавити викиди, які знаходяться в околі точки 1,z =
де радіус околу буде залежати від кількості елементів у кластері, тобто від .N
Оскільки нас буде цікавити задача розбиття на підгрупи, тобто задача класте-
ризації, будемо припускати, що всі зв’язки в одному кластері є однотипними. Да-
не припущення будемо формалізувати наступним чином: елементи матриці сумі-
жності A мають однаковий розподіл, тобто
,ijA F
де F — розподіл з носієм (0, )S та скінченним другим моментом та нену-
льовим середнім:
2
1 2; .ij ijEA EA = =
Тоді матрицю перехідних ймовірностей будемо визначати із наступних спів-
відношень:
1
.
ij
ij N
ij
j
A
P
A
=
=
Міжнародний науково-технічний журнал
«Проблеми керування та інформатики», 2022, № 1 39
Тоді матриця ijP буде стохастичною; крім того, всі елементи матриці будуть
мати той же розподіл, носієм якого є множина [0, 1]. Надалі для доведення основ-
ного твердження даної роботи будемо використовувати наступний факт.
Теорема 1 [7]. Нехай елементи матриці A є незалежними випадковими ве-
личинами з нульовим математичним сподіванням та скінченною дисперсією:
0,ijEA =
2 .ijDA =
Тоді розподіл власних значень матриць
1
NM A
N
=
при N → буде збігатися до рівномірного розподілу в одиничному крузі в ,C
тобто
1
, 1,
( )
0 в іншому випадку.
z
f z
=
Слід зауважити, що матриця вигляду (2) є «незручною» для дослідження,
оскільки елементи в рядках не є залежними за рахунок
1
N
ij
j
A
=
у знаменнику. Да-
ний факт означає, що елементи матриці ijP не є незалежними, що порушує основ-
ні умови теореми для визначення асимптотики розподілу власних значень матри-
ці .P Ще однією проблемою є той факт, що елементи матриці ijP мають носієм
множину R+ та
1
.ijEP
N
=
Таким чином, порушується і друга умова теореми.
Для подолання першої проблеми використаємо закон великих чисел. Для
цього поряд із матрицею P розглянемо матрицю
1
.
ij
ij
A
P
N
=
Зауважимо, що елементи матриці ijP є незалежними випадковими величина-
ми; крім того, асимптотика власних значень матриць P та P є однаковою. Для
цього розглянемо наступну лему.
Лема. Спектр матриць P та P є асимптотично еквівалентним, тобто
1,...,
lim max ( ) 0.i
N i N
P P
→ =
− =
Доведення. Згідно з існуванням скінченного другого моменту для ,ijA отри-
маємо, що
1
1
1 N
ij
j
A
N =
→
у середньому квадратичному. Використовуючи даний факт, отримаємо, що
40 ISSN 1028-0979
1
1
1
1 1
1 1 1
1
.
N
ij
N
ij ij ij j ij
ij ij ijN N N
j
ij ij ij
j j j
N A
A A A A
P P A
N N N
A A A
=
=
= = =
−
− = − = = −
Таким чином, елементи різниці двох матриць будуть прямувати до 0. Врахо-
вуючи той факт, що
1
ij
N
ij
j
A
A
=
мають однаковий розподіл для довільних ,i отримає-
мо наступне співвідношення:
1 1
1 1 1 1 1
1 1 1
1 1
(1) (1) 0
N N N N N
ij ij ij
ij ijN N N
i j i j i
ij ij ij
j j j
A A A
A A o o
N N
A A A= = = = =
= = =
− = − = = →
у середньому квадратичному.
Лему доведено.
Зауваження. Можна посилити твердження леми та довести, що
1,...,
lim max ( ) 0i
N i N
N P P
→ =
− =
для [0,1).
Отже, грунтуючись на лемі, надалі можемо зосередити увагу на дослідженні
власних значень матриці ,P які задовольняють умові незалежності.
Теорема 2. Розподіл власних значень матриці
N
P
має асимптотичний
розподіл, який зосереджений в одиничному крузі { : 1}z C z та володіє одним
викидом (1).
N
o+
Доведення. Поряд із матрицею P розглянемо центровану матрицю
, 1,...,
.
i j N
P
N =
=
Використаємо наступне співвідношення для :P
.CP P P P P P= − + = +
Основним фактом даного представлення є те, що матриця CP має вигляд
111
1
.
N
C
N NN
AA
N N
P
A A
N N
−−
=
− −
Міжнародний науково-технічний журнал
«Проблеми керування та інформатики», 2022, № 1 41
Отже, елементи матриці CP задовольняють умовам теореми 1, і можна стве-
рджувати, що власні значення матриці
111
1
N
C
N NN
AA
N N
N
P
A A
N N
−−
=
− −
будуть мати асимптотичний рівномірний розподіл у крузі { : 1}.z C z
Для остаточного доведення теореми залишилося знайти розподіл власних
значень матриці P та її зв’язок із матрицею .CP Скористаємося поняттям норма-
льної матриці. Враховуючи той факт, що елементи матриці
CN
P
є незалежни-
ми випадковими величинами, отримаємо, що
2
1
( )( )
N
C C
ik jk
k
ij
N N N
P P A A
=
= − − =
.C C
ji
N N
P P
=
З іншого боку, матриця
N
P
також є нормальною, оскільки
2 2
2 2 2
1
N
k
ij
N N N
P P
N N=
= = =
.C C
ji
N N
P P
=
Крім того, матриці
CN
P
та
N
P
є переставними, тобто
2
C CN N N
P P P P=
рівна за розподілом матриці
2
.C CN N N
P P PP=
Таким чином, можна вказати унітарну випадкову матрицю ,U для якої
*,C
C
P
N
P UD U=
* ,P
N
P UD U=
42 ISSN 1028-0979
де CP
D та PD — діагональні матриці. У цьому випадку власні значення матриці
( )CN
P P+
визначаються як сума власних значень
CN
P
та .
N
P
Власні значення матри-
ці
N
P
дорівнюють
1 2, ... 0.N
N N N N
P P P
= = = =
(3)
Використовуючи властивості нормальних переставних матриць, приходимо
до висновку, що власні значення матриці ( )CN
P P+
будуть сумою власних
значень матриці
CN
P
та .
N
P
Крім того, нас не цікавить порядок додавання
на основі (3). Таким чином, власні значення матриці ( )CN
P P+
будуть мати
асимптотичний рівномірний розподіл в одиничному крузі
{ : 1},z C z
крім одного значення, яке дорівнює (1).
N
o+
Враховуючи даний факт, отрима-
ємо, що власні значення P асимптотично розміщені в крузі
:z C z
N
та одне з власних значень даної матриці дорівнює
1
1 .o
N
+
Теорему доведено.
Моделювання
Як приклад розглянемо задачу визначення оптимальної кількості кластерів
для мережі, зв’язки між вузлами в одному кластері будемо моделювати за допо-
могою розподілу Пуассона з параметром 1 2. + Крім того, шуми, які будуть ві-
дображати міжкластерні зв’язки, будемо моделювати за допомогою розподілу
Пуассона з параметром 2 , кількість кластерів при моделюванні дорівнює .k Та-
ким чином, розподіл елемента матриці суміжності A буде мати вигляд
1 2
2
( ), , в одному кластері,
( ) в іншому випадку.
ij
Poiss i j
A
Poiss
+
Для визначення оптимального значення кількості кластерів opt ,k як було за-
значено в теоремі 2, будемо користатися викидами, тобто власними значеннями,
близькими до одиниці. Точніше кажучи,
Міжнародний науково-технічний журнал
«Проблеми керування та інформатики», 2022, № 1 43
opt
1
opt
1
2max ( ,..., )
( ) : ( ) ,
min ( ,..., )
optk
i i
k
k P P
N N
=
де iN — кількість елементів у i-му кластері,
2
i — дисперсія елементів у i-му
кластері. Зауважимо, що в роботі [12] окреслено дещо інший підхід до визначення
викидів, проте даний вибір викидів може породжувати невірні висновки для різ-
них розмірностей кластерів, тобто для різних .iN Тому для розв’язання проблеми
різних розмірностей будемо використовувати наступний критерій визначення ви-
кидів:
opt
opt
1
opt
opt 1
2max ( ,..., )0,2
( ) : ( ) min , .
min ( ,..., )
k
i i
k
k P P
k N N
=
Результати кластеризації можемо бачити в таблиці. З даної таблиці видно, що
невірна оцінка може виникати у трьох випадках.
• Кількість кластерів велика, тобто ( ).k o N=
• Розміри кластерів дуже різняться, тобто значення співвідношення
max ( )
min ( )
i
i
N
r
N
=
є великим.
• Середнє значення шуму, за яким будуються міжкластерні зв’язки, має од-
наковий порядок із усередненими зв’язками всередині кластерів, тобто
( ) ( ( )).ii ijE A o E A=
Дані три критичні ситуації призводять до заниження значення оптимальної
кількості кластерів opt .k Виконання двох сценаріїв можемо бачити в останньому
випадку у таблиці. По-перше, в цьому випадку
max ( ) 800
40,
min ( ) 20
i
i
N
r
N
= = =
що свідчить про незбалансованість між розмірами кластерів. По-друге, середнє
значення міжкластерного зв’язку дорівнює 8, в той же час середній зв’язок у
кластері дорівнює 8 10 18,+ = тобто дані зв’язки задовольняють співвідношен-
ню ( ) ( ( )).ii ijE A o E A= Як можемо бачити з рис. 1 (власні значення матриці P для
випадку (10, 8) = та (500, 20, 300, 800,100, 400)),N = за виконання цих двох
сценаріїв викиди «стягуються» до центру. В цьому випадку відбувається зани-
ження оптимальної кількості кластерів opt .k
Таблиця
1 2( , ) =
1( ,..., )kN N N= k kopt
(20, 0,5) 500, 200, 300, 800, 100, 400 6 6
(20, 1) 500, 200, 300, 800, 100, 400 6 6
(20, 1) 1000, 200, 20 3 3
(20, 4) 200, 200, 200 3 3
(20, 10) 1000, 200, 200, 200, 200 5 5
(10, 8) 500, 20, 300, 800, 100, 400 6 5
44 ISSN 1028-0979
Рис. 1
Якщо жодна з критичних ситуацій не має місця, то всі викиди будуть близькими
до 1, = як і зазначено в теоремі 2. Даний результат проілюстровано на рис. 2 при
власних значеннях (10, 0,5) = матриці P та (500, 300, 800, 400, 400).N =
Рис. 2
Висновок
У даній роботі проведено спектральний аналіз власних значень матриці пере-
ходу для випадку однотипного зв’язку для всіх елементів. Проаналізовано грани-
чний розподіл власних значень матриці переходу на основі зв’язку викидів серед
власних значень та оптимальної кількості кластерів opt .k
У майбутніх роботах планується визначити взаємозв’язок між помилкою
кластеризації та величинами, що можуть породжувати дану помилку, — спів-
відношення між максимальним та мінімальним розмірами кластерів
max ( )
,
min ( )
i
i
N
N
співвідношення між середнім значенням шуму та середнім значенням зв’язку
в кластерах
min
max
ij
ii
EP
EP
та співвідношення між розмірністю даних N та кількіс-
тю кластерів .k
– 1 0 1
1
0
– 1
– 1 0 1
1
0
– 1
Міжнародний науково-технічний журнал
«Проблеми керування та інформатики», 2022, № 1 45
О.Л. Кириченко, І.В. Малик, С.Е. Остапов
АНАЛІЗ КЛАСТЕРНОЇ СТРУКТУРИ ІНТЕРНЕТ-МЕРЕЖ
НА ОСНОВІ ВИПАДКОВИХ МАТРИЦЬ
Основна увага надається оцінці оптимальної кількості кластерів для сис-
теми, що задається матрицею суміжності A з N вузлами при .N → Роз-
глянуто асимптотичний розподіл власних значень стохастичної випадкової
матриці без умов незалежності елементів, спектр якої можна розкласти на
регулярну частину та викиди. На основі припущень про однотипність
зв’язків у кластері зроблено висновок про оптимальну кількість кластерів
для різних прикладних задач. Проведено моделювання мережі зв’язків, що
розподілені за законом Пуассона, та знайдено оптимальну кількість клас-
терів. Результати моделювання вказують на високу точність визначення
оптимальної кількості кластерів. У основній теоремі важливим є припу-
щення про існування моменту вище другого для кожного елементу матри-
ці .A Проте, з урахуванням нормалізації, цю умову можна послабити до
існування математичного сподівання матриці. Дане послаблення умов збі-
жності дає можливість використання доведеного твердження на ширший
клас прикладних задач, де наявність скінченної дисперсії не вимагається.
Зазначимо, що викиди є дійсними власними значеннями для нормалізова-
ної матриці, що дозволяє швидко локалізувати викиди зі складністю ( ),O N
де N — кількість вузлів системи. Отже, вдалося послабити два важливі
припущення щодо розподілу елементів випадкової матриці, а саме припу-
щення про рівність нулю математичних сподівань елементів матриці та
про незалежність елементів матриці. Крім того, незалежність елементів
можна замінити слабкою незалежністю, яка зберігає збіжність до серед-
нього значення в законі великих чисел.
O.L. Kyrychenko, I.V. Malyk, S.E. Ostapov
CLUSTER STRUCTURE ANALYSIS OF INTERNET
NETWORKS BASED ON RANDOM MATRIXES
The main attention is paid to the estimation of the optimal number of clusters
for the system given by the node adjacency matrix .A Based on the assump-
tions about the similarity of connections in the cluster, the conclusion was
drawn about optimal number of clusters for different applications. Poisson's
network of connections is modeled and the optimal number of clusters is found.
The simulation results indicate high accuracy in determining the optimal num-
ber of clusters. In the basic theorem, it is important to assume the existence of a
moment above the second for each element of the matrix .A However, taking
into account normalization, this condition can be reduced to the existence of a
mathematical expectation of the matrix .A This weakening of the convergence
conditions makes it possible to use a proven statement for a wider class of ap-
plied problems, where the presence of a finite variance is not required. Note
that the emissions are valid eigenvalues for the normalized matrix, which al-
lows you to localize quickly emissions with complexity ( ),O N where N — the
number of system nodes. Thus, we managed to weaken two important assump-
tions about the distribution of elements of a random matrix, namely the as-
sumption about the equality of 0 mathematical expectations of the elements of
the matrix and the independence of the elements of the matrix. In addition, the
independence of the elements can be replaced by weak independence, which
maintains convergence to the mean value in the law of large numbers.
46 ISSN 1028-0979
REFERENCES
1. Li F., Qiao W., Sun H., Wan H., Wang J., Xia Y., Xu Z., Zhang P. Smart transmission grid: vi-
sion and framework. IEEE Transactions on Smart Grid. 2010. 1, N 2. P. 168–177.
2. Liserre M., Sauter T., Hung J.-Y. Future energy systems: integrating renewable energy sources
into the smart power grid through industrial electronics. IEEE Industrial Electronics Magazine.
2010. 4. P. 18–37. http://dx.doi.org/10.1109/MIE.2010.935861.
3. Марченко В.А., Пастур Л.А. Распределение собственных значений в некоторых ансамблях
случайных матриц. Матем. сб. 1967. 72 (114), № 4. C. 507–536.
4. Lytova A., Pastur L. Central limit theorem for linear eigenvalue statistics of random matrices with
independent entries. The Annals of Probability. 2009. 37 (5). P. 1778–1840. http://dx.-
doi.org/10.1214/09-AOP452/.
5. Tao T., Vu V. Random matrices: sharp concentration of eigenvalues, random matrices. Theory
and Applications. 2012. 02 (03). 28 p. http://dx.doi.org/10.1142/S201032631350007X.
6. Wigner Eugene P. On the distribution of the roots of certain symmetric matrices. The Annals of
Mathematics, Second Series. 1958. 67, N 2. P. 325–327.
7. Wigner Eugene P. Characteristic vectors of bordered matrices with infinite dimensions. The An-
nals of Mathematics, Second Series. 1955. 62, N 3. P. 548–564. https://doi.org/10.2307/1970079.
8. Robert C. Qiu, Paul Antonik. Smart grid using big data analytics. A random matrix theory
approach. Wiley Online Library. 2017. 632 p.
9. Terence Tao. Topics in random matrix theory. University of California, Graduate studies in
mathematics. 2012. 132. 340 p. Includes bibliographical references and index. ISBN 978-0-8218-
7430-1.
10. Geronimo J.S., Hill T.P. Necessary and sufficient condition that the limit of Stieltjes transforms is
a Stieltjes transform. Journal of Approximation Theory. 2003. 121 (1). P. 54–60.
11. Гантмахер Ф.Р. Теория матриц. М. : Наука, 1966. 576 с.
12. Кириченко О.Л., Малик І.В., Остапов С.Е. Стохастичні моделі в задачах штучного інтелек-
ту. Вісник Київського національного університету імені Тараса Шевченка. Серія «Фізико-
математичні науки». 2021. Вип. 2. С. 53–57.
Отримано 31.01.2022
|
| id | nasplib_isofts_kiev_ua-123456789-210862 |
| institution | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| issn | 0572-2691 |
| language | Ukrainian |
| last_indexed | 2026-03-12T12:41:28Z |
| publishDate | 2022 |
| publisher | Інститут кібернетики ім. В.М. Глушкова НАН України |
| record_format | dspace |
| spelling | Кириченко, О.Л. Малик, І.В Остапов, С.Е. 2025-12-19T14:38:59Z 2022 Аналіз кластерної структури Інтернет-мереж на основі випадкових матриць / О.Л. Кириченко, І.В. Малик, С.Е. Остапов // Проблеми керування та інформатики. — 2022. — № 1. — С. 37-46. — Бібліогр.: 12 назв. — укр. 0572-2691 https://nasplib.isofts.kiev.ua/handle/123456789/210862 004.942,519.177, 519.217 10.34229/1028-0979-2022-1-4 Основна увага надається оцінці оптимальної кількості кластерів для системи, що задається матрицею суміжності A з N вузлами при N→∞ . Розглянуто асимптотичний розподіл власних значень стохастичної випадкової матриці без умов незалежності елементів, спектр якої можна розкласти на регулярну частину та викиди. На основі припущень про однотипність зв’язків у кластері зроблено висновок про оптимальну кількість кластерів для різних прикладних задач. Проведено моделювання мережі зв’язків, що розподілені за законом Пуассона, та знайдено оптимальну кількість кластерів. Результати моделювання вказують на високу точність визначення оптимальної кількості кластерів. У основній теоремі важливим є припущення про існування моменту вище другого для кожного елементу матриці A. Проте, з урахуванням нормалізації, цю умову можна послабити до існування математичного сподівання матриці. Дане послаблення умов збіжності дає можливість використання доведеного твердження на ширший клас прикладних задач, де наявність скінченної дисперсії не вимагається. Зазначимо, що викиди є дійсними власними значеннями для нормалізованої матриці, що дозволяє швидко локалізувати викиди зі складністю O(N), де N — кількість вузлів системи. Отже, вдалося послабити два важливі припущення щодо розподілу елементів випадкової матриці, а саме припущення про рівність нулю математичних сподівань елементів матриці та про незалежність елементів матриці. Крім того, незалежність елементів можна замінити слабкою незалежністю, яка зберігає збіжність до середнього значення в законі великих чисел. Основна увага надається оцінці оптимальної кількості кластерів для системи, що задається матрицею суміжності A з N вузлами при N→∞ . Розглянуто асимптотичний розподіл власних значень стохастичної випадкової матриці без умов незалежності елементів, спектр якої можна розкласти на регулярну частину та викиди. На основі припущень про однотипність зв’язків у кластері зроблено висновок про оптимальну кількість кластерів для різних прикладних задач. Проведено моделювання мережі зв’язків, що розподілені за законом Пуассона, та знайдено оптимальну кількість кластерів. Результати моделювання вказують на високу точність визначення оптимальної кількості кластерів. У основній теоремі важливим є припущення про існування моменту вище другого для кожного елементу матриці A. Проте, з урахуванням нормалізації, цю умову можна послабити до існування математичного сподівання матриці. Дане послаблення умов збіжності дає можливість використання доведеного твердження на ширший клас прикладних задач, де наявність скінченної дисперсії не вимагається. Зазначимо, що викиди є дійсними власними значеннями для нормалізованої матриці, що дозволяє швидко локалізувати викиди зі складністю O(N), де N — кількість вузлів системи. Отже, вдалося послабити два важливі припущення щодо розподілу елементів випадкової матриці, а саме припущення про рівність нулю математичних сподівань елементів матриці та про незалежність елементів матриці. Крім того, незалежність елементів можна замінити слабкою незалежністю, яка зберігає збіжність до середнього значення в законі великих чисел. uk Інститут кібернетики ім. В.М. Глушкова НАН України Проблемы управления и информатики Стохастичні системи, нечіткі множини Аналіз кластерної структури Інтернет-мереж на основі випадкових матриць Cluster structure analysis of Internet networks based on random matrices Article published earlier |
| spellingShingle | Аналіз кластерної структури Інтернет-мереж на основі випадкових матриць Кириченко, О.Л. Малик, І.В Остапов, С.Е. Стохастичні системи, нечіткі множини |
| title | Аналіз кластерної структури Інтернет-мереж на основі випадкових матриць |
| title_alt | Cluster structure analysis of Internet networks based on random matrices |
| title_full | Аналіз кластерної структури Інтернет-мереж на основі випадкових матриць |
| title_fullStr | Аналіз кластерної структури Інтернет-мереж на основі випадкових матриць |
| title_full_unstemmed | Аналіз кластерної структури Інтернет-мереж на основі випадкових матриць |
| title_short | Аналіз кластерної структури Інтернет-мереж на основі випадкових матриць |
| title_sort | аналіз кластерної структури інтернет-мереж на основі випадкових матриць |
| topic | Стохастичні системи, нечіткі множини |
| topic_facet | Стохастичні системи, нечіткі множини |
| url | https://nasplib.isofts.kiev.ua/handle/123456789/210862 |
| work_keys_str_mv | AT kiričenkool analízklasternoístrukturiínternetmerežnaosnovívipadkovihmatricʹ AT malikív analízklasternoístrukturiínternetmerežnaosnovívipadkovihmatricʹ AT ostapovse analízklasternoístrukturiínternetmerežnaosnovívipadkovihmatricʹ AT kiričenkool clusterstructureanalysisofinternetnetworksbasedonrandommatrices AT malikív clusterstructureanalysisofinternetnetworksbasedonrandommatrices AT ostapovse clusterstructureanalysisofinternetnetworksbasedonrandommatrices |