Дослідження представлення багаточасткових графів за допомогою топологічного аналізу даних
Розглянуто проблему представлення багаточасткових графів для задач машинного навчання (МН) на графах за допомогою методів топологічного МН, зокрема шляхом обчислення персистентних гомологій (ПГ) хмар точок. Розглянуто також векторні представлення графів, отриманих за допомогою білінійних моделей та...
Saved in:
| Date: | 2023 |
|---|---|
| Main Authors: | , |
| Format: | Article |
| Language: | Ukrainian |
| Published: |
V.M. Glushkov Institute of Cybernetics of NAS of Ukraine
2023
|
| Subjects: | |
| Online Access: | https://jais.net.ua/index.php/files/article/view/202 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| Journal Title: | Problems of Control and Informatics |
Institution
Problems of Control and Informatics| id |
oai:ojs2.jais.net.ua:article-202 |
|---|---|
| record_format |
ojs |
| institution |
Problems of Control and Informatics |
| baseUrl_str |
|
| datestamp_date |
2024-03-14T10:27:27Z |
| collection |
OJS |
| language |
Ukrainian |
| topic |
граф багаточастковий граф машинне навчання топологічний аналіз даних персистентні гомології |
| spellingShingle |
граф багаточастковий граф машинне навчання топологічний аналіз даних персистентні гомології Yavorskyi, Oleksandr Kussul, Nataliia Дослідження представлення багаточасткових графів за допомогою топологічного аналізу даних |
| topic_facet |
граф многочасточный граф машинное обучение топологический анализ данных персистентные гомологии граф багаточастковий граф машинне навчання топологічний аналіз даних персистентні гомології graph multipartite graph machine learning topological data analysis persistent homology |
| format |
Article |
| author |
Yavorskyi, Oleksandr Kussul, Nataliia |
| author_facet |
Yavorskyi, Oleksandr Kussul, Nataliia |
| author_sort |
Yavorskyi, Oleksandr |
| title |
Дослідження представлення багаточасткових графів за допомогою топологічного аналізу даних |
| title_short |
Дослідження представлення багаточасткових графів за допомогою топологічного аналізу даних |
| title_full |
Дослідження представлення багаточасткових графів за допомогою топологічного аналізу даних |
| title_fullStr |
Дослідження представлення багаточасткових графів за допомогою топологічного аналізу даних |
| title_full_unstemmed |
Дослідження представлення багаточасткових графів за допомогою топологічного аналізу даних |
| title_sort |
дослідження представлення багаточасткових графів за допомогою топологічного аналізу даних |
| title_alt |
Studying the multipartite graph representations with topological data analysis Исследование представления многочастичных графов с помощью топологического анализа данных |
| description |
Розглянуто проблему представлення багаточасткових графів для задач машинного навчання (МН) на графах за допомогою методів топологічного МН, зокрема шляхом обчислення персистентних гомологій (ПГ) хмар точок. Розглянуто також векторні представлення графів, отриманих за допомогою білінійних моделей та моделей трансляції, серед яких є модель тензорної декомпозиції TuckeR і моделі зсуву MurE та PairRE. Взято до уваги як повністю експресивні моделі, так і моделі з недоведеним рівнем експресивності. Як приклад багаточасткового графу обрано граф, що має 271 тип вершин та два типи ребер. Обчислення ПГ проведено для кожної моделі. Отримані представлення розбито на два окремих класи. Перший складається лише з векторних представлень вершин, а другий має представлення як вершин, так і одного з типів ребер. Для обох класів обраховано ПГ з максимальним виміром 2, що покриває 1-, 2- та 3-вимірні дірки. Для представлення ПГ обрано персистентні діаграми. Після цього точки отриманих діаграм використано для статистичного аналізу за допомогою обчислення значень коефіцієнтів ексцесу, асиметрії, відхилення та середнього. Дані статистичні характеристики обраховано як для самих моделей, так і для модулів їхніх різниць. Основна мета роботи полягає в тому, аби показати, що різні моделі представлень мають різні характеристики з точки зору ПГ, що вказує на те, що самі моделі не є топологічно еквівалентними, а тому їх вибір принципово впливає на якість та точність вивчення представлень багаточасткових графів. Даний результат досягається шляхом порівняння вищезазначених статистичних параметрів, а також гістограм середніх значень отриманих векторів. |
| publisher |
V.M. Glushkov Institute of Cybernetics of NAS of Ukraine |
| publishDate |
2023 |
| url |
https://jais.net.ua/index.php/files/article/view/202 |
| work_keys_str_mv |
AT yavorskyioleksandr doslídžennâpredstavlennâbagatočastkovihgrafívzadopomogoûtopologíčnogoanalízudanih AT kussulnataliia doslídžennâpredstavlennâbagatočastkovihgrafívzadopomogoûtopologíčnogoanalízudanih AT yavorskyioleksandr studyingthemultipartitegraphrepresentationswithtopologicaldataanalysis AT kussulnataliia studyingthemultipartitegraphrepresentationswithtopologicaldataanalysis AT yavorskyioleksandr issledovaniepredstavleniâmnogočastičnyhgrafovspomoŝʹûtopologičeskogoanalizadannyh AT kussulnataliia issledovaniepredstavleniâmnogočastičnyhgrafovspomoŝʹûtopologičeskogoanalizadannyh |
| first_indexed |
2025-10-30T02:48:47Z |
| last_indexed |
2025-10-30T02:48:47Z |
| _version_ |
1847373361312694272 |
| spelling |
oai:ojs2.jais.net.ua:article-2022024-03-14T10:27:27Z Дослідження представлення багаточасткових графів за допомогою топологічного аналізу даних Studying the multipartite graph representations with topological data analysis Исследование представления многочастичных графов с помощью топологического анализа данных Yavorskyi, Oleksandr Kussul, Nataliia граф многочасточный граф машинное обучение топологический анализ данных персистентные гомологии граф багаточастковий граф машинне навчання топологічний аналіз даних персистентні гомології graph multipartite graph machine learning topological data analysis persistent homology Розглянуто проблему представлення багаточасткових графів для задач машинного навчання (МН) на графах за допомогою методів топологічного МН, зокрема шляхом обчислення персистентних гомологій (ПГ) хмар точок. Розглянуто також векторні представлення графів, отриманих за допомогою білінійних моделей та моделей трансляції, серед яких є модель тензорної декомпозиції TuckeR і моделі зсуву MurE та PairRE. Взято до уваги як повністю експресивні моделі, так і моделі з недоведеним рівнем експресивності. Як приклад багаточасткового графу обрано граф, що має 271 тип вершин та два типи ребер. Обчислення ПГ проведено для кожної моделі. Отримані представлення розбито на два окремих класи. Перший складається лише з векторних представлень вершин, а другий має представлення як вершин, так і одного з типів ребер. Для обох класів обраховано ПГ з максимальним виміром 2, що покриває 1-, 2- та 3-вимірні дірки. Для представлення ПГ обрано персистентні діаграми. Після цього точки отриманих діаграм використано для статистичного аналізу за допомогою обчислення значень коефіцієнтів ексцесу, асиметрії, відхилення та середнього. Дані статистичні характеристики обраховано як для самих моделей, так і для модулів їхніх різниць. Основна мета роботи полягає в тому, аби показати, що різні моделі представлень мають різні характеристики з точки зору ПГ, що вказує на те, що самі моделі не є топологічно еквівалентними, а тому їх вибір принципово впливає на якість та точність вивчення представлень багаточасткових графів. Даний результат досягається шляхом порівняння вищезазначених статистичних параметрів, а також гістограм середніх значень отриманих векторів. The problem of representation of multipartite graphs for graph learning problems using topological machine learning methods, in particular, by calculating the persistent homologies of point clouds, is considered. We consider vector representations of graphs obtained using bilinear models and translation models, including the tensor decomposition model TuckeR, and the shift models MurE and PairRE. Both the fully expressive models and models with unproven expressivity levels are taken into account. As an example of a multipartite graph, a graph with two hundred and seventy-one types of vertices and two types of edges was chosen. We calculate persistent homologies for each model. The resulting representations are divided into two separate classes. The first one consists of vector representations of vertices only, while the second one has both vertex and edge representations. For both classes, persistent homologies with a maximum dimension of two are computed, covering one-, two-, and three-dimensional holes. To represent the persistent homologies, we chose persistent diagrams. After that, the points of the obtained diagrams are used for statistical analysis by calculating the values of kurtosis, skewness, deviation, and mean. These statistical characteristics are calculated both for the models themselves and for the modules of their differences. The main goal of this paper is to show that different representation models have different characteristics in terms of persistent homologies, which indicates that the models themselves are not topologically equivalent and therefore their choice fundamentally affects the quality and accuracy of studying representations of multipartite graphs. This result is achieved by comparing the above statistical parameters, as well as histograms of the average values of the obtained vectors. Рассмотрена проблема представления многочастичных графов для задач машинного обучения (МН) на графах с помощью методов топологического МН, в частности путем вычисления персистентных гомологий (ПГ) облаков точек. Рассмотрены также векторные представления графов, полученных с помощью билинейных моделей и моделей трансляции, среди которых модель тензорной декомпозиции TuckeR и модели смещения MurE и PairRE. Приняты во внимание как полностью экспрессивные модели, так и модели с недоказанным уровнем экспрессивности. В качестве примера многочастичного графа выбран граф, имеющий 271 тип вершин и два типа ребер. Вычисление ПГ произведено для каждой модели. Полученные представления разбиты на два отдельных класса. Первый состоит только из векторных представлений вершин, а второй имеет представление как вершин, так и одного из типов ребер. Для обоих классов рассчитаны ПГ с максимальным измерением 2, покрывающим 1-, 2- и 3-мерные дыры. Для представления ПГ выбраны персистентные диаграммы. После этого точки полученных диаграмм используются для статистического анализа посредством вычисления значений коэффициентов эксцесса, асимметрии, отклонения и среднего. Данные статистические характеристики подсчитаны как для самих моделей, так и для модулей их разниц. Основная цель работы состоит в том, чтобы показать, что разные модели представлений имеют разные характеристики с точки зрения ПГ, что указывает на то, что сами модели не являются топологически эквивалентными, поэтому их выбор принципиально влияет на качество и точность изучения представлений многочастичных графов. Данный результат достигается путем сравнения вышеперечисленных статистических параметров, а также гистограмм средних значений полученных векторов. V.M. Glushkov Institute of Cybernetics of NAS of Ukraine 2023-07-24 Article Article application/pdf https://jais.net.ua/index.php/files/article/view/202 10.34229/1028-0979-2023-5-9 Міжнародний науково-технічний журнал "Проблеми керування та інформатики"; Том 68 № 5 (2023): Міжнародний науково-технічний журнал "Проблеми керування та інформатики"; 107-117 International Scientific Technical Journal "Problems of Control and Informatics; Том 68 № 5 (2023): International Scientific Technical Journal "PROBLEMS OF CONTROL AND INFORMATICS"; 107-117 International Scientific Technical Journal "Problems of Control and Informatics"; Vol. 68 No. 5 (2023): International Scientific Technical Journal "PROBLEMS OF CONTROL AND INFORMATICS"; 107-117 2786-6505 2786-6491 10.34229/1028-0979-2023-5 uk https://jais.net.ua/index.php/files/article/view/202/288 Copyright (c) 2023 Oleksandr Yavorskyi, Nataliia Kussul https://creativecommons.org/licenses/by-nc-nd/4.0 |