Дослідження представлення багаточасткових графів за допомогою топологічного аналізу даних

Розглянуто проблему представлення багаточасткових графів для задач машинного навчання (МН) на графах за допомогою методів топологічного МН, зокрема шляхом обчислення персистентних гомологій (ПГ) хмар точок. Розглянуто також векторні представлення графів, отриманих за допомогою білінійних моделей та...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Datum:2023
Hauptverfasser: Yavorskyi, Oleksandr, Kussul, Nataliia
Format: Artikel
Sprache:Ukrainian
Veröffentlicht: V.M. Glushkov Institute of Cybernetics of NAS of Ukraine 2023
Schlagworte:
Online Zugang:https://jais.net.ua/index.php/files/article/view/202
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Problems of Control and Informatics

Institution

Problems of Control and Informatics
Beschreibung
Zusammenfassung:Розглянуто проблему представлення багаточасткових графів для задач машинного навчання (МН) на графах за допомогою методів топологічного МН, зокрема шляхом обчислення персистентних гомологій (ПГ) хмар точок. Розглянуто також векторні представлення графів, отриманих за допомогою білінійних моделей та моделей трансляції, серед яких є модель тензорної декомпозиції TuckeR і моделі зсуву MurE та PairRE. Взято до уваги як повністю експресивні моделі, так і моделі з недоведеним рівнем експресивності. Як приклад багаточасткового графу обрано граф, що має 271 тип вершин та два типи ребер. Обчислення ПГ проведено для кожної моделі. Отримані представлення розбито на два окремих класи. Перший складається лише з векторних представлень вершин, а другий має представлення як вершин, так і одного з типів ребер. Для обох класів обраховано ПГ з максимальним виміром 2, що покриває 1-, 2- та 3-вимірні дірки. Для представлення ПГ обрано персистентні діаграми. Після цього точки отриманих діаграм використано для статистичного аналізу за допомогою обчислення значень коефіцієнтів ексцесу, асиметрії, відхилення та середнього. Дані статистичні характеристики обраховано як для самих моделей, так і для модулів їхніх різниць. Основна мета роботи полягає в тому, аби показати, що різні моделі представлень мають різні характеристики з точки зору ПГ, що вказує на те, що самі моделі не є топологічно еквівалентними, а тому їх вибір принципово впливає на якість та точність вивчення представлень багаточасткових графів. Даний результат досягається шляхом порівняння вищезазначених статистичних параметрів, а також гістограм середніх значень отриманих векторів.