Дослідження представлення багаточасткових графів за допомогою топологічного аналізу даних

Розглянуто проблему представлення багаточасткових графів для задач машинного навчання (МН) на графах за допомогою методів топологічного МН, зокрема шляхом обчислення персистентних гомологій (ПГ) хмар точок. Розглянуто також векторні представлення графів, отриманих за допомогою білінійних моделей та...

Full description

Saved in:
Bibliographic Details
Date:2023
Main Authors: Yavorskyi, Oleksandr, Kussul, Nataliia
Format: Article
Language:Ukrainian
Published: V.M. Glushkov Institute of Cybernetics of NAS of Ukraine 2023
Subjects:
Online Access:https://jais.net.ua/index.php/files/article/view/202
Tags: Add Tag
No Tags, Be the first to tag this record!
Journal Title:Problems of Control and Informatics

Institution

Problems of Control and Informatics
Description
Summary:Розглянуто проблему представлення багаточасткових графів для задач машинного навчання (МН) на графах за допомогою методів топологічного МН, зокрема шляхом обчислення персистентних гомологій (ПГ) хмар точок. Розглянуто також векторні представлення графів, отриманих за допомогою білінійних моделей та моделей трансляції, серед яких є модель тензорної декомпозиції TuckeR і моделі зсуву MurE та PairRE. Взято до уваги як повністю експресивні моделі, так і моделі з недоведеним рівнем експресивності. Як приклад багаточасткового графу обрано граф, що має 271 тип вершин та два типи ребер. Обчислення ПГ проведено для кожної моделі. Отримані представлення розбито на два окремих класи. Перший складається лише з векторних представлень вершин, а другий має представлення як вершин, так і одного з типів ребер. Для обох класів обраховано ПГ з максимальним виміром 2, що покриває 1-, 2- та 3-вимірні дірки. Для представлення ПГ обрано персистентні діаграми. Після цього точки отриманих діаграм використано для статистичного аналізу за допомогою обчислення значень коефіцієнтів ексцесу, асиметрії, відхилення та середнього. Дані статистичні характеристики обраховано як для самих моделей, так і для модулів їхніх різниць. Основна мета роботи полягає в тому, аби показати, що різні моделі представлень мають різні характеристики з точки зору ПГ, що вказує на те, що самі моделі не є топологічно еквівалентними, а тому їх вибір принципово впливає на якість та точність вивчення представлень багаточасткових графів. Даний результат досягається шляхом порівняння вищезазначених статистичних параметрів, а також гістограм середніх значень отриманих векторів.