Масштабована кластеризація текстових даних на основі вкладення слів та аналіз шуму

Text data clustering is a key component of unstructured text message analysis. To utilize these methods, text data must be converted into vector representations, i.e., word embeddings must be performed. This paper presents a modification of the HDBSCAN* clustering algorithm using custom distance met...

Повний опис

Збережено в:
Бібліографічні деталі
Дата:2026
Автори: Shutiak, Dmytro, Podkolzin, Gleb, Pokhylenko, Oleksandr
Формат: Стаття
Мова:Англійська
Опубліковано: The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2026
Теми:
Онлайн доступ:https://journal.iasa.kpi.ua/article/view/365268
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:System research and information technologies
Завантажити файл: Pdf

Репозитарії

System research and information technologies

Схожі ресурси