Автоматизовані методи оцінки когерентності україномовних текстів з використанням методології машинного навчання
Проаналізовано основні методи оцінки когерентності текстів з використанням різних технологій машинного навчання. Детально описано принципи роботи методів з використанням рекурентної та згорткової нейронних мереж, розглянуто їх переваги та недоліки. Обґрунтовано доцільність використання методу графу...
Saved in:
| Published in: | Проблеми програмування |
|---|---|
| Date: | 2020 |
| Main Authors: | , |
| Format: | Article |
| Language: | Ukrainian |
| Published: |
Інститут програмних систем НАН України
2020
|
| Subjects: | |
| Online Access: | https://nasplib.isofts.kiev.ua/handle/123456789/180475 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| Journal Title: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Cite this: | Автоматизовані методи оцінки когерентності україномовних текстів з використанням методології машинного навчання / А.А. Крамов, С.Д. Погорілий // Проблеми програмування. — 2020. — № 2-3. — С. 295-303. — Бібліогр.: 21 назв. — укр. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| Summary: | Проаналізовано основні методи оцінки когерентності текстів з використанням різних технологій машинного навчання. Детально описано принципи роботи методів з використанням рекурентної та згорткової нейронних мереж, розглянуто їх переваги та недоліки. Обґрунтовано доцільність використання методу графу семантичної схожості порівняно з іншими методами. Запропоновано використання інших підходів векторного представлення речень для розрахунку міри семантичної схожості елементів тексту. Проведено експериментальну перевірку проаналізованих методів на множині україномовних наукових статей, здійснено навчання моделей семантичного представлення слів та речень. Виконано навчання рекурентної та згорткової нейронних мереж з використанням методу раннього зупину. Обраховано точність вирішення задач розрізнення документів та вставки для проаналізованих методів, здійснено порівняльний аналіз отриманих результатів.
Проанализированы основные методы оценки когерентности текстов с использованием различных технологий машинного обучения. Детально описаны принципы работы методов с использованием рекуррентной и сверточной нейронных сетей, рассмотрены их преимущества и недостатки. Обосновано целесообразность использования метода графа семантического сходства в сравнении с другими методами. Предложено использование других подходов векторного представления предложений для расчета меры семантического сходства элементов текста. Проведена экспериментальная проверка методов на множества украиноязычных научных статей, осуществлено обучение моделей семантического представления слов и предложений. Исполнено обучение рекуррентной и сверточной нейронных сетей с использованием метода ранней остановки. Посчитана точность решения задач различения документов и вставки для методов, осуществлен сравнительный анализ полученных результатов.
The main methods of coherence evaluation of texts with the usage of different machine learning techniques have been analyzed. The principles of methods with the usage of recurrent and convolutional neural networks have been described in details. The advantages of a semantic similarity graph method have been considered. Other approaches to perform the vector representation of sentences for the estimation of semantic similarity between the elements of a text have been suggested to use. The experimental examination of methods has been performed on the set of Ukrainian scientific articles. The training of recurrent and convolutional networks with the usage of early stopping has been performed. The accuracy of the solving of document discrimination and insertion tasks has been calculated. The comparative analysis of the results obtained has been performed.
|
|---|---|
| ISSN: | 1727-4907 |