Метод розрахунку когерентності українського тексту

Проаналізовано основні методи автоматизованої оцінки когерентності тексту, який написано природною мовою. Запропоновано вдосконалення методу графа семантичної схожості за допомогою попередньої підготовки моделі, а саме здійснення навчання нейронної мережі векторного представлення речень. Проведено е...

Повний опис

Збережено в:

Бібліографічні деталі
Опубліковано в: :	Реєстрація, зберігання і обробка даних
Дата:	2018
Автори:	Погорілий, С.Д., Крамов, А.А.
Формат:	Стаття
Мова:	Українська
Опубліковано:	Інститут проблем реєстрації інформації НАН України 2018
Теми:	Інформаційно-аналітичні системи обробки даних
Онлайн доступ:	https://nasplib.isofts.kiev.ua/handle/123456789/169073
Теги:	Додати тег Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:	Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:	Метод розрахунку когерентності українського тексту / С.Д. Погорілий, А.А. Крамов // Реєстрація, зберігання і обробка даних. — 2018. — Т. 20, № 4. — С. 64–75. — Бібліогр.: 15 назв. — укр.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine

_version_	1862631723670437888
author	Погорілий, С.Д. Крамов, А.А.
author_facet	Погорілий, С.Д. Крамов, А.А.
citation_txt	Метод розрахунку когерентності українського тексту / С.Д. Погорілий, А.А. Крамов // Реєстрація, зберігання і обробка даних. — 2018. — Т. 20, № 4. — С. 64–75. — Бібліогр.: 15 назв. — укр.
collection	DSpace DC
container_title	Реєстрація, зберігання і обробка даних
description	Проаналізовано основні методи автоматизованої оцінки когерентності тексту, який написано природною мовою. Запропоновано вдосконалення методу графа семантичної схожості за допомогою попередньої підготовки моделі, а саме здійснення навчання нейронної мережі векторного представлення речень. Проведено експериментальну перевірку роботи методу графа семантичної схожості та його модифікованих версій на множині україномовних статей наукових журналів різної тематики. Ефективність роботи методу та його модифікацій розраховано за допомогою вирішення типових задач оцінки когерентності тексту: задач розрізнення документів і вставки. На основі отриманих результатів визначено найбільш ефективні модифікацію та параметри методу графа семантичної схожості для оцінки когерентності україномовних текстів. Проанализированы основные методы автоматизированной оценки когерентности текста, написанного на естественном языке, с помощью подходов, основанных на машинном обучении. Предложено усовершенствование метода графа семантического сходства с помощью предварительной подготовки модели, а именно осуществления обучения нейронной сети векторного представления предложений. Проведена экспериментальная проверка работы метода графа семантического сходства и его модифицированных версий на множестве статей, написанных на украинском языке, научных журналов различной тематики. Эффективность работы метода и его модификаций рассчитана с помощью решения типичных задач оценки когерентности текста: задач различения документов и вставки. На основе полученных результатов определены наиболее эффективные модификации и параметры метода графа семантического сходства для оценки когерентности текстов, написанных на украинском языке. Due to the growing role of the SEO technologies, it is necessary to perform an automated analysis of the article’s quality. Such an approach helps both to return the most intelligible pages for the user’s query and to raise the web-sites positions to the top of query results. An automated assessment of a coherence is a part of the complex analysis of the text. In this article, main methods for text coherence measurements for Ukrainian languageare analyzed. Expediency of using the semantic similarity graph method in comparison with other methods is explained. It is suggested the improvement of that method by the pretraining of the neural network for vector representations of sentences. Experimental examination of the original method and its modifications is made. Training and examination procedures are made on the corpus of Ukrainian texts, which were previously retrieved from abstracts and full texts of Ukrainian scientific articles. The testing procedure is implemented by performing of two typical tasks for the text coherence assessment: document discrimination task and insertion task. Accordingly to the analysis it is defined the most effective combination of method’s modification and its parameter for the measurement of the text coherence.
first_indexed	2025-11-30T12:19:29Z
format	Article
fulltext
id	nasplib_isofts_kiev_ua-123456789-169073
institution	Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn	1560-9189
language	Ukrainian
last_indexed	2025-11-30T12:19:29Z
publishDate	2018
publisher	Інститут проблем реєстрації інформації НАН України
record_format	dspace
spelling	Погорілий, С.Д. Крамов, А.А. 2020-06-03T18:05:38Z 2020-06-03T18:05:38Z 2018 Метод розрахунку когерентності українського тексту / С.Д. Погорілий, А.А. Крамов // Реєстрація, зберігання і обробка даних. — 2018. — Т. 20, № 4. — С. 64–75. — Бібліогр.: 15 назв. — укр. 1560-9189 DOI: https://doi.org/10.35681/1560-9189.2018.20.4.178945 https://nasplib.isofts.kiev.ua/handle/123456789/169073 004.83 Проаналізовано основні методи автоматизованої оцінки когерентності тексту, який написано природною мовою. Запропоновано вдосконалення методу графа семантичної схожості за допомогою попередньої підготовки моделі, а саме здійснення навчання нейронної мережі векторного представлення речень. Проведено експериментальну перевірку роботи методу графа семантичної схожості та його модифікованих версій на множині україномовних статей наукових журналів різної тематики. Ефективність роботи методу та його модифікацій розраховано за допомогою вирішення типових задач оцінки когерентності тексту: задач розрізнення документів і вставки. На основі отриманих результатів визначено найбільш ефективні модифікацію та параметри методу графа семантичної схожості для оцінки когерентності україномовних текстів. Проанализированы основные методы автоматизированной оценки когерентности текста, написанного на естественном языке, с помощью подходов, основанных на машинном обучении. Предложено усовершенствование метода графа семантического сходства с помощью предварительной подготовки модели, а именно осуществления обучения нейронной сети векторного представления предложений. Проведена экспериментальная проверка работы метода графа семантического сходства и его модифицированных версий на множестве статей, написанных на украинском языке, научных журналов различной тематики. Эффективность работы метода и его модификаций рассчитана с помощью решения типичных задач оценки когерентности текста: задач различения документов и вставки. На основе полученных результатов определены наиболее эффективные модификации и параметры метода графа семантического сходства для оценки когерентности текстов, написанных на украинском языке. Due to the growing role of the SEO technologies, it is necessary to perform an automated analysis of the article’s quality. Such an approach helps both to return the most intelligible pages for the user’s query and to raise the web-sites positions to the top of query results. An automated assessment of a coherence is a part of the complex analysis of the text. In this article, main methods for text coherence measurements for Ukrainian languageare analyzed. Expediency of using the semantic similarity graph method in comparison with other methods is explained. It is suggested the improvement of that method by the pretraining of the neural network for vector representations of sentences. Experimental examination of the original method and its modifications is made. Training and examination procedures are made on the corpus of Ukrainian texts, which were previously retrieved from abstracts and full texts of Ukrainian scientific articles. The testing procedure is implemented by performing of two typical tasks for the text coherence assessment: document discrimination task and insertion task. Accordingly to the analysis it is defined the most effective combination of method’s modification and its parameter for the measurement of the text coherence. uk Інститут проблем реєстрації інформації НАН України Реєстрація, зберігання і обробка даних Інформаційно-аналітичні системи обробки даних Метод розрахунку когерентності українського тексту Метод расчета когерентности украинского текста Method of the coherence evaluation of Ukrainian text Article published earlier
spellingShingle	Метод розрахунку когерентності українського тексту Погорілий, С.Д. Крамов, А.А. Інформаційно-аналітичні системи обробки даних
title	Метод розрахунку когерентності українського тексту
title_alt	Метод расчета когерентности украинского текста Method of the coherence evaluation of Ukrainian text
title_full	Метод розрахунку когерентності українського тексту
title_fullStr	Метод розрахунку когерентності українського тексту
title_full_unstemmed	Метод розрахунку когерентності українського тексту
title_short	Метод розрахунку когерентності українського тексту
title_sort	метод розрахунку когерентності українського тексту
topic	Інформаційно-аналітичні системи обробки даних
topic_facet	Інформаційно-аналітичні системи обробки даних
url	https://nasplib.isofts.kiev.ua/handle/123456789/169073
work_keys_str_mv	AT pogoríliisd metodrozrahunkukogerentnostíukraínsʹkogotekstu AT kramovaa metodrozrahunkukogerentnostíukraínsʹkogotekstu AT pogoríliisd metodrasčetakogerentnostiukrainskogoteksta AT kramovaa metodrasčetakogerentnostiukrainskogoteksta AT pogoríliisd methodofthecoherenceevaluationofukrainiantext AT kramovaa methodofthecoherenceevaluationofukrainiantext

Метод розрахунку когерентності українського тексту

Репозитарії

Схожі ресурси