Метод виявлення іменних груп в україномовних текстах

Здійснено порівняльний аналіз основних автоматизованих методів пошуку іменних груп та іменованих сутностей в англомовних та україномовних текстах; обґрунтовано доцільність використання моделі Universal Dependencies. Запропоновано комплексний метод на основі аналізу деревовидної синтаксичної структур...

Full description

Saved in:
Bibliographic Details
Published in:Control systems & computers
Date:2019
Main Authors: Погорілий, С.Д., Крамов, А.А.
Format: Article
Language:Ukrainian
Published: Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України 2019
Subjects:
Online Access:https://nasplib.isofts.kiev.ua/handle/123456789/181049
Tags: Add Tag
No Tags, Be the first to tag this record!
Journal Title:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Cite this:Метод виявлення іменних груп в україномовних текстах / С.Д. Погорілий, А.А. Крамов // Control systems & computers. — 2019. — № 5. — С. 48-61. — Бібліогр.: 13 назв. — укр.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id nasplib_isofts_kiev_ua-123456789-181049
record_format dspace
spelling Погорілий, С.Д.
Крамов, А.А.
2021-10-30T18:04:10Z
2021-10-30T18:04:10Z
2019
Метод виявлення іменних груп в україномовних текстах / С.Д. Погорілий, А.А. Крамов // Control systems & computers. — 2019. — № 5. — С. 48-61. — Бібліогр.: 13 назв. — укр.
2706-8145
DOI: https://doi.org/10.15407/usim.2019.05.048
https://nasplib.isofts.kiev.ua/handle/123456789/181049
004.83
Здійснено порівняльний аналіз основних автоматизованих методів пошуку іменних груп та іменованих сутностей в англомовних та україномовних текстах; обґрунтовано доцільність використання моделі Universal Dependencies. Запропоновано комплексний метод на основі аналізу деревовидної синтаксичної структури речення та моделі виявлення іменованих сутностей. Здійснено експериментальну перевірку ефективності пропонованого методу та показано доцільність його використання для пошуку іменних груп в україномовних текстах.
Цель статьи. Сравнительный анализ основных методов поиска именных групп в англоязычных и украиноязычных текстах. Создание комплексного метода определения именных групп в текстах соответственно с особенностями украинского языка. Осуществление экспериментальной проверки предложенного метода на корпусе украиноязычных статей. Результаты. Проанализированы методы поиска именных групп в тексте и обоснована целесообразность использования древовидной синтаксической структуры предложения. Недостатком многих методов поиска именных групп в тексте является зависимость эффективности их определения от свойств конкретного языка. Решено использовать модель Universal Dependencies в связи с унифицированным форматом обработки предложения для разных языков и наличием обученной модели построение древовидной структуры предложений украиноязычных текстов. Предложен комплексный метод определения именных групп в украиноязычных текстах с использованием средств Universal Dependencies и модели распознавания именованных сущностей. Осуществлена экспериментальная проверка эффективности предложенного метода на корпусе украиноязычных новостей и рассчитаны метрики точности метода.
Purpose. Comparative analysis of the main methods of noun phrases detection in English and Ukrainian texts. The creation of a complex method for the detection of noun phrases in texts according to the features of the Ukrainian language. The performing of experimental examination of the suggested method on the corpus of Ukrainian articles. Results. The different methods of noun phrases detection have been analyzed. The expediency of the representation of sentences as a tree structure has been justified. The key disadvantage of many methods of noun phrase detection is the severe dependence of the effectiveness of their detection from the features of a certain language. Taking into account the unified format of sentence processing and the availability of the trained model for the building of sentence trees for Ukrainian texts, the Universal Dependency model has been chosen. The complex method of noun phrases detection in Ukrainian texts utilizing Universal Dependencies means and named-entity recognition model has been suggested. Experimental verification of the effectiveness of the suggested method on the corpus of Ukrainian news has been performed. Different metrics of method accuracy have been calculated.
uk
Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України
Control systems & computers
Intellectual Informational Technologies and Systems
Метод виявлення іменних груп в україномовних текстах
Метод определения именных групп в украиноязычных текстах
Method of Noun Phrase Detection in Ukrainian Texts
Article
published earlier
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
title Метод виявлення іменних груп в україномовних текстах
spellingShingle Метод виявлення іменних груп в україномовних текстах
Погорілий, С.Д.
Крамов, А.А.
Intellectual Informational Technologies and Systems
title_short Метод виявлення іменних груп в україномовних текстах
title_full Метод виявлення іменних груп в україномовних текстах
title_fullStr Метод виявлення іменних груп в україномовних текстах
title_full_unstemmed Метод виявлення іменних груп в україномовних текстах
title_sort метод виявлення іменних груп в україномовних текстах
author Погорілий, С.Д.
Крамов, А.А.
author_facet Погорілий, С.Д.
Крамов, А.А.
topic Intellectual Informational Technologies and Systems
topic_facet Intellectual Informational Technologies and Systems
publishDate 2019
language Ukrainian
container_title Control systems & computers
publisher Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України
format Article
title_alt Метод определения именных групп в украиноязычных текстах
Method of Noun Phrase Detection in Ukrainian Texts
description Здійснено порівняльний аналіз основних автоматизованих методів пошуку іменних груп та іменованих сутностей в англомовних та україномовних текстах; обґрунтовано доцільність використання моделі Universal Dependencies. Запропоновано комплексний метод на основі аналізу деревовидної синтаксичної структури речення та моделі виявлення іменованих сутностей. Здійснено експериментальну перевірку ефективності пропонованого методу та показано доцільність його використання для пошуку іменних груп в україномовних текстах. Цель статьи. Сравнительный анализ основных методов поиска именных групп в англоязычных и украиноязычных текстах. Создание комплексного метода определения именных групп в текстах соответственно с особенностями украинского языка. Осуществление экспериментальной проверки предложенного метода на корпусе украиноязычных статей. Результаты. Проанализированы методы поиска именных групп в тексте и обоснована целесообразность использования древовидной синтаксической структуры предложения. Недостатком многих методов поиска именных групп в тексте является зависимость эффективности их определения от свойств конкретного языка. Решено использовать модель Universal Dependencies в связи с унифицированным форматом обработки предложения для разных языков и наличием обученной модели построение древовидной структуры предложений украиноязычных текстов. Предложен комплексный метод определения именных групп в украиноязычных текстах с использованием средств Universal Dependencies и модели распознавания именованных сущностей. Осуществлена экспериментальная проверка эффективности предложенного метода на корпусе украиноязычных новостей и рассчитаны метрики точности метода. Purpose. Comparative analysis of the main methods of noun phrases detection in English and Ukrainian texts. The creation of a complex method for the detection of noun phrases in texts according to the features of the Ukrainian language. The performing of experimental examination of the suggested method on the corpus of Ukrainian articles. Results. The different methods of noun phrases detection have been analyzed. The expediency of the representation of sentences as a tree structure has been justified. The key disadvantage of many methods of noun phrase detection is the severe dependence of the effectiveness of their detection from the features of a certain language. Taking into account the unified format of sentence processing and the availability of the trained model for the building of sentence trees for Ukrainian texts, the Universal Dependency model has been chosen. The complex method of noun phrases detection in Ukrainian texts utilizing Universal Dependencies means and named-entity recognition model has been suggested. Experimental verification of the effectiveness of the suggested method on the corpus of Ukrainian news has been performed. Different metrics of method accuracy have been calculated.
issn 2706-8145
url https://nasplib.isofts.kiev.ua/handle/123456789/181049
citation_txt Метод виявлення іменних груп в україномовних текстах / С.Д. Погорілий, А.А. Крамов // Control systems & computers. — 2019. — № 5. — С. 48-61. — Бібліогр.: 13 назв. — укр.
work_keys_str_mv AT pogoríliisd metodviâvlennâímennihgrupvukraínomovnihtekstah
AT kramovaa metodviâvlennâímennihgrupvukraínomovnihtekstah
AT pogoríliisd metodopredeleniâimennyhgruppvukrainoâzyčnyhtekstah
AT kramovaa metodopredeleniâimennyhgruppvukrainoâzyčnyhtekstah
AT pogoríliisd methodofnounphrasedetectioninukrainiantexts
AT kramovaa methodofnounphrasedetectioninukrainiantexts
first_indexed 2025-12-01T17:06:46Z
last_indexed 2025-12-01T17:06:46Z
_version_ 1850860707499737088