Метод получения информации из онтологии на основе анализа фразы на естественном языке

Разработан метод анализа фраз на естественных языках флективного типа (украинский и русский), позволяющий выделить в предложениях основные идеи и группы слов, при помощи которых они излагаются. Сформированные таким образом семантические деревья высказываний, каждое из которых выражает одну конкретну...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Проблеми програмування
Datum:2020
Hauptverfasser: Литвин, А.А., Величко, В.Ю., Каверинский В.В.
Format: Artikel
Sprache:Russian
Veröffentlicht: Інститут програмних систем НАН України 2020
Schlagworte:
Online Zugang:https://nasplib.isofts.kiev.ua/handle/123456789/180478
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:Метод получения информации из онтологии на основе анализа фразы на естественном языке / А.А. Литвин, В.Ю. Величко, В.В. Каверинский // Проблеми програмування. — 2020. — № 2-3. — С. 322-330. — Бібліогр.: 18 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id nasplib_isofts_kiev_ua-123456789-180478
record_format dspace
spelling Литвин, А.А.
Величко, В.Ю.
Каверинский В.В.
2021-09-29T18:39:21Z
2021-09-29T18:39:21Z
2020
Метод получения информации из онтологии на основе анализа фразы на естественном языке / А.А. Литвин, В.Ю. Величко, В.В. Каверинский // Проблеми програмування. — 2020. — № 2-3. — С. 322-330. — Бібліогр.: 18 назв. — рос.
1727-4907
DOI: https://doi.org/10.15407/pp2020.02-03.322
https://nasplib.isofts.kiev.ua/handle/123456789/180478
681.3.06
Разработан метод анализа фраз на естественных языках флективного типа (украинский и русский), позволяющий выделить в предложениях основные идеи и группы слов, при помощи которых они излагаются. Сформированные таким образом семантические деревья высказываний, каждое из которых выражает одну конкретную идею, являются удобным исходным материалом для построения запросов к онтологии на языке SPARQL. Метод анализа предложений включает следующую последовательность основных этапов: разбиение на слова, выделение маркерных слов и словосочетаний, определение типа высказывания, выделение именных групп, составление синтаксического графа предложения, построение семантических деревьев высказываний, основанных на имеющихся типах высказываний, подстановка параметров из семантических деревьев высказываний в соответствующие шаблоны SPARQL запросов. Выбор соответствующего шаблона запроса зависит от типа высказывания, выраженного данным семантическим деревом высказывания. Понятия, полученные в качестве ответа на запрос, связываются с соответствующим семантическим деревом высказывания. В случае неполучения информации из онтологии, производится редукция именных групп для выражения более общих понятий и построение запросов с их использованием. Это позволяет всегда получить некоторый ответ, хотя и не столь точный, как при использовании полной именной группы. Использование шаблонов SPARQL запросов требует априорно заданной структуры онтологии, которая также предлагается в данной работе. Такая система применима для ведения диалога с помощью чат-бота, для автоматического получения ответов на вопросы к тексту.
Розроблено метод аналізу природно-мовних речень для мов флективного типу (українська та російська), який дозволяє виділити в реченні основні висловлені ідеї та групи слів, за допомогою яких вони викладаються. Сформовані таким чином семантичні дерева висловлювань, кожне з яких виражає одну конкретну ідею, є зручним вихідним матеріалом для побудови запитів до онтології мовою SPARQL. Метод аналізу речень включає наступну послідовність основних етапів: розбиття на слова, виділення маркерних слів і словосполучень, визначення типу висловлювання, виділення іменних груп, побудова синтаксичного графа речення, побудова семантичних дерев висловлювань, заснованих на наявних типах висловлювань, підстановка параметрів з семантичних дерев висловлювань до відповідних шаблонів SPARQL запитів. Вибір відповідного шаблону запиту залежить від типу висловлювання, яке виражено семантичним деревом висловлення. Отримані в якості відповіді на запит набори понять зв’язуються з відповідним семантичним деревом висловлювання. У разі неотримання інформації з онтології, проводиться редукція іменних груп для вираження більш загальних понять і побудови запитів з їх використанням. Це дозволяє завжди отримати деяку відповідь, хоч і не настільки точну, як при використанні повної іменної групи. Використання шаблонів SPARQL запитів вимагає апріорно заданої структури онтології, яка також пропонується в даній роботі. Така система може бути застосована для організації діалогу з чат-ботом або для автоматичного отримання відповідей на питання до тексту.
A method for phrases analyzing in natural languages of inflective type (Ukrainian and Russian) has been developed. The method allows one to outline main expressed ideas and groups of words in the text by which they are stated. The semantic trees of propositions formed in this way, each of which expresses one specific idea, are a convenient source material for constructing queries to the ontology in the SPARQL language. The analysis algorithm is based on the following sequence of basic steps: word tokenize, determining of marker words and phrases, identifying available type of proposition, identifying nouns groups, building a syntactic graph of a sentence, building semantic trees of propositions based on existing types of propositions, substituting parameters from semantic trees of propositions in the corresponding SPARQL query templates. The choice of an appropriate template depends on the type of proposition expressed by a given semantic tree of a proposition. The sets of concepts received as an answer are tied as corresponding answers to the previously defined semantic tree of proposition. In case of non-receipt of information from the ontology, the reduction of noun groups is carried out to express more general concepts and the building queries using them. This allows us to get some answer, although not as accurate as when we use the full noun group. The use of SPARQL query templates requires an a priori known ontology structure, which is also proposed in this paper. Such a system is applicable for dialogue using chat-bots or for automatically receiving answers to questions from the text.
ru
Інститут програмних систем НАН України
Проблеми програмування
Методи машинного навчання
Метод получения информации из онтологии на основе анализа фразы на естественном языке
Метод отримання інформації з онтології на основі аналізу фрази природною мовою
Method of information obtaining from ontology on the basis of a natural language phrase analysis
Article
published earlier
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
title Метод получения информации из онтологии на основе анализа фразы на естественном языке
spellingShingle Метод получения информации из онтологии на основе анализа фразы на естественном языке
Литвин, А.А.
Величко, В.Ю.
Каверинский В.В.
Методи машинного навчання
title_short Метод получения информации из онтологии на основе анализа фразы на естественном языке
title_full Метод получения информации из онтологии на основе анализа фразы на естественном языке
title_fullStr Метод получения информации из онтологии на основе анализа фразы на естественном языке
title_full_unstemmed Метод получения информации из онтологии на основе анализа фразы на естественном языке
title_sort метод получения информации из онтологии на основе анализа фразы на естественном языке
author Литвин, А.А.
Величко, В.Ю.
Каверинский В.В.
author_facet Литвин, А.А.
Величко, В.Ю.
Каверинский В.В.
topic Методи машинного навчання
topic_facet Методи машинного навчання
publishDate 2020
language Russian
container_title Проблеми програмування
publisher Інститут програмних систем НАН України
format Article
title_alt Метод отримання інформації з онтології на основі аналізу фрази природною мовою
Method of information obtaining from ontology on the basis of a natural language phrase analysis
issn 1727-4907
url https://nasplib.isofts.kiev.ua/handle/123456789/180478
citation_txt Метод получения информации из онтологии на основе анализа фразы на естественном языке / А.А. Литвин, В.Ю. Величко, В.В. Каверинский // Проблеми програмування. — 2020. — № 2-3. — С. 322-330. — Бібліогр.: 18 назв. — рос.
work_keys_str_mv AT litvinaa metodpolučeniâinformaciiizontologiinaosnoveanalizafrazynaestestvennomâzyke
AT veličkovû metodpolučeniâinformaciiizontologiinaosnoveanalizafrazynaestestvennomâzyke
AT kaverinskiivv metodpolučeniâinformaciiizontologiinaosnoveanalizafrazynaestestvennomâzyke
AT litvinaa metodotrimannâínformacíízontologíínaosnovíanalízufraziprirodnoûmovoû
AT veličkovû metodotrimannâínformacíízontologíínaosnovíanalízufraziprirodnoûmovoû
AT kaverinskiivv metodotrimannâínformacíízontologíínaosnovíanalízufraziprirodnoûmovoû
AT litvinaa methodofinformationobtainingfromontologyonthebasisofanaturallanguagephraseanalysis
AT veličkovû methodofinformationobtainingfromontologyonthebasisofanaturallanguagephraseanalysis
AT kaverinskiivv methodofinformationobtainingfromontologyonthebasisofanaturallanguagephraseanalysis
first_indexed 2025-12-07T17:17:43Z
last_indexed 2025-12-07T17:17:43Z
_version_ 1850870714141245440
description Разработан метод анализа фраз на естественных языках флективного типа (украинский и русский), позволяющий выделить в предложениях основные идеи и группы слов, при помощи которых они излагаются. Сформированные таким образом семантические деревья высказываний, каждое из которых выражает одну конкретную идею, являются удобным исходным материалом для построения запросов к онтологии на языке SPARQL. Метод анализа предложений включает следующую последовательность основных этапов: разбиение на слова, выделение маркерных слов и словосочетаний, определение типа высказывания, выделение именных групп, составление синтаксического графа предложения, построение семантических деревьев высказываний, основанных на имеющихся типах высказываний, подстановка параметров из семантических деревьев высказываний в соответствующие шаблоны SPARQL запросов. Выбор соответствующего шаблона запроса зависит от типа высказывания, выраженного данным семантическим деревом высказывания. Понятия, полученные в качестве ответа на запрос, связываются с соответствующим семантическим деревом высказывания. В случае неполучения информации из онтологии, производится редукция именных групп для выражения более общих понятий и построение запросов с их использованием. Это позволяет всегда получить некоторый ответ, хотя и не столь точный, как при использовании полной именной группы. Использование шаблонов SPARQL запросов требует априорно заданной структуры онтологии, которая также предлагается в данной работе. Такая система применима для ведения диалога с помощью чат-бота, для автоматического получения ответов на вопросы к тексту. Розроблено метод аналізу природно-мовних речень для мов флективного типу (українська та російська), який дозволяє виділити в реченні основні висловлені ідеї та групи слів, за допомогою яких вони викладаються. Сформовані таким чином семантичні дерева висловлювань, кожне з яких виражає одну конкретну ідею, є зручним вихідним матеріалом для побудови запитів до онтології мовою SPARQL. Метод аналізу речень включає наступну послідовність основних етапів: розбиття на слова, виділення маркерних слів і словосполучень, визначення типу висловлювання, виділення іменних груп, побудова синтаксичного графа речення, побудова семантичних дерев висловлювань, заснованих на наявних типах висловлювань, підстановка параметрів з семантичних дерев висловлювань до відповідних шаблонів SPARQL запитів. Вибір відповідного шаблону запиту залежить від типу висловлювання, яке виражено семантичним деревом висловлення. Отримані в якості відповіді на запит набори понять зв’язуються з відповідним семантичним деревом висловлювання. У разі неотримання інформації з онтології, проводиться редукція іменних груп для вираження більш загальних понять і побудови запитів з їх використанням. Це дозволяє завжди отримати деяку відповідь, хоч і не настільки точну, як при використанні повної іменної групи. Використання шаблонів SPARQL запитів вимагає апріорно заданої структури онтології, яка також пропонується в даній роботі. Така система може бути застосована для організації діалогу з чат-ботом або для автоматичного отримання відповідей на питання до тексту. A method for phrases analyzing in natural languages of inflective type (Ukrainian and Russian) has been developed. The method allows one to outline main expressed ideas and groups of words in the text by which they are stated. The semantic trees of propositions formed in this way, each of which expresses one specific idea, are a convenient source material for constructing queries to the ontology in the SPARQL language. The analysis algorithm is based on the following sequence of basic steps: word tokenize, determining of marker words and phrases, identifying available type of proposition, identifying nouns groups, building a syntactic graph of a sentence, building semantic trees of propositions based on existing types of propositions, substituting parameters from semantic trees of propositions in the corresponding SPARQL query templates. The choice of an appropriate template depends on the type of proposition expressed by a given semantic tree of a proposition. The sets of concepts received as an answer are tied as corresponding answers to the previously defined semantic tree of proposition. In case of non-receipt of information from the ontology, the reduction of noun groups is carried out to express more general concepts and the building queries using them. This allows us to get some answer, although not as accurate as when we use the full noun group. The use of SPARQL query templates requires an a priori known ontology structure, which is also proposed in this paper. Such a system is applicable for dialogue using chat-bots or for automatically receiving answers to questions from the text.