Онтологоподібні системи аналізу природномовних текстів

Розглянуто підхід до побудови онтологоподібних систем для аналізу текстів на природній мові (на разі тільки українською мовою). Такі системи будуються на основі формальних визначень онтології O = (X, R, F, A(D, Rc)) та синтаксичного і семантичного аналізу за допомогою елементів дескриптивної логіки....

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Проблеми програмування
Datum:2018
Hauptverfasser: Кривий, С.Л., Дарчук, Н.П., Провотар, О.І.
Format: Artikel
Sprache:Ukrainian
Veröffentlicht: Інститут програмних систем НАН України 2018
Schlagworte:
Online Zugang:https://nasplib.isofts.kiev.ua/handle/123456789/144592
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:Онтологоподібні системи аналізу природномовних текстів / С.Л. Кривий, Н.П. Дарчук, О.І. Провотар // Проблеми програмування. — 2018. — № 2-3. — С. 132-139. — Бібліогр.: 4 назв. — укр.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id nasplib_isofts_kiev_ua-123456789-144592
record_format dspace
spelling Кривий, С.Л.
Дарчук, Н.П.
Провотар, О.І.
2018-12-30T17:06:57Z
2018-12-30T17:06:57Z
2018
Онтологоподібні системи аналізу природномовних текстів / С.Л. Кривий, Н.П. Дарчук, О.І. Провотар // Проблеми програмування. — 2018. — № 2-3. — С. 132-139. — Бібліогр.: 4 назв. — укр.
1727-4907
https://nasplib.isofts.kiev.ua/handle/123456789/144592
004.272
Розглянуто підхід до побудови онтологоподібних систем для аналізу текстів на природній мові (на разі тільки українською мовою). Такі системи будуються на основі формальних визначень онтології O = (X, R, F, A(D, Rc)) та синтаксичного і семантичного аналізу за допомогою елементів дескриптивної логіки. При побудові онтології вказується предметна область, до якої відносяться поняття з X і відношення із R. Фіксація області необхідна, оскільки сенс понять та відношень може бути різним в різних предметних областях. Специфікація області необхідна також для точнішого визначення інтерпретації F. Додаткові обмеження F описуються аксіоми А цієї області та обмеженнями Rc, які мають форму додаткових визначень (уточнення, обмеження на можливі значення і т. д.) властивостей області інтерпретації D. Вхідний текст T розглядається як область інтерпретації D(Т). З дескриптивної логіки використовуються визначення синтаксису понять та відношень. Використовуючи цей синтаксис, визначається тип логічної мови, яка в даному випадку є логікою предикатів першого порядку і стає можливим проводити логічне виведення та отримувати висновки з інформації, отриманої з вхідного тексту. Вхідний текст T розглядається як область інтерпретації F для понять X та відношень R, які з нього отримані. Результати синтактико-семантичного аналізу використовуються як вхідні дані для побудови онтології. В результаті такого аналізу відбувається розбиття об'єктів на групи, які відповідають частинам мови. Використовуючи цю інформацію та додаткові обмеження, будується онтологія даної предметної області. З точки зору користувача D(T) виглядає як об’єкт реляційної бази даних, який складається лише з унарних та бінарних відношень. Різниця полягає в тому, що в класичних БД відношення замкнуті в рамках даної бази даних, в той час як D(T), як база даних, є відкритою для даної ПО, тому що нормалізоване представлення знань виконується в ситуації, коли немає припущення про повноту цих знань. Крім того, D(T) зв'язує семантичними відношеннями концепти C i відношення R із R, що немає аналогу в семантиці реляційних БД.
Рассматривается подход к построению онтологоподобных систем для исследования естественноязыковых текстов (на данное время только украинского языка) на основе синтактико-семантического анализа с использованием дескриптивных логик. Такие системы строятся на основе формального определения онтологии O = (X, R, F, A(D, Rc)) и синтаксического и семантического анализа с помощью элементов дескриптивной логики. При построении онтологии фиксируется предметная область, к которой относятся концепты из X и отношения из R. Фиксация области необходима, поскольку смысл концептов и отношений может быть разным в разных предметных областях. Спецификация области необходима ещё и для более точного определения интерпретации F. Дополнительные ограничения описываются аксиомами А этой области и ограничениями Rc, которые имеют вид дополнительных определений (уточнения, ограничения на возможные значения и т. д.) свойств области интерпретации D. Входной текст T рассматривается как область интерпретации D(Т). Из дескриптивной логики используются определения синтаксиса концептов и отношений. Используя этот синтаксис, определяется тип логического языка, который в данном случае является логикой предикатов первого порядка и появляется возможность проводить логический вывод и получать следствия из информации, полученной из входного текста. Входной текст T рассматривается как область интерпретации F для концептов из X и отношений R, которые из него получены. Результаты синтактико-семантического анализа используются как входные данные для построения онтологии. В результате такого анализа происходит разбиение объектов на группы, которые соответствуют частям языка. Используя эту информацию и дополнительные ограничения, строится онтология данной предметной области. С точки зрения пользователя D(T) выглядит как объект реляционной базы данных, который состоит только лишь из унарных и бинарных отношений. Разница состоит в том, что в классических БД отношения замкнуты в рамках данной базы данных, в то время как D(T), как база данных, является открытой для данной ПО, потому что нормализованное представление знаний используется в ситуации, когда нет предположения о полноте этих знаний. Кроме того, D(T) связывает семантическими отношениями концепты C и отношения R из R, чего не имеет аналога в семантике реляционных БД.
In this paper an approach to building of Ontological similar systems for analysis of texts in natural language (on this time only Ukrainian languages) is considered. Such systems are built on the base of formal definitions of ontology O = (X, R, F, A (D, Rc)) and syntactical and semantic analysis by using elements of Descriptive logics. When constructing an ontology, a subject domain is indicated and includes concepts from X and relations from R. Such indicates are necessary because of semantic sense of concepts and relations can be depend of the domain. Specification of domain is necessary to define more precision of the interpretation F. Additional adjustments of F are described by the axioms A of this domain and the restrictions Rc, which have the form of additional definitions (clarifications, constraints on possible values, etc.) of the properties of the domain of interpretation D. An input text T considered as domain of interpretation D. From Descriptive logics we use definition of syntax of concepts and relations. Using this syntax ef concepts and definitions we obtain first order logic and can do reasoning and obtain conclusions from information derived from input text. The input text T considered as the domain D of interpretation F for concepts X and relations R which are derived from it. Syntactical and semantic result of analysis is used as input data for building of ontology. As a result of such analysis is the partition of objects on the groups which are correspond of the parts of speech. By using this information and additional adjustments we build data knowledge of the input domain. In terms of user the domain D looks like an object of the relational database, which includes only unary and binary relations. The difference lies in the fact that classical database relationships are closed within this domain, while D as a database is open because the normalized representation of knowledge is executed in a situation where there is no assumption about the completeness of these knowledge. In addition, D relates the semantic relations of the concepts and the relation, which is not analogous to the relational database semantics.
uk
Інститут програмних систем НАН України
Проблеми програмування
Моделі та засоби систем баз даних і знань
Онтологоподібні системи аналізу природномовних текстів
Ontological similar systems for analysis of texts of natural language
Article
published earlier
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
title Онтологоподібні системи аналізу природномовних текстів
spellingShingle Онтологоподібні системи аналізу природномовних текстів
Кривий, С.Л.
Дарчук, Н.П.
Провотар, О.І.
Моделі та засоби систем баз даних і знань
title_short Онтологоподібні системи аналізу природномовних текстів
title_full Онтологоподібні системи аналізу природномовних текстів
title_fullStr Онтологоподібні системи аналізу природномовних текстів
title_full_unstemmed Онтологоподібні системи аналізу природномовних текстів
title_sort онтологоподібні системи аналізу природномовних текстів
author Кривий, С.Л.
Дарчук, Н.П.
Провотар, О.І.
author_facet Кривий, С.Л.
Дарчук, Н.П.
Провотар, О.І.
topic Моделі та засоби систем баз даних і знань
topic_facet Моделі та засоби систем баз даних і знань
publishDate 2018
language Ukrainian
container_title Проблеми програмування
publisher Інститут програмних систем НАН України
format Article
title_alt Ontological similar systems for analysis of texts of natural language
issn 1727-4907
url https://nasplib.isofts.kiev.ua/handle/123456789/144592
citation_txt Онтологоподібні системи аналізу природномовних текстів / С.Л. Кривий, Н.П. Дарчук, О.І. Провотар // Проблеми програмування. — 2018. — № 2-3. — С. 132-139. — Бібліогр.: 4 назв. — укр.
work_keys_str_mv AT kriviisl ontologopodíbnísistemianalízuprirodnomovnihtekstív
AT darčuknp ontologopodíbnísistemianalízuprirodnomovnihtekstív
AT provotaroí ontologopodíbnísistemianalízuprirodnomovnihtekstív
AT kriviisl ontologicalsimilarsystemsforanalysisoftextsofnaturallanguage
AT darčuknp ontologicalsimilarsystemsforanalysisoftextsofnaturallanguage
AT provotaroí ontologicalsimilarsystemsforanalysisoftextsofnaturallanguage
first_indexed 2025-12-07T21:16:56Z
last_indexed 2025-12-07T21:16:56Z
_version_ 1850885764718526464
description Розглянуто підхід до побудови онтологоподібних систем для аналізу текстів на природній мові (на разі тільки українською мовою). Такі системи будуються на основі формальних визначень онтології O = (X, R, F, A(D, Rc)) та синтаксичного і семантичного аналізу за допомогою елементів дескриптивної логіки. При побудові онтології вказується предметна область, до якої відносяться поняття з X і відношення із R. Фіксація області необхідна, оскільки сенс понять та відношень може бути різним в різних предметних областях. Специфікація області необхідна також для точнішого визначення інтерпретації F. Додаткові обмеження F описуються аксіоми А цієї області та обмеженнями Rc, які мають форму додаткових визначень (уточнення, обмеження на можливі значення і т. д.) властивостей області інтерпретації D. Вхідний текст T розглядається як область інтерпретації D(Т). З дескриптивної логіки використовуються визначення синтаксису понять та відношень. Використовуючи цей синтаксис, визначається тип логічної мови, яка в даному випадку є логікою предикатів першого порядку і стає можливим проводити логічне виведення та отримувати висновки з інформації, отриманої з вхідного тексту. Вхідний текст T розглядається як область інтерпретації F для понять X та відношень R, які з нього отримані. Результати синтактико-семантичного аналізу використовуються як вхідні дані для побудови онтології. В результаті такого аналізу відбувається розбиття об'єктів на групи, які відповідають частинам мови. Використовуючи цю інформацію та додаткові обмеження, будується онтологія даної предметної області. З точки зору користувача D(T) виглядає як об’єкт реляційної бази даних, який складається лише з унарних та бінарних відношень. Різниця полягає в тому, що в класичних БД відношення замкнуті в рамках даної бази даних, в той час як D(T), як база даних, є відкритою для даної ПО, тому що нормалізоване представлення знань виконується в ситуації, коли немає припущення про повноту цих знань. Крім того, D(T) зв'язує семантичними відношеннями концепти C i відношення R із R, що немає аналогу в семантиці реляційних БД. Рассматривается подход к построению онтологоподобных систем для исследования естественноязыковых текстов (на данное время только украинского языка) на основе синтактико-семантического анализа с использованием дескриптивных логик. Такие системы строятся на основе формального определения онтологии O = (X, R, F, A(D, Rc)) и синтаксического и семантического анализа с помощью элементов дескриптивной логики. При построении онтологии фиксируется предметная область, к которой относятся концепты из X и отношения из R. Фиксация области необходима, поскольку смысл концептов и отношений может быть разным в разных предметных областях. Спецификация области необходима ещё и для более точного определения интерпретации F. Дополнительные ограничения описываются аксиомами А этой области и ограничениями Rc, которые имеют вид дополнительных определений (уточнения, ограничения на возможные значения и т. д.) свойств области интерпретации D. Входной текст T рассматривается как область интерпретации D(Т). Из дескриптивной логики используются определения синтаксиса концептов и отношений. Используя этот синтаксис, определяется тип логического языка, который в данном случае является логикой предикатов первого порядка и появляется возможность проводить логический вывод и получать следствия из информации, полученной из входного текста. Входной текст T рассматривается как область интерпретации F для концептов из X и отношений R, которые из него получены. Результаты синтактико-семантического анализа используются как входные данные для построения онтологии. В результате такого анализа происходит разбиение объектов на группы, которые соответствуют частям языка. Используя эту информацию и дополнительные ограничения, строится онтология данной предметной области. С точки зрения пользователя D(T) выглядит как объект реляционной базы данных, который состоит только лишь из унарных и бинарных отношений. Разница состоит в том, что в классических БД отношения замкнуты в рамках данной базы данных, в то время как D(T), как база данных, является открытой для данной ПО, потому что нормализованное представление знаний используется в ситуации, когда нет предположения о полноте этих знаний. Кроме того, D(T) связывает семантическими отношениями концепты C и отношения R из R, чего не имеет аналога в семантике реляционных БД. In this paper an approach to building of Ontological similar systems for analysis of texts in natural language (on this time only Ukrainian languages) is considered. Such systems are built on the base of formal definitions of ontology O = (X, R, F, A (D, Rc)) and syntactical and semantic analysis by using elements of Descriptive logics. When constructing an ontology, a subject domain is indicated and includes concepts from X and relations from R. Such indicates are necessary because of semantic sense of concepts and relations can be depend of the domain. Specification of domain is necessary to define more precision of the interpretation F. Additional adjustments of F are described by the axioms A of this domain and the restrictions Rc, which have the form of additional definitions (clarifications, constraints on possible values, etc.) of the properties of the domain of interpretation D. An input text T considered as domain of interpretation D. From Descriptive logics we use definition of syntax of concepts and relations. Using this syntax ef concepts and definitions we obtain first order logic and can do reasoning and obtain conclusions from information derived from input text. The input text T considered as the domain D of interpretation F for concepts X and relations R which are derived from it. Syntactical and semantic result of analysis is used as input data for building of ontology. As a result of such analysis is the partition of objects on the groups which are correspond of the parts of speech. By using this information and additional adjustments we build data knowledge of the input domain. In terms of user the domain D looks like an object of the relational database, which includes only unary and binary relations. The difference lies in the fact that classical database relationships are closed within this domain, while D as a database is open because the normalized representation of knowledge is executed in a situation where there is no assumption about the completeness of these knowledge. In addition, D relates the semantic relations of the concepts and the relation, which is not analogous to the relational database semantics.