Использование онтологии предметной области для снятия омонимии в естественно-языковых текстах
Разработан метод снятия различных видов омонимии в естественно-языковых текстах деловых, научных и правовых документов. Специфика метода заключается в том, что он не требует использования большого количества синтаксических правил и корпуса размеченных текстов, что значительно упрощает его реализацию...
Saved in:
| Published in: | Проблеми програмування |
|---|---|
| Date: | 2017 |
| Main Authors: | , |
| Format: | Article |
| Language: | Russian |
| Published: |
Інститут програмних систем НАН України
2017
|
| Subjects: | |
| Online Access: | https://nasplib.isofts.kiev.ua/handle/123456789/144476 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| Journal Title: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Cite this: | Использование онтологии предметной области для снятия омонимии в естественно-языковых текстах / О.Н. Лесько, Ю.В. Рогушина // Проблеми програмування. — 2017. — № 2. — С. 61-71. — Бібліогр.: 13 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| _version_ | 1862746155665850368 |
|---|---|
| author | Лесько, О.Н. Рогушина, Ю.В. |
| author_facet | Лесько, О.Н. Рогушина, Ю.В. |
| citation_txt | Использование онтологии предметной области для снятия омонимии в естественно-языковых текстах / О.Н. Лесько, Ю.В. Рогушина // Проблеми програмування. — 2017. — № 2. — С. 61-71. — Бібліогр.: 13 назв. — рос. |
| collection | DSpace DC |
| container_title | Проблеми програмування |
| description | Разработан метод снятия различных видов омонимии в естественно-языковых текстах деловых, научных и правовых документов. Специфика метода заключается в том, что он не требует использования большого количества синтаксических правил и корпуса размеченных текстов, что значительно упрощает его реализацию и сокращает время, необходимое для создания и разметки корпуса текстов. Этот результат достигается как за счет использования онтологии предметной области, так и за счет особенностей синтаксических структур деловых, научных и правовых документов.
Розроблено метод зняття різних видів омонімії у природномовних текстах ділових, наукових і правових документів. Специфіка методу полягає у тому, що він не вимагає використання великої кількості синтаксичних правил і корпусу розмічених текстів, що значно спрощує його реалізацію і скорочує час, необхідний для створення і розмітки корпуса текстів. Цей результат досягається як внаслідок використання онтології предметної області, так і за рахунок особливостей синтаксичних структур ділових, наукових і правових документів.
The article analyses the clarification of various types of homonymy that can be executed without use of semantic information, but only on the basis of syntactic rules. This analysis shows how features of the syntactic structures of legislative and academic texts allow to reduce the number of formal rules required for parsing. A minimal set of syntactic rules necessary for the automatic analysis of such texts is proposed. A method of homonymy clarification in natural language business, scientific and legal text documents is developed. Proposed method does not require the use of a large number of syntactic rules and marked-up texts. Such specificity greatly simplifies the implementation and reduces the time required for creation and markup of text corpora. This result is achieved by use of domain ontology, and by the specifics of syntactic structures of business, scientific and legal documents. In addition, we demonstrate how the use of domain ontology allows to simplify the analysis of the test documents. As opposed to other systems of automatic processing of natural language texts that use domain ontology for semantic analysis too the domain ontology is used to highlight terms in the text and further morphological information of each word in wordy terms.
|
| first_indexed | 2025-12-07T20:44:22Z |
| format | Article |
| fulltext | |
| id | nasplib_isofts_kiev_ua-123456789-144476 |
| institution | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| issn | 1727-4907 |
| language | Russian |
| last_indexed | 2025-12-07T20:44:22Z |
| publishDate | 2017 |
| publisher | Інститут програмних систем НАН України |
| record_format | dspace |
| spelling | Лесько, О.Н. Рогушина, Ю.В. 2018-12-24T17:50:54Z 2018-12-24T17:50:54Z 2017 Использование онтологии предметной области для снятия омонимии в естественно-языковых текстах / О.Н. Лесько, Ю.В. Рогушина // Проблеми програмування. — 2017. — № 2. — С. 61-71. — Бібліогр.: 13 назв. — рос. 1727-4907 https://nasplib.isofts.kiev.ua/handle/123456789/144476 004.853, 004.55 Разработан метод снятия различных видов омонимии в естественно-языковых текстах деловых, научных и правовых документов. Специфика метода заключается в том, что он не требует использования большого количества синтаксических правил и корпуса размеченных текстов, что значительно упрощает его реализацию и сокращает время, необходимое для создания и разметки корпуса текстов. Этот результат достигается как за счет использования онтологии предметной области, так и за счет особенностей синтаксических структур деловых, научных и правовых документов. Розроблено метод зняття різних видів омонімії у природномовних текстах ділових, наукових і правових документів. Специфіка методу полягає у тому, що він не вимагає використання великої кількості синтаксичних правил і корпусу розмічених текстів, що значно спрощує його реалізацію і скорочує час, необхідний для створення і розмітки корпуса текстів. Цей результат досягається як внаслідок використання онтології предметної області, так і за рахунок особливостей синтаксичних структур ділових, наукових і правових документів. The article analyses the clarification of various types of homonymy that can be executed without use of semantic information, but only on the basis of syntactic rules. This analysis shows how features of the syntactic structures of legislative and academic texts allow to reduce the number of formal rules required for parsing. A minimal set of syntactic rules necessary for the automatic analysis of such texts is proposed. A method of homonymy clarification in natural language business, scientific and legal text documents is developed. Proposed method does not require the use of a large number of syntactic rules and marked-up texts. Such specificity greatly simplifies the implementation and reduces the time required for creation and markup of text corpora. This result is achieved by use of domain ontology, and by the specifics of syntactic structures of business, scientific and legal documents. In addition, we demonstrate how the use of domain ontology allows to simplify the analysis of the test documents. As opposed to other systems of automatic processing of natural language texts that use domain ontology for semantic analysis too the domain ontology is used to highlight terms in the text and further morphological information of each word in wordy terms. ru Інститут програмних систем НАН України Проблеми програмування Моделі та засоби систем баз даних і знань Использование онтологии предметной области для снятия омонимии в естественно-языковых текстах Використання онтології предметної області для зняття омонімії в природномовних текстах Article published earlier |
| spellingShingle | Использование онтологии предметной области для снятия омонимии в естественно-языковых текстах Лесько, О.Н. Рогушина, Ю.В. Моделі та засоби систем баз даних і знань |
| title | Использование онтологии предметной области для снятия омонимии в естественно-языковых текстах |
| title_alt | Використання онтології предметної області для зняття омонімії в природномовних текстах |
| title_full | Использование онтологии предметной области для снятия омонимии в естественно-языковых текстах |
| title_fullStr | Использование онтологии предметной области для снятия омонимии в естественно-языковых текстах |
| title_full_unstemmed | Использование онтологии предметной области для снятия омонимии в естественно-языковых текстах |
| title_short | Использование онтологии предметной области для снятия омонимии в естественно-языковых текстах |
| title_sort | использование онтологии предметной области для снятия омонимии в естественно-языковых текстах |
| topic | Моделі та засоби систем баз даних і знань |
| topic_facet | Моделі та засоби систем баз даних і знань |
| url | https://nasplib.isofts.kiev.ua/handle/123456789/144476 |
| work_keys_str_mv | AT lesʹkoon ispolʹzovanieontologiipredmetnoioblastidlâsnâtiâomonimiivestestvennoâzykovyhtekstah AT rogušinaûv ispolʹzovanieontologiipredmetnoioblastidlâsnâtiâomonimiivestestvennoâzykovyhtekstah AT lesʹkoon vikoristannâontologíípredmetnoíoblastídlâznâttâomonímíívprirodnomovnihtekstah AT rogušinaûv vikoristannâontologíípredmetnoíoblastídlâznâttâomonímíívprirodnomovnihtekstah |