Словообразовательная база знаний экспертной обучающей системы

Для экспертной обучающей системы предложена логическая структура словообразовательной базы знаний и формальная модель узлов дерева, включающая описание методов словообразования с использованием функций выбора. Для експертної навчальної системи запропонована логічна структура словотворчої бази знан...

Full description

Saved in:
Bibliographic Details
Date:2009
Main Authors: Вороной, С.М., Егошина, А.А.
Format: Article
Language:Russian
Published: Інститут проблем штучного інтелекту МОН України та НАН України 2009
Subjects:
Online Access:https://nasplib.isofts.kiev.ua/handle/123456789/7799
Tags: Add Tag
No Tags, Be the first to tag this record!
Journal Title:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Cite this:Словообразовательная база знаний экспертной обучающей системы / С.М. Вороной, А.А. Егошина // Штучний інтелект. — 2009. — № 1. — С. 74-78. — Бібліогр.: 3 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1859909492304510976
author Вороной, С.М.
Егошина, А.А.
author_facet Вороной, С.М.
Егошина, А.А.
citation_txt Словообразовательная база знаний экспертной обучающей системы / С.М. Вороной, А.А. Егошина // Штучний інтелект. — 2009. — № 1. — С. 74-78. — Бібліогр.: 3 назв. — рос.
collection DSpace DC
description Для экспертной обучающей системы предложена логическая структура словообразовательной базы знаний и формальная модель узлов дерева, включающая описание методов словообразования с использованием функций выбора. Для експертної навчальної системи запропонована логічна структура словотворчої бази знань і формальна модель вузлів дерева, що включає опис методів словотвору з використанням функцій вибору. A logical structure of word formation knowledge base and formal model of tree nodes, which includes a description of the methods using the word choice was offered for expertise learning system.
first_indexed 2025-12-07T16:01:43Z
format Article
fulltext «Искусственный интеллект» 1’2009 74 2В УДК 004.89:004.4 С.М. Вороной, А.А. Егошина Государственный университет информатики и искусственного интеллекта, г. Донецк, Украина smv@iai.donetsk.ua Словообразовательная база знаний экспертной обучающей системы Для экспертной обучающей системы предложена логическая структура словообразовательной базы знаний и формальная модель узлов дерева, включающая описание методов словообразования с использованием функций выбора. Введение Проблема обработки естественноязыковой информации остается актуальной на протяжении последних десятилетий. Системы информационного поиска, диалоговые системы, средства машинного перевода и автоматического реферирования, модули про- верки правописания используют анализ текстов, написанных на естественном языке. Использование словообразовательного компонента в информационно-поисковых системах предоставляет возможности для расширения полноты запроса, необходимость которого вызвана малым количеством обнаруженных ресурсов. Наличие модуля сло- вообразования в системах обработки текстов приспосабливает их к работе с неопо- знанными словами, которые образованы путем сложения основ, конверсией частей речи, с помощью аффиксов и т.д. Словообразовательные процессы – это основной путь пополнения лексики языка, в связи с этим модуль словообразования является неотъемлемой частью сов- ременных интеллектуальных информационно-поисковых и обучающих систем с ес- тественноязыковым интерфейсом. Актуальность разработки системы обучения словообразованию обусловлена тем, что знание словообразовательной системы способствует формированию и развитию у изучающих русский язык навыков грамотной речи: правильного употребления производных слов в структуре синтаксических единиц, соблюдения норм согласова- ния и управления, умения пользоваться синонимическими разноуровневыми языковыми средствами и т.д. [1]. Постановка задачи Обучение включает в себя больше, чем просто представление информации; необходима проверка действий обучаемого с динамичной обратной связью в про- цессе обучения для избежания ошибочных выводов, а также отложенная обратная связь для периодической оценки знаний обучаемого. Парадигма экспертной системы позволяет очень четко разделить знания и их обработку, увеличивая возможность многократного проведения такого процесса [2]. Одним из основных компонентов экспертной системы является база знаний (БЗ), предназначенная для хранения долгосрочных данных, описывающих словообразова- Словообразовательная база знаний экспертной обучающей системы «Штучний інтелект» 1’2009 75 2В тельную область (словари флективных классов, корней, аффиксов и окончаний) [3], а также правил словообразовательного синтеза и чередований. Разработка БЗ на основе устроенного по семантическому принципу словообра- зовательного словаря Тихонова позволит применять при словообразовательном ана- лизе и синтезе основные принципы объектно-ориентированного программирования, в первую очередь – наследование. Мотивационные и семантические отношения в сло- вообразовании можно трактовать и использовать как связи множественного насле- дования признаков. Множественного наследования потому, что мотивированное слово наследует признаки как минимум от двух источников: от слова основы и от словооб- разующего форманта. Целью статьи является разработка логической структуры БЗ для экспертной обу- чающей системы словообразованию русского языка. Словообразовательная база знаний экспертной обучающей системы Словообразовательная БЗ представляет собой лес, в качестве деревьев которого выступают словообразовательные гнезда словаря Тихонова. Дерево – одна из наиболее распространенных структур, используемых для представления данных в ЭВМ. Подобные структуры широко применяются при орга- низации банков данных, систем управления базами данных, в системах программного имитационного моделирования сложных комплексов и т.д. Особое значение сетевые структуры приобрели в системах искусственного интеллекта, в которых они адек- ватно отражают логику организации данных и сложные отношения, возникающие в таких системах между различными элементами данных. В этих системах деревья применяются для представления логических конструкций, необходимых для пред- ставления знаний, образования понятий и осуществления логических выводов. Формально дерево (tree) представляет собой конечное множество Т одного или более узлов со следующими свойствами:  существует один выделенный узел, а именно корень (root) данного дерева Т;  остальные узлы распределены среди m>=0 непересекающихся множеств Т1,…Тm, и каждое из этих множеств в свою очередь является деревом, деревья Т1,…Тm называются поддеревьями (subtrees) данного корня. Выбор представления дерева зависит от решаемой задачи и способа ее решения. Узлом дерева назовем структуру  )(,),( ijaa k ij xSzRUA , (1) где U(R) – объединение элементов множества формантов R, представляющее собой производящую основу; za – часть речи слова, образующегося в узле Aji k; Sa(xji) – функция, задающая способ словообразования, с помощью которого об- разуется узел Aji k, xji – формант. Корнями деревьев являются первые и обязательные ступени словообразования, которые являются непроизводными. На каждой ступени словообразования может быть образовано большое число производных слов. Порядок размещения узлов (производных слов) дерева на каждом ярусе учитывает их семантическую близость к родительскому узлу (производящему слову), а также лексико-грамматические и словообразовательные отношения. Например, Вороной С.М., Егошина А.А. «Искусственный интеллект» 1’2009 76 2В для имени существительного со значением лица наиболее семантически близкими являются уменьшительно-ласкательные и увеличительные существительные; за ни- ми идут названия лиц женского пола, детей (при названии животных – самок и детенышей). Самые близкие производные слова в лексико-грамматическом отношении для качественных прилагательных – это формы оценки. Для глаголов – это возвратные глаголы и существительные со значением процесса. Наиболее широким является первый ярус дерева. Принцип размещения узлов (производных слов) следующий: 1) если родительский узел – имя существительное, то дочерние узлы размещены в таком порядке: а) формы оценки исходного существительного; б) остальные имена существительные; в) имена прилагательные; г) наречия; д) префиксальные и префиксально-суффиксальные имена существительные и имена прилагательные (в алфавитном порядке); е) глаголы. В каждом из этих разрядов может быть один, несколько или множество узлов. Однако редки случаи, когда в ярусе встречаются все перечисленные разряды. 2) если родительский узел – имя прилагательное: а) субстантивные прилагательные; б) формы оценки исходного прилагательного; в) бесприставочные имена прилагательные; г) наречия; д) имена существительные; е) префиксальные прилагательные и наречия; ж) глаголы. 3) если родительский узел – имя числительное: а) собирательные числительные; б) существительные; в) количественные существительные; г) наречия; д) прилагательные. 4) если родительский узел – глагол: а) возвратный глагол; б) суффиксальная форма несовершенного вида; в) однократный глагол; г) многократный глагол; д) отглагольные существительные; е) причастия; ж) прилагательные; з) наречия; и) префиксальные и префиксально-суффиксальные глаголы. Местоимения и наречия как производящие основы выступают редко, поэтому необходимость разработки принципа размещения производных не возникает. Для учета описанного порядка размещения узлов в структуру, описывающую элемент узла дерева, вводится дополнительный элемент К, представляющий собой Словообразовательная база знаний экспертной обучающей системы «Штучний інтелект» 1’2009 77 2В бинарный массив, длина которого равна максимальному числу категорий перечис- ленных выше частей речи. Наибольшим числом категорий, равным девяти, обладает глагол ],...,[ 921 kkkK  . (2) Если у текущего родительского узла существуют потомки, обладающие i-м свойством, то ki = 1, если же таких потомков нет или число свойств меньше i, то ki = 0. То есть, например,  для существительного )06(  ii kik ;  для прилагательного )07(  ii kik . Таким образом, структура (1) будет иметь вид  KxSzRUA ijaa k ij ),(,),( . (3) Причем, под именами элементов массива будет подразумеваться название кате- гории, свойственной части речи za. То есть, если узел – имя существительное, то выражение k1 = 1 будет означать наличие потомков, обозначающих формы оценки исходного существительного, однако если в качестве родительского узла выступает глагол, то выражение k1 = 1 будет означать наличие потомков, являющихся возврат- ными глаголами. Рассмотрим первую ступень словообразования прилагательного бедный: бедн(ый) бедн-ейш-ий бедн-оват-ый бедн-еньк-ий бедн-о бедн-ость бедн-от-а бедн-як без-бедн-ый пре-бедн-ый бедн-е-ть при-бедн-ить-ся Для данного примера элементы массива категорий будут иметь такие значения: К={0,1,1,1,1,1,1,0,0}. Первые семь элементов обозначают наличие или отсутствие по- томков, обладающих характеристиками, свойственными производным прилагательного. Последние два элемента равны нулю, так как категорий производных прилагательного существует только семь. Аффиксы, хранящиеся в словарях, структура которых приведена в [3], будем трактовать как факты БЗ. А функции Sa(xji), задающие законы словообразования, – как правила БЗ. Однако, следует отметить, что поведение одного и того же аффикса в разных ситуациях различно, то есть одному и тому же аффиксу могут соответствовать раз- ные правила. Например, рассмотрим суффикс -щик при образовании имен существительных. Случай 1: мотивирующее слово (родительский узел) – глагол. В данной ситуа- ции суффикс -щик вызывает следующие чередования на морфемном шве: к – ч, г – ж, л – ль (размолоть – размольщик). К тому же конечная гласная производящей основы и финаль -ива не сохраняются (протирать – протирщик). Случай 2: мотивирующее слово – имя прилагательное. В этом случае суффикс -щик не дает чередований вообще. Но финали -н- (после согласной) и -ск- основы Вороной С.М., Егошина А.А. «Искусственный интеллект» 1’2009 78 2В мотивирующего слова отсутствуют в образованном существительном (инструмен- тальный – инструментальщик). Случай 3: мотивирующее слово – имя существительное. В данной ситуации пе- ред морфом -щик чередуются л – ль (факел – факельщик), ск – щ (сыск – сыщик), ст – щ (поместье – помещик). Финаль -к- /-ок мотивирующего слова в производном слове отсутствует (шарманка – шарманщик). Таким образом, способ словообразования можно представить следующим вы- ражением: }{ ySsS ia  , (4) где si – способ словообразования объекта, выбираемый из множества S альтернатив- ных способов, выбираемых по некоторому условию у. Условие у представляет собой следующий кортеж:   ,y , (5) где π – совокупность сведений об объекте, а φ – множество правил (словообразова- ния и чередования). Сведения об объекте представляют собой множество информационных харак- теристик, таких, как код аффикса (x), часть речи родительского узла и текущего (c), финаль основы производящего слова (f)  fcx ,, . (6) Части речи родительского и текущего узлов предлагается представить в виде кодов, первый разряд которых соответствуют коду части речи родительского узла, а второй – текущего. Заключение Таким образом, в настоящей работе предложена логическая структура словооб- разовательной базы знаний и формальная модель узлов дерева, включающая описания методов словообразования с использованием функций выбора. В дальнейшем планируется разработка эвристического алгоритма нахождения пути к узлу дерева, обладающему требуемой семантикой. Полученные результаты применяются при разработке экспертной обучающей системы словообразованию русского языка. Литература 1. Потиха З.А. Современное русское словообразование. – М.: Просвещение, 1970. 2. Рыбина Г.В., Рыбин В.М. Опыт разработки и перспективы использования обучающих интегриро- ванных экспертных систем в учебном процессе // Научная сессия МИФИ – 2007. Сб. научных тру- дов: В 17 т. – М.: МИФИ. – Т. 3. Интеллектуальные системы и технологии. – С. 37-39. 3. Егошина А.А. Об одном способе построения статического словаря морфологического процессора // Мате- риалы Седьмой Международной научно-технической конференции «Искусственный интеллект. Интел- лектуальные и многопроцессорные системы – 2006». – Таганрог: Изд-во ТРТУ. – 2006. – Т. 2. – 404 с. С.М. Вороной, Г.А. Єгошина Словотворча база знань експертної навчальної системи Для експертної навчальної системи запропонована логічна структура словотворчої бази знань і формальна модель вузлів дерева, що включає опис методів словотвору з використанням функцій вибору. S. Voronoy, А. Yegoshina Word Formation Knowledge Base for Expertise Learning System A logical structure of word formation knowledge base and formal model of tree nodes, which includes a description of the methods using the word choice was offered for expertise learning system. Статья поступила в редакцию 26.11.2008.
id nasplib_isofts_kiev_ua-123456789-7799
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 1561-5359
language Russian
last_indexed 2025-12-07T16:01:43Z
publishDate 2009
publisher Інститут проблем штучного інтелекту МОН України та НАН України
record_format dspace
spelling Вороной, С.М.
Егошина, А.А.
2010-04-13T12:09:36Z
2010-04-13T12:09:36Z
2009
Словообразовательная база знаний экспертной обучающей системы / С.М. Вороной, А.А. Егошина // Штучний інтелект. — 2009. — № 1. — С. 74-78. — Бібліогр.: 3 назв. — рос.
1561-5359
https://nasplib.isofts.kiev.ua/handle/123456789/7799
004.89:004.4
Для экспертной обучающей системы предложена логическая структура словообразовательной базы знаний и формальная модель узлов дерева, включающая описание методов словообразования с использованием функций выбора.
Для експертної навчальної системи запропонована логічна структура словотворчої бази знань і формальна модель вузлів дерева, що включає опис методів словотвору з використанням функцій вибору.
A logical structure of word formation knowledge base and formal model of tree nodes, which includes a description of the methods using the word choice was offered for expertise learning system.
ru
Інститут проблем штучного інтелекту МОН України та НАН України
Обучающие и экспертные системы
Словообразовательная база знаний экспертной обучающей системы
Словотворча база знань експертної навчальної системи
Word Formation Knowledge Base for Expertise Learning System
Article
published earlier
spellingShingle Словообразовательная база знаний экспертной обучающей системы
Вороной, С.М.
Егошина, А.А.
Обучающие и экспертные системы
title Словообразовательная база знаний экспертной обучающей системы
title_alt Словотворча база знань експертної навчальної системи
Word Formation Knowledge Base for Expertise Learning System
title_full Словообразовательная база знаний экспертной обучающей системы
title_fullStr Словообразовательная база знаний экспертной обучающей системы
title_full_unstemmed Словообразовательная база знаний экспертной обучающей системы
title_short Словообразовательная база знаний экспертной обучающей системы
title_sort словообразовательная база знаний экспертной обучающей системы
topic Обучающие и экспертные системы
topic_facet Обучающие и экспертные системы
url https://nasplib.isofts.kiev.ua/handle/123456789/7799
work_keys_str_mv AT voronoism slovoobrazovatelʹnaâbazaznaniiékspertnoiobučaûŝeisistemy
AT egošinaaa slovoobrazovatelʹnaâbazaznaniiékspertnoiobučaûŝeisistemy
AT voronoism slovotvorčabazaznanʹekspertnoínavčalʹnoísistemi
AT egošinaaa slovotvorčabazaznanʹekspertnoínavčalʹnoísistemi
AT voronoism wordformationknowledgebaseforexpertiselearningsystem
AT egošinaaa wordformationknowledgebaseforexpertiselearningsystem