Словообразовательная база знаний экспертной обучающей системы
Для экспертной обучающей системы предложена логическая структура словообразовательной базы знаний и формальная модель узлов дерева, включающая описание методов словообразования с использованием функций выбора. Для експертної навчальної системи запропонована логічна структура словотворчої бази знан...
Saved in:
| Date: | 2009 |
|---|---|
| Main Authors: | , |
| Format: | Article |
| Language: | Russian |
| Published: |
Інститут проблем штучного інтелекту МОН України та НАН України
2009
|
| Subjects: | |
| Online Access: | https://nasplib.isofts.kiev.ua/handle/123456789/7799 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| Journal Title: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Cite this: | Словообразовательная база знаний экспертной обучающей системы / С.М. Вороной, А.А. Егошина // Штучний інтелект. — 2009. — № 1. — С. 74-78. — Бібліогр.: 3 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| _version_ | 1859909492304510976 |
|---|---|
| author | Вороной, С.М. Егошина, А.А. |
| author_facet | Вороной, С.М. Егошина, А.А. |
| citation_txt | Словообразовательная база знаний экспертной обучающей системы / С.М. Вороной, А.А. Егошина // Штучний інтелект. — 2009. — № 1. — С. 74-78. — Бібліогр.: 3 назв. — рос. |
| collection | DSpace DC |
| description | Для экспертной обучающей системы предложена логическая структура словообразовательной базы знаний и
формальная модель узлов дерева, включающая описание методов словообразования с использованием
функций выбора.
Для експертної навчальної системи запропонована логічна структура словотворчої бази знань і формальна
модель вузлів дерева, що включає опис методів словотвору з використанням функцій вибору.
A logical structure of word formation knowledge base and formal model of tree nodes, which includes a
description of the methods using the word choice was offered for expertise learning system.
|
| first_indexed | 2025-12-07T16:01:43Z |
| format | Article |
| fulltext |
«Искусственный интеллект» 1’2009 74
2В
УДК 004.89:004.4
С.М. Вороной, А.А. Егошина
Государственный университет информатики и искусственного интеллекта,
г. Донецк, Украина
smv@iai.donetsk.ua
Словообразовательная база знаний
экспертной обучающей системы
Для экспертной обучающей системы предложена логическая структура словообразовательной базы знаний и
формальная модель узлов дерева, включающая описание методов словообразования с использованием
функций выбора.
Введение
Проблема обработки естественноязыковой информации остается актуальной на
протяжении последних десятилетий. Системы информационного поиска, диалоговые
системы, средства машинного перевода и автоматического реферирования, модули про-
верки правописания используют анализ текстов, написанных на естественном языке.
Использование словообразовательного компонента в информационно-поисковых
системах предоставляет возможности для расширения полноты запроса, необходимость
которого вызвана малым количеством обнаруженных ресурсов. Наличие модуля сло-
вообразования в системах обработки текстов приспосабливает их к работе с неопо-
знанными словами, которые образованы путем сложения основ, конверсией частей
речи, с помощью аффиксов и т.д.
Словообразовательные процессы – это основной путь пополнения лексики
языка, в связи с этим модуль словообразования является неотъемлемой частью сов-
ременных интеллектуальных информационно-поисковых и обучающих систем с ес-
тественноязыковым интерфейсом.
Актуальность разработки системы обучения словообразованию обусловлена тем,
что знание словообразовательной системы способствует формированию и развитию
у изучающих русский язык навыков грамотной речи: правильного употребления
производных слов в структуре синтаксических единиц, соблюдения норм согласова-
ния и управления, умения пользоваться синонимическими разноуровневыми языковыми
средствами и т.д. [1].
Постановка задачи
Обучение включает в себя больше, чем просто представление информации;
необходима проверка действий обучаемого с динамичной обратной связью в про-
цессе обучения для избежания ошибочных выводов, а также отложенная обратная
связь для периодической оценки знаний обучаемого. Парадигма экспертной системы
позволяет очень четко разделить знания и их обработку, увеличивая возможность
многократного проведения такого процесса [2].
Одним из основных компонентов экспертной системы является база знаний (БЗ),
предназначенная для хранения долгосрочных данных, описывающих словообразова-
Словообразовательная база знаний экспертной обучающей системы
«Штучний інтелект» 1’2009 75
2В
тельную область (словари флективных классов, корней, аффиксов и окончаний) [3],
а также правил словообразовательного синтеза и чередований.
Разработка БЗ на основе устроенного по семантическому принципу словообра-
зовательного словаря Тихонова позволит применять при словообразовательном ана-
лизе и синтезе основные принципы объектно-ориентированного программирования, в
первую очередь – наследование. Мотивационные и семантические отношения в сло-
вообразовании можно трактовать и использовать как связи множественного насле-
дования признаков. Множественного наследования потому, что мотивированное слово
наследует признаки как минимум от двух источников: от слова основы и от словооб-
разующего форманта.
Целью статьи является разработка логической структуры БЗ для экспертной обу-
чающей системы словообразованию русского языка.
Словообразовательная база знаний
экспертной обучающей системы
Словообразовательная БЗ представляет собой лес, в качестве деревьев которого
выступают словообразовательные гнезда словаря Тихонова.
Дерево – одна из наиболее распространенных структур, используемых для
представления данных в ЭВМ. Подобные структуры широко применяются при орга-
низации банков данных, систем управления базами данных, в системах программного
имитационного моделирования сложных комплексов и т.д. Особое значение сетевые
структуры приобрели в системах искусственного интеллекта, в которых они адек-
ватно отражают логику организации данных и сложные отношения, возникающие в
таких системах между различными элементами данных. В этих системах деревья
применяются для представления логических конструкций, необходимых для пред-
ставления знаний, образования понятий и осуществления логических выводов.
Формально дерево (tree) представляет собой конечное множество Т одного или
более узлов со следующими свойствами:
существует один выделенный узел, а именно корень (root) данного дерева Т;
остальные узлы распределены среди m>=0 непересекающихся множеств Т1,…Тm,
и каждое из этих множеств в свою очередь является деревом, деревья Т1,…Тm
называются поддеревьями (subtrees) данного корня.
Выбор представления дерева зависит от решаемой задачи и способа ее решения.
Узлом дерева назовем структуру
)(,),( ijaa
k
ij xSzRUA , (1)
где U(R) – объединение элементов множества формантов R, представляющее собой
производящую основу;
za – часть речи слова, образующегося в узле Aji
k;
Sa(xji) – функция, задающая способ словообразования, с помощью которого об-
разуется узел Aji
k, xji – формант.
Корнями деревьев являются первые и обязательные ступени словообразования,
которые являются непроизводными.
На каждой ступени словообразования может быть образовано большое число
производных слов. Порядок размещения узлов (производных слов) дерева на каждом
ярусе учитывает их семантическую близость к родительскому узлу (производящему
слову), а также лексико-грамматические и словообразовательные отношения. Например,
Вороной С.М., Егошина А.А.
«Искусственный интеллект» 1’2009 76
2В
для имени существительного со значением лица наиболее семантически близкими
являются уменьшительно-ласкательные и увеличительные существительные; за ни-
ми идут названия лиц женского пола, детей (при названии животных – самок и
детенышей).
Самые близкие производные слова в лексико-грамматическом отношении для
качественных прилагательных – это формы оценки. Для глаголов – это возвратные
глаголы и существительные со значением процесса.
Наиболее широким является первый ярус дерева. Принцип размещения узлов
(производных слов) следующий:
1) если родительский узел – имя существительное, то дочерние узлы размещены
в таком порядке:
а) формы оценки исходного существительного;
б) остальные имена существительные;
в) имена прилагательные;
г) наречия;
д) префиксальные и префиксально-суффиксальные имена существительные
и имена прилагательные (в алфавитном порядке);
е) глаголы.
В каждом из этих разрядов может быть один, несколько или множество узлов.
Однако редки случаи, когда в ярусе встречаются все перечисленные разряды.
2) если родительский узел – имя прилагательное:
а) субстантивные прилагательные;
б) формы оценки исходного прилагательного;
в) бесприставочные имена прилагательные;
г) наречия;
д) имена существительные;
е) префиксальные прилагательные и наречия;
ж) глаголы.
3) если родительский узел – имя числительное:
а) собирательные числительные;
б) существительные;
в) количественные существительные;
г) наречия;
д) прилагательные.
4) если родительский узел – глагол:
а) возвратный глагол;
б) суффиксальная форма несовершенного вида;
в) однократный глагол;
г) многократный глагол;
д) отглагольные существительные;
е) причастия;
ж) прилагательные;
з) наречия;
и) префиксальные и префиксально-суффиксальные глаголы.
Местоимения и наречия как производящие основы выступают редко, поэтому
необходимость разработки принципа размещения производных не возникает.
Для учета описанного порядка размещения узлов в структуру, описывающую
элемент узла дерева, вводится дополнительный элемент К, представляющий собой
Словообразовательная база знаний экспертной обучающей системы
«Штучний інтелект» 1’2009 77
2В
бинарный массив, длина которого равна максимальному числу категорий перечис-
ленных выше частей речи. Наибольшим числом категорий, равным девяти, обладает
глагол
],...,[ 921 kkkK . (2)
Если у текущего родительского узла существуют потомки, обладающие i-м
свойством, то ki = 1, если же таких потомков нет или число свойств меньше i, то ki = 0.
То есть, например,
для существительного )06( ii kik ;
для прилагательного )07( ii kik .
Таким образом, структура (1) будет иметь вид
KxSzRUA ijaa
k
ij ),(,),( . (3)
Причем, под именами элементов массива будет подразумеваться название кате-
гории, свойственной части речи za. То есть, если узел – имя существительное, то
выражение k1 = 1 будет означать наличие потомков, обозначающих формы оценки
исходного существительного, однако если в качестве родительского узла выступает
глагол, то выражение k1 = 1 будет означать наличие потомков, являющихся возврат-
ными глаголами.
Рассмотрим первую ступень словообразования прилагательного бедный:
бедн(ый)
бедн-ейш-ий
бедн-оват-ый
бедн-еньк-ий
бедн-о
бедн-ость
бедн-от-а
бедн-як
без-бедн-ый
пре-бедн-ый
бедн-е-ть
при-бедн-ить-ся
Для данного примера элементы массива категорий будут иметь такие значения:
К={0,1,1,1,1,1,1,0,0}. Первые семь элементов обозначают наличие или отсутствие по-
томков, обладающих характеристиками, свойственными производным прилагательного.
Последние два элемента равны нулю, так как категорий производных прилагательного
существует только семь.
Аффиксы, хранящиеся в словарях, структура которых приведена в [3], будем
трактовать как факты БЗ. А функции Sa(xji), задающие законы словообразования, –
как правила БЗ.
Однако, следует отметить, что поведение одного и того же аффикса в разных
ситуациях различно, то есть одному и тому же аффиксу могут соответствовать раз-
ные правила.
Например, рассмотрим суффикс -щик при образовании имен существительных.
Случай 1: мотивирующее слово (родительский узел) – глагол. В данной ситуа-
ции суффикс -щик вызывает следующие чередования на морфемном шве: к – ч, г – ж,
л – ль (размолоть – размольщик). К тому же конечная гласная производящей основы
и финаль -ива не сохраняются (протирать – протирщик).
Случай 2: мотивирующее слово – имя прилагательное. В этом случае суффикс
-щик не дает чередований вообще. Но финали -н- (после согласной) и -ск- основы
Вороной С.М., Егошина А.А.
«Искусственный интеллект» 1’2009 78
2В
мотивирующего слова отсутствуют в образованном существительном (инструмен-
тальный – инструментальщик).
Случай 3: мотивирующее слово – имя существительное. В данной ситуации пе-
ред морфом -щик чередуются л – ль (факел – факельщик), ск – щ (сыск – сыщик), ст –
щ (поместье – помещик). Финаль -к- /-ок мотивирующего слова в производном слове
отсутствует (шарманка – шарманщик).
Таким образом, способ словообразования можно представить следующим вы-
ражением:
}{ ySsS ia , (4)
где si – способ словообразования объекта, выбираемый из множества S альтернатив-
ных способов, выбираемых по некоторому условию у.
Условие у представляет собой следующий кортеж:
,y , (5)
где π – совокупность сведений об объекте, а φ – множество правил (словообразова-
ния и чередования).
Сведения об объекте представляют собой множество информационных харак-
теристик, таких, как код аффикса (x), часть речи родительского узла и текущего (c),
финаль основы производящего слова (f)
fcx ,, . (6)
Части речи родительского и текущего узлов предлагается представить в виде
кодов, первый разряд которых соответствуют коду части речи родительского узла, а
второй – текущего.
Заключение
Таким образом, в настоящей работе предложена логическая структура словооб-
разовательной базы знаний и формальная модель узлов дерева, включающая описания
методов словообразования с использованием функций выбора.
В дальнейшем планируется разработка эвристического алгоритма нахождения
пути к узлу дерева, обладающему требуемой семантикой. Полученные результаты
применяются при разработке экспертной обучающей системы словообразованию
русского языка.
Литература
1. Потиха З.А. Современное русское словообразование. – М.: Просвещение, 1970.
2. Рыбина Г.В., Рыбин В.М. Опыт разработки и перспективы использования обучающих интегриро-
ванных экспертных систем в учебном процессе // Научная сессия МИФИ – 2007. Сб. научных тру-
дов: В 17 т. – М.: МИФИ. – Т. 3. Интеллектуальные системы и технологии. – С. 37-39.
3. Егошина А.А. Об одном способе построения статического словаря морфологического процессора // Мате-
риалы Седьмой Международной научно-технической конференции «Искусственный интеллект. Интел-
лектуальные и многопроцессорные системы – 2006». – Таганрог: Изд-во ТРТУ. – 2006. – Т. 2. – 404 с.
С.М. Вороной, Г.А. Єгошина
Словотворча база знань експертної навчальної системи
Для експертної навчальної системи запропонована логічна структура словотворчої бази знань і формальна
модель вузлів дерева, що включає опис методів словотвору з використанням функцій вибору.
S. Voronoy, А. Yegoshina
Word Formation Knowledge Base for Expertise Learning System
A logical structure of word formation knowledge base and formal model of tree nodes, which includes a
description of the methods using the word choice was offered for expertise learning system.
Статья поступила в редакцию 26.11.2008.
|
| id | nasplib_isofts_kiev_ua-123456789-7799 |
| institution | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| issn | 1561-5359 |
| language | Russian |
| last_indexed | 2025-12-07T16:01:43Z |
| publishDate | 2009 |
| publisher | Інститут проблем штучного інтелекту МОН України та НАН України |
| record_format | dspace |
| spelling | Вороной, С.М. Егошина, А.А. 2010-04-13T12:09:36Z 2010-04-13T12:09:36Z 2009 Словообразовательная база знаний экспертной обучающей системы / С.М. Вороной, А.А. Егошина // Штучний інтелект. — 2009. — № 1. — С. 74-78. — Бібліогр.: 3 назв. — рос. 1561-5359 https://nasplib.isofts.kiev.ua/handle/123456789/7799 004.89:004.4 Для экспертной обучающей системы предложена логическая структура словообразовательной базы знаний и формальная модель узлов дерева, включающая описание методов словообразования с использованием функций выбора. Для експертної навчальної системи запропонована логічна структура словотворчої бази знань і формальна модель вузлів дерева, що включає опис методів словотвору з використанням функцій вибору. A logical structure of word formation knowledge base and formal model of tree nodes, which includes a description of the methods using the word choice was offered for expertise learning system. ru Інститут проблем штучного інтелекту МОН України та НАН України Обучающие и экспертные системы Словообразовательная база знаний экспертной обучающей системы Словотворча база знань експертної навчальної системи Word Formation Knowledge Base for Expertise Learning System Article published earlier |
| spellingShingle | Словообразовательная база знаний экспертной обучающей системы Вороной, С.М. Егошина, А.А. Обучающие и экспертные системы |
| title | Словообразовательная база знаний экспертной обучающей системы |
| title_alt | Словотворча база знань експертної навчальної системи Word Formation Knowledge Base for Expertise Learning System |
| title_full | Словообразовательная база знаний экспертной обучающей системы |
| title_fullStr | Словообразовательная база знаний экспертной обучающей системы |
| title_full_unstemmed | Словообразовательная база знаний экспертной обучающей системы |
| title_short | Словообразовательная база знаний экспертной обучающей системы |
| title_sort | словообразовательная база знаний экспертной обучающей системы |
| topic | Обучающие и экспертные системы |
| topic_facet | Обучающие и экспертные системы |
| url | https://nasplib.isofts.kiev.ua/handle/123456789/7799 |
| work_keys_str_mv | AT voronoism slovoobrazovatelʹnaâbazaznaniiékspertnoiobučaûŝeisistemy AT egošinaaa slovoobrazovatelʹnaâbazaznaniiékspertnoiobučaûŝeisistemy AT voronoism slovotvorčabazaznanʹekspertnoínavčalʹnoísistemi AT egošinaaa slovotvorčabazaznanʹekspertnoínavčalʹnoísistemi AT voronoism wordformationknowledgebaseforexpertiselearningsystem AT egošinaaa wordformationknowledgebaseforexpertiselearningsystem |