Концептуальные графы и семантические сети в системах обработки естественно-языковой информации
У роботі розглянуто підхід до адаптації відомих описів концептуальних графів стосовно візуалізації формалізованого подання природничо-мовних висловлювань для флективних мов. В работе рассмотрен подход к адаптации известных описаний концептуальных графов применительно к визуализации формализованного...
Збережено в:
| Опубліковано в: : | Математичні машини і системи |
|---|---|
| Дата: | 2009 |
| Автори: | , , |
| Формат: | Стаття |
| Мова: | Російська |
| Опубліковано: |
Інститут проблем математичних машин і систем НАН України
2009
|
| Теми: | |
| Онлайн доступ: | https://nasplib.isofts.kiev.ua/handle/123456789/47220 |
| Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Цитувати: | Концептуальные графы и семантические сети в системах обработки естественно-языковой информации / А.В. Палагин, С.Л. Кривой, Н.Г. Петренко // Мат. машини і системи. — 2009. — № 3. — С. 67–79. — Бібліогр.: 5назв. — рос. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraine| _version_ | 1859665700678795264 |
|---|---|
| author | Палагин, А.В. Кривой, С.Л. Петренко, Н.Г. |
| author_facet | Палагин, А.В. Кривой, С.Л. Петренко, Н.Г. |
| citation_txt | Концептуальные графы и семантические сети в системах обработки естественно-языковой информации / А.В. Палагин, С.Л. Кривой, Н.Г. Петренко // Мат. машини і системи. — 2009. — № 3. — С. 67–79. — Бібліогр.: 5назв. — рос. |
| collection | DSpace DC |
| container_title | Математичні машини і системи |
| description | У роботі розглянуто підхід до адаптації відомих описів концептуальних графів стосовно візуалізації формалізованого подання природничо-мовних висловлювань для флективних мов.
В работе рассмотрен подход к адаптации известных описаний концептуальных графов применительно к визуализации формализованного представления естественно-языковых высказываний для флективных языков.
In this work, the approach to adaptation of known descriptions of conceptual graphs with reference to visualization of the formalized representation of naturally-language statements for inflectional languages is considered.
|
| first_indexed | 2025-11-30T11:22:44Z |
| format | Article |
| fulltext |
© Палагин А.В., Кривой С.Л., Петренко Н.Г., 2009 67
ISSN 1028-9763. Математичні машини і системи, 2009, № 3
УДК 004.318
А.В. ПАЛАГИН, С.Л. КРИВОЙ, Н.Г. ПЕТРЕНКО
КОНЦЕПТУАЛЬНЫЕ ГРАФЫ И СЕМАНТИЧЕСКИЕ СЕТИ В СИСТЕМАХ
ОБРАБОТКИ ЕСТЕСТВЕННО-ЯЗЫКОВОЙ ИНФОРМАЦИИ
Abstract: In this work, the approach to adaptation of known descriptions of conceptual graphs with reference to visualization
of the formalized representation of naturally-language statements for inflectional languages is considered.
Key words: semantic networks, conceptual graphs, logic of predicates of the first order.
Анотація: У роботі розглянуто підхід до адаптації відомих описів концептуальних графів стосовно
візуалізації формалізованого подання природничо-мовних висловлювань для флективних мов.
Ключові слова: семантичні мережі, концептуальні графи, логіка предикатів першого порядку.
Аннотация: В работе рассмотрен подход к адаптации известных описаний концептуальных графов
применительно к визуализации формализованного представления естественно-языковых высказываний
для флективных языков.
Ключевые слова: семантические сети, концептуальные графы, логика предикатов первого порядка.
1. Введение
Проблема поиска, представления, понимания и компьютерной обработки естественно-языковых
объектов (ЕЯО) является одной из наиболее сложных проблем в свете решения соответствующих
задач искусственного интеллекта, в частности, построения эффективного человеко-машинного
общения на языке, близком к естественному.
Сложность этой проблемы состоит в том, что ЕЯО плохо формализуются и вследствие
этого плохо поддаются автоматизации. В настоящее время существуют только некоторые частные
подходы к формализации и автоматизации при решении этой проблемы. Как правило, эти подходы
основываются на использовании языка формальной математической логики (классической и
неклассической). Наиболее часто используется логика предикатов первого порядка с применением
правила резолюций в качестве основного правила вывода и другими вспомогательными
правилами. Особенно активно в последнее десятилетие развивается подход к представлению и
анализу естественно-языковых объектов (ЕЯО) с использованием темпоральной и
экстенсиональной логик. В этих логиках правило резолюций не работает, и тут используются
теоретико-автоматные методы исследования, методы семантического табло либо равносильные
им.
2. Постановка задачи
В данной работе дан краткий обзор метода представления и обработки ЕЯО с использованием
языка предикатов первого порядка. Данный формализм охватывает проблему анализа текстов в
сочетании с методом резолюций.
Уместно уточнить, что проблему компьютерной обработки ЕЯО мы подразделяем на три
подпроблемы:
а) представления ЕЯО;
б) получения следствий, проверки выполнимости, противоречивости или непро-
тиворечивости заданного множества формул на основе выбранного представления;
в) получения цепочки формального доказательства выводимости следствий, выполнимости
(невыполнимости) заданного множества следствий.
ISSN 1028-9763. Математичні машини і системи, 2009, № 3 68
Анализ перечисленных подпроблем показывает, что использование формальных методов
проверки непротиворечивости или выполнимости множества формул в системах гильбертовского
типа (т.е. систем, в которых доказательства получаются формальным образом из аксиом путем
применения правил вывода) для подпроблемы в) не имеет более-менее удовлетворительного
решения. Дело в том, что системы гильбертовского типа не являются структурированными, т. е.
для сбора необходимой информации по одному единственному объекту необходимо
просматривать все множество логических формул, которые находятся в системе (обычно такой
системой является реляционная база данных). К сожалению, этим недостатком страдают все
формальные логические системы гильбертовского типа. В целях устранения этого недостатка было
предложено графическое представление формул и их аргументов, которое служит глобализации и
структурированию информации. Основой графического представления являются концептуальные
графы (КГ) и более сложные структуры – семантические сети (СС). Такое представление позволяет
визуализировать модель естественно-языковой картины мира и, в случае необходимости, весь
процесс доказательства или процесс вывода.
3. Неформальные определения и примеры
Введем формальные определения упомянутых выше понятий КГ и СС, а также приведем примеры
для иллюстраций этих понятий.
Определение 1. Концептуальным графом называется размеченный двудольный
ориентированный граф 1 2( , )G V V E= ∪ , где 1 2V V∩ = ∅ , вершины из 1V размечены именами
предикатов, а вершины из 2V – именами аргументов; E – множество дуг (ориентированных ребер).
Дуги графа соединяют вершины, помеченные именами предикатов, с вершинами, помеченными
именами аргументов. Вершины из множества 1V называются узлами-предикатами, вершины из 2V
– узлами-концептами, а сами предикаты – концептуальными предикатами.
Из приведенного определения следует, что концептуальный граф должен удовлетворять
таким условиям:
1) количество дуг, связывающих узлы-предикаты с узлами-концептами, равно арности
предиката (т.е. числу его аргументов);
2) все узлы-предикаты, помеченные символом одного и того же концептуального предиката,
имеют одинаковую арность;
3) все дуги, связывающие узлы-предикаты и узлы-концепты в КГ, упорядочены от 1 до n ,
где n – арность предиката;
4) графически узлы-предикаты обозначаются эллипсами, а узлы-концепты –
прямоугольниками.
Если используемый логический язык типизирован, т.е. его объектам приписаны некоторые
типы, то с каждым концептуальным предикатным символом связывается кортеж >< cba ,...,, ,
называемый сигнатурой этого предиката. Или, другими словами, сигнатура предиката описывает
семантическую модель правильного употребления аргументов в синтаксической структуре
ISSN 1028-9763. Математичні машини і системи, 2009, № 3 69
некоторого ЕЯ-предложения с максимальной выразительной мощностью. Под максимальной
выразительной мощностью понимается соответствующий кортеж без пустых элементов.
КГ не случайно выбраны в качестве структур данных для представления предикатов и их
аргументов. Эти структуры прошли длительную апробацию в системах баз данных и
зарекомендовали себя с наилучшей стороны. Это проявляется, прежде всего, в эффективности
выполнения операций на таких структурах данных. Операции на множестве КГ выполняются с
целью эффективного построения более сложной структуры – семантической сети.
Определение 2. Семантической сетью называется объединение заданного множества
концептуальных графов вместе с описанием их взаимосвязей и погружением в контекст области
рассуждений.
Для подкрепления этих полуформальных определений КГ и СС рассмотрим примеры,
иллюстрирующие эти понятия.
Пример 1. Рассмотрим предложение
“КГ описывает семантику некоторого высказывания”. (1)
Соответствующий этому предложению концептуальный граф представлен ниже.
Заметим, что КГ может иметь различные представления, которые включают некоторые
уточнения, характеристики контекста или семантики.
В то время, как КГ представляют одну логическую формулу, СС представляет совокупность
КГ, погруженных во взаимосвязи и общий контекст рассуждений. СС получаются из КГ по правилам
конъюнкции и упрощения. Эти формальные правила сводятся к следующему: пусть дано два КГ 1G
и 2G , тогда КГ G строится из этих графов путем применения правил конъюнкции и упрощения.
Правило конъюнкции (ПК): Если узел-концепт 1c в 1G идентичен узлу-концепту 2c в 2G ,
то G получается удалением 2c и соединением с 1c всех связывающих узлов, которые были
связаны с 2c в 2G .
Правило упрощения (ПУ): Если КГ G после соединения содержит два идентичных
(соединенных с одними и теми же узлами-концептами) связывающих узла, то можно удалить один
из них вместе со связанными с ним дугами.
Пример 2. В качестве первого графа возьмем КГ из примера 1, а второй КГ соответствует
предложению
“КГ описывает семантику предложения с одной грамматической основой”. (2)
КГ Семантика
Высказывание:
Описывать
ISSN 1028-9763. Математичні машини і системи, 2009, № 3 70
В результате применения ПУ к концептуальным графам высказываний (1) и (2) получим
семантическую сеть для указанных концептуальных графов, показанную ниже. Иногда такую СС
называют объединенным КГ.
Далее основное внимание будет сосредоточено на КГ и методах их представления,
типизации и обработки.
4. Способы представления КГ и их характеристика
Представление семантической модели ЕЯО в зависимости от типов решаемых задач (и
соответствующих КГ) может иметь различную степень детализации. При этом различают две
задачи формально-логического представления ЕЯО в процессе компьютерного анализа и
интерпретации.
Первая из них относится к внутриязыковой обработке, при которой результат
семантического анализа представляется наиболее полными логическими выражениями в
соответствующем логическом базисе. Их формирование осуществляется параллельно с
процедурой снятия лексической неоднозначности, которая предполагает детализацию КГ и
эксплицитное представление соответствующих контекстных зависимостей.
Вторая задача относится к внеязыковой (или постязыковой, машинной) обработке, к этапу
создания базы знаний (БЗ) предметной области (ПдО), а точнее – к созданию базы правил
логического вывода. Такая база должна содержать короткие правила (занимать мало места в
памяти), позволяющие реализовывать эффективный вывод (с точки зрения быстродействия) [3].
Из анализа указанных задач следует, что для первой задачи нужно использовать
детализированные КГ, а для второй – обобщенные КГ и соответствующие СС.
Ниже будут рассмотрены некоторые определения и правила построения детализированных
КГ, базирующиеся на концептуальных графах Дж. Совы [1, 2]. Также будут рассмотрены основные
проблемы, связанные с автоматическим построением детализированных КГ (описывающих
входной ЕЯО), и предложены пути их преодоления.
Для наглядности описания детализированных концептуальных графов (далее
концептуальных графов) будем использовать естественно-языковые высказывания (ЕЯВ) из ПдО
“Интеллектуальные информационные системы (ИИС)” и определение семантической сети, взятое
из [3]. Формирование структуры КГ, соответствующей указанному определению, будем проводить в
три этапа: от простых трех высказываний (составляющих ядро определения семантической сети) –
ISSN 1028-9763. Математичні машини і системи, 2009, № 3 71
на первом этапе, к их расширенным аналогам – на втором этапе и их объединению (полному
определению) – на третьем.
Рассмотрим первое высказывание первого этапа (из упомянутого определения
семантической сети) и соответствующий ему КГ (рис.1).
Ι.1. “Сети представляются в виде графа”.
Рис. 1. Концептуальный граф для высказывания Ι.1
Существует и линейная форма записи КГ. При этом прямоугольники заменяются
квадратными скобками, а эллипсы – круглыми.
Обе формы записи: графическая и линейная, – представляют один и тот же абстрактный
граф. Существует алгоритм, с помощью которого можно каждому КГ сопоставить формулу логики
предикатов первого порядка. С помощью этого алгоритма КГ на рис. 1 преобразуется в
нижеследующую формулу логики предикатов. Причем, если никакой другой квантор не определен в
поле концепта, то квантором по умолчанию является квантор существования ∃.
Неформально КГ – некоторая структура концептов и концептуальных отношений, где
каждая дуга связывает некоторое концептуальное отношение R с некоторым концептом C .
Такое представление детализированных КГ несколько отличается от введенного выше
описания. Объединение узлов концептов-предикатов и узлов концептов-аргументов в узлы-
концепты и введение другого вида узлов – узлов-концептуальных отношений (рис. 1: агент, тема)
является одним из главных моментов сути детализации. При этом узел концепта-предиката
назовём главным узлом-концептом, а узлы концептов-аргументов – просто узлами-концептами.
Такое преобразование, по сути, детализирует семантические отношения в синтаксической
структуре предложения и представляет их в явном виде.
Компоненты структуры КГ определяются нижеследующими определениями:
• Каждая дуга E в G связывает концептуальное отношение R с концептом C . Дуга E
принадлежит отношению R и не принадлежит концепту C .
• Концептуальный граф G может иметь концепты, которые не связаны ни с каким
концептуальным отношением, но любая дуга, принадлежащая некоторому концептуальному
отношению в G , должна быть присоединена только к одному концепту.
• Подграфами концептуального графа G могут быть:
а) пустой граф, который не имеет ни концептов, ни концептуальных отношений, ни дуг;
б) одноэлементный граф, который состоит из одного концепта;
в) граф-звезда, который состоит из одного концептуального отношения и концептов,
присоединенных к его дугам.
ISSN 1028-9763. Математичні машини і системи, 2009, № 3 72
Рассмотрим следующие два высказывания первого этапа и концептуальные графы для них
запишем в линейной форме (рис. 2).
Ι.2. “Вершины соответствуют объектам”.
Ι.3. “Дуги соответствуют отношениям”.
Рис. 2. Высказывания Ι.2 и Ι.3 и их концептуальные графы
Второй этап
Каждый концепт C имеет тип t и референт r . Слева записывается концепт-тип, а через
двоеточие справа записывается подтип (элемент, терм, конкретное имя), который присутствует в
высказывании. А теперь рассмотрим концептуальный граф для высказывания “Сеть высказывания
Ι.1 представляется в виде концептуального графа”. Для него концепт [Сеть] примет вид [Сеть:
Высказывание_Ι.1]. Такое представление предполагает наличие онтологии ПдО “ИИС” (и базы
знаний, содержащей список высказываний,
в том числе Ι.1), фрагмент которой
представлен на рис. 3.
Каждое концептуальное отношение
R имеет реляционный тип t и целое
неотрицательное число n , названное
арностью.
Число дуг, которые принадлежат R ,
равно арности n , при этом сами дуги
нумеруются от 1 до n .
Для каждого n -арного R
существует последовательность, состоящая из n концептных типов >< nccc ,...,, 21 , названная
сигнатурой R . Сигнатура >< ncccR ,...,, 21 является частным случаем сигнатуры концепта-
предиката >< cba ,...,, . Сигнатура отношения в общем виде представляет ограничение на типы
концептов, которые могут быть связаны с его дугами.
Например, для отношения “Агент” сигнатура – <Действие,
Сущность>, которая указывает, что тип концепта, связанного
с его правой дугой, должен быть “Действие” или некоторым
его подтипом в онтологической иерархии. Для высказывания
Ι.1 используемое отношение “Агент” предполагает
следующую онтологическую иерархию (рис. 4).
Концепты-типы и концептуальные отношения имеют
иерархические структуры, которые представляют собой
Рис. 3. Фрагмент онтологии концепта “Сеть”
из ПдО “ИИС”
Рис. 4. Фрагмент онтологии
для концепта-типа “Действие”
ISSN 1028-9763. Математичні машини і системи, 2009, № 3 73
частично упорядоченные множества T и R соответственно, чьи элементы обозначают типы
концептов и отношений. Каждое обозначение концепта в T и отношения в R определено как
примитив или как частичное упорядочение по T и R отношениям подтипа с символом ≤ – для
подтипа, < – для собственного подтипа, ≥ – для супертипа и > – для собственного супертипа.
Референт концепта определен квантором и указателем. Квантором может быть или
квантор существования или квантор всеобщности или обозначения: количества – (@1) и набора
{1,2,3}.
Квантор существования представлен или символом ∃ или отсутствием любого другого
символа квантора или выражения.
Квантор всеобщности представлен или символом ∀ или выражением в расширенном
синтаксисе, которое может быть оттранслировано в концептуальные графы, содержащие только
кванторы существования.
Указатель в поле референта может быть трех видов.
Литерал – синтаксическое представление формы референта. Литералы также бывают трех
видов – числа, строки символов и закодированные литералы, которые определены парой,
состоящей из идентификатора и строки.
Локатор – символ, который определяет, как может быть найден референт. Существуют два
вида локаторов, отличающихся способом определения референта: индивидуальный маркер
(определяет уникальный концепт в каталоге экземпляров БЗ) и индексированный маркер (символ,
определяющий референт в соответствии с некоторыми соглашениями, которые являются
независимыми от текущей БЗ), начинающийся с символа #.
Дескриптор – концептуальный граф, который описывает референт.
Референт концепта определяет сущность или множество сущностей, к которым относится
концепт.
Вместо обращения к объекту по маркеру или по имени можно использовать обобщенный
маркер “∗” для определения неспецифицированных экземпляров. Эта информация часто
опускается в метках понятий: узел, заданный только меткой типа [Вершина], эквивалентен узлу
[Вершина: ∗]. Дополнительно к обобщенному маркеру КГ позволяют использовать именованные
переменные. Они представляются звездочкой, за которой следует имя переменной, например,
[Вершина: ∗х]. Это позволяет указывать в разных концептуальных графах один и тот же
обобщенный концепт-тип.
В КГ под контекстом понимается концепт с вложенным КГ, который описывает референт. В
свою очередь, вложенный КГ может содержать концепты с вложенными концептуальными
графами, т.е. концепты могут быть вложенными.
Кореферентным множеством C в концептуальном графе G называется множество
концептов, отобранных из G или из графов, вложенных в контексты G .
В графической системе обозначений элементы кореферентного множества могут быть
соединены пунктирными линиями, которые называются кореферентными связями.
ISSN 1028-9763. Математичні машини і системи, 2009, № 3 74
В линейной системе обозначений два концепта могут быть связаны пунктирной линией
только тогда, когда они записаны рядом друг с другом в одной и той же строке.
В ЕЯВ кореферентная связь обычно выражается некоторой формой глагола быть.
Например, КГ может быть прочитан так: “Некоторый
концептуальный граф есть естественно-языковое высказывание“. В исчислении предикатов
кореферентная связь соответствует равенству (∃x: КГ)(∃y: ЕЯВ) yx = .
В теоретическом базисе концептуальных графов определено понятие базы знаний, под
которым подразумевается контекст типа KnowledgeBase, десигнатором его является некоторый
полифункциональный КГ, состоящий из четырех компонентов:
– иерархия типов. Контекст типа TypeHierarchy, десигнатором которого является КГ T,
который определяет частичное упорядочение обозначений типа и одноместных лямбда-выражений
для каждого определенного обозначения типа;
– иерархия отношений. Контекст типа RelationHierarchy, десигнатором которого является
КГ R, который определяет частичное упорядочение отношений, а также арности для каждого
отношения;
– каталог используемых индивидов. Контекст типа CatalogofIndividuals, десигнатором
которого является КГ C, содержащий точно один концепт для каждого индивидуального маркера
КГ C и может быть использован в БЗ. Десигнатор может содержать другие концепты и отношения,
что описывают индивиды;
– верхний уровень контекста (контекст типа Assertion), десигнатором которого является
КГ А.
Содержание БЗ должно удовлетворять следующим ограничениям:
– обозначения типов в любом концептуальном графе должны быть специфицированы в T ;
– обозначения отношений в любом концептуальном графе должны быть специфицированы
в R ;
– индивидуальные маркеры в любом концептуальном графе должны быть
специфицированы в C .
Обозначения типов KnowledgeBase, TypeHierarchy, RelationHierarchy, CatalogofIndividuals и
Assertion являются метауровневыми обозначениями и не специфицируются в T .
Приведенное определение соотносит БЗ с единственным концептом, который также может
быть вложен в другую базу знаний. Каталог индивидов перечисляет все именованные сущности в
выбранной для исследования предметной области.
Для дальнейшего рассмотрения основ построения концептуальных графов на рис. 5
представлены расширенные высказывания второго этапа и соответствующие им концептуальные
графы.
II.1. “Семантические сети представляются в виде направленного графа”.
Представляться_
в_виде
ТемаАгент
Направленный_
граф
Семантическая_
сеть
ISSN 1028-9763. Математичні машини і системи, 2009, № 3 75
II.2. “Вершины направленного графа соответствуют объектам (понятиям, сущностям)
предметной области”.
II.3. “Дуги направленного графа соответствуют отношениям (связям) между
объектами”.
Рис. 5. Расширенные высказывания второго этапа и их КГ
В расширенных ЕЯВ второго этапа введенные (на первом этапе) концепты-типы
конкретизируются, для некоторых из них добавляются новые концептуальные отношения и
вводятся понятия-синонимы. Указанные расширенные ЕЯВ представляют собой три составляющие
(три грамматические основы) одного из принятых формальных определений семантической сети.
На третьем этапе, объединив соответствующие КГ, мы получим результирующий КГ (или
семантическую сеть) для указанного определения.
Несмотря на огромную популярность концептуальных графов, в известной методологии их
построения [1, 2] имеется ряд задач, при решении которых у разработчика конкретной знание-
ориентированной компьютерной системы возникают серьезные трудности, разрешение которых
порой оказывается проблематичным. Например, в случае компьютерной обработки естественно-
языковых объектов (ЕЯО):
– не определены принципы построения иерархии концептов-типов и концептуальных
отношений, а также механизмы их обработки;
– отсутствует механизм функционального анализа ЕЯВ (определения ролевых функций
членов предложения);
– не определен механизм выделения терминов из ЕЯО, описывающих некоторую ПдО,
причем термины могут состоять из нескольких словоформ различных частей речи (например,
“семантическая сеть”, “направленный граф” и др.);
Соответствовать ТемаАгент ОбъектВершина
Часть
Представлены в
Понятие
Сущность
Предметная
область
Соответствовать ТемаАгент ОтношениеДуга
Между
Связь
Объект
ISSN 1028-9763. Математичні машини і системи, 2009, № 3 76
– не определен механизм разрешения индексированных меток (или проблемы
анафорических связей);
– не определен механизм фильтрации или отбора из терминов рассматриваемой ПдО
концептов и концептов-индивидов;
– не определены механизмы системной интеграции лингвистического и предметного
аспектов анализа ЕЯО;
– не определены механизмы квантификации переменных;
– введенное понятие кореферентного множества сформулировано неоднозначно для
понимания;
– не определены механизмы формирования шаблонов сигнатур для концептуальных
отношений.
Решение проблем, возникающих в связи с устранением описанных выше недостатков,
возможно на основе принципов и механизмов построения языково-онтологической
информационной системы (ЯОИС). Подробно ЯОИС рассматривается в ряде работ [4, 5 и др.].
Применительно к проблеме построения концептуальных графов в ЯОИС задействованы
компоненты: “Языково-онтологическая картина мира (ЯОКМ)”, “Онтология ПдО” и “Грамматический
процессор”. ЯОКМ представляет собой общелингвистическую онтологию, компонентами которой
являются онтологии лексем таких частей речи, как существительное, глагол, прилагательное и
наречие. Онтология ПдО представляет собой онтологическую структуру концептов-типов ПдО,
специфичных для нее концептуальных отношений и лексических средств. Системная интеграция
указанных онтологий (лингвистической и предметной области) совместно с базой фактов и правил
вывода для рассматриваемой ПдО содержит в себе в некотором виде концепт KnowledgeBase, а
грамматический процессор формирует структурные единицы соответствующих иерархий.
Концепты различаются по разновидностям, тесно связанным с грамматическими
характеристиками ЕЯВ. При построении алгоритма интерпретации ЕЯВ и его КГ важная роль
отводится глаголам-сказуемым, поскольку они определяют отношения между подлежащим,
дополнением и другими компонентами предложения. Помимо концептов, необходимо определить
концептуальные отношения, которые будут использованы в КГ. В общем случае для связи
компонент в предложении верхний уровень иерархии отношений можно определить следующим
образом:
• Слово Агент служит для обозначения отношения, связывающего концепт Действие с
концептом Сущность. Здесь следует различать концепт Сущность как одушевленный объект и
неодушевленный. Следовательно, применяются разные интерпретации отношения Агент.
• Слово Носитель_состояния служит для обозначения отношения, связывающего концепт
Состояние с концептом Одушевленный, отражающее связь между психическим состоянием и его
носителем.
• Слово Объект служит для обозначения отношения, связывающего концепт Событие или
Состояние с концептом Сущность.
ISSN 1028-9763. Математичні машини і системи, 2009, № 3 77
• Слово Инструмент служит для обозначения отношения, связывающего концепт
Действие с концептом Сущность, и определяет инструмент, используемый для выполнения
действия.
• Слово Часть служит для обозначения отношения, связывающего концепты “Часть-целое”.
• Слово Тема служит для обозначения отношения, связывающего концепт Событие или
Состояние с концептом Сущность некоторой абстрактной формы.
• Слово Время маркирует время действия глагола-сказуемого в предложении.
• Слово Цель связывает концепт с другим концептом, который представляет его цель.
• Слово Пациент связывает концепт Действие с концептом Одушевленный, на кого
направлено действие.
• Слово Способ связывает концепт Действие с концептом, обозначающим способ
выполнения действия (в предложении обычно выражается наречием).
• Слова, обозначающие предлоги (в, на и др.) маркируют отношения семантики падежных
форм существительных.
• И другие.
Предположим, что указанная обработка ЕЯВ второго этапа уже выполнена. Тогда,
применив операцию объединения к концептуальным графам (рис. 5), получим синтезированную СС
для третьего этапа (рис. 6).
Рис. 6. СС ЕЯВ третьего этапа
Она может быть прочитана следующим образом.
Семантические сети представляются в виде направленного графа, вершины которого
соответствуют объектам (понятиям, сущностям) предметной области, а дуги – отношениям
(связям) между объектами.
Представляться в видеАгент1
Направленный граф :
Семантическая сеть : *?
Соответствовать
Агент2
Вершина :
Часть
Предметная_область :
Отношение : *?
Дуга :
Между
Связь : *?
Тема1
Тема2
Представлять в
Объект : *? Понятие : *?
Сущность : *?
ISSN 1028-9763. Математичні машини і системи, 2009, № 3 78
Для формирования шаблонов сигнатур концептуальных отношений требуется разработать
алгоритм их извлечения из интегрированной онтологии “ЯОКМ∧ Онтология_ПдО” (где они
представлены в неявном виде) и эксплицитного представления.
Концептуальные графы могут включать концепт-тип [Суждение], объектом ссылки которого
является множество концептуальных графов. Этот концепт изображается прямоугольником,
содержащим указанное множество концептуальных графов.
КГ позволяют легко представить такие конъюнктивные понятия, как “Граф содержит
вершины и дуги“. Сложнее обстоит вопрос с операциями отрицания и дизъюнкции.
Операция отрицания “Не” вводится как операция, аргументом которой является концепт-тип
[Суждение]. При этом высказывание становится ложным. Так, высказывание “Не существует
графов без вершин и дуг“ может быть представлено следующим образом.
Используя отрицание и
конъюнкцию, можно формировать КГ
для представления дизъюнктивных
утверждений в соответствии с
правилами логики. Предполагается, что
в КГ родовые понятия связаны
квантором существования. Используя отрицание и квантор существования, можно представить
квантор всеобщности. Например, КГ на рис. 7 можно рассматривать как представление логического
выражения
( ) ( ) ( ) ( )
( ) ( )( ) ⋅
∧∧
∧∧∧∧
¬∀∀∀∀
32,41,4
4321
4321
XXXТемаXXАгент
XСодержатьXДугаXВершинаXГраф
XXXX
Концептуальные графы по своей выразительной мощности эквивалентны исчислению
предикатов первого порядка. Существует прямое соответствие представления КГ системе
обозначений исчисления предикатов. В [2] предложен алгоритм представления некоторого
концептуального графа G формулой исчисления предикатов. Суть его сводится к выполнению
таких шагов:
1. Каждое из n родовых концептов G связать с отдельной переменной nxxx ,...,, 21 .
2. Каждое конкретное понятие в G связать с отдельной константой. Эта константа может
быть просто именем или маркером, используемым для указания объекта ссылки для данного
понятия.
3. Представить каждый узел концепта унарным предикатом, имя которого соответствует
типу этого узла, аргументом которого является переменная или константа данного узла.
4. Представить каждое n -арное концептуальное отношение на графе G n -арным
предикатом с тем же именем. Каждый аргумент предиката является переменной или константой,
соответствующей узлу концепта, связанного с этим отношением.
5. Сформировать тело выражения исчисления предикатов в виде конъюнкции атомарных
выражений, построенных в п.п. 3.4. Все переменные в выражении считаются связанными
квантором существования.
Рис. 7. КГ с операцией отрицания
ISSN 1028-9763. Математичні машини і системи, 2009, № 3 79
Для примера приведем конечные выражения исчисления предикатов для КГ ЕЯВ второго
этапа (рис. 5), полученные в результате применения описанного выше алгоритма. При этом:
– родовые концепты КГ для ЕЯВ II.1 связаны с переменными: X1 – “Семантическая_сеть”,
X2 – “Направленный_граф”, X11 – “Представляться_в_виде”;
– родовые концепты КГ для ЕЯВ II.2 связаны с переменными: X3 – “Вершина”, X4 –
“Объект”, X5 – “Понятие”, X6 – “Сущность”, X7 – “Предметная_область”, X12 – “Соответствовать”;
– родовые концепты КГ для ЕЯВ II.3 связаны с переменными: X8 – “Дуга”, X9 –
“Отношение”, X10 – “Связь”, X12 – “Соответствовать”.
II.1.
( ) ( )
( ) ( ) ( ) ⋅
∧∧∧
∧∧
∃∃∃
2,1111,11111__
2_1_
1121
XXТемаXXАгентXвидевтьсяПредставля
XграфыйНаправленнXсетькаяСемантичес
XXX
II.2.
II.3.
5. Выводы
В работе рассмотрен подход к адаптации известных описаний КГ декларативного характера
применительно к визуализации формализованного представления ЕЯВ для флективных
(например, русского или украинского) языков. Основным назначением построения КГ является
создание компьютерных систем, которые предоставляли бы возможность явного представления
знаний, извлеченных из ЕЯО, и позволили бы их анализировать. Показана недостаточность
выразительной мощности известных представлений КГ при создании прикладных систем, а также
предложены некоторые пути по ее преодолению. Суть предложений сводится к применению
онтологического подхода к проектированию КГ в системе описательных средств компьютерной
системы, в частности, использования общелингвистической и предметной онтологий.
СПИСОК ЛИТЕРАТУРЫ
1. Sowa, John F. Knowledge Representation: Logical, Philosophical, and Computational Foundations. – Brooks Cole
Publishing Co., Pacific Grove, CA, 2000. – 594 p.
2. Sowa J.F. Conceptual Structures: Information Processing in Mind and Machine. Reading, MA: Addison – Wesley,
1984.
3. Палагин А.В., Яковлев Ю.С. Системная интеграция средств компьютерной техники. – Винница:
«УНІВЕРСУМ-Вінниця», 2005. – 680 с.
4. Палагін О.В., Петренко М.Г. Розбудова абстрактної моделі мовно-онтологічної інформаційної системи //
Математичні машини і системи. – 2007. – № 1. – С. 42 – 50.
5. Палагин А.В., Петренко Н.Г. К вопросу системно-онтологической интеграции знаний предметной области //
Математичні машини і системи. – 2007. – № 3, 4. – С. 63 – 75.
Стаття надійшла до редакції 20.01.2009
( ) ( ) ( ) ( )
( ) ( ) ( ) ⋅
∧∧∧
∧∧∧∧
∃∃∃∃
10,99,1228,122
121098
121098
XXБытьXXТемаXXАгент
XоватьСоответствXСвязьXОтношениеXДуга
XXXX
( ) ( ) ( ) ( )
( ) ( )
( ) ( ) ( )
( ) ( ) ( )
⋅
∧∧∧
∧∧∧
∧∧∧
∧∧∧∧
∃∃∃∃∃∃
6,45,47,4_
2,34,1223,122
127_
6543
1276543
XXБытьXXБытьXXвтьПредставля
XXЧастьXXТемаXXАгент
XоватьСоответствXобластьПредметная
XСущностьXПонятиеXОбъектXВершина
XXXXXX
|
| id | nasplib_isofts_kiev_ua-123456789-47220 |
| institution | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| issn | 1028-9763 |
| language | Russian |
| last_indexed | 2025-11-30T11:22:44Z |
| publishDate | 2009 |
| publisher | Інститут проблем математичних машин і систем НАН України |
| record_format | dspace |
| spelling | Палагин, А.В. Кривой, С.Л. Петренко, Н.Г. 2013-07-10T16:42:39Z 2013-07-10T16:42:39Z 2009 Концептуальные графы и семантические сети в системах обработки естественно-языковой информации / А.В. Палагин, С.Л. Кривой, Н.Г. Петренко // Мат. машини і системи. — 2009. — № 3. — С. 67–79. — Бібліогр.: 5назв. — рос. 1028-9763 https://nasplib.isofts.kiev.ua/handle/123456789/47220 004.318 У роботі розглянуто підхід до адаптації відомих описів концептуальних графів стосовно візуалізації формалізованого подання природничо-мовних висловлювань для флективних мов. В работе рассмотрен подход к адаптации известных описаний концептуальных графов применительно к визуализации формализованного представления естественно-языковых высказываний для флективных языков. In this work, the approach to adaptation of known descriptions of conceptual graphs with reference to visualization of the formalized representation of naturally-language statements for inflectional languages is considered. ru Інститут проблем математичних машин і систем НАН України Математичні машини і системи Обчислювальні системи Концептуальные графы и семантические сети в системах обработки естественно-языковой информации Концептуальні графи та семантичні мережі в системах обробки природничо-мовної інформації Conceptual graphs and semantic networks in systems of processing of naturally-language information Article published earlier |
| spellingShingle | Концептуальные графы и семантические сети в системах обработки естественно-языковой информации Палагин, А.В. Кривой, С.Л. Петренко, Н.Г. Обчислювальні системи |
| title | Концептуальные графы и семантические сети в системах обработки естественно-языковой информации |
| title_alt | Концептуальні графи та семантичні мережі в системах обробки природничо-мовної інформації Conceptual graphs and semantic networks in systems of processing of naturally-language information |
| title_full | Концептуальные графы и семантические сети в системах обработки естественно-языковой информации |
| title_fullStr | Концептуальные графы и семантические сети в системах обработки естественно-языковой информации |
| title_full_unstemmed | Концептуальные графы и семантические сети в системах обработки естественно-языковой информации |
| title_short | Концептуальные графы и семантические сети в системах обработки естественно-языковой информации |
| title_sort | концептуальные графы и семантические сети в системах обработки естественно-языковой информации |
| topic | Обчислювальні системи |
| topic_facet | Обчислювальні системи |
| url | https://nasplib.isofts.kiev.ua/handle/123456789/47220 |
| work_keys_str_mv | AT palaginav konceptualʹnyegrafyisemantičeskiesetivsistemahobrabotkiestestvennoâzykovoiinformacii AT krivoisl konceptualʹnyegrafyisemantičeskiesetivsistemahobrabotkiestestvennoâzykovoiinformacii AT petrenkong konceptualʹnyegrafyisemantičeskiesetivsistemahobrabotkiestestvennoâzykovoiinformacii AT palaginav konceptualʹnígrafitasemantičnímerežívsistemahobrobkiprirodničomovnoíínformacíí AT krivoisl konceptualʹnígrafitasemantičnímerežívsistemahobrobkiprirodničomovnoíínformacíí AT petrenkong konceptualʹnígrafitasemantičnímerežívsistemahobrobkiprirodničomovnoíínformacíí AT palaginav conceptualgraphsandsemanticnetworksinsystemsofprocessingofnaturallylanguageinformation AT krivoisl conceptualgraphsandsemanticnetworksinsystemsofprocessingofnaturallylanguageinformation AT petrenkong conceptualgraphsandsemanticnetworksinsystemsofprocessingofnaturallylanguageinformation |