Интенсиональные представления в виде нечеткой гибридной модели знаний

Рассматривается проблема представления знаний, содержащихся в естественно-языковых текстах. Сформулирована проблема в общем виде и выдвинуты гипотезы на основе существующей концепции знаний. С учетом специфики человеческого мышления разработана гибридная модель представления знаний, состояние кот...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Datum:2008
1. Verfasser: Парамонов, А.И.
Format: Artikel
Sprache:Russian
Veröffentlicht: Інститут проблем штучного інтелекту МОН України та НАН України 2008
Schlagworte:
Online Zugang:https://nasplib.isofts.kiev.ua/handle/123456789/7582
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:Интенсиональные представления в виде нечеткой гибридной модели знаний / А.И. Парамонов // Штучний інтелект. — 2008. — № 4. — С. 605-611. — Бібліогр.: 7 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id nasplib_isofts_kiev_ua-123456789-7582
record_format dspace
spelling nasplib_isofts_kiev_ua-123456789-75822025-02-09T09:36:33Z Интенсиональные представления в виде нечеткой гибридной модели знаний Інтенсіональні представлення у вигляді нечіткої гібридної моделі знань Fuzzy Hybrid Model of Knowledge as Intensional Representation Парамонов, А.И. Нейросетевые и нечеткие системы Рассматривается проблема представления знаний, содержащихся в естественно-языковых текстах. Сформулирована проблема в общем виде и выдвинуты гипотезы на основе существующей концепции знаний. С учетом специфики человеческого мышления разработана гибридная модель представления знаний, состояние которой позволяет представлять знания, выраженные фрагментом текстовой информации. На основе модели прототипов решается задача учета индивидуальных знаний об окружении. Розглядається проблема представлення знань, що містяться у природно-мовних текстах. Сформульована проблема в загальному вигляді і висунуті гіпотези на основі існуючої концепції знань. З урахуванням специфіки людського мислення розроблена гібридна модель представлення знань, стан якої дозволяє представляти знання, виражені фрагментом текстової інформації. На основі моделі прототипів вирішується завдання врахування індивідуальних знань про оточення. The problem of knowledge representation containing in naturally-language texts is considered. The problem in a general view is formulated. Hypotheses, on the basis of the existing knowledge concept are put forward. Separation of existing models of knowledge representation is marked at the problem decision. These models do not solve all problems connected with knowledge representation. The hybrid model of knowledge representation is developed. The condition of hybrid model allows representing the knowledge expressed by a text information fragment. On the basis of prototypes model the problem is solved with consideration of individual knowledge of an environment. In view of specificity of human thinking, the indistinct hybrid model of knowledge representation is offered. 2008 Article Интенсиональные представления в виде нечеткой гибридной модели знаний / А.И. Парамонов // Штучний інтелект. — 2008. — № 4. — С. 605-611. — Бібліогр.: 7 назв. — рос. 1561-5359 https://nasplib.isofts.kiev.ua/handle/123456789/7582 004.89:004.4+004.934 ru application/pdf Інститут проблем штучного інтелекту МОН України та НАН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Russian
topic Нейросетевые и нечеткие системы
Нейросетевые и нечеткие системы
spellingShingle Нейросетевые и нечеткие системы
Нейросетевые и нечеткие системы
Парамонов, А.И.
Интенсиональные представления в виде нечеткой гибридной модели знаний
description Рассматривается проблема представления знаний, содержащихся в естественно-языковых текстах. Сформулирована проблема в общем виде и выдвинуты гипотезы на основе существующей концепции знаний. С учетом специфики человеческого мышления разработана гибридная модель представления знаний, состояние которой позволяет представлять знания, выраженные фрагментом текстовой информации. На основе модели прототипов решается задача учета индивидуальных знаний об окружении.
format Article
author Парамонов, А.И.
author_facet Парамонов, А.И.
author_sort Парамонов, А.И.
title Интенсиональные представления в виде нечеткой гибридной модели знаний
title_short Интенсиональные представления в виде нечеткой гибридной модели знаний
title_full Интенсиональные представления в виде нечеткой гибридной модели знаний
title_fullStr Интенсиональные представления в виде нечеткой гибридной модели знаний
title_full_unstemmed Интенсиональные представления в виде нечеткой гибридной модели знаний
title_sort интенсиональные представления в виде нечеткой гибридной модели знаний
publisher Інститут проблем штучного інтелекту МОН України та НАН України
publishDate 2008
topic_facet Нейросетевые и нечеткие системы
url https://nasplib.isofts.kiev.ua/handle/123456789/7582
citation_txt Интенсиональные представления в виде нечеткой гибридной модели знаний / А.И. Парамонов // Штучний інтелект. — 2008. — № 4. — С. 605-611. — Бібліогр.: 7 назв. — рос.
work_keys_str_mv AT paramonovai intensionalʹnyepredstavleniâvvidenečetkojgibridnojmodeliznanij
AT paramonovai íntensíonalʹnípredstavlennâuviglâdínečítkoígíbridnoímodelíznanʹ
AT paramonovai fuzzyhybridmodelofknowledgeasintensionalrepresentation
first_indexed 2025-11-25T11:44:21Z
last_indexed 2025-11-25T11:44:21Z
_version_ 1849762585719603200
fulltext «Штучний інтелект» 4’2008 605 7П УДК 004.89:004.4+004.934 А.И. Парамонов Донецкий национальный университет, г. Донецк, Украина anton@paramonov.info, paramonov@dongu.donetsk.ua Интенсиональные представления в виде нечеткой гибридной модели знаний Рассматривается проблема представления знаний, содержащихся в естественно-языковых текстах. Сформулирована проблема в общем виде и выдвинуты гипотезы на основе существующей концепции знаний. С учетом специфики человеческого мышления разработана гибридная модель представления знаний, состояние которой позволяет представлять знания, выраженные фрагментом текстовой информации. На основе модели прототипов решается задача учета индивидуальных знаний об окружении. Информатизация жизнедеятельности человека сопровождается ростом цифровой информации и соответственно развитием систем и методов работы с ней. Особенно актуальны направления в области интеллектуальных систем и автоматизации процессов. Одним из основных средств обмена информацией, в том числе и цифровой, между людьми является текст. Текст представляет собой связную, компактную, воспроизво- димую последовательность знаков, выражающую некоторое содержание и обладающую смыслом. Принципиальной особенностью задач анализа текстовой информации явля- ется то, что предметом анализа выступают знания о предметной области, содержащиеся в текстовой информации. Иными словами, для интеллектуальных систем интерпретации текстовой информации необходимы средства для представления знаний, содержа- щихся в этом тексте. Проблема понимания языковых сообщений не нова для современной науки. Решение этой проблемы лежит на стыке области искусственного интеллекта (ИИ), ког- нитивной психологи и лингвистики. Существуют подходы к решению данной задачи, которые описаны в работах А.Н. Хомского (теория трансформационных грамматик, теория следов), Д.А. Поспелова (представления знаний и рассуждения), Т. Винограда (вопросно-ответные системы, лингвистические процессоры), Р. Шенка (ТКЗ), М. Минского (теория фреймов), В.Н. Вагина (дедукция и вывод на сетях) и других ученых в области ИИ. В когнитивной психологии широко известны работы Дж. Андерсона, Р. Солсо, М.А. Холодной и др. Проблема понимания естественно-языковой (ЕЯ) информации решается с помощью перевода внешнего представления на ЕЯ в некую внутреннюю структуру, описываю- щую систему знаний. По мере развития исследований в области интеллектуальных систем возникла концепция знаний. Со временем сформировавшиеся модели представления знаний и данных сливались, убирая чёткую грань между данными и знаниями. В развитых мо- делях представления знаний можно выделить 2 компоненты [1]: интенсиональные представления и экстенсиональные представления. Экстенсиональные представления относятся к данным. С точки зрения моделей представления текстовой информации, экстенсиональной компонентой является обра- батываемый текст. Парамонов А.И. «Искусственный интеллект» 4’2008 606 7П Интенсиональные представления относятся к знаниям о предметной области. Интенсиональная компонента есть концептуальная модель представления знаний. Под концептуальной моделью понимается концепция знаний о данной области, постро- енная инженером по знаниям. Автором строится гипотеза что знания, которые выражены фрагментом ЕЯ текста, могут быть представлены фрагментом концептуальной модели. Гипотезу можно сфор- мулировать следующим образом: заданному экстенсиональному отношению, опреде- лённому как протоструктура фрагмента текста, соответствует своё интенсиональное отношение. Это главная идея, положенная в основу работы. На основе анализа рассмотренных подходов в качестве интенсионального пред- ставления в работе предлагается гибридная нечеткая модель знаний. Гибридная модель представления знаний Структура гибридной модели (ГМ) разработана на основе комплексного подхо- да к решению поставленной задачи. Анализ когнитивного подхода позволил выделить базовые единицы модели: объекты, действия и события [2]. Элементы модели объе- диняются в классификационные структуры: семантические и пропозициональные сети [3], [4]. В модели учтены особенности индивидуального восприятия окружающего мира, представленные набором индивидуальных знаний о мире в виде прототипов гибр- дной модели. Прототипы формируются в соответствии с классификационными струк- турами и разделяются на схемы и скрипты [2], [4]. Таким образом, множество элементов модели и связи между ними представляют систему знаний. В основе модели лежит формальная система вида:        N2N1,,S,D,OГМ . (1) Множества {O}, {D} и {S} есть множества базовых элементов, соответственно, множества объектов, действий и событий. N1 есть классификационная структура (семантическая сеть), отражающая взаимодействия информационных единиц множеств объектов и действий. N2 есть пропозициональная сеть, отражающая связи элементов множества событий. Таким образом, будем считать предложенную ГМ интенсио- нальным представлением системы интерпретации текстовой информации. Каждое слово текста отражает какое-то понятие, представляемое в концептуальной схеме симво- лом, либо его часть. Слово, или набор слов, описывающее конкретное понятие (сущ- ность), названо термином. В предлагаемой модели понятия (термины) названы объектами. Под объектом понимается модель сущности некоторого реального мира, которая обладает неким набором свойств. Для полноценного понимания окружения необхо- димо определить множество объектов рассматриваемой модели мира [5], то есть выделить предметную область. Каждый объект мировой модели может быть описан другими более элементарными объектами, а те, в свою очередь, другими и т.д. Согласно введенному определению, объектом в концептуальной модели будем считать именованную сущность и соответствующее ей множество признаков. Фор- мально запись объекта аналогична сетевой модели фрейма [1]:   n iio pTO 1}{, , (2) где oT – имя объекта, ip – i-й атрибут объекта. Интенсиональные представления в виде нечеткой гибридной модели знаний «Штучний інтелект» 4’2008 607 7П Отметим, что в ГМ возможно наличие различных объектов при одинаковом наборе атрибутов у них. Их отличие может быть только в имени. Возникновение такой ситуации природно для человеческого восприятия. К этому может привести недоста- точное знание предметной области либо абстрагирование объектов с выделением только общих признаков. Текст (или языковое общение), кроме рассматриваемых объектов реального мира, несет еще информацию и об отношениях между ними. В языковой грамматике такие отношения названы глаголами. Отношения между понятиями на концептуаль- ном уровне названы действиями. За основу в определении действий была взята теория Р. Шенка, предложенная в работе [2]. По аналогии с объектами действия могут быть описаны через другие действия – более элементарные, а те, в свою очередь, через другие. Согласно теории концептуальной зависимости (ТКЗ) используется класс элементарных действий, названных АКТами [2]. Таким образом, действие какой-либо концептуализации есть, в сущности, имя, под которым объединяется множество последовательных действий, рассматриваемых как его часть. Эти инструментальные концептуализации не связаны причинно, по- скольку они реально неотделимы друг от друга. Они в действительности выражают одно действие и, таким образом, рассматриваются как часть концептуализации. Формально в работе действие концептуальной модели представлено именем и набором соответствующих ему АКТов:   m iiD pTD 1}{, , (3) где DT – наименование действия, ip – АКТ, составляющий часть действия (признак действия). Событием названо некоторое действие, описывающее конкретные отношения конкретных объектов. В терминах предложенной модели событие есть множество, состоящее из действия и объектов, а также ряда прочих (вспомогательных) аргументов, которые могут выступать объектами или субъектами действия в элементарных АКТах. К вспомогательным аргументам относятся данные, при необходимости, дополни- тельно описывающие ситуацию: место, время, «инструменты» и так далее. Итак, делается заключение, что одна концептуализация действия рассматрива- ется как представитель одного события. В общем виде событие описывается как упорядоченный набор S:   k llji cODOS 1}{,,, , (4) где ji OO , – объект и субъект действия (i ≠ j) (2), D – действие (3), lc – дополни- тельный аргумент события. Порядок объекта и субъекта действия устанавливается однозначно. В силу того, что существуют возвратные глаголы, в которых реципиентом высту- пает сам субъект действия, вводится вспомогательный объект «is». Использование вспомогательного объекта возможно только для заданного множества действий. Описанные элементы гибридной модели, объекты и действия, образуют единое пространство – знание о предметной области. Для удобного и корректного использо- вания элементы этого пространства нуждаются в структурировании. На основе обзора существующих моделей представления семантических структур, а также с учётом пред- ставлений объектов и действий в ГМ, в качестве базовой классификационной структуры элементов ГМ выбрана модель сравнительных семантических признаков. Парамонов А.И. «Искусственный интеллект» 4’2008 608 7П Элементы ГМ, объединённые в семантические сети (объекты и действия), определены как рабочие элементы гибридной модели (РЭГМ). Семантические сети позволяют выделить все понятия в рамках предметной области и отношения между этими понятиями, а также структурировать их (разбить на составляющие и установить между всеми составляющими именованные связи). В работе сети представлены подграфами вида: A) (V, N , (5) где V – множество узлов сетей (РЭГМ), A – множество дуг сетей. Согласно выбранной модели сравнительных семантических признаков элементы сети (5) запишутся как (6) и (7). niVvPPTv i m lsp q kdefi ,1,,}]{[},]{[, 00   , (6) где iv – i-й узел сети, T – имя узла семантической сети, defP – определяющий приз- нак узла, spP – характерный признак узла, q – число определяющих признаков узла, m – число характерных признаков узла. jtypeAA  }{ , (7) где typeA – заданный тип связей в семантической сети. В терминах рассматриваемой модели в качестве узлов семантических сетей будет выступать множество объектов (2) или действий (3): n 1ii n 1ii }{DV или }{OV   . В предложенной ГМ на семантических сетях введено два типа связей:  21 typetype AAA  , где 1typeA – связи в сети типа «part_of», 2typeA – связи в сети типа «is_a». Для представления знаний, содержащихся в каждом отдельном предложении, используется пропозициональная репрезентация. Пропозициональный анализ представ- ляет в памяти сложные предложения в виде простых, которые выступают абстрактными пропозициональными единицами, или эпизодами. Пропозициональная информация может быть представлена в сетях, которые показывают отношения между понятиями. Эпизоды – это события ГМ, которые объединены пропозициональными связями. Различаются три пропозициональных связи: отношение «затем», ведущее к новому событию, отношение «во время» (или в то время как), позволяющее соединять теку- щие события с новым событием, и отношение «время», позволяющее соединять со- бытия с неопределенным временным порядком. Эпизоды являются узлами пропози- циональной сети. Таким образом, пропозициональная сеть есть множество событий с заданными пропозициональными связями между его элементами. Пропозициональ- ная сеть описана в гибридной модели подграфом вида: ) (U, N B , где U – множество узлов сети, B – множество дуг (пропозициональные связи). Множество пропозициональных связей может быть записано как:   timenowafter BBBB  , Интенсиональные представления в виде нечеткой гибридной модели знаний «Штучний інтелект» 4’2008 609 7П где afterB – множество дуг пропозициональной сети, помеченных связью «затем», nowB – множество связей «во время», timeB – множество связей «время». Интенсиональные отношения в ГМ представлены прототипами. Прототип – это обобщенное представление, в котором воспроизведен набор общих и детализированных признаков типичного объекта (или действия) и которое выступает в качестве основы для идентификации любого нового понятия [6]. Про- тотипом в ГМ принято называть любой элемент модели (объект, действие, событие), который обладает набором собственных атрибутов, доступных к изменению под заданное окружение. В работе определено два типа прототипов: схемы и скрипты. Схемой названа абстракция объектов или репрезентация семантической сети объектов в терминах конкретного окружающего мира. Наличие и типы связей между объектами в сети зависят от модели окружающего мира. Схема отражает текущее представление заданного окружающего мира. Схемой назван подграф N , представ- ленный в виде )A ,V( N  , где V′ – множество узлов сетей, элементы которого пред- ставлены в виде (2) и (3), А′ – множество дуг сетей ( R(A)A  ). Отличие одной модели мира от другой представлено количеством признаков в соответствующих узлах сети (значения n и m в формулах (2) и (3)), а также их составом. Скрипты – репрезентация схемы, предложенная Шенком и Абельсоном для понятий, описывающих события [2]. В терминах предлагаемой ГМ скриптом названа репрезентация пропозициональной сети в терминах конкретного окружающего мира. Скриптом назван подграф N  , представленный в виде )( N BU,  , где U – множество узлов сети или пропозиций, B′ – подмножество возможных связей из универсума дуг пропозициональной сети ( R(B)B  ). Таким образом, скрипт задает только наличие и типы связей в сети. С учетом введенного понятия прототипа рассматриваемая гибридная модель в конкретной реализации представляет собой семантические и пропозициональные сети прототипов. Это свойство модели демонстрирует особенность восприятия мира человеком в зависимости от его познаний. Нечеткая гибридная модель Предложенная и описанная выше ГМ представления знаний в виде множества прототипов (схем и скриптов) является интенсиональным представлением уникаль- ных знаний о некоторой предметной области. Но данное представление не может быть полным, потому что человеческое мышление представляет собой нечёткий механизм [7]. Таким образом, полная модель знаний должна быть представлена нечеткой ГМ (НГМ), которая задана системой вида НГМ = <ГМ, {CF}> , где каждой составляющей ГМ из (1) приписывается фактор уверенности (CF). Фактор уверенности для множеств объектов и действий, обозначенных в работе как РГЭМ, заложен в природе этих элементов. Исходя из (2) и (3) РЭГМ есть набор признаков, формируемый из множества всех возможных признаков при построении интенсиональной части модели. Для каждого интенсионального представления зада- Парамонов А.И. «Искусственный интеллект» 4’2008 610 7П ется разная степень принадлежности определённого признака конкретному понятию. Это даёт возможность определить каждый РЭГМ как подмножество признаков, об- ладающее нечеткой характеристикой: )})(pм|p{(T i ~ Ti~  ; (8) }{pP i ; ,..,1}е,2е{0,M  , где )(pμ i ~ T – функция принадлежности признака узлу ~ T , ip – признак РЭГМ, P – множество всех признаков, M – множество возможных значений функции принад- лежностей. Фактор уверенности для элементов множества событий задаётся уверенностью в составляющих этого события. Согласно (4) событие состоит из элементов мно- жеств объектов и действий, а также дополнительных аргументов, которые влияют на отношения между событиями, но не являются составляющими уверенности в самом событии. Таким образом, если в качестве элементов события принять РЭГМ, описанные в (8), то событие определяется как множество нечётких подмножеств. },,{ дсо ~ i ~ i ~ i TTTS j  , (9) где со ~ i ~ i ,TT – узлы семантической сети объектов (объект и субъект), д ~ iT – узел семан- тической сети действий. Фактор уверенности классификационных структур НГМ есть множество нечётких характеристик связей в этих структурах. Соответственно, семантические сети, описан- ные в (5), будут представлены в виде нечёткого графа ~ A [7] )}(|{ ~ ijij aaA  , ,),(:),( ~ MvvVVvv jiAji   ),,()( ~ jiAij vva   },1,...,2,,0{ M где vi, vj – узлы семантической сети, aij – дуга из узла vi в узел vj, ),( ji vv или )( ija – функция принадлежности дуги aij данной сети, или сила связи узлов vi и vj ( ]1,0[)( ija ), М – множество принадлежностей элементов множества VV  . С учётом формулы (8) множество узлов семантической сети ~ A будет представ- лено как множество нечётких подмножеств }{ ~ jTV  . Аналогичным образом нечёткое подмножество ~ B , такое, что ,),(:),( ~ MuuUUuu jiBji   },1,...,2,,0{ M задаёт нечёткий граф пропозициональной сети. Интенсиональные представления в виде нечеткой гибридной модели знаний «Штучний інтелект» 4’2008 611 7П Соответственно, )( ijb определяет силу связи узлов в данной пропозициональ- ной сети. А сами узлы с учётом (9) будут определены как }{ jSU  , где jS – событие, или эпизод пропозициональной сети. Построенная с учётом заданных факторов уверенности НГМ описывает инди- видуальные знания о предметной области и формирует новые интенсиональные отношения. Выводы Исследуемая в работе проблема представления знаний сформулирована в виде гипотез на основе существующей концепции знаний. С учетом возможных интенсио- нальных представлений разработана гибридная модель знаний, состояние которой позволяет представлять знания, выраженные фрагментом текстовой информации. В работе показано, что необходимо учитывать индивидуальные знания об окружении. В качестве решения этой задачи предлагается модель прототипов. Но данное пред- ставление не может быть полным, потому что человеческое мышление представляет собой нечёткий механизм. Таким образом, полная модель знаний, или интенсиональное представление, в работе описана в виде нечеткой гибридной модели знаний. Литература 1. Искусственный интеллект: В 3 кн. / Под. Ред. Д.А. Поспелова. – М.: Радио и связь, 1990. – Кн. 2 Модели и методы: Справочник. – 304 с.: ил. 2. Шенк Р. Обработка концептуальной информации: Пер. с англ. Г.В. Сенина. – М.: Энергия, 1980. – 360 с.: ил. 3. Солсо Р. Когнитивная психология. – СПб.: Питер, 2002. – 592 с.: ил. 4. Андерсон Дж. Когнитивная психология. – 5-е изд. – СПб.: Питер, 2002. – 496 с.: ил. 5. Виноград Терри. Программа, понимающая естественный язык: Пер. с англ. С.С. Калитина. – М.: Мир, 1976. – 295 с. 6. Хофман И. Активная память. – М.: Прогресс, 1986. – 39 с. 7. Кофман А. Введение в теорию нечетких множеств: Пер. с франц. – М.: Радио и связь, 1982. – 432 с.: ил. А.І. Парамонов Інтенсіональні представлення у вигляді нечіткої гібридної моделі знань Розглядається проблема представлення знань, що містяться у природно-мовних текстах. Сформульована проблема в загальному вигляді і висунуті гіпотези на основі існуючої концепції знань. З урахуванням специфіки людського мислення розроблена гібридна модель представлення знань, стан якої дозволяє представляти знання, виражені фрагментом текстової інформації. На основі моделі прототипів вирішується завдання врахування індивідуальних знань про оточення. A.L. Paramonov Fuzzy Hybrid Model of Knowledge as Intensional Representation The problem of knowledge representation containing in naturally-language texts is considered. The problem in a general view is formulated. Hypotheses, on the basis of the existing knowledge concept are put forward. Separation of existing models of knowledge representation is marked at the problem decision. These models do not solve all problems connected with knowledge representation. The hybrid model of knowledge representation is developed. The condition of hybrid model allows representing the knowledge expressed by a text information fragment. On the basis of prototypes model the problem is solved with consideration of individual knowledge of an environment. In view of specificity of human thinking, the indistinct hybrid model of knowledge representation is offered. Статья поступила в редакцию 16.07.2008.