О проблеме интерпретации тестовой информации
В статье рассмотрен подход к проблеме интерпретации текстовой информации. Предложен метод обработки текстовых фрагментов на основе нечеткой концептуальной модели представления знаний. Использование скрытых знаний (контекста), полученных путем вывода на основе опыта, позволяет расширить область интер...
Збережено в:
| Дата: | 2012 |
|---|---|
| Автор: | |
| Формат: | Стаття |
| Мова: | Russian |
| Опубліковано: |
Інститут проблем штучного інтелекту МОН України та НАН України
2012
|
| Назва видання: | Штучний інтелект |
| Теми: | |
| Онлайн доступ: | https://nasplib.isofts.kiev.ua/handle/123456789/57738 |
| Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Цитувати: | О проблеме интерпретации тестовой информации / А.И. Парамонов // Штучний інтелект. — 2012. — № 4. — С. 245-252. — Бібліогр.: 4 назв. — рос. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraine| id |
nasplib_isofts_kiev_ua-123456789-57738 |
|---|---|
| record_format |
dspace |
| spelling |
nasplib_isofts_kiev_ua-123456789-577382025-02-23T17:22:26Z О проблеме интерпретации тестовой информации Про проблему інтерпретації тексту The problem of Text Interpretation Парамонов, А.И. Анализ и синтез коммуникационной информации В статье рассмотрен подход к проблеме интерпретации текстовой информации. Предложен метод обработки текстовых фрагментов на основе нечеткой концептуальной модели представления знаний. Использование скрытых знаний (контекста), полученных путем вывода на основе опыта, позволяет расширить область интерпретации текста, а как следствие, повысить эффективность автоматизированных систем категоризации, аннотации, а также информационно-поисковых систем. У статті розглянуто підхід до проблеми інтерпретації текстової інформації. Запропоновано метод обробки текстових фрагментів на основі нечіткої концептуальної моделі представлення знань. Використання прихованих знань (контексту), отриманих шляхом виведення на основі досвіду, дозволяє розширити сферу інтерпретації тексту, а як наслідок, підвищити ефективність автоматизованих систем категоризації, анотації, а також інформаційно-пошукових систем. In article the approach to a problem of text interpretation is considered. The method of text fragments processing on the basis of fuzzy conceptual model of knowledge representation is offered. Use of the tacit knowledge (context) received by a conclusion on the basis of experience, allows to expand area of text interpretation, and as a result, to increase efficiency of the automated systems of categorization, annotations and information search systems. 2012 Article О проблеме интерпретации тестовой информации / А.И. Парамонов // Штучний інтелект. — 2012. — № 4. — С. 245-252. — Бібліогр.: 4 назв. — рос. 1561-5359 https://nasplib.isofts.kiev.ua/handle/123456789/57738 004.89:004.4+004.934 ru Штучний інтелект application/pdf Інститут проблем штучного інтелекту МОН України та НАН України |
| institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| collection |
DSpace DC |
| language |
Russian |
| topic |
Анализ и синтез коммуникационной информации Анализ и синтез коммуникационной информации |
| spellingShingle |
Анализ и синтез коммуникационной информации Анализ и синтез коммуникационной информации Парамонов, А.И. О проблеме интерпретации тестовой информации Штучний інтелект |
| description |
В статье рассмотрен подход к проблеме интерпретации текстовой информации. Предложен метод обработки текстовых фрагментов на основе нечеткой концептуальной модели представления знаний. Использование скрытых знаний (контекста), полученных путем вывода на основе опыта, позволяет расширить область интерпретации текста, а как следствие, повысить эффективность автоматизированных систем категоризации, аннотации, а также информационно-поисковых систем. |
| format |
Article |
| author |
Парамонов, А.И. |
| author_facet |
Парамонов, А.И. |
| author_sort |
Парамонов, А.И. |
| title |
О проблеме интерпретации тестовой информации |
| title_short |
О проблеме интерпретации тестовой информации |
| title_full |
О проблеме интерпретации тестовой информации |
| title_fullStr |
О проблеме интерпретации тестовой информации |
| title_full_unstemmed |
О проблеме интерпретации тестовой информации |
| title_sort |
о проблеме интерпретации тестовой информации |
| publisher |
Інститут проблем штучного інтелекту МОН України та НАН України |
| publishDate |
2012 |
| topic_facet |
Анализ и синтез коммуникационной информации |
| url |
https://nasplib.isofts.kiev.ua/handle/123456789/57738 |
| citation_txt |
О проблеме интерпретации тестовой информации / А.И. Парамонов // Штучний інтелект. — 2012. — № 4. — С. 245-252. — Бібліогр.: 4 назв. — рос. |
| series |
Штучний інтелект |
| work_keys_str_mv |
AT paramonovai oproblemeinterpretaciitestovojinformacii AT paramonovai proproblemuínterpretacíítekstu AT paramonovai theproblemoftextinterpretation |
| first_indexed |
2025-11-24T03:32:22Z |
| last_indexed |
2025-11-24T03:32:22Z |
| _version_ |
1849641027856498688 |
| fulltext |
«Штучний інтелект» 4’2012 245
3П
УДК 004.89:004.4+004.934
А.И. Парамонов
Донецкий национальный университет, Украина
Украина, 83001, г. Донецк, ул. Университетская, 24
О проблеме интерпретации тестовой информации
A.I. Paramonov
Donetsk National Universit, Ukraine
Ukraine, 83001, Donetsk, Universitetskaya Str., 24
The problem of Text Interpretation
А.І. Парамонов
Донецький національний університет, Україна
Україна, 83001, м. Донецьк, вул. Університетська, 24
Про проблему інтерпретації тексту
В статье рассмотрен подход к проблеме интерпретации текстовой информации. Предложен метод обработки
текстовых фрагментов на основе нечеткой концептуальной модели представления знаний. Использование
скрытых знаний (контекста), полученных путем вывода на основе опыта, позволяет расширить область
интерпретации текста, а как следствие, повысить эффективность автоматизированных систем категоризации,
аннотации, а также информационно-поисковых систем.
Ключевые слова: модель представления знаний, интерпретация текста, контекст.
In article the approach to a problem of text interpretation is considered. The method of text fragments processing on
the basis of fuzzy conceptual model of knowledge representation is offered. Use of the tacit knowledge (context)
received by a conclusion on the basis of experience, allows to expand area of text interpretation, and as a result, to
increase efficiency of the automated systems of categorization, annotations and information search systems.
Key words: model of knowledge representation, the text interpretation, context.
У статті розглянуто підхід до проблеми інтерпретації текстової інформації. Запропоновано метод обробки
текстових фрагментів на основі нечіткої концептуальної моделі представлення знань. Використання
прихованих знань (контексту), отриманих шляхом виведення на основі досвіду, дозволяє розширити сферу
інтерпретації тексту, а як наслідок, підвищити ефективність автоматизованих систем категоризації, анотації,
а також інформаційно-пошукових систем.
Ключові слова: модель представлення знань, інтерпретація тексту, контекст.
Введение
Как самостоятельное научное направление искусственный интеллект (ИИ) су-
ществует сравнительно недолго, но уже достигнуты существенные результаты, сфор-
мированы некоторые концептуальные модели, устоялись определенные фундаменталь-
ные парадигмы. Исследования ИИ влились в общий поток технологий сингулярности,
таких как информатика, нанотехнология, молекулярная биоэлектроника, квантовая
теория и т.д. И уже не вызывают удивления идеи, что именно эти исследования
будут определять характер того информационного общества, которое уже приходит
на смену индустриальной цивилизации.
Одной из насущных и актуальных задач в современном информационном
обществе является процесс накопления и применения корпоративных знаний. Инфор-
мационные потоки, циркулирующие в информационно-аналитических центрах, преиму-
щественно представляют собой неструктурированную разноязычную текстовую ин-
Парамонов А.И.
«Искусственный интеллект» 4’2012246
3П
формацию. Принципиальной особенностью задач анализа текстовой информации
является то, что предметом анализа выступают знания о предметной области, содержа-
щиеся в текстовой информации. Таким образом, ядром системы поддержки информа-
ционно-аналитической деятельности должна быть система автоматизации распознавания,
извлечения и формализации знаний, содержащихся в текстах, т.е. система понимания
и интерпретации текстовой информации.
Решение поставленной задачи лежит на стыке ИИ и когнитивной психологии.
Психолингвистические и психосемантические теории понимания текста предполагают,
что в процессе понимания формируется смысл текста, отличный от исходного.
Для создания систем интерпретации текстовой информации предлагается конце-
птуальная модель представления знаний [1], которая сохраняет содержащиеся в
тексте и генерирует на их основе новые знания. Концептуальная гибридная модель
представляет собой систему знаний, которая содержит множество базовых элементов
(объекты, действия, события) и связи между ними (классификационные структуры).
Предложенная система знаний позволяет преображать экстенсиональные представления,
выраженные фрагментом текста, в интенсиональные представления системы, с возмож-
ностью появления новых представлений (извлечение из текста неявных знаний). В мо-
дели используется концепция прототипов, что позволяет учитывать особенность вос-
приятия мира человеком в зависимости от его познаний и окружения. Для учета
особенностей человеческого мышления и неоднозначности восприятия информации гиб-
ридная концептуальная модель формализована на основе аппарата нечетких множеств.
Компьютерные эксперименты, проведенные с предложенной моделью, подтвер-
дили возможность представления знаний на ее основе и показали эффективность ее
использования. В результате анализа экспериментов выявлена зависимость уровня
понимания текста от предметной области. Так, для однозначной в плане терминологии
области (например, «финансовые рынки») уровень извлекаемых знаний из корпусов
текстов выше, чем для «многомерных» областей (например, «литературные произве-
дения»). Это связано с наличием большого числа терминов с не-взаимно-однозначным
сопоставлением формы и содержания, таких понятий, как синонимы, антонимы, омо-
графы, полисемия, узуальные значения. Однако согласно опытам когнитивных психо-
логов подобные различия в восприятии разной тематики наблюдаются и у основного
числа испытуемых людей. Таким образом, для полноценного использования моделей
представления и интерпретации текстовой информации, в том числе и разработанной
нечеткой гибридной модели, необходим механизм однозначного сопоставления тер-
минов с их смысловым содержанием, вкладываемым в них автором текста или вос-
принимаемым читателем.
Целью данной работы является разработка метода обработки текстовой инфор-
мации на основе нечеткой концептуальной модели представления знаний.
В общем случае задача интерпретации текста на естественном языке сводится к
преобразованию входного текста, который представлен в виде уровней конкретизации
смысловой нагрузки, в элементы нечеткой концептуальной модели (рис. 1). Из извест-
ных моделей ИИ в основу интерпретации текста положен механизм рассуждения на
основе опыта, что позволило использовать существующую систему знаний в условиях
заданной предметной области, и благодаря этому определять адекватность и пред-
метную направленность текста. Применение вывода на основе опыта позволило
получить скрытые знания (неявные знания или смысл), содержащиеся в текст.
О проблеме интерпретации тестовой информации
«Штучний інтелект» 4’2012 247
3П
Входная обрабатываемая конечная последовательность символов алфавита, которая
может содержать ошибки, названа первичным текстом. Начальной обработкой вход-
ного текста является терминологическая разметка, в результате выполнения которой
формируется подмножество терминов с некоторой степенью уверенности присутствия
их в первичном тексте (нечеткие термины) [2]. Затем выполняется событийная раз-
метка, которая предполагает построение последовательности фраз из нечетких терминов,
собранных в определенные структуры (нечеткие фразы). Нечеткие фразы в свою оче-
редь являются предметом концептуального анализа текста. Для интерпретации тер-
минов (построение нечетких фраз) и отображения текста в виде событийной модели
(построение контекста) используется предложенная концептуальная гибридная мо-
дель (ГМ) представления знаний.
Задачу однозначного сопоставления терминов с их смысловым содержанием
предлагается решать на основе событийной разметки. На этапе событийной разметки
нечеткие термины сопоставляются с элементами ГМ. Нечеткая характеристика термина
задает фактор уверенности сопоставленного ему элемента. Одновременно с этим выпол-
няется синтаксический анализ отдельного предложения, в которое входят рассматри-
ваемые нечеткие термины. По сути, каждый рассматриваемый фрагмент первичного
текста выступает отдельным предложением естественного языка. При сопоставлении
термина с узлами классификационных сетей ГМ учитываются также и результаты
грамматического анализа – определяется часть речи, которую он представляет. Соот-
ветственно, глаголы (сказуемые) активизируют узлы семантической сети действий, а
Первичный текст
Нечеткие фразы
Контекст
Нечеткие термины
Нечеткие морфы
Нечеткий текст
Символьный анализ
Морфологический анализ
Терминологический анализ
Фразеологический анализ
Концептуальный анализ Фразеологический синтез
Умозаключения
(Рассуждения на основе опыта)
Терминологический синтез
Морфологический синтез
Символьный синтез
Рисунок 1 – Процесс обработки текстовой информации
Парамонов А.И.
«Искусственный интеллект» 4’2012248
3П
существительные (подлежащее, дополнение) активизирует узлы сети объектов. Сопут-
ствующие части речи (например, прилагательные, обстоятельства) выступают в каче-
стве свойств объектов (набор дополнительных характеристик). В качестве свойств
узлов действий выступают предлоги, падежи и склонения глагола, которые указывают
направленность воздействия, временные и другие характеристики.
Активность узла i (фактор уверенности в узле i) есть нечеткое множество
i~
X (1),
которое задается на базовом универсальном множестве X, введенном на шкале [0; 1].
][(x)}, x{x|μ
~
X
~
iXi 1;0 . (1)
При активизации узлов значениям их активности сопоставляются значения уве-
ренности в соответствующих терминах (2).
][ x(x)μ(x)μ
~
Tj
~
iX 1;0, . (2)
После этого активизируются узлы-синонимы. Передача активности от узла к
узлу выполняется по дуге, соединяющей эти узлы. Значение активности ]
~
Y[ ji ,
поступившее по дуге jia от узла j, рассчитывается по формуле (3).
)(a]X[]
~
Y[ ji
~
jji , (3)
где ]X[
~
j – активность смежного узла j, )(a ji – поток по дуге jia [1], знак
« » означает умножение нечеткого подмножества на число.
Активность передается только тем смежным узлам, в направлении которых дуги
имеют значения потока больше заданного порога (экспериментальным путем определен
порог «0,9»). То есть узлам, которые считаются синонимами. Текущая активность
узла рассчитывается как общая накопленная активность ti ]
~
Y[
j , поступившая от
всех смежных узлов. В качестве механизма расчета текущей активности узла исполь-
зуется модель логогена Мортона [1], [3]. Начальное состояние активности узла зада-
ется нечетким множеством, характеризующим первоначальное отсутствие активности.
Входом логогена является последовательность нечетких множеств, описывающих уро-
вень активности смежных воздействующих узлов (3). Выходом является активность
рассматриваемого узла после воздействия на него близких по смыслу узлов. В ка-
честве операции изменения активности используется:
t
~
lit
~
l-
it
~
l
i ]Y[λ]X[]X[ 1 ; ,nl 1 , (4)
где t
~
l-
i ]X[ 1 – накопленная ранее активность узла (активность узла i до поступ-
ления активности от l-го узла), t
~
li ]Y[ – значение активности вновь поступившего
свидетельства от l-го узла (3), λ – функция ограничения распространения
активности (5), n – количество воздействующих узлов на узел i, * – операция
накопления активности, реализованная в виде пересчета значений абсцисс и ординат
L-R функции принадлежности для активированных узлов.
О проблеме интерпретации тестовой информации
«Штучний інтелект» 4’2012 249
3П
Таким образом, значения абсцисс L-R функции принадлежности для узлов, акти-
вированных при распространении активности, при перерасчете формул вычисляются
следующим образом:
λ(x))-x(xxx
t]
~
l
iX[]
~
lX[
t]
~
l
iX[t]
~
l
iX[
11 1 .
Соответственно, значения ординат рассчитываются в виде
λ(x);(x))-μ((x)μ(x)μ(x)μ
t]
~
l
iX[t]
~
liY[
t]
~
l
iX[t]
~
l
iX[
11 1
(x))), μ(a((x)μ ]
~
lX[lit]
~
liY[ min .
Введение функции λ позволяет контролировать процесс распространения ак-
тивности.
,0
1
)(aесли ,
;)(aесли ,
λ(x)
li
li (5)
где δ – пороговое значение распространения активности (для узлов-синони-
мов 9,0δ ).
Когда все возможные трактовки терминов первичного текста определены, и все
соответствующие узлы сетей объектов и действий активизированы, то активность пе-
редается на событийную модель – активизируются узлы пропозициональной сети.
При этом семантическая сеть объектом будет иметь два активных подграфа, характе-
ризующих объект и субъект действия.
Фактор уверенности в каждом из элементов события формирует корпусную мо-
дель фразы в виде возможных интерпретаций событий с заданной функцией уверен-
ности в каждом событии. При этом множество активизированных событий зависит
от модели мира в базе знаний (заложенных возможных конструкций событий) и от мно-
жества активизированных узлов семантических сетей. Таким образом, задается не-
четкая фраза
~
jF (6) как некоторое событие с заданной функцией уверенности в нем.
}Θ, {SF
~
jj
~
j , (6)
где jS – j-е событие,
j~
Θ – фактор уверенности в j-м событии (7).
~
Θ)
~
Θ
~
Θ(
~
Θ д
j
c
j
o
jj , (7)
где
~
Θo
j – фактор уверенности в объекте j-го события,
~
Θ c
j – фактор уверенности
в субъекте j-го события,
~
Θд
j – фактор уверенности в действии (АКТе) j-го события.
Факторы уверенности в каждом элементе события есть не что иное, как активность
соответствующего узла классификационной структуры объектов или действий (3).
Из множества полученных нечетких фраз отбираем с наибольшим фактором
уверенности (или с фактором уверенности, превышающим заданный порог). В ре-
зультате фрагмент обрабатываемого текста в модели будет представлять собой после-
довательность входных событий (нечетких фраз)
~
,...,
~
,
~
kFFF 21 .
Фрагмент входной текстовой информации интерпретируется с учетом контекста.
Контекст представляет собой активный подграф гибридной модели. Обработка оче-
Парамонов А.И.
«Искусственный интеллект» 4’2012250
3П
редной нечеткой фразы фрагмента текста заключается в пересчете активности узлов
подграфа гибридной модели (контекста). В основе подграфа положены узлы пропо-
зициональной сети. Основной процедурой обработки знаний выступает распространение
активности по сети. Активность узлов задаётся аналогично формуле (1).
В процессе интерпретации входных знаний у определенных узлов сети значения
активности изменяются. При этом перерасчет происходит при обработке каждого со-
бытия фрагмента текста. Значение активности узла при обработке m-го события фраг-
мента текста рассчитывается с учетом трех факторов:
1) m-го события фрагмента текста;
2) активности узла, полученной при обработке m-1, m-2, …, m-k событий
фрагмента текста (k<m);
3) контекстных знаний.
Таким образом, значение нечеткого множества активности в момент времени t
определяется как:
titititi ]
~
X[]
~
X[]
~
X[]
~
X[ 321 , (8)
где t
~
i ]X[ 1 – активность, поступившая при обработке m-го события, t
~
i ]X[ 2 –
активность узла i, полученная при обработке предыдущих событий текста (состав-
ляющая активности от памяти), t
~
i ]X[ 3 – активность, поступившая от контекста (от
смежных узлов сети), знак «» означает дизъюнктивную сумму нечетких под-
множеств [4].
Каждая из трех составляющих оказывает воздействие на множество
~
X i в один и
тот же момент времени t. Процесс обработки входного фрагмента текста представляет
собой дискретный во времени и непрерывный по состоянию процесс. Каждое изме-
нение временного шага связано с обработкой очередного события фрагмента текста.
Активность, поступившая при обработке m-го события, есть отображение не-
четкой характеристики входного события (нечеткой фразы) в активность узла.
С каждым узлом связана память глубиной k, где хранятся k значений актив-
ности, полученных на предыдущих m-l ( 1,kl , k<m) этапах обработки текста. Актив-
ностью узла i в контекстной памяти будем считать нечеткое множество, полученное
как выпуклая комбинация нечетких множеств (активности на предыдущих этапах
обработки) [4].
Под воздействием контекстных знаний понимается распространение активности
внутри сети.
Распространение активности подразумевает, что на уровень активности узла воз-
действует активность, передаваемая ему от смежных с ним других узлов сети. Актив-
ность, поступившая от смежных узлов, рассчитывается по формуле (3).
При этом следует учесть, что в пропозициональной сети распространение актив-
ности возможно только по дугам, описывающим такие типы связей, как «во время» и
«время» [1].
Отдельно следует упомянуть проблему «связности» текста, в основе которой –
обработка цепочки событий по дугам «затем». При обработке текста (при формиро-
вании контекста) необходимо учитывать, как связаны во времени события, рассматри-
ваемые на предыдущем этапе обработки и на текущем. Эта задача будет рассмотрена
в следующих работах.
О проблеме интерпретации тестовой информации
«Штучний інтелект» 4’2012 251
3П
Составляющая активности узла от контекста рассчитывается как общая накоплен-
ная активность, поступившая от всех возможных смежных узлов. В качестве механизма
расчета составляющей активности узла от контекста используется модель логогена
Мортона, рассмотренная ранее. Рассчитывается по формуле (4).
После нескольких итераций волна распространения активности затухает. На
этом этап воздействия m-го события фрагмента текста на контекст модели завершается.
При обработке следующего события вычисления повторяются. Полученное подмно-
жество активных узлов будет формировать контекстные знания модели о поступив-
шем тексте.
Текущая активность узла определяет наличие элемента, который этот узел
представляет, в обрабатываемом фрагменте текста.
На следующем шаге итерации первого такта текущая активность будет представ-
лена как активность верхнего слоя памяти, и будет учтена при расчете новой активности.
«Смыслом» анализируемого текста (или контекстом) будем считать цепочку
событий (фрагмент пропозициональной сети), узлы которой обладают нечеткой
характеристикой активности.
В терминах ГМ все знания, содержащиеся во входной текстовой информации,
будут представлены множеством T:
}
~
X,{ST ii ;
{b,c}xxT
~
X
~
iXi ),0)(( ,
где iS – i-й узел пропозициональной сети,
~
X i – активность i-го узла сети.
Для выделения контекста разного уровня восприятия текста введено понятие -уро-
вень активности, которое описывает обычное подмножество -уровня нечеткого отноше-
ния [4]. В данном случае под нечетким отношением понимается активный подграф вида:
(x)}{x|μ]
~
X[ α]
~
iX[
α
i ; {b,c}xα;(x)μ α]
~
iX[
,
где
α
i ]
~
X[ – активный подграф -уровня, – пороговое значение
активности узлов контекста ( ];[α 10 ).
Выводы
Представленная модель контекста может быть трактована как известный в
литературе по искусственному интеллекту, но не формализованный метод рассуж-
дений на основе опыта. Таким образом, рассуждения на основе опыта формали-
зованы и представлены в виде модели изменения активности сети. Результаты вывода
на основе неявных знаний (вывод на основе опыта), представленные в виде контекста,
могут быть использованы для последующих рассуждений на основе поверхностных
знаний (вывод на основе правил). Создание симбиоза в виде гибридной архитектуры,
сочетающей в себе рассуждения на основе правил и опыта, позволяет расширить
перечень задач, поддающихся автоматизации. Использование знаний, полученных
путем вывода на основе опыта, позволяет расширить область интерпретации текста,
а как следствие, повысить эффективность автоматизированных систем категоризации,
аннотации, а также информационно-поисковых систем.
Парамонов А.И.
«Искусственный интеллект» 4’2012252
3П
Литература
1. Парамонов А.И. Интенсиональные представления в виде нечеткой гибридной модели знаний /
А.И. Парамонов // Искусственный интеллект. – 2008. – № 3. – С. 605-611.
2. Ломонос Я.Г. Терминологическая разметка текста в автоматизированной системе
интеллектуальной обработки текстовой информации / Я.Г. Ломонос // Искусственный и
интеллект. – 2006. – № 3. – С. 537-547.
3. Люггер Дж.Ф. Искусственный интеллект: стратегии и методы решения сложных проблем /
Люггер Дж.Ф. – М. : Изд. дом «Вильямс», 2003. – 864 с.
4. Кофман А. Введение в теорию нечетких множеств / Кофман А. ; [пер. с франц.]. – М. : Радио и
связь, 1982. – 432 с., ил.
Literatura
1. Paramonov A.I. Fuzzy hybrid model of knowledge as Intensional representation / A.I. Paramonov //
Iskusstvennyj intellect. – 2008. – № 3. – P. 605-611.
2. Lomonos Y.G. Terminological text-markup into an automated system for intelligent processing of textual
information / Y.G. Lomonos // Iskusstvennyj intellect. – 2006. – № 3. – P. 537-547.
3. Luger George F. Artificial intelligence: strategies and methods for solving complex problems / Luger
George F. – Moscow : Publishing house «Williams», 2003. - 864 p.
4. Kofman A. Introduction to the theory of fuzzy sets [Translated from French.] / Kofman A. – Moscow :
Radio and Communication, 1982. – 432 p., Ill.
RESUME
A.I. Paramonov
The Problem of Text Interpretation
In article the approach to a problem of text interpretation is considered. The general
scheme of text processing is described. The method of interpretation textual information on the
basis of fuzzy conceptual model of knowledge representation [1] is developed.
Determinations of fuzzy data representation are defined. The fuzzy characteristic of
conceptual models networks – activity is entered. It is offered to use formalized cognitive
Morton’s logogen model (4). The stage of the conceptual analysis is constructed on the
basis of networks activity model. The model of activity assumes that the sense of the text is
formed as set of three components (8): the processed text, memory and contextual
knowledge. The mechanism of reasoning on the basis of experience is formalized in the
form of text interpretation model.
Results of a conclusion on the basis of the tacit knowledge (a conclusion on the basis
of experience), which are presented by a context, it’s offered to use for the subsequent
reasoning on the basis of superficial knowledge. Use of contextual model allows to expand
area of text interpretation, and as a result, to increase efficiency of the automated systems
of categorization, annotations and information search systems.
Статья поступила в редакцию 05.06.2012.
|