Структуризация и анализ данных в растущих пирамидальных сетях
Рассматривается организация памяти интеллектуальных систем в виде растущих пирамидальных сетей (РПС), обеспечивающая формирование понятия, иерархическое упорядочение, классификацию вводимой информации. Приведены алгоритм построения РПС при вводе признаковых описаний объектов по частям, а также резул...
Saved in:
| Published in: | Системні дослідження та інформаційні технології |
|---|---|
| Date: | 2004 |
| Main Authors: | , , , |
| Format: | Article |
| Language: | Russian |
| Published: |
Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України
2004
|
| Subjects: | |
| Online Access: | https://nasplib.isofts.kiev.ua/handle/123456789/50331 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| Journal Title: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Cite this: | Структуризация и анализ данных в растущих пирамидальных сетях / В.П. Гладун, Н.Д. Ващенко, В.Ю. Величко, Ю.Г. Ткаченко // Систем. дослідж. та інформ. технології. — 2004. — № 1. — С. 82-92. — Бібліогр.: 6 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| _version_ | 1859590887122665472 |
|---|---|
| author | Гладун, В.П. Ващенко, Н.Д. Величко, В.Ю. Ткаченко, Ю.Г. |
| author_facet | Гладун, В.П. Ващенко, Н.Д. Величко, В.Ю. Ткаченко, Ю.Г. |
| citation_txt | Структуризация и анализ данных в растущих пирамидальных сетях / В.П. Гладун, Н.Д. Ващенко, В.Ю. Величко, Ю.Г. Ткаченко // Систем. дослідж. та інформ. технології. — 2004. — № 1. — С. 82-92. — Бібліогр.: 6 назв. — рос. |
| collection | DSpace DC |
| container_title | Системні дослідження та інформаційні технології |
| description | Рассматривается организация памяти интеллектуальных систем в виде растущих пирамидальных сетей (РПС), обеспечивающая формирование понятия, иерархическое упорядочение, классификацию вводимой информации. Приведены алгоритм построения РПС при вводе признаковых описаний объектов по частям, а также результаты применения РПС для анализа данных в химии и материаловедении.
Розглядається організація пам’яті інтелектуальних систем у вигляді зростаючих пірамідальних мереж (ЗПМ), яка дозволяє формування поняття, ієрархічне впорядкування, класифікацію інформації, що вводиться. Наведено алгоритм побудови ЗПМ під час вводу ознакових описів об’єктів по частинам, а також результати застосування ЗПМ для аналізу даних у хімії та матеріалознавстві.
The paper deals with memory organization for intelligent systems in the form of growing pyramidal networks (GPS), which provides processes of concept formation, hierarchical regulation and classification of input information. The algorithm of GPS building is described for the case when object descriptions are introduced by parts. Results of GPS application in chemistry and material science are discussed.
|
| first_indexed | 2025-11-27T15:18:10Z |
| format | Article |
| fulltext |
© В.П. Гладун, Н.Д. Ващенко, В.Ю. Величко, Ю.Г. Ткаченко, 2004
82 ISSN 1681–6048 System Research & Information Technologies, 2004, № 1
TIДC
ПРОБЛЕМНО І ФУНКЦІОНАЛЬНО
ОРІЄНТОВАНІ КОМП’ЮТЕРНІ СИСТЕМИ
ТА МЕРЕЖІ
УДК 681.3:06
СТРУКТУРИЗАЦИЯ И АНАЛИЗ ДАННЫХ В РАСТУЩИХ
ПИРАМИДАЛЬНЫХ СЕТЯХ
В.П. ГЛАДУН, Н.Д. ВАЩЕНКО, В.Ю. ВЕЛИЧКО, Ю.Г ТКАЧЕНКО
Рассматривается организация памяти интеллектуальных систем в виде расту-
щих пирамидальных сетей (РПС), обеспечивающая формирование понятия,
иерархическое упорядочение, классификацию вводимой информации. Приве-
дены алгоритм построения РПС при вводе признаковых описаний объектов по
частям, а также результаты применения РПС для анализа данных в химии и
материаловедении.
ВВЕДЕНИЕ
Соревнование компьютера с человеком в решении так называемых интел-
лектуальных задач все чаще завершается победой компьютера. Однако воз-
никает очевидное противоречие — компьютер решает сложные многовари-
антные задачи в искусственных, относительно бедных средах (например,
шахматы), и «спотыкается» в решении простых (для человека) житейских
задач, требующих, тем не менее, быстрого понимания и оценки многоком-
понентных ситуаций.
Чем компенсируется у человека очевидное преимущество компьютера
в быстродействии? Ответ один: в основном, организацией памяти. Постара-
емся выделить структурные свойства памяти, которые, по нашему мнению,
необходимы для формирования вразумительных объяснений человеческого
феномена обработки информации.
1. Превалирующей тенденцией в развитии интеллектуальных систем
является совершенствование человеко-машинного взаимодействия, вплоть
до достижения партнерского уровня отношений. Поэтому необходимо ис-
пользовать в компьютерах естественные, свойственные человеку принципы
моделирования сред, ситуаций, задач. Типы моделей у партнеров (человека
и компьютера) должны быть одинаковыми. В жизнедеятельности человека
важное значение имеют логико-лингвистические информационные модели,
т.е. такие, в которых основные элементы — не числа и вычислительные
операции, а имена и логические связи. Логико-лингвистические модели аде-
кватно описываются естественно-языковыми конструкциями, и в этом одно
из важнейших их достоинств в организации человеко-машинного интерфей-
Структуризация и анализ данных в растущих пирамидальных сетях
Системні дослідження та інформаційні технології, 2004, № 1 83
са. В будущих компьютерах должны быть созданы условия для человеко-
машинного решения задач в партнерском режиме, обеспечивающем пе-
реключение от компьютера к человеку и наоборот в процессе решения од-
ной задачи. Такой режим можно организовать только согласованием
типов информационных моделей, используемых партнерами. Логико-
лингвистические модели — наиболее приемлемый тип моделей для такого
согласования.
2. Структура памяти формируется одновременно с восприятием и под
влиянием воспринимаемой и уже хранящейся информации. Она отображает
воспринятую информацию. Структуризация информации — неотъемлемая
функция памяти. К основным процессам структуризации относятся форми-
рование ассоциативных связей путем выделения пересечений признаковых
представлений объектов, иерархическое упорядочение, классификация,
формирование обобщенных логических признаковых моделей классов (по-
нятий). В реальных условиях восприятия информации часто нет возможно-
сти получить полную информацию об объекте сразу, единовременно (на-
пример, из-за неудачного ракурса или освещенности при восприятии
зрительной информации). Поэтому процессы формирования памяти должны
допускать возможность «порционной», по частям, достройки моделей объ-
ектов и их классов.
3. В различных процессах обработки информации объекты представ-
ляются одним из двух способов: именем (свернутое, конвергированное
представление) или набором значений признаков (развернутое представле-
ние). Структура памяти должна обеспечивать удобный переход от одного
представления к другому. Механизмы, обеспечивающие такой переход в
нейросистеме человека при опознании и вспоминании, рассматриваются в
работах Г.С. Воронкова и З.Л. Рабиновича [1].
Сформулируем приведенные тезисы в виде требований к организации
памяти в интеллектуальных системах.
• Знания разных типов должны объединяться в иерархическую се-
тевую структуру, построенную на единых для всех видов знаний прин-
ципах.
• Структура, представляющая знания, должна обладать развитыми ас-
социативными свойствами и таким образом обеспечивать выполнение раз-
нородных поисковых операций.
• Сеть должна отражать иерархичность реальных сред и в связи с этим
быть удобной для представления родовидовых связей и структур составных
объектов.
• Обязательными функциями памяти должны быть формирование ас-
социативных связей путем выделения пересечений признаковых представ-
лений объектов, иерархического упорядочения, классификации, формирова-
ния понятий. Эти функции должны выполняться одновременно с
восприятием информации.
• В сети должен быть обеспечен удобный двунаправленный переход
между свернутым и развернутым представлениями объектов.
В.П. Гладун, Н.Д. Ващенко, В.Ю. Величко, Ю.Г Ткаченко
ISSN 1681–6048 System Research & Information Technologies, 2004, № 1 84
РАСТУЩАЯ ПИРАМИДАЛЬНАЯ СЕТЬ
Приведенным требованиям удовлетворяют РПС. Применение РПС для ре-
шения аналитических задач в различных областях науки и техники подтвер-
дило их репутацию эффективного средства структуризации больших объе-
мов данных, обеспечивающего не только высокие результаты при решении
аналитических задач, но и, в отличие от нейронных сетей, формирование
легко интерпретируемых обобщенных описаний закономерностей, характе-
ризующих классы объектов.
Теория и практические применения РПС описаны во многих публика-
циях [2–6]. В этой статье приводятся несколько измененные правила фор-
мирования РПС, обеспечивающие их построение при вводе признаковых
описаний объектов по частям, и сопоставляются результаты применения
РПС при выполнении анализа данных индуктивными методами и методами,
в основе которых лежит вывод по аналогии.
Растущей пирамидальной сетью называется ациклический ориентиро-
ванный граф, в котором нет вершин, имеющих одну входящую дугу. Вер-
шины, не имеющие входящих дуг, называются рецепторами, остальные —
концепторами. Подграф пирамидальной сети, содержащий вершину a и
все вершины, от которых имеются пути к a , называется пирамидой верши-
ны a . Вершины, входящие в пирамиду вершины a , образуют ее субмноже-
ство. Множество вершин, к которым имеются пути от вершины a , называ-
ется ее супермножеством.
В субмножестве и супермножестве вершины выделяются 0-субмножество
и 0-супермножество, состоящие из тех вершин, которые связаны с ней непо-
средственно. При построении сети входной информацией служат наборы
значений признаков, описывающих некоторые объекты (материалы, состоя-
ния агрегата, ситуации, болезни и т.п.). Рецепторы соответствуют значениям
признаков. В различных задачах это могут быть имена свойств, отношений,
состояний, действий, объектов или классов объектов. Концепторы соответ-
ствуют описаниям объектов в целом и пересечениям описаний.
В начальном состоянии сеть состоит только из рецепторов. Концепто-
ры формируются в результате работы алгоритма построения сети. Алгоритм
[2–5] предназначен для работы в ситуациях, когда признаковое описание
каждого объекта полностью известно и вводится целиком. При появлении
новых признаков, характеризующих объект, необходимо формировать новое
полное описание объекта и заменять представляющую его пирамиду другой,
соответствующей новому описанию. Однако, как уже отмечалось, в реаль-
ных ситуациях функционирования интегрального интеллектуального агента
далеко не всегда возможно одновременное восприятие всех характеристик
объекта. В этих случаях информация об объектах поступает по частям. По-
является необходимость изменить алгоритм построения сети таким образом,
чтобы обеспечить возможность включения в существующие пирамиды объ-
ектов новых признаков по мере их появления, без замены пирамид в целом.
Приведем описание измененного алгоритма.
При вводе признакового описания объекта рецепторы, соответствую-
щие значениям признаков, входящим в описание, переводятся в состояние
возбуждения. Процесс возбуждения распространяется по сети. Концептор
Структуризация и анализ данных в растущих пирамидальных сетях
Системні дослідження та інформаційні технології, 2004, № 1 85
переводится в состояние возбуждения, если возбуждены все вершины его
0-субмножества. Рецепторы и концепторы сохраняют состояние возбужде-
ния в течение выполнения всех операций достройки сети.
Пусть при вводе описания объекта aF – подмножество возбужденных
вершин 0-субмножества вершины a ; G — множество возбужденных вер-
шин сети, не имеющих других возбужденных вершин в своих супермно-
жествах.
Ввод новых вершин производится по следующим правилам.
Правило 1.
Если вершина a не возбуждена, и множество aF содержит более одно-
го элемента, то дуги, соединяющие вершины из множества aF с вершиной
a, ликвидируются, и в сеть вводится новый концептор, который соединяется
заходящими дугами с вершинами множества aF и исходящей дугой с вер-
шиной a . Новая вершина находится в состоянии возбуждения.
Выполнение правила 1 иллюстрируется рис. 1 (I, II).
Сеть II возникает после возбуждения в сети I рецепторов 2, 3, 4, 5.
Как следует из правила 1, условием ввода в сеть новой вершины явля-
ется ситуация, когда некоторая вершина сети оказывается не полностью
возбужденной (возбуждаются не все, но не менее двух вершин ее
0 -субмножества). Новые вершины вводятся в субмножества не полностью
возбужденных вершин.
После введения новых вершин во все участки, где удовлетворяется ус-
ловие правила 1, выполняется правило 2 или 3.
a a
I
1 2 3 4 5 6 7
Fa
II
1 2 3 4 5 6 7
G
Новая вершина
b a a
III
1 2 3 4 5 6 7
G
1
IV
2 3 4 5 6 7
b
Новая вершина
Рис. 1. Построение сети
В.П. Гладун, Н.Д. Ващенко, В.Ю. Величко, Ю.Г Ткаченко
ISSN 1681–6048 System Research & Information Technologies, 2004, № 1 86
Правило 2.
Если множество G содержит более одного элемента и не содержит
вершины, помеченной именем введенного объекта, к сети присоединяется
новый концептор, который соединяется заходящими дугами со всеми вер-
шинами множества G . Новая вершина находится в возбужденном состоя-
нии. Выполнение правила 2 иллюстрируется рис.1(ІІ,ІІІ). Сеть ІІІ возникает
после возбуждения в сети II рецепторов 2, 3, 4, 5, 6.
Правило 3.
Если множество G содержит более одного элемента, в том числе вер-
шину, помеченную именем введенного объекта, то эта вершина соединяется
входящими дугами с теми вершинами из множества G , которые не соеди-
нены с ней.
Выполнение правила 3 иллюстрируется рис.1(ІІІ,ІV). Сеть ІV возникает
после возбуждения в сети ІІІ рецепторов 2, 3, 4, 5, 6, 7 при условии, что они
соответствуют описанию объекта b .
В измененном алгоритме возможность включения в существующие пи-
рамиды новых признаков обеспечивается правилом 3.
Пирамидальные сети удобны для выполнения различных операций ас-
социативного поиска. Например, можно выбрать все объекты с заданным
сочетанием значений признаков, прослеживая пути из вершины сети, соот-
ветствующей этому сочетанию. Для выборки всех объектов, описания кото-
рых пересекаются с описанием заданного объекта, достаточно проследить
пути из вершин, образующих его пирамиду.
Алгоритм построения сети обеспечивает автоматическое установление
ассоциативной близости между объектами по общим элементам их описа-
ний. Все процессы построения сети при обработке одного описания локали-
зуются в относительно небольшой ее части – пирамиде, соответствующей
этому описанию.
Важным свойством пирамидальных сетей является их иерархичность,
позволяющая естественным образом отображать структуру составных объ-
ектов и родовидовые связи.
Концепторы сети соответствуют сочетаниям значений признаков,
определяющих конъюнктивные классы объектов. При включении возбуж-
денных вершин в пирамиду объекта осуществляется привязка объекта к
классам, определения которых представлены этими вершинами. Таким об-
разом при построении сети формируются конъюнктивные классы объектов,
т.е. осуществляется классификация без учителя. Классифицирующие свойс-
тва пирамидальной сети имеют большое значение для моделирования сред и
ситуаций.
Переход от конвергированных представлений объектов (концепторов) к
развернутым (наборам рецепторов) осуществляется путем просмотра пира-
мид в разных направлениях (сверху вниз и наоборот).
В РПС реализуются индуктивные процессы формирования обобщен-
ных логических моделей классов объектов (понятий) [2–5]. Сформирован-
ное понятие представляется в сети ансамблем особо выделенных (кон-
трольных) вершин. На основе анализа сети специальная процедура строит
понятие в форме логического выражения.
Структуризация и анализ данных в растущих пирамидальных сетях
Системні дослідження та інформаційні технології, 2004, № 1 87
В таблице приведен пример формирования понятий на основе анализа
фрагмента обучающей выборки. Даны описания керамических материалов
двух классов с использованием следующих признаков: M — материал, T —
тонкость порошка, C — его состав, PP — способ получения порошка, GP —
условия получения образца при горячем прессовании, NoGP — другие усло-
вия получения образца, DU — особые условия изготовления образца, Por —
пористость, Z — зернистость. Буквы и цифры обозначают значения соответ-
ствующих признаков.
Обучающая выборка
Объект Класс M T C PP GP NoGP DU Por Z
97 1 Al 2 SYN 2 2GP
96 1 Al 2 SYN 2 1GP
92 1 Al 2 SYN 2 2GP 1
227 1 TiB 11 TiO-C SYN 9 3 2
228 1 TiB 11 TiO-C SYN 9 3 2
229 1 TiB 11 TiO-C SYN 9 3 2
233 1 SiC 11 TiO-C SYN 9 3 2
234 1 SiC 11 SiO-C SYN 9 3 2
235 1 SiC 11 SiO-C SYN 9 3 2
237 1 SiC 11 SiO-C SYN 9 3 2
239 1 ZrB 11 ZrO-C SYN 9 3 2
240 1 ZrB 11 ZrO-C SYN 9 3 2
241 1 ZrB 11 ZrO-C SYN 9 3 2
242 1 ZrB 11 ZrO-C SYN 9 3 2
154 1 TiB 7 TiO-C KRB 3 3 4
156 1 TiB 7 TiO-C KRB 3 3 4
163 1 1AlO 1 AlO SYN 1 4
158 2 TiB 8 TiO-C KRB 3 3 6
160 2 1AlO 1 AlO SYN 1 1
159 2 BC 1 SYN 1 1
308 2 ZrB 11 ZrO-C SYN 9 2
На рис. 2 показана соответствующая пирамидальная сеть после выпол-
нения процесса формирования понятий. Контрольные вершины PP_SYN,
Por_3, 239, 163 характеризуют класс 1, а 158, 308 и $6 — класс 2.
Класс 1 описывается следующим логическим выражением, где ∨, ∧,
¬ — логические операции дизъюнкции, конъюнкции и отрицания:
PP_SYN ∧ ¬{T_1 ∧ GP_1} ∧ ¬ {M_ZrB ∧ C_ZrO-C ∧ T_11 ∧
NoGP_9 ∧ Z_2} ∨
Por_3 ∧ ¬{T_8 ∧ Z_6 ∧ M_TiB ∧ C_TiO-C ∧ PP_KRB ∧ GP_3} ∨
M_ZrB ∧ C_ZrO-C ∧ T_11 ∧ PP_SYN ∧ NoGP_9 ∧ Por_3 ∧ Z_2 ∨
M_1AlO ∧ T_1 ∧ C_AlO ∧ PP_SYN ∧ GP_1 ∧ Por_4.
В.П. Гладун, Н.Д. Ващенко, В.Ю. Величко, Ю.Г Ткаченко
ISSN 1681–6048 System Research & Information Technologies, 2004, № 1 88
Логические выражения, определяющие различные классы объектов,
объединяются в кластерные базы данных (КБД). КБД содержат информа-
цию о группах объектов (кластерах), специфичных для исследуемой пред-
метной области. На основе КБД решаются задачи классификации, диагно-
стики и прогнозирования.
После того как понятие для некоторого класса объектов сформировано,
проблемы прогнозирования и диагностики сводятся к задаче классифика-
ции. Классификация новых объектов выполняется путем сравнения их при-
знаковых описаний с понятием, определяющим класс прогнозируемых или
диагностируемых объектов. Объекты можно классифицировать, вычисляя
значение логических выражений, которые представляют соответствующие
понятия.
Для лучшего понимания алгоритма формирования понятий дадим его
геометрическую интерпретацию.
Каждой вершине сети, имеющей k рецепторов в своем субмножестве,
соответствует )( ks − -мерная плоскость в s -мерном признаковом простран-
стве. Плоскость содержит все точки, представляющие объекты, при воспри-
ятии которых возбуждается эта вершина. )( ks − -мерные плоскости, соот-
ветствующие контрольным вершинам понятия iQ , будем называть зонами
понятия iQ .
Для пирамидальных сетей справедливы следующие утверждения.
Утверждение 1. Зона некоторой вершины сети целиком входит в зоны
вершин ее субмножества и содержит зоны вершин ее супермножества.
Утверждение 2. Точка, представляющая объект в признаковом про-
странстве, находится внутри области, образованной пересечением зон кон-
трольных вершин, которые возбуждаются при восприятии этого объекта.
В результате работы алгоритма для каждого из сформированных поня-
тий строится область из зон признакового пространства, содержащая все
Рис. 2. Пример сети
Структуризация и анализ данных в растущих пирамидальных сетях
Системні дослідження та інформаційні технології, 2004, № 1 89
точки объектов соответствующего класса и не содержащая ни одной точки,
представляющей объекты других классов. Она аппроксимирует распределе-
ние объектов соответствующего класса и состоит из линейных элементар-
ных областей (гиперплоскостей), а ограничивающая ее поверхность являет-
ся кусочно-линейной. Следовательно, алгоритм осуществляет кусочно-
линейное разделение объектов, соответствующих разным понятиям.
Описанный метод обеспечивает решение аналитических проблем клас-
сификации, диагностики и прогнозирования на основе логических моделей
классов объектов. Модель отображает зависимости исследуемого класса от
сочетаний значений признаков, т.е. дает возможность учесть эффект совме-
стного влияния нескольких признаков.
Существенной особенностью метода формирования понятий в пирами-
дальных сетях является возможность введения в понятия так называемых
исключающих признаков, которые не принадлежат объектам исследуемого
класса. Таким образом сформированные понятия имеют более компактную
логическую структуру, что в принципе позволяет увеличить точность диаг-
ноза или прогноза. В логическом выражении исключающие признаки пред-
ставлены переменными с отрицанием.
Все поисковые операции пирамидальной сети ограничиваются сравни-
тельно малым фрагментом сети, который содержит пирамиду объекта и
вершины, непосредственно связанные с ней. Это создает принципиальную
возможность решать практические аналитические проблемы на основе боль-
ших объемов данных.
В пирамидальной сети информация хранится в виде отображения в
структуре сети. Информация об объектах и классах объектов представлена
ансамблями вершин (пирамидами), распределенными по всей сети. Внесе-
ние новой информации вызывает перераспределение связей между верши-
нами сети, т.е. изменение ее структуры.
Конечно, в полной мере достоинства пирамидальных сетей проявляют-
ся при их физической реализации, допускающей параллельное распростра-
нение сигналов по сети. Важным свойством сети как средства хранения
информации является то, что параллельное распространение сигналов со-
четается в ней с возможностью параллельного приема сигналов на рецеп-
торы.
Существует аналогия между основными процессами в РПС и нейрон-
ных сетях. Главное преимущество РПС: ее структура формируется полно-
стью автоматически в зависимости от вводимых данных. В результате дос-
тигается оптимизация представления информации путем адаптации
структуры сети к структурным особенностям данных. Причем, в отличие от
нейронных сетей, эффект адаптации достигается без введения априорной
избыточности сети. Процесс обучения не зависит от ее предопределенной
конфигурации. Недостатком нейронных сетей по сравнению с РПС является
то, что выделенные в них обобщенные знания не могут быть явно представ-
лены в виде правил или логических выражений. Это затрудняет их интер-
претацию и понимание человеком.
В.П. Гладун, Н.Д. Ващенко, В.Ю. Величко, Ю.Г Ткаченко
ISSN 1681–6048 System Research & Information Technologies, 2004, № 1 90
ЭКСПЕРИМЕНТЫ И ПРИМЕНЕНИЕ
Программный комплекс, используемый для проведения экспериментов и
решения прикладных задач, состоит из трех систем.
1. CONFOR — реализует индуктивные методы.
2. ANALOGY — использует вывод по аналогии.
3. DISCRET — с ее помощью признаки, заданные в числовых шкалах,
преобразуются в номинальные. Эта задача называется задачей дискретиза-
ции. Дискретизация выполняется на шкалах числовых признаков сравнени-
ем распределений объектов обучающей выборки, принадлежащих различ-
ным классам.
Вывод по аналогии является основой методов, суть которых состоит в
анализе объектов обучающей выборки, наиболее «похожих» на исследуе-
мый объект. Исследуемый объект считается принадлежащим классу, чьи
объекты соответствуют в пространстве признаков точкам, расположенным
наиболее близко к точке, представляющей исследуемый объект (метод K
ближайших соседей). Проблема поиска аналогии должна решаться вместе с
вопросами организации памяти, обеспечивающей установление аналогии
объектов.
В свете современных воззрений это должна быть память коннекциони-
стского типа, допускающая параллельное выполнение поисковых операций
и отражающая в своей структуре семантические пересечения блоков ин-
формации. Этим требованиям отвечают растущие пирамидальные сети. Ал-
горитм построения сети, работающий при вводе описаний новых объектов,
одновременно является алгоритмом поиска в сети аналогов нового объекта,
имеющих общие с ним фрагменты описаний. Степень подобия объектов
оценивается мощностью пересечения их атрибутивных описаний.
Комплекс прошел длительное испытание временем. Типичные при-
кладные задачи, для решения которых использовался комплекс: прогнози-
рование новых химических соединений и материалов с заданными свойст-
вами, солнечной активности, нарушений в работе сложных агрегатов, а
также прогнозирование в генетике, геологии, медицинская и техническая
диагностика.
Сравнение методов прогнозирования на основе индуктивного вывода и
вывода по аналогии проводилось на задачах прогнозирования существова-
ния неорганических соединений с заданными свойствами.
В качестве обучающей выборки использовались таблицы, содержащие
атрибутивные описания двойных, тройных и четверных систем химических
элементов, образующих и не образующих химические соединения. Обу-
чающие выборки для двойных, тройных и четверных систем содержали со-
ответственно 1333, 4278 и 4963 описания, а экзаменационные выборки —
692, 2156 и 2536 описаний. Каждый химический элемент описывался 87
признаками. Описания двойных, тройных и четверных систем состояли со-
ответственно из 174, 261 и 348 признаков. Была достигнута достаточно вы-
сокая точность прогноза — от 97,88 до 99,86%.
На основании результатов экспериментов можно сделать следующие
выводы:
Структуризация и анализ данных в растущих пирамидальных сетях
Системні дослідження та інформаційні технології, 2004, № 1 91
1. Методы, основанные на аналогии с предварительным переводом чи-
словых признаков в номинальные (система DISCRET), более просты в ис-
пользовании и дают хорошие результаты прогноза при условии применения
представительных обучающих выборок в случаях, когда области распреде-
ления объектов разных классов в пространстве признаков компактны. Без
предварительного перевода признаков в номинальные реализация методов
существенно усложняется из-за необходимости согласования единиц изме-
рения для признаков, заданных в различных шкалах.
2. В методах, основанных на аналогии, результаты классификации за-
висят от параметра, определяющего размеры анализируемого окружения
точки, представляющей объект в признаковом пространстве (например,
число K в методе K ближайших соседей). Естественно выбирать K таким
образом, чтобы обеспечить наилучшую классификацию объектов экзамена-
ционной выборки. В этом случае параметр K может идеально разделять
экзаменационную выборку и, тем не менее, давать плохие результаты при
классификации других объектов.
3. Использование методов, содержащих индуктивный вывод, снижает
требования к обучающей выборке. Однако в отличие от методов, основан-
ных на аналогии, индуктивные методы гораздо чаще приводят к появлению
неопределенного прогноза (ответа типа «не знаю»). Это происходит, в част-
ности, в случаях, когда исследуемый объект одновременно соответствует
закономерностям, характеризующим различные классы. Работу системы
CONFOR, реализующей методы, которые содержат индуктивный вывод,
можно сравнить с поведением серьезного исследователя, «не бросающего
слов на ветер». Работая в очень сложном «зашумленном» признаковом про-
странстве, он часто отвечает «не знаю», однако дает прогноз с большой сте-
пенью точности.
4. Иногда важным достоинством индуктивных методов прогнозирова-
ния является создание обобщенной модели исследуемого класса объектов,
которая представляется в виде логического выражения, удобного для интер-
претации человеком.
ЗАКЛЮЧЕНИЕ
Растущая пирамидальная сеть является сетевой памятью, автоматически на-
страиваемой на структуру входной информации. B отличие от сетей нейро-
подобных элементов эффект адаптации достигается без введения априорной
избыточности сети.
Исследования, выполненные на сложных данных большого объема, по-
казали высокую эффективность применения растущих пирамидальных сетей
для решения аналитических задач. Такие качества, как простота внесения
изменений, совмещение процессов ввода информации с ее классификацией,
обобщением и выделением существенных признаков, высокая ассоциатив-
ность, делают растущие пирамидальные сети важным компонентом прогно-
зирующих и диагностических систем.
В.П. Гладун, Н.Д. Ващенко, В.Ю. Величко, Ю.Г Ткаченко
ISSN 1681–6048 System Research & Information Technologies, 2004, № 1 92
ЛИТЕРАТУРА
1. Воронков Г.С. Рабинович З.Л. Естественная среда памяти и мышления: мо-
дельное представление //Тр. междунар. конф. «Знание — Диалог — Реше-
ние — 2001». — СПБ: Изд. Сев.-Зап. политехн. ин-та, 2001. — С. 110–115.
2. Гладун В.П. Партнерство с компьютером. Человеко-машинные целеустремлен-
ные системы. — Киев: Port-Royal, 2000. — 118 с.
3. Гладун В.П. Ващенко Н.Д. Локально-статистические методы формирования
знаний // Кибернетика и системный анализ. – 1995. — № 2. — С. 62–74.
4. Гладун В.П. Планирование решений. — Киев: Наук. думка, 1987. — 167 с.
5. Gladun V.P. and Vashchenko N.D. Analitical processes in pyramidal networks // In-
tern. Journal on Information Theories and Applications. FOI-COMMERCE,
Sofia. — 2000. — 7, № 3. — С. 103–109.
6. Kiselyova N., Gladun V., Vashchenko N. Computational Materials Design Using Ar-
tificial Intelligence Methods // Journal of Alloys and Compounds. — 1998. —
№ 279. — Р. 8–13.
Поступила 18.06.2003
|
| id | nasplib_isofts_kiev_ua-123456789-50331 |
| institution | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| issn | 1681–6048 |
| language | Russian |
| last_indexed | 2025-11-27T15:18:10Z |
| publishDate | 2004 |
| publisher | Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України |
| record_format | dspace |
| spelling | Гладун, В.П. Ващенко, Н.Д. Величко, В.Ю. Ткаченко, Ю.Г. 2013-10-10T20:18:14Z 2013-10-10T20:18:14Z 2004 Структуризация и анализ данных в растущих пирамидальных сетях / В.П. Гладун, Н.Д. Ващенко, В.Ю. Величко, Ю.Г. Ткаченко // Систем. дослідж. та інформ. технології. — 2004. — № 1. — С. 82-92. — Бібліогр.: 6 назв. — рос. 1681–6048 https://nasplib.isofts.kiev.ua/handle/123456789/50331 681.3:06 Рассматривается организация памяти интеллектуальных систем в виде растущих пирамидальных сетей (РПС), обеспечивающая формирование понятия, иерархическое упорядочение, классификацию вводимой информации. Приведены алгоритм построения РПС при вводе признаковых описаний объектов по частям, а также результаты применения РПС для анализа данных в химии и материаловедении. Розглядається організація пам’яті інтелектуальних систем у вигляді зростаючих пірамідальних мереж (ЗПМ), яка дозволяє формування поняття, ієрархічне впорядкування, класифікацію інформації, що вводиться. Наведено алгоритм побудови ЗПМ під час вводу ознакових описів об’єктів по частинам, а також результати застосування ЗПМ для аналізу даних у хімії та матеріалознавстві. The paper deals with memory organization for intelligent systems in the form of growing pyramidal networks (GPS), which provides processes of concept formation, hierarchical regulation and classification of input information. The algorithm of GPS building is described for the case when object descriptions are introduced by parts. Results of GPS application in chemistry and material science are discussed. ru Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України Системні дослідження та інформаційні технології Проблемно і функціонально орієнтовані комп’ютерні системи та мережі Структуризация и анализ данных в растущих пирамидальных сетях Структуризація та аналіз даних у зростаючих пірамідальних мережах Structuring and analysis of data in growing pyramidal networks Article published earlier |
| spellingShingle | Структуризация и анализ данных в растущих пирамидальных сетях Гладун, В.П. Ващенко, Н.Д. Величко, В.Ю. Ткаченко, Ю.Г. Проблемно і функціонально орієнтовані комп’ютерні системи та мережі |
| title | Структуризация и анализ данных в растущих пирамидальных сетях |
| title_alt | Структуризація та аналіз даних у зростаючих пірамідальних мережах Structuring and analysis of data in growing pyramidal networks |
| title_full | Структуризация и анализ данных в растущих пирамидальных сетях |
| title_fullStr | Структуризация и анализ данных в растущих пирамидальных сетях |
| title_full_unstemmed | Структуризация и анализ данных в растущих пирамидальных сетях |
| title_short | Структуризация и анализ данных в растущих пирамидальных сетях |
| title_sort | структуризация и анализ данных в растущих пирамидальных сетях |
| topic | Проблемно і функціонально орієнтовані комп’ютерні системи та мережі |
| topic_facet | Проблемно і функціонально орієнтовані комп’ютерні системи та мережі |
| url | https://nasplib.isofts.kiev.ua/handle/123456789/50331 |
| work_keys_str_mv | AT gladunvp strukturizaciâianalizdannyhvrastuŝihpiramidalʹnyhsetâh AT vaŝenkond strukturizaciâianalizdannyhvrastuŝihpiramidalʹnyhsetâh AT veličkovû strukturizaciâianalizdannyhvrastuŝihpiramidalʹnyhsetâh AT tkačenkoûg strukturizaciâianalizdannyhvrastuŝihpiramidalʹnyhsetâh AT gladunvp strukturizacíâtaanalízdanihuzrostaûčihpíramídalʹnihmerežah AT vaŝenkond strukturizacíâtaanalízdanihuzrostaûčihpíramídalʹnihmerežah AT veličkovû strukturizacíâtaanalízdanihuzrostaûčihpíramídalʹnihmerežah AT tkačenkoûg strukturizacíâtaanalízdanihuzrostaûčihpíramídalʹnihmerežah AT gladunvp structuringandanalysisofdataingrowingpyramidalnetworks AT vaŝenkond structuringandanalysisofdataingrowingpyramidalnetworks AT veličkovû structuringandanalysisofdataingrowingpyramidalnetworks AT tkačenkoûg structuringandanalysisofdataingrowingpyramidalnetworks |