Иерархические нейронные сети как средство решения трудноформализуемых задач искусственного интеллекта
Несмотря на впечатляющие успехи одной из наиболее бурно развивающихся и перспективных наук
 современности, получившей название «искусственный интеллект», сложнейшей областью в ней по-
 прежнему является формализация ряда задач, решаемых человеком. Имеются многочисленные
 попы...
Saved in:
| Date: | 2009 |
|---|---|
| Main Authors: | , , |
| Format: | Article |
| Language: | Russian |
| Published: |
Інститут проблем штучного інтелекту МОН України та НАН України
2009
|
| Subjects: | |
| Online Access: | https://nasplib.isofts.kiev.ua/handle/123456789/7818 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| Journal Title: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Cite this: | Иерархические нейронные сети как средство решения трудноформализуемых задач искусственного интеллекта / Т.Ф. Басканова, Ю.П. Ланкин, С.В. Комиссаров // Штучний інтелект. — 2009. — № 1. — С. 100-111. — Бібліогр.: 33 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| _version_ | 1860017159670857728 |
|---|---|
| author | Басканова, Т.Ф. Ланкин, Ю.П. Комиссаров, С.В. |
| author_facet | Басканова, Т.Ф. Ланкин, Ю.П. Комиссаров, С.В. |
| citation_txt | Иерархические нейронные сети как средство решения трудноформализуемых задач искусственного интеллекта / Т.Ф. Басканова, Ю.П. Ланкин, С.В. Комиссаров // Штучний інтелект. — 2009. — № 1. — С. 100-111. — Бібліогр.: 33 назв. — рос. |
| collection | DSpace DC |
| description | Несмотря на впечатляющие успехи одной из наиболее бурно развивающихся и перспективных наук
современности, получившей название «искусственный интеллект», сложнейшей областью в ней по-
прежнему является формализация ряда задач, решаемых человеком. Имеются многочисленные
попытки ее упрощения на основе нечеткой логики, искусственных нейронных сетей и других
подобных методов. В результате этих исследований получается сложный конструктор из разно-
родных компонентов, относящихся к различным научным направлениям, и создаваемый под каждую
конкретную задачу. Одним из базовых направлений преодоления существующих трудностей является
построение адаптивных, иерархических архитектур. Однако это направление отпугивает многих
талантливых исследователей, говорящих об экспоненциально нарастающей сложности конструи-
рования системы. В данной статье предложен достаточно простой формализм, позволяющий строить
иерархические архитектуры на базе искусственных нейронных сетей.
Незважаючи на вражаючі успіхи однієї з найперспективніших наук сучасності, що бурхливо розвиваються
і яка отримала назву «штучний інтелект», найскладнішою галуззю в ній, як і раніше, є формалізація низки
завдань, які вирішує людина. Здійснюються численні спроби її спрощення на основі нечіткої логіки, штучних
нейронних мереж й інших подібних методів. У результаті цих досліджень отримуємо складний конструктор
із різнорідних компонентів, що належать до різних наукових напрямів, який створюється під кожну
конкретну задачу. Одним із базових напрямів подолання існуючих труднощів є побудова адаптивних,
ієрархічних архітектур. Однак цей напрям відлякує багатьох талановитих дослідників, які говорять про
експоненціально наростаючу складність конструювання системи. У даній статті запропонований
досить простий формалізм, який дозволяє будувати ієрархічні архітектури на базі штучних нейронних
мереж.
Despite of impressive successes of one of most actively developing and perspective sciences of the modernity which has obtained a title – the artificial intelligence, the extremely complicated area in it still is formalising of some the tasks solved by the person. There are numerous attempts of its simplification on the basis of fuzzy logic, artificial neural nets and other similar methods. As a result of these researches the complicated designer from the heterogeneous components concerning to various scientific directions and created under each specific target turns out. One of base directions of overcoming of existing difficulties is construction of adaptive, hierarchical architectures. However this direction frightens off many talented researches speaking about exponential increasing complexity of designing of a system. In the given article it is offered enough the simple formalism, permitting to build hierarchical architectures on the basis of artificial neural nets.
|
| first_indexed | 2025-12-07T16:45:46Z |
| format | Article |
| fulltext |
«Искусственный интеллект» 1’2009 100
3Б
УДК 519.7
Т.Ф. Басканова1, Ю.П. Ланкин2, С.В. Комиссаров3
1Сибирский федеральный университет, г. Красноярск, Россия
2Институт биофизики СО РАН, г. Красноярск, Россия
3Сибирский государственный технологический университет, г. Красноярск, Россия
tfbask@mail.ru, tfbask@mail.ru, lan7@mail.ru
Иерархические нейронные сети как средство
решения трудноформализуемых задач
искусственного интеллекта
Несмотря на впечатляющие успехи одной из наиболее бурно развивающихся и перспективных наук
современности, получившей название «искусственный интеллект», сложнейшей областью в ней по-
прежнему является формализация ряда задач, решаемых человеком. Имеются многочисленные
попытки ее упрощения на основе нечеткой логики, искусственных нейронных сетей и других
подобных методов. В результате этих исследований получается сложный конструктор из разно-
родных компонентов, относящихся к различным научным направлениям, и создаваемый под каждую
конкретную задачу. Одним из базовых направлений преодоления существующих трудностей является
построение адаптивных, иерархических архитектур. Однако это направление отпугивает многих
талантливых исследователей, говорящих об экспоненциально нарастающей сложности конструи-
рования системы. В данной статье предложен достаточно простой формализм, позволяющий строить
иерархические архитектуры на базе искусственных нейронных сетей.
Введение
Начиная с самых первых этапов, все развитие вычислительной техники является
грандиозной попыткой прорыва от достаточно простых методов автоматизации задач,
решаемых человеком, к вершинам человеческого интеллекта. Несмотря на множество
замечательных достижений, многие специалисты оценивают успехи в моделировании
мышления как весьма скромные и предлагают оставить надежду приблизить
возможности вычислительных систем к человеческим, по крайней мере, до конца
текущего столетия.
Вместе с тем решаемые человечеством задачи очень быстро усложняются. Это
касается не только чрезвычайно динамичных социальных, политических и эконо-
мических ситуаций, потребностей медицины, технического прогресса, космических
исследований соседних планет, но и быстро набирающего обороты планетарного
экологического кризиса, грозящего к середине текущего столетия смести с лица
Земли большую часть человечества [1]. Все эти задачи требуют создания сложных и
гибких инструментов моделирования, построения экспертных оценок и управления
природными и социальными системами.
Решение столь сложных задач невозможно без дальнейшего развития одного из
наиболее сложных и перспективных направлений науки – искусственного интел-
лекта. Среди ряда его направлений одними из наиболее перспективных методов
решения трудноформализуемых реальных задач по-прежнему остаются нейроинфор-
матика и нейрокибернетика. И следующим важным этапом их развития является
освоение иерархических архитектур.
Иерархические нейронные сети как средство решения...
«Штучний інтелект» 1’2009 101
3Б
Состояние области исследований
Как известно, наилучшим аппаратом для моделирования является тот, что обла-
дает базовыми свойствами моделируемого объекта или явления, которые требуется
отразить в создаваемой модели.
При построении реалистичных моделей мозга, мышления, природных и
социальных систем необходимо опираться на свойства системности, адаптивности и
иерархичности реальных объектов.
По словам современного специалиста по методологии науки Чайковского [2],
«можно с уверенностью сказать, что наука переориентируется с механико-статисти-
ческого понимания мира на системное». Вместе с тем в силу существующих
предубеждений и представления о сложности подобных моделей до сих пор преоб-
ладают механистические и статистические построения в ущерб реалистичности и
адекватности.
Считается, что, создав описание какого-либо процесса в виде системы диф-
ференциальных уравнений и выполнив их идентификацию по реальным данным,
можно получить адекватную модель явления. За исключением простых случаев для
двух-трех дифференциальных уравнений, поддающихся качественному анализу, или
случаев, сводимых к описанному (при условии ряда ограничений), такое представление
является весьма сомнительным. Оно напоминает средневековые механистические
взгляды на окружающий мир, говорящие о том, что, имея данные о начальном
состоянии вселенной, можно вычислить любое последующее ее состояние.
Однако, во-первых, достаточно сложная модель, содержащая несколько диф-
ференциальных уравнений и с десяток параметров, начинает напоминать нейросеть и
может иметь множество решений, включающих различные наборы параметров. Но, в
отличие от нейросети, структура которой формируется под решение задачи адаптивным
алгоритмом, такая модель не имеет целевой функции и варьирование параметрами
может приводить к непредсказуемым результатам. А сама процедура идентификации
(фитинг) в ряде случаев может представлять серьезную проблему.
Во-вторых, свойства реальных, квазистационарных или нестационарных сложных
систем нелинейно изменяются, их структура адаптивно (в биологии, социуме и
экологии, а по представлениям ряда ученых – и за их пределами) перестраивается под
текущие условия с учетом иерархических взаимодействий. В результате эффективность
чисто детерминистских моделей убедительно демонстрируется, например, качеством
прогнозов погоды. Собственно и модели гораздо более простых механических систем
зачастую оказываются весьма приближенными. Так, сотрудничая со специалистами в
работе над управляемыми конструкциями, один из авторов столкнулся с тем, что
сравнительно простая четырехпролетная балка оказалась статически неопределимой, и
ее модель удалось построить лишь с учетом прямых измерений на конкретном объекте,
учитывающих остаточные деформации. Проблема управления объектом и учета
изменений его свойств во времени была эффективно решена путем использования
адаптивного нейросетевого алгоритма управления [3].
В-третьих, сложные детерминированные системы, ввиду необозримости их много-
численных свойств и отсутствия конкретных данных, в ряде случаев приходится
описывать как статистические.
Все сказанное не отменяет ценности детерминистских моделей, однако должно
учитываться при правдоподобном моделировании систем реального мира и их
свойств, особенно свойств человеческого мозга, имитируемых системами искус-
ственного интеллекта.
Басканова Т.Ф., Ланкин Ю.П., Комиссаров С.В.
«Искусственный интеллект» 1’2009 102
3Б
В настоящее время известно, что методологические ограничения при по-
строении моделей мышления касаются не только детерминизма, но и формально-
логических методов, особенно популярных на первых этапах развития моделирования
интеллектуальных операций мозга. В частности, на принципах формальной логики
базировались многие начальные представления искусственного интеллекта, и ей
обязан своим появлением такой язык, как Пролог [4]. Этот язык активно
использовался при создании пятого поколения ЭВМ [5]. Обнародование амбициоз-
ного японского проекта создания компьютеров пятого поколения [6] произвело в
начале 80-х годов прошлого века эффект разорвавшейся бомбы и породило в ряде
ведущих стран гонку за первенство в области информационных технологий. Однако,
несмотря на ряд впечатляющих достижений, надежды разработчиков компьютеров
пятого поколения на создание высокоуровневых систем человеко-машинного
диалога, машинной формализации нечетко поставленных задач и других подобных
решений – не оправдались. Конструкторы столкнулись с «комбинаторным взрывом» –
экспоненциальным нарастанием требуемого объема памяти и времени вычислений при
попытке моделирования множества ассоциативных связей, возникающих у человека
при решении задач реального мира. Причем, как показано в [7], надежды на ее решение
за счет роста вычислительных мощностей и распараллеливание вычислений –
иллюзорны. Уменьшение размеров транзисторов и других элементов микропроцес-
сорных СБИС (позволяющее сократить длину проводящих путей с целью снижения
ограничений на время распространения сигналов, обусловленное конечной скорос-
тью их распространения) имеет конечные пределы. Эти пределы обусловлены
нарастанием влияния статистических квантовых эффектов, которые могут приводить
к ошибкам двоичной логики (используемой в компьютерах), с уменьшением раз-
меров электронных компонентов. Эффективность же параллельных вычислений
(сегодня параллельные архитектуры уже активно внедряются в повседневную жизнь
в виде многоядерных процессоров персональных компьютеров) также имеет ограничен-
ные возможности и растет не линейно – пропорционально числу процессоров, а
всего лишь пропорционально логарифму от числа процессоров. Не говоря уже о
том, что далеко не все задачи поддаются эффективному распараллеливанию
традиционными методами, а те, что поддаются (несмотря на все сложности
параллельного программирования), во многих случаях стремятся к вырождению в
последовательные процессы, когда весь кластер простаивает в ожидании одного или
нескольких критических процессов, без завершения которых невозможно продолжить
вычисления.
Как отмечается в [7], ограничения параллельных вычислений не распростра-
няются на нейронные сети, нейроны которых работают по одному алгоритму и могут
параллельно обрабатывать данные без необходимости учета их содержания.
Заметим, что проблемы логического моделирования мышления не сводятся к
вышеописанным. Так, в книге известного физика Д. Дойча [8], специалиста по
квантовой теории и квантовым вычислениям, приводится интересная формулировка
теоремы Геделя о неполноте: «Для любого набора правил вывода существуют
обоснованные доказательства, которые эти правила не определяют, как таковые».
Среди высказываний выдающихся ученых встречаются и такие [9]: «…можно
предложить формально безупречное исчисление, которое будет находиться в явном
противостоянии логике Аристотеля и, что главное, об этом исчислении спокойно
можно говорить на языке аристотелевой логики. И, более того, можно показать, что
эти две логики сосуществуют вместе в сознании человека».
Иерархические нейронные сети как средство решения...
«Штучний інтелект» 1’2009 103
3Б
При всей важности формально-логических методов рассмотренные ограни-
чения, вероятно, являются принципиальными и не преодолеваются также и в рамках
нечеткой логики, активно используемой в шестом поколении компьютеров наряду с
другими математическими методами, повышающими гибкость систем искус-
ственного интеллекта при решении задач реального мира.
Как кажется, одним из способов преодолеть ограничения описанных методологий
является использование случайности. Она позволяет имитировать методы поиска и
неожиданных творческих ходов в мышлении, напоминающих интуицию. Однако идеи
усредненного статистического описания сознания, предлагаемые В.В. Налимовым
в [9], [10] и другими исследователями, также не привели к принципиально новым
результатам, способным приблизиться к возможностям человеческого мозга и сохранили
лишь теоретическую ценность.
Прикладные результаты статистических методов достигли уровня распозна-
вания речи и построения иерархических систем анализа текстов с целью поиска
статистически значимых (как бы «смысловых») совпадений, позволяющих на основе
сходного окружения выделить вероятных претендентов на искомую информацию.
Такие системы весьма полезны для работы в поисковых серверах интернета или
поиске по текстам электронных изданий, но возможность сопоставления их с
человеческим мозгом является проблематичной.
Одна из популярных гипотез, связанных с работой самого мозга, высказана
еще одним известным физиком – Р. Пенроузом. Он говорит о принципиальной
невычислимости сознательного мышления и высказывает мнение о недостаточности
коннекционизма (на котором базируется большинство современных нейросетевых
алгоритмов) для моделирования сознания. Его гипотеза заключается в том, что
феномен мышления в человеческом мозге связан с квантовыми эффектами в
микротрубочках нейронов мозга [11]: «Я убежден, что фокус нашего внимания
следует переместить с нейронов на микротрубочки цитоскелета: именно там,
вероятнее всего, возникают коллективные (когерентные) квантовые эффекты…
Должна существовать существенная сцепленность между состояниями, поддержи-
ваемыми внутри отдельных цитоскелетов во многих нейронах, т.е. нечто вроде
коллективного квантового состояния, охватывающего обширные области мозга».
С точки зрения искусственного интеллекта, используемая Пенроузом термино-
логия наводит на мысль о квантовых компьютерах. Сам Р. Пенроуз высказывается
очень осторожно о возможности их физического воплощения. Более того, по его
мнению [11]: «Процессы, которые могут быть адекватно описаны в рамках вычис-
лимой (или случайной) физики, не могут… иметь отношения к сознанию», для
описания которого необходимо создание гипотетической OR-теории.
Весьма оптимистично мнение упомянутого выше специалиста по квантовым
физике и компьютерам Д. Дойча, доказавшего возможность существования универ-
сального квантового компьютера. Он утверждает, что с точки зрения природных
квантовых вычислений, научно-техническая реализация которых находится сейчас в
зачаточном состоянии, «…соответствующие эволюционные процессы, такие как жизнь
и мышление, не являются трудоемкими и требуют не слишком много дополнительных
ресурсов, чтобы произойти в реальности» [8].
Заметим, что в данной работе нам интересна возможность технического
воплощения модели мышления. Однако изучение современных представлений в
области квантовых вычислений приводит к рассмотрению процедур конструи-
рования специализированных квантовых вентилей, операций с кубитами (кванто-
Басканова Т.Ф., Ланкин Ю.П., Комиссаров С.В.
«Искусственный интеллект» 1’2009 104
3Б
выми битами), описания интерференции, «запутанных состояний», декогеренции
и т.д. [12]. Доказательство возможности физической реализации универсальных
квантовых компьютеров, необходимых для реализации моделей мышления в области
искусственного интеллекта, является в настоящий момент только теоретическим
результатом Д. Дойча. Соответственно, оценка потенциала подобных машин остает-
ся пока в области околонаучных гипотез и не может здесь рассматриваться.
Резюмируя сказанное, отметим, что, вероятно, правы оба исследователя. Согласно
Дойчу, сознание во Вселенной должно быть распространенным явлением.
А согласно Пенроузу, статистических методов и теоретических возможностей совре-
менной квантовой механики недостаточно для описания процессов мышления.
Обсуждая возможности использования современных подходов к имитации
процессов мозга и мышления, нельзя не упомянуть результаты, полученные
специалистами по синергетике (науке о самоорганизации). Одной из монографий,
имеющих отношение к описанию работы мозга, является книга Г. Хакена [13]. Она
содержит ряд тонких наблюдений и интерпретаций, описание самоорганизации для
простых случаев, параметров порядка и управляющих параметров, определяющих
поведение диссипативных систем. Демонстрируются простые примеры связи микро-
и макроуровней, приводится пример синергетического компьютера. В синергетике
имеются также попытки описания иерархических структур [14].
Однако при всей мировоззренческой ценности идей синергетики для современной
науки ее нынешние возможности ограничены достаточно простыми моделями. За несо-
ответствие деклараций и результатов она и подвергается многочисленной критике.
Совершив феноменальный скачок по объединению микро- и макроуровней в единые
системы и описав процессы их самоорганизации, синергетика не смогла выйти за
пределы традиционных физических и математических представлений, сдерживающих
ее дальнейшее развитие. Ее построения до сих пор остаются слишком тяжеловесными
для описания гибких адаптивных структур реального мозга и процессов мышления.
Проведенное рассмотрение трудностей реализации моделей человеческого
мышления и формализации представлений о решении задач реального мира в
современной науке вновь возвращает нас к нейроинформатике как одному из
наиболее перспективных направлений исследований в рассматриваемой области.
Идеи нейросетевых методов базируются на принципах организации мозга (свойства
моделируемого объекта и модели совпадают), и дальнейшее развитие этих идей
выглядит так же заманчиво, как и на начальных этапах исследований по созданию
искусственных интеллектуальных систем. Как и реальный мозг, нейросетевые
модели характеризуются пластичностью и многосвязностью, несводимостью свойств
объекта (нейросети) к сумме свойств его элементов (нейронов), т.е. системностью.
Подобно мозгу, они способны воспроизводить решение задачи путем обучения, а не
искусственного эвристического конструирования систем для каждого класса задач и
идеально приспособлены для распараллеливания вычислений. По этим причинам
неудивительно, что современные исследования по построению моделей осознания
выполняются на основе нейроподобных систем и включают иерархические
представления [15].
Как указывает Дунин-Барковский [16], авторы программы «Real World Computing
(RWC)» / «Вычисления в реальном мире» или шестого поколения компьютеров
«огромную роль (до 30 – 40 процентов ее содержания) отводят исследованию
естественных и созданию искусственных нейронных сетей».
Иерархические нейронные сети как средство решения...
«Штучний інтелект» 1’2009 105
3Б
Очередным серьезным шагом, позволяющим получить новые результаты в
области искусственного интеллекта и моделировании свойств мозга, представляется
возможность создания иерархических архитектур нейронных сетей, реализации
которых и посвящается данная статья.
Цель статьи
Цель данной статьи – предложить формальное описание иерархических архи-
тектур на основе искусственных нейронных сетей.
Постановка задачи
Постановка задачи основывается на ряде теоретических и практических пред-
посылок.
В предыдущих разделах были кратко рассмотрены возможности и ограничения
ряда базовых методов, используемых при моделировании мышления и решении
задач искусственного интеллекта. По мнению авторов, несмотря на все трудности
понимания принципов работы мозга и еще более серьезные проблемы адекватного
математического описания процессов мышления и решения интеллектуальных задач
человеком, постепенное сближение формальных моделей искусственного интеллекта
с архитектурой и процессами человеческого мозга является одним из наиболее
перспективных путей имитации решения человеком трудноформализуемых задач
реального мира.
Нельзя не согласиться с многочисленными критиками, что господствующие на
сегодня в нейроинформатике коннекционистские модели (успешно решающие
множество научных и прикладных задач) недостаточны для воспроизводства свойств
человеческого мышления в технических системах и моделируют лишь отдельные
аспекты в работе мозга. Увеличение числа моделируемых формальных нейронов не
ведет к принципиальным качественным изменениям свойств коннекционистских
моделей. Полезность этой парадигмы для решаемого класса задач пропорциональна
глубине понимания нейропсихологических принципов организации поведения и
мышления.
В череде проблем, к разрешению которых предстоит подойти, одной из
главных является создание формальных представлений для работы с адаптивными
иерархическими моделями структур мозга.
В современной нейропсихологии принято считать, «…что функциональные
системы головного мозга имеют одинаковое (иерархическое) строение и что
анатомические данные позволяют выделить в коре головного мозга первичные,
вторичные и третичные зоны» (рис. 1) [17]. С точки зрения обработки входных
потоков информации, первичные зоны являются проекционными для сенсорных
систем организма и осуществляют первичную обработку сенсорных данных. Вторич-
ные и третичные зоны являются ассоциативными или интегрирующими. Во вторичных
зонах осуществляется конвергенция сенсорных потоков соответствующей модальности,
а третичные зоны конвергируют мультимодальную сенсорную информацию и осу-
ществляют высшие корковые функции мозга, включая мышление.
Данная статья основывается на использовании авторского нейросетевого алго-
ритма самостоятельной адаптации [18], созданного для работы со сложными (в том
числе иерархическими) нейросетевыми архитектурами. В работе [19] показано, что
этот алгоритм является одним из наиболее перспективных среди современных нейро-
сетевых алгоритмов для построения виртуальных моделей мозга.
Басканова Т.Ф., Ланкин Ю.П., Комиссаров С.В.
«Искусственный интеллект» 1’2009 106
3Б
Рисунок 1 – Системы связей первичных, вторичных и третичных зон мозговой коры:
I – первичные (центральные) поля;
II – вторичные (периферические) поля;
III – третичные поля (зоны перекрытия анализаторов).
Жирными линиями выделены:
в I – система проекционных (корково-подкорковых) связей коры;
в II – система проекционно-ассоциативных связей коры;
в III – система ассоциативных связей коры;
1 – рецептор; 2 – эффектор; 3 – нейрон чувствительного узла; 4 – двигательный нейрон;
5, 6 – переключательные нейроны спинного мозга и ствола;
7-10 – переключательные нейроны подкорковых образований;
11, 14 – афферентные волокна из подкорки; 13 – пирамида V слоя;
16 – пирамида подслоя III3; 18 – пирамиды подслоев III2 и III1;
12, 15, 17 – звездчатые клетки коры
(по Г.И. Полякову)
Помимо рассмотренных теоретических предпосылок, статья основывается на
опыте решения различных задач [20-23] с помощью нейронных сетей и опыте
разработки аппаратных [24] и программных [25] нейросетевых имитаторов. В частности,
предпринимались теоретические и практические попытки построения иерархических
нейросетевых структур [26], [27] и исследования по динамической адаптации [28] и
взаимоадаптации [29] нейронных сетей.
Исходя из проведенного рассмотрения, задачей данной статьи работы является
предложить математическое описание структур иерархических нейронных сетей,
пригодное для программной реализации.
Иерархические архитектуры нейронных сетей
Рассмотрим обобщенную иерархическую архитектуру (адаптивную систему
[30]), включающую sP иерархических уровней, каждый из которых содержит pL
компонентов (нейронных сетей). Любой компонент системы может получать векторы
входных сигналов от одного или нескольких других (влияющих) компонентов и
передавать вектор своих выходных сигналов любым другим компонентам.
Иерархические нейронные сети как средство решения...
«Штучний інтелект» 1’2009 107
3Б
Каждый компонент рассматриваемой системы идентифицируется двумя индек-
сами ps LlPplp 1,1, . Нумерация иерархических уровней осуществляется
сверху вниз. Номер верхнего уровня – 1, а номер нижнего – sP .
Для задания произвольной структуры связей в иерархической системе удобно
использовать табличное (или матричное) представление и двойную систему индексов.
Индексами ,p l будем обозначать рассматриваемый компонент системы, а
индексами , 1 , 1s pr m r P m L – другие компоненты системы, посылающие
на рассматриваемый компонент векторы своих выходных сигналов mr
v
, . Здесь
lpVvv ,1 – номер вектора входных сигналов для компонента lp, , а lpV , –
общее число векторов входных сигналов для компонента lp, .
Тогда входные векторы для компонента lp, формируются объединением
векторов mr
v
, :
,
, ,
1
.
p lV
p l r m
v
v
B
(1)
Обозначим преобразование, осуществляемое на компонентах lp, как , .p lQ
Тогда выходные векторы этих компонентов будут равны
lplplp BQ ,,, . (2)
Значения ,r m по известному v могут быть получены из табл. 1.
Таблица 1 – Индексы влияющих компонентов mr,
p1 p2 … pPs
l1 l2 … lLp … … l1 l2 … lLp
v1 v2 v1 v2 v1 v2 v1 v2 … … v1 v2 v1 v2 v1 v2 v1 v2
r … … … … … … … … … … … … … … … … … …
m … … … … … … … … … … … … … … … … … …
Для простоты в таблице во всех случаях принято , 2p lV .
Предложенное формальное представление позволяет получить компактные
записи сложных структур взаимосвязей компонентов в рамках иерархических
архитектур.
Конкретные реализации иерархических архитектур на основе алгоритма,
предложенного в работе [18], могут выглядеть следующим образом. Пусть описание
формального нейрона иерархической нейронной сети имеет вид
, , ,p l p l
i iarctg (3)
где lp
i
, – сигнал i-го нейрона в выходном векторе нейросети lp, (2).
Заметим, что в соответствии с [31], вид нелинейности нейрона может быть
выбран достаточно произвольно, а работа обучающего алгоритма [18] не зависит от
этого выбора.
Соответственно,
, , , , ,
, ,p l p l p l r m Ps l
i j ij v i i
j v
x A (4)
Басканова Т.Ф., Ланкин Ю.П., Комиссаров С.В.
«Искусственный интеллект» 1’2009 108
3Б
где lp
j
, – сигналы на входе i-го нейрона от нейронов рассматриваемой нейросети
lp, ; lp
ijx , – веса связи нейросети lp, ; mr
iv
,
, – сигналы на входе i-го нейрона
нейросети lp, от нейронов других нейросетей иерархической адаптивной системы,
являющиеся компонентами векторов mr
v
, , составляющих входной вектор lpB , (1)
нейросети lp, ; lPs
iA , – внешние входные сигналы нейронов для нижнего
иерархического уровня sP .
Рассмотрим пример конкретной реализации иерархической архитектуры (рис. 2).
Рисунок 2 – Пример трехуровневой иерархической архитектуры из восьми
нейросетей (векторы внешних входных сигналов lPsA , не показаны)
Таблицы индексов влияющих компонентов для каждого из уровней иерархии
на рис. 2 будут выглядеть следующим образом (табл. 2-4).
Таблица 2 – Индексы влияющих компонентов ,r m 1-го уровня иерархии (p = 1)
p 1
l 1
v 1 2 3
r 2 2 2
m 1 2 3
Таблица 3 – Индексы влияющих компонентов ,r m 2-го уровня иерархии (p = 2)
p 2
l 1 2 3
v 1 2 3 4 5 1 2 3 4 5 1 2 3
r 1 2 3 3 3 1 2 3 3 3 2 3 3
m 1 2 1 2 3 1 3 2 3 4 1 3 4
1,1
3,1 3,2 3,3 3,4
2,1 2,2 2,3
Иерархические нейронные сети как средство решения...
«Штучний інтелект» 1’2009 109
3Б
Таблица 4 – Индексы влияющих компонентов ,r m 3-го уровня иерархии (p = 3)
p 3
l 1 2 3 4
v 1 2 1 1 2 3 1
r 1 3 3 1 3 3 3
m 1 3 1 1 2 4 2
Тогда для трехуровневой иерархической архитектуры, показанной на рис. 2, в
соответствии с уравнением (4) получим:
j
iiiijji x 3,2
,3
2,2
,2
1,2
,1
1,11,11,1
j
iiiiiijji x 3,3
,5
2,3
,4
1,3
,3
2,2
,2
1,1
,1
1,21,21,2
j
iiiiiijji x 4,3
,5
3,3
,4
2,3
,3
3,2
,2
1,1
,1
2,22,22,2
j
iiiijji x 4,3
,3
3,3
,2
1,2
,1
3,23,23,2 (5)
j
iiiijji Ax 1,33,3
,2
1,1
,1
1,31,31,3
j
iiijji Ax 2,31,3
,1
2,32,32,3
j
iiiiijji Ax 3,34,3
,3
2,3
,2
1,1
,1
3,33,33,3
j
iiijji Ax 4,32,3
,1
4,34,34,3 .
Сигналам mr
iv
,
, на входе i-го нейрона нейросети ,p l могут быть поставлены
в соответствие веса связей, аналогичные ,
, .p l
i jx
Заключение
В данной статье предложены математические представления, позволяющие строить
адаптивные, иерархические архитектуры на основе искусственных нейронных
сетей. Использование иерархии значительно расширяет возможности существующих
нейросетей.
Следует отметить, что трудности формализации множества важных реальных
задач, помешавшие достижению ряда поставленных в [32] целей, были одной из
основных причин более чем весьма ограниченного успеха программы компьютеров
5-го поколения. Но именно такими качественными представлениями обычно изобилуют
задачи реальной жизни, и к их обработке сложно подходить логическими и другими
традиционными формальными методами. Полученные формализмы предназначены для
расширения возможностей систем искусственного интеллекта по работе с трудно-
формализуемыми представлениями.
С другой стороны, предложенные в статье описания иерархических архитектур
могут быть достаточно просто перенесены на адаптивные модели мозга с целью
более глубокого его изучения и понимания. Один из примеров адаптивных моделей
Басканова Т.Ф., Ланкин Ю.П., Комиссаров С.В.
«Искусственный интеллект» 1’2009 110
3Б
нейронов мозга приведен в книге [33]. Вместе с тем для изучения общих системных
закономерностей работы мозга могут быть весьма полезны и простые, коннекцио-
нистские, иерархические нейронные сети, приведенные в данной работе.
Литература
1. Медоуз Д.Л., Медоуз Д., Йорген Р. За пределами роста. – М.: Издательская группа «Прогресс», 1994.
2. Чайковский Ю.В. Элементы эволюционной диатропики. – М.: Наука, 1990. – 272 с.
3. Ланкин Ю.П. Адаптивное нейросетевое управление механическим объектом // VII Всероссийская
конференция «Нейрокомпьютеры и их применение» с международным участием «НКП-2001». –
М.: ИПРЖР, 2001. – С. 168-171.
4. Братко И. Программирование на языке Пролог для искусственного интеллекта. – М.: Мир, 1990. – 560 с.
5. Язык Пролог в пятом поколении ЭВМ: Сб. статей. – М.: Мир, 1998. – 501 с.
6. Fifth Generation Computer Systems. Preliminary Report of Generation Computer Systems / Edited by
T. Mota-Oka. – Amsterdam, New York, Oxford: North-Holland Publication Company, 1982.
7. Барцев С.И., Гилев С.Е., Охонин В.А. Принцип двойственности в организации адаптивных сетей
обработки информации // Динамика химических и биологических систем. – Новосибирск: Наука,
Сиб. отд-ние, 1989. – С. 6-55.
8. Дойч Д. Структура реальности: Пер. с англ. – Ижевск: НИЦ «Регулярная и хаотическая динамика»,
2001. – 400 с.
9. Налимов В.В. Спонтанность сознания: вероятностная теория смыслов и смысловая архитектоника
личности. – М.: Прометей, 1989. – 287 с.
10. Налимов В.В. В поисках иных смыслов. – М.: Издательская группа «Прогресс», 1993. – 280 с.
11. Пенроуз Р. Тени разума: в поисках науки о сознании: Пер. с англ. – Москва; Ижевск: Институт
компьютерных исследований, 2005. – 688 с.
12. Берман Г.П., Дулен Г.Д., Майньери Р., Цифринович В.И. Введение в квантовые компьютеры / Пер.
с англ. – М.; Ижевск: Институт компьютерных исследований; НИЦ «Регулярная и хаотическая
динамика», 2004. – 188 с.
13. Хакен Г. Принципы работы головного мозга. Синергетический подход к активности мозга,
поведению и когнитивной деятельности: Пер. с англ. – М.: ПЕР СЭ, 2001. – 351 с.
14. Николис Дж. Динамика иерархических систем: Эволюционное представление: Пер. с англ. – М.:
Мир, 1989. – 488 с.
15. Кавамура К., Парин С.Б., Полевая С.А., Яхно В.Г. Возможность построения симуляторов осознания
сенсорных сигналов: Иерархия «распознающих ячеек»; нейроархитектура, психофизические данные //
Научная сессия МИФИ-2008. X Всероссийская научно-техническая конференция «Нейроинформатика-
2008». Лекции по нейроинформатике: В 2 ч. – Ч. 1. – М.: МИФИ, 2008. – С. 23-57.
16. Дунин-Барковский В.Л. Введение: Нейрокибернетика, нейроинформатика, нейрокомпьютеры //
Нейроинформатика. – Новосибирск: Наука. Сиб. предприят. РАН, 1998. – С. 5-17.
17. Лурия А.Р. Основы нейропсихологии. – М.: Издат. центр «Академия», 2006. – 384 с.
18. Lankin J.P., Baskanova T.F. Algorithms of self-adaptation for atmospheric model designing // SPIE. –
2004. – Vol. 5397. – P. 260-270.
19. Ланкин Ю.П., Парамонова Н.С., Маштакова Л.П. О возможности создания виртуальной модели
мозга // Ползуновский альманах. – 2006. – № 4. – С. 82-85.
20. Ланкин Ю.П., Землянский А.Н., Плотников С.В., Абросимов П.С., Путилов С.А. Нейроинформатика:
создание нейросетевых роботов для решения инженерно-экологических задач (адаптивные системы с
поисковым поведением) // Инженерная экология. – 2000. – № 3. – С. 3-18.
21. Lankin Yu.P., Lobova T.I., Popova L.Yu. Assessment of the Human Impact on the Aquatic Ecosystem of Lake
Shira using Neural Network Methods // Optical Memory and Neural Networks (Information Optics). – Vol. 15,
№ 2. – 2006. – P. 65-73.
22. Кашкин В.Б., Ланкин Ю.П., Сакаш И.Ю. Метод прогноза состояния озонового слоя Земли на различных
временных интервалах с применением нейронных сетей // Физика атмосферы и океана. – 2005. – Т. 41,
№ 4. – С. 520-526.
23. Ланкин Ю.П., Колокольцев В.М., Тухватулин И.Х., Долгополова Л.Б. Использование нейросетевых
методов при создании новых сплавов // Известия высших учебных заведений. Черная металлургия. –
2000. – № 11. – С. 44-48.
24. Барцев С.И., Ланкин Ю.П. Проектирование аналоговых специализированных нейропроцессоров //
Известия вузов. Радиоэлектроника. – 2000. – Т. 43, № 9. – С. 72-77.
Иерархические нейронные сети как средство решения...
«Штучний інтелект» 1’2009 111
3Б
25. Ланкин Ю.П., Лобова Т.И., Басканова Т.Ф. Интеллектуальные средства автоматизации решения
сложных классификационных задач // Искусственный интеллект. – 2007. – № 4. – С. 612-622.
26. Ланкин Ю.П., Ким И.Е. Разработка языковых моделей на сетях с самостоятельной адаптацией //
Научная сессия МИФИ-2001. III Всероссийская научно-техническая конференция «Нейроинфор-
матика-2001». – Сборник научных трудов: В 2 ч. – Ч. 1. – М.: МИФИ, 2001. – С. 129-136.
27. Лалетин П.А., Ланкина Э.Г., Ланкин Ю.П. Использование сетей с самостоятельной адаптацией для
распознавания слов человеческой речи // Научная сессия МИФИ-2000. II Всероссийская научно-
техническая конференция «Нейроинформатика-2000». – Сборник научных трудов: В 2 ч. – Ч. 2. –
М.: МИФИ, 2000. – С. 88-95.
28. Ланкин Ю.П., Лалетин А.П. Моделирование изменений экологических объектов с помощью
нейронных сетей // Сибирский экологический журнал. – 1999. – Т. VI, № 4. – С. 449-452.
29. Ланкин Ю.П. Взаимоадаптация нейронных сетей // VII Всероссийская конференция «Нейро-
компьютеры и их применение» с международным участием «НКП-2001». – М.: ИПРЖР, 2001. –
С. 566-569.
30. Ланкин Ю.П., Хлебопрос Р.Г. Экологические основания концепции самоадаптирующихся сетей и
систем с поисковым поведением // Инженерная экология. – 2001. – № 2. – С. 2-26.
31. Горбань А.Н. Обобщенная аппроксимационная теорема и вычислительные возможности нейрон-
ных сетей // Сибирский журнал вычислительной математики. – 1998. – 1, № 1. – С. 11-24.
32. ЭВМ пятого поколения: концепции, проблемы, перспективы: Пер. с яп. / Под ред. Т. Мото-Ока. –
М.: Финансы и статистика, 1984. – 110 с.
33. Гринченко С.Н. Системная память живого (как основа его метаэволюции и периодической
структуры). – М.: ИПИРАН, Мир, 2004. – 512 с.
Т.Ф. Басканова, Ю.П. Ланкін, С.В. Коміссаров
Ієрархічні нейронні мережі як засіб розв’язання важкоформалізованих задач штучного інтелекту
Незважаючи на вражаючі успіхи однієї з найперспективніших наук сучасності, що бурхливо розвиваються
і яка отримала назву «штучний інтелект», найскладнішою галуззю в ній, як і раніше, є формалізація низки
завдань, які вирішує людина. Здійснюються численні спроби її спрощення на основі нечіткої логіки, штучних
нейронних мереж й інших подібних методів. У результаті цих досліджень отримуємо складний конструктор
із різнорідних компонентів, що належать до різних наукових напрямів, який створюється під кожну
конкретну задачу. Одним із базових напрямів подолання існуючих труднощів є побудова адаптивних,
ієрархічних архітектур. Однак цей напрям відлякує багатьох талановитих дослідників, які говорять про
експоненціально наростаючу складність конструювання системи. У даній статті запропонований
досить простий формалізм, який дозволяє будувати ієрархічні архітектури на базі штучних нейронних
мереж.
T.F. Baskanova, Yu.P. Lankin, S.V. Komissarov
Hierarchical Neural Networks as Means of a Decision of Difficulty Formalizable Problems of an
Artificial Intelligence
Despite of impressive successes of one of most actively developing and perspective sciences of the modernity
which has obtained a title – the artificial intelligence, the extremely complicated area in it still is formalising of
some the tasks solved by the person. There are numerous attempts of its simplification on the basis of fuzzy logic,
artificial neural nets and other similar methods. As a result of these researches the complicated designer from the
heterogeneous components concerning to various scientific directions and created under each specific target turns
out. One of base directions of overcoming of existing difficulties is construction of adaptive, hierarchical
architectures. However this direction frightens off many talented researches speaking about exponential increasing
complexity of designing of a system. In the given article it is offered enough the simple formalism, permitting to
build hierarchical architectures on the basis of artificial neural nets.
Статья поступила в редакцию 02.07.2008.
|
| id | nasplib_isofts_kiev_ua-123456789-7818 |
| institution | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| issn | 1561-5359 |
| language | Russian |
| last_indexed | 2025-12-07T16:45:46Z |
| publishDate | 2009 |
| publisher | Інститут проблем штучного інтелекту МОН України та НАН України |
| record_format | dspace |
| spelling | Басканова, Т.Ф. Ланкин, Ю.П. Комиссаров, С.В. 2010-04-13T13:29:40Z 2010-04-13T13:29:40Z 2009 Иерархические нейронные сети как средство решения трудноформализуемых задач искусственного интеллекта / Т.Ф. Басканова, Ю.П. Ланкин, С.В. Комиссаров // Штучний інтелект. — 2009. — № 1. — С. 100-111. — Бібліогр.: 33 назв. — рос. 1561-5359 https://nasplib.isofts.kiev.ua/handle/123456789/7818 519.7 Несмотря на впечатляющие успехи одной из наиболее бурно развивающихся и перспективных наук
 современности, получившей название «искусственный интеллект», сложнейшей областью в ней по-
 прежнему является формализация ряда задач, решаемых человеком. Имеются многочисленные
 попытки ее упрощения на основе нечеткой логики, искусственных нейронных сетей и других
 подобных методов. В результате этих исследований получается сложный конструктор из разно-
 родных компонентов, относящихся к различным научным направлениям, и создаваемый под каждую
 конкретную задачу. Одним из базовых направлений преодоления существующих трудностей является
 построение адаптивных, иерархических архитектур. Однако это направление отпугивает многих
 талантливых исследователей, говорящих об экспоненциально нарастающей сложности конструи-
 рования системы. В данной статье предложен достаточно простой формализм, позволяющий строить
 иерархические архитектуры на базе искусственных нейронных сетей. Незважаючи на вражаючі успіхи однієї з найперспективніших наук сучасності, що бурхливо розвиваються
 і яка отримала назву «штучний інтелект», найскладнішою галуззю в ній, як і раніше, є формалізація низки
 завдань, які вирішує людина. Здійснюються численні спроби її спрощення на основі нечіткої логіки, штучних
 нейронних мереж й інших подібних методів. У результаті цих досліджень отримуємо складний конструктор
 із різнорідних компонентів, що належать до різних наукових напрямів, який створюється під кожну
 конкретну задачу. Одним із базових напрямів подолання існуючих труднощів є побудова адаптивних,
 ієрархічних архітектур. Однак цей напрям відлякує багатьох талановитих дослідників, які говорять про
 експоненціально наростаючу складність конструювання системи. У даній статті запропонований
 досить простий формалізм, який дозволяє будувати ієрархічні архітектури на базі штучних нейронних
 мереж. Despite of impressive successes of one of most actively developing and perspective sciences of the modernity which has obtained a title – the artificial intelligence, the extremely complicated area in it still is formalising of some the tasks solved by the person. There are numerous attempts of its simplification on the basis of fuzzy logic, artificial neural nets and other similar methods. As a result of these researches the complicated designer from the heterogeneous components concerning to various scientific directions and created under each specific target turns out. One of base directions of overcoming of existing difficulties is construction of adaptive, hierarchical architectures. However this direction frightens off many talented researches speaking about exponential increasing complexity of designing of a system. In the given article it is offered enough the simple formalism, permitting to build hierarchical architectures on the basis of artificial neural nets. ru Інститут проблем штучного інтелекту МОН України та НАН України Нейросетевые и нечеткие системы Иерархические нейронные сети как средство решения трудноформализуемых задач искусственного интеллекта Ієрархічні нейронні мережі як засіб розв’язання важкоформалізованих задач штучного інтелекту Hierarchical Neural Networks as Means of a Decision of Difficulty Formalizable Problems of an Artificial Intelligence Article published earlier |
| spellingShingle | Иерархические нейронные сети как средство решения трудноформализуемых задач искусственного интеллекта Басканова, Т.Ф. Ланкин, Ю.П. Комиссаров, С.В. Нейросетевые и нечеткие системы |
| title | Иерархические нейронные сети как средство решения трудноформализуемых задач искусственного интеллекта |
| title_alt | Ієрархічні нейронні мережі як засіб розв’язання важкоформалізованих задач штучного інтелекту Hierarchical Neural Networks as Means of a Decision of Difficulty Formalizable Problems of an Artificial Intelligence |
| title_full | Иерархические нейронные сети как средство решения трудноформализуемых задач искусственного интеллекта |
| title_fullStr | Иерархические нейронные сети как средство решения трудноформализуемых задач искусственного интеллекта |
| title_full_unstemmed | Иерархические нейронные сети как средство решения трудноформализуемых задач искусственного интеллекта |
| title_short | Иерархические нейронные сети как средство решения трудноформализуемых задач искусственного интеллекта |
| title_sort | иерархические нейронные сети как средство решения трудноформализуемых задач искусственного интеллекта |
| topic | Нейросетевые и нечеткие системы |
| topic_facet | Нейросетевые и нечеткие системы |
| url | https://nasplib.isofts.kiev.ua/handle/123456789/7818 |
| work_keys_str_mv | AT baskanovatf ierarhičeskieneironnyesetikaksredstvorešeniâtrudnoformalizuemyhzadačiskusstvennogointellekta AT lankinûp ierarhičeskieneironnyesetikaksredstvorešeniâtrudnoformalizuemyhzadačiskusstvennogointellekta AT komissarovsv ierarhičeskieneironnyesetikaksredstvorešeniâtrudnoformalizuemyhzadačiskusstvennogointellekta AT baskanovatf íêrarhíčníneironnímerežíâkzasíbrozvâzannâvažkoformalízovanihzadačštučnogoíntelektu AT lankinûp íêrarhíčníneironnímerežíâkzasíbrozvâzannâvažkoformalízovanihzadačštučnogoíntelektu AT komissarovsv íêrarhíčníneironnímerežíâkzasíbrozvâzannâvažkoformalízovanihzadačštučnogoíntelektu AT baskanovatf hierarchicalneuralnetworksasmeansofadecisionofdifficultyformalizableproblemsofanartificialintelligence AT lankinûp hierarchicalneuralnetworksasmeansofadecisionofdifficultyformalizableproblemsofanartificialintelligence AT komissarovsv hierarchicalneuralnetworksasmeansofadecisionofdifficultyformalizableproblemsofanartificialintelligence |