Критерии сравнения распознающих моделей на основе нейронных сетей и анализ их взаимосвязей
Решена актуальная проблема автоматизации построения и анализа распознающих и диагностических моделей на основе нейронных сетей. Предложен комплекс критериев сравнения нейромоделей и методов их синтеза, содержащий в дополнение к традиционно используемым критериям времени и точности критерии, харак...
Saved in:
| Published in: | Искусственный интеллект |
|---|---|
| Date: | 2014 |
| Main Author: | |
| Format: | Article |
| Language: | Russian |
| Published: |
Інститут проблем штучного інтелекту МОН України та НАН України
2014
|
| Subjects: | |
| Online Access: | https://nasplib.isofts.kiev.ua/handle/123456789/85242 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| Journal Title: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Cite this: | Критерии сравнения распознающих моделей на основе нейронных сетей и анализ их взаимосвязей / С.А. Субботин // Искусственный интеллект. — 2014. — № 1. — С. 142–152. — Бібліогр.: 5 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| id |
nasplib_isofts_kiev_ua-123456789-85242 |
|---|---|
| record_format |
dspace |
| spelling |
Субботин, С.А. 2015-07-23T12:04:34Z 2015-07-23T12:04:34Z 2014 Критерии сравнения распознающих моделей на основе нейронных сетей и анализ их взаимосвязей / С.А. Субботин // Искусственный интеллект. — 2014. — № 1. — С. 142–152. — Бібліогр.: 5 назв. — рос. 1561-5359 https://nasplib.isofts.kiev.ua/handle/123456789/85242 004.93 Решена актуальная проблема автоматизации построения и анализа распознающих и диагностических моделей на основе нейронных сетей. Предложен комплекс критериев сравнения нейромоделей и методов их синтеза, содержащий в дополнение к традиционно используемым критериям времени и точности критерии, характеризующие логическую прозрачность. Проведены вычислительные эксперименты по исследованию предложенных критериев сравнения нейронных сетей путём решения практических задач. Вирішено актуальну проблему автоматизації побудови та аналізу розпізнавальних і діагностичних моделей на основі нейронних мереж. Запропоновано комплекс критеріїв порівняння нейромоделей і методів їх синтезу, що містить на додаток до традиційно використовуваних критеріїв часу і точності критерії, що характеризують логічну прозорість. Проведено обчислювальні експерименти з дослідження запропонованих критеріїв порівняння нейронних мереж шляхом вирішення практичних завдань. The actual problem of automation of construction and analysis of recognition and diagnostic models based on neural networks was solved. The set of criteria for comparing of neural network models and synthesis methods was proposed. It contains in addition to the traditionally used time and accuracy criteria the criteria characterizing the logical transparency. Computational experiments on the proposed criteria for comparison of neural networks were conducted by solving practical problems. ru Інститут проблем штучного інтелекту МОН України та НАН України Искусственный интеллект Интеллектуальные системы планирования, управления, моделирования и принятия решений Критерии сравнения распознающих моделей на основе нейронных сетей и анализ их взаимосвязей Критерії порівняння розпізнавальних моделей на основі нейронних мереж і аналіз їх взаємозв’язків Criteria for comparison of recognition models based on neural networks and analysis of their mutual relations Article published earlier |
| institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| collection |
DSpace DC |
| title |
Критерии сравнения распознающих моделей на основе нейронных сетей и анализ их взаимосвязей |
| spellingShingle |
Критерии сравнения распознающих моделей на основе нейронных сетей и анализ их взаимосвязей Субботин, С.А. Интеллектуальные системы планирования, управления, моделирования и принятия решений |
| title_short |
Критерии сравнения распознающих моделей на основе нейронных сетей и анализ их взаимосвязей |
| title_full |
Критерии сравнения распознающих моделей на основе нейронных сетей и анализ их взаимосвязей |
| title_fullStr |
Критерии сравнения распознающих моделей на основе нейронных сетей и анализ их взаимосвязей |
| title_full_unstemmed |
Критерии сравнения распознающих моделей на основе нейронных сетей и анализ их взаимосвязей |
| title_sort |
критерии сравнения распознающих моделей на основе нейронных сетей и анализ их взаимосвязей |
| author |
Субботин, С.А. |
| author_facet |
Субботин, С.А. |
| topic |
Интеллектуальные системы планирования, управления, моделирования и принятия решений |
| topic_facet |
Интеллектуальные системы планирования, управления, моделирования и принятия решений |
| publishDate |
2014 |
| language |
Russian |
| container_title |
Искусственный интеллект |
| publisher |
Інститут проблем штучного інтелекту МОН України та НАН України |
| format |
Article |
| title_alt |
Критерії порівняння розпізнавальних моделей на основі нейронних мереж і аналіз їх взаємозв’язків Criteria for comparison of recognition models based on neural networks and analysis of their mutual relations |
| description |
Решена актуальная проблема автоматизации построения и анализа распознающих и диагностических
моделей на основе нейронных сетей. Предложен комплекс критериев сравнения нейромоделей и
методов их синтеза, содержащий в дополнение к традиционно используемым критериям времени и точности
критерии, характеризующие логическую прозрачность. Проведены вычислительные эксперименты по
исследованию предложенных критериев сравнения нейронных сетей путём решения практических задач.
Вирішено актуальну проблему автоматизації побудови та аналізу розпізнавальних і діагностичних моделей
на основі нейронних мереж. Запропоновано комплекс критеріїв порівняння нейромоделей і методів їх
синтезу, що містить на додаток до традиційно використовуваних критеріїв часу і точності критерії, що
характеризують логічну прозорість. Проведено обчислювальні експерименти з дослідження запропонованих
критеріїв порівняння нейронних мереж шляхом вирішення практичних завдань.
The actual problem of automation of construction and analysis of recognition and diagnostic models based on neural
networks was solved. The set of criteria for comparing of neural network models and synthesis methods was
proposed. It contains in addition to the traditionally used time and accuracy criteria the criteria characterizing the
logical transparency. Computational experiments on the proposed criteria for comparison of neural networks were
conducted by solving practical problems.
|
| issn |
1561-5359 |
| url |
https://nasplib.isofts.kiev.ua/handle/123456789/85242 |
| citation_txt |
Критерии сравнения распознающих моделей на основе нейронных сетей и анализ их взаимосвязей / С.А. Субботин // Искусственный интеллект. — 2014. — № 1. — С. 142–152. — Бібліогр.: 5 назв. — рос. |
| work_keys_str_mv |
AT subbotinsa kriteriisravneniâraspoznaûŝihmodeleinaosnoveneironnyhseteiianalizihvzaimosvâzei AT subbotinsa kriterííporívnânnârozpíznavalʹnihmodeleinaosnovíneironnihmerežíanalízíhvzaêmozvâzkív AT subbotinsa criteriaforcomparisonofrecognitionmodelsbasedonneuralnetworksandanalysisoftheirmutualrelations |
| first_indexed |
2025-11-27T02:58:48Z |
| last_indexed |
2025-11-27T02:58:48Z |
| _version_ |
1850795746676178944 |
| fulltext |
ISSN 1561-5359 «Искусственный интеллект» 2014 № 1 142
3С
УДК 004.93
С.А. Субботин
Запорожский национальный технический университет
Украина, 69063, г. Запорожье, ул. Жуковского, 64
Критерии сравнения распознающих моделей
на основе нейронных сетей и анализ их взаимосвязей
S.A. Subbotin
Zaporizhzhya National Technical University
Ukraine, 69063, Zaporizhzhya, Zhukovskiy st., 64
Criteria for Comparison of Recognition Models Based on
Neural Networks and Analysis of Their Mutual Relations
С.А. Субботін
Запорізький національний технічний університет
Україна, 69063, м. Запорожжя, вул. Жуковського, 64
Критерії порівняння розпізнавальних моделей
на основі нейронних мереж і аналіз їх взаємозв’язків
Решена актуальная проблема автоматизации построения и анализа распознающих и диагностических
моделей на основе нейронных сетей. Предложен комплекс критериев сравнения нейромоделей и
методов их синтеза, содержащий в дополнение к традиционно используемым критериям времени и точности
критерии, характеризующие логическую прозрачность. Проведены вычислительные эксперименты по
исследованию предложенных критериев сравнения нейронных сетей путём решения практических задач.
Ключевые слова: нейронная сеть, распознавание образов, диагностирование,
анализ моделей, критерий сравнения.
The actual problem of automation of construction and analysis of recognition and diagnostic models based on neural
networks was solved. The set of criteria for comparing of neural network models and synthesis methods was
proposed. It contains in addition to the traditionally used time and accuracy criteria the criteria characterizing the
logical transparency. Computational experiments on the proposed criteria for comparison of neural networks were
conducted by solving practical problems.
Key words: neural network pattern recognition, diagnosis, model analysis, comparison criterion.
Вирішено актуальну проблему автоматизації побудови та аналізу розпізнавальних і діагностичних моделей
на основі нейронних мереж. Запропоновано комплекс критеріїв порівняння нейромоделей і методів їх
синтезу, що містить на додаток до традиційно використовуваних критеріїв часу і точності критерії, що
характеризують логічну прозорість. Проведено обчислювальні експерименти з дослідження запропонованих
критеріїв порівняння нейронних мереж шляхом вирішення практичних завдань.
Ключові слова: нейронна мережа, розпізнавання образів, діагностування, аналіз моделей,
критерій порівняння.
Введение
В задачах построения распознающих и диагностических моделей широкое рас-
пространение на практике получили искусственные нейронные сети (НС), благодаря
их способностям обучаться прецедентам [1], [2].
Поскольку на сегодняшний день предложено достаточно много различных типов
архитектур НС и еще больше существует вариантов реализации сетей каждого типа,
Критерии сравнения распознающих моделей на основе нейронных сетей...
«Штучний інтелект» 2014 № 1 143
3С
то большое значение приобретает задача сравнения и выбора такой модели, реали-
зуемой НС, которая удовлетворяла бы целому ряду требований относительно качества
функционирования.
Одной из наиболее широко применяемых на практике архитектур НС являются
многослойные НС (МНС) прямого распространения сигнала, для которых предложе-
ны эффективные методы обучения [1], [3]. Большое видовое разнообразие известных
методов обучения МНС также делает актуальным сравнение и отбор наиболее
практически полезных методов, что, в свою очередь, требует разработки соответст-
вующих критериев сравнения.
Традиционно используемыми на практике критериями сравнения МНС и мето-
дов их построения являются минимум достигаемой ошибки и минимум времени
(числа итераций), затрачиваемых на построение модели [1], [3]. Однако при наличии
ряда методов, позволяющих получать модели с приемлемыми значениями ошибки и
примерно одинаковым временем обучения, выбор наилучшего метода и наилучшей
модели оказывается нетривиальной задачей.
Целью данной работы является создание критериев, позволяющих количест-
венно оценивать основные свойства моделей на основе МНС и методов их построения.
Постановка задачи
Пусть мы имеем исходную выборку X = <x, y> – набор S прецедентов о за-
висимости y(x), x = {xs}, y={ys}, s = 1, 2, ..., S, характеризующихся набором N
входных признаков {xj}, j = 1, 2, ..., N, где j – номер признака, и выходным призна-
ком y. Каждый s-й прецедент представим как <xs, ys>, xs={xs
j}, где xs
j – значение j-го
входного, а ys – значение выходного признака для s-го прецедента (экземпляра)
выборки, ys {1, 2, ..., K}, где K – число классов, K>1.
МНС можно представить как иерархическую структуру вида:
, ..., 2, 1, , ..., 2, 1, },{ , (...))),,(( 1
),(),(),0(),1(),()1,()1,( MNiwwxwy i
j
is
i
iiMiMMMs
где M – число слоёв, Nμ – число узлов (нейронов) в μ-м слое, ),(),( и ii – со-
ответственно, дискриминантная (весовая) и активационная функции i-го узла μ-го
слоя, ),( i
jw – значение веса j-го входа i-го узла μ-го слоя.
Множество )}({ ),(),(),( iiiy определяет структурные блоки МНС, а }{ ),( i
jw –
её параметры.
Тогда задача построения МНС заключается в задании таких её структуры
)}({ ),(),(),( iiiy и параметров }{ ),( i
jw , которые удовлетворяют комплексу крите-
риев }{ i , где i – i-й критерий качества МНС.
Соответственно, для анализа свойств и сравнения методов построения и моде-
лей МНС необходимо определить показатели i , позволяющие количественно вы-
ражать основные свойства МНС и методов их обучения.
Критерии сравнения нейромоделей
Как известно, сходимость итеративных методов обучения МНС, зависит, кроме
размерности обучающих данных и начальных значений весов, также от задаваемых
максимально допустимой общей ошибки обучения (критерий качества обучения) и
количества допустимых циклов обучения (критерий длительности обучения).
Субботин С.А.
«Искусственный интеллект» 2014 № 1 144
3С
Эти два критерия останова целесообразно использовать при сравнении итеративных
методов обучения МНС. Зафиксировав поочередно каждый из критериев останова обуче-
ния, можно проследить, как для каждого метода обучения МНС при одинаковых обучаю-
щих выборках меняются время обучения МНС tоб., затраченное количество циклов
обучения epoch и достигнутая точность (ошибка) E [1], [3].
В [1] для сравнения методов обучения НС предлагается наряду с количеством
циклов обучения использовать такой критерий, как Nv – количество дополнительных
переменных для организации вычислительного процесса. Под дополнительными
здесь понимаются переменные, необходимые для сохранения промежуточных ре-
зультатов вычислений при программной реализации метода обучения. Предпочтение
следует отдавать тем методам, которые при обучении НС требуют малого числа до-
полнительных переменных, что связано с ограничением ресурсов вычислительных
средств.
Достаточно важной характеристикой любой распознающей системы является
ее сложность. Исходя из биологической специфики НС, в [2] применительно к ним
предлагается использовать следующую терминологию:
– структурная (статическая) сложность системы – описывает построение
системы из составляющих ее подсистем;
– вычислительная сложность (сложность управления) – мера вычислительных
ресурсов, необходимых для детального расчета особенностей динамики системы,
описывает выполняемые операции обработки информации и характеризует практи-
ческую сложность детального понимания поведения системы – может быть сведена
к зависимости вычислительных возможностей (ресурсов вычислительной системы),
необходимых для моделирования поведения системы, от размера задачи.
Структурную сложность нейросетевой модели, основными структурными элемен-
тами которой являются нейроны, будем характеризовать количеством нейронов Nн.,
которое для МНС определяется по формуле:
M
NN
1
н. .
Вычислительную сложность нейросетевой модели будем характеризовать числом
используемых ячеек памяти Nп.м. и количеством времени работы tp., затрачиваемым
на расчет значений выходов модели при заданных входах для одного экземпляра,
либо количеством времени работы НС для всех экземпляров обучающей выборки tp.о.
или тестовой выборки tp.т..
Вычислительную сложность метода синтеза нейросетевой модели будем характери-
зовать числом используемых ячеек памяти Nп.а. и количеством времени, затрачиваемым
на обучение модели, tоб..
Очевидно, что число используемых ячеек памяти Nп.а. будет равно сумме числа ячеек,
необходимых для хранения обучающей выборки, числа ячеек, необходимых для хранения
переменных модели (в случае НС – весов и порогов), и числа ячеек, необходимых для
хранения Nv дополнительных переменных: п.а. . ,в M w w v vN S N N N N где .в –
число ячеек памяти для хранения одного элемента данных обучающей выборки;
S(N+NM) – число элементов данных (размерность) обучающей выборки, включая ко-
личество элементов данных целевых признаков; w – число ячеек памяти, необходи-
мых для хранения одного веса сети; Nw – количество весов и порогов сети; v – число
ячеек памяти, необходимых для хранения одной дополнительной переменной метода
обучения.
Критерии сравнения распознающих моделей на основе нейронных сетей...
«Штучний інтелект» 2014 № 1 145
3С
Таких традиционно используемых при сравнении НС и методов их обучения
показателей, как точность (ошибка) аппроксимации сетью обучающей или тестовой
выборки и время, затрачиваемое на обучение сети и (или) работу обученной сети
оказывается недостаточно, поскольку даже несколько НС одного и того же типа, с
одинаковой топологией, обученные на одних и тех же данных с помощью одного и
того же метода обучения и обеспечивающие почти одинаковую точность аппрокси-
мации и сравнимое время обучения и работы, из-за разных начальных состояний (разных
значений весов перед обучением) могут обладать существенно разным качеством,
что связано с уровнем логической прозрачности полученной нейросетевой модели,
избыточностью памяти и связей сети, качеством аппроксимации обучающих данных.
Поэтому в дополнение к рассмотренным ранее критериям сравнения НС, не-
обходимо разработать комплекс частных и обобщенных критериев, позволяющих
количественно оценивать вышеперечисленные свойства нейросетевых моделей, сравни-
вать их и принимать решение о выборе более оптимальной модели для решения постав-
ленной задачи.
Как было отмечено выше, НС обладают памятью, реализуемой весами. Чем
меньше память сети, тем меньше образов она может запомнить, но если две сети с
разным объемом памяти обеспечивают требуемую точность распознавания (оцени-
вания), то сеть с меньшей памятью, очевидно, будет проявлять лучшие обобщающие
свойства.
Избыточность памяти сети будем характеризовать с помощью коэффициента
избыточности для хранения обучающей выборки:
SN
NK w
I , Nw > 1, S > 0, N > 0.
Если KI > 1, то память сети избыточна (размерность памяти сети больше
размерности обучающей выборки). Если KI = 1, то сеть может запомнить всю
обучающую выборку (размерность памяти сети равна размерности обучающей выборки).
Если KI < 1, то сеть не сможет в точности запомнить всю обучающую выборку
(размерность памяти сети меньше размерности обучающей выборки), однако при этом
сеть будет проявлять обобщающие и аппроксимирующие способности.
В случае если количество весов, равных нулю, в НС Nw=0 велико, то KI будем
определять как:
SN
NNK ww
I
0
.
Поскольку НС являются вычислительными устройствами, весьма важными
характеристиками являются сложность их аппаратной или программной реализации,
а также время работы в процессе распознавания одного экземпляра данных.
Вычислительную сложность i-го нейрона μ-го слоя T(μ,i) будем определять как:
T(μ,i) = N(μ,i)(Tc
(μ,i) + Tφ
(μ,i)) + Tψ
(μ,i), где N(μ,i) –число входов i-го нейрона μ-го слоя; Tc
(μ,i)
– вычислительная сложность одного синапса i-го нейрона μ-го слоя; Tφ
(μ,i)
–
вычислительная сложность дискриминантной функции i-го нейрона μ-го слоя для
обработки двух аргументов; Tψ
(μ,i)
– вычислительная сложность функции активации i-
го нейрона μ-го слоя. Заметим, что, если ψ(μ,i)(x) = x, то Tψ
(μ,i) можно положить равной
нулю. Вычислительные сложности синапсов, дискриминантных функций и функций
активации определяют с учетом условий реализации сети (на разных ЭВМ с разной
скоростью работы затраты времени на вычисления будут разными).
Субботин С.А.
«Искусственный интеллект» 2014 № 1 146
3С
Вычислительная сложность сети прямого распространения при последова-
тельной реализации вычислений (при программной реализации на ЭВМ с последо-
вательной организацией вычислений) Т1 определяется как :
M N
i
iTT
1 1
,
1 .
Вычислительную сложность сети прямого распространения при параллельной
реализации вычислений (например, при аппаратной реализации сети) Т2 будем опре-
делять по формуле:
M
i
Ni
TT
1
,
,...,2,12 max .
Логическая прозрачность сети в значительной степени зависит от общего ко-
личества связей в сети и количества связей, соединяющих конкретные нейроны
(количества входов нейронов скрытых слоев). Чем меньше связей, тем проще сеть и
тем удобнее она для анализа и интерпретации человеком.
Коэффициент разреженности связей сети прямого распространения определим
по формуле:
M
w
R
NN
NK
1
1
0 , N0 = N,
где
M
w NNN
1
100 .
Коэффициент связанности МНС определим как:
M
w
RC
NN
NKK
1
1
011 .
Для коэффициентов связанности и разреженности связей сети прямого распро-
странения характерны следующие свойства: KR+KC =1; 0KR 1;0KC 1.
Коэффициент средней связанности нейронной сети прямого распространения
KM показывает среднее количество входов нейронов всех слоев, кроме первого:
M N
i
i
w
i
MM NN
N
K
2 1
,
0
,
2
1 ,
где i
wN ,
0
– число весов i-го нейрона μ-го слоя сети, равных нулю.
Чем больше в сети единичных синапсов (связей, веса которых равны по мо-
дулю единице), тем проще ее реализация (прежде всего аппаратная) и удобнее
анализ человеком.
Долю единичных синапсов в сети прямого распространения будем рассчи-
тывать по формуле:
M
w
L
NN
NK
1
1
1 , N0 = N,
где Nw=1 – число весов сети, по модулю равных единице:
M
w NNN
1
110 .
Критерии сравнения распознающих моделей на основе нейронных сетей...
«Штучний інтелект» 2014 № 1 147
3С
Долю неединичных синапсов в сети прямого распространения KN определим из
выражения:
M
w
LN
NN
NKK
1
1
111 , N0 = N.
Для долей единичных и неединичных синапсов сети прямого распространения
характерны следующие свойства: KL + KN = 1; 0 KL 1; 0 KN 1.
Поскольку логическая прозрачность связей сети зависит в значительной
степени от разреженности и простоты связей, будем ее характеризовать коэффи-
циентом, показывающим долю бинарных (нулевых или единичных по модулю) весов в
общем количестве весов сети.
Коэффициент логической прозрачности связей сети прямого распространения
будем определять из выражения:
M
ww
LRT
NN
NNKKK
1
1
10 , N0 = N.
Коэффициент логической непрозрачности (размытости) связей сети прямого
распространения KS будем рассчитывать как LRTS KKKK 11 .
Для коэффициентов логической прозрачности и непрозрачности связей сети
прямого распространения характерны следующие свойства: KТ + KS = 1; 0KT 1;
0 KS 1.
Для более точной оценки логической прозрачности будем определять логическую
прозрачность сети через логическую прозрачность ее элементов.
Коэффициент логической прозрачности i-го нейрона μ-го слоя сети KE
(μ,i) будет
определяться типом используемой функции активации. Для линейной и пороговой
функций активации примем: KE
(μ,i) = 1, для всех остальных функций активации
KE
(μ,i) = 0.
Коэффициент логической прозрачности МНС KU будем рассчитываться как:
.0,
1
1 1
,
MM
M
M N
i
i
E
U K
NK
K
K
Чем больше KU, тем выше уровень логической прозрачности сети, и, наоборот,
чем меньше KU, тем ниже уровень логической прозрачности сети.
Одной из важнейших характеристик нейросетевых моделей является качество
аппроксимации. Качество аппроксимации при одном и том же уровне ошибки тем
выше, чем меньше используется весов.
Коэффициент качества аппроксимации нейросетевой модели KA определим как
среднюю долю ошибки, приходящуюся на ненулевые веса сети:
0
ww
A NN
EK ,
где E – совокупная ошибка, допускаемая сетью (например, среднеквадратическая
ошибка), такая, что E , где – максимально допустимая ошибка (цель
обучения). В качестве ошибки Е можно использовать ошибку по обучающей выборке Eоб.
или по тестовой выборке Eт..
Субботин С.А.
«Искусственный интеллект» 2014 № 1 148
3С
Вычислительные аспекты реализации
расчёта критериев сравнения нейромоделей
Рассмотрим вычислительные аспекты некоторых критериев сравнения методов
синтеза нейромоделей.
Поскольку важнейшими характеристиками итеративных методов обучения
МНС являются время обучения tоб., количество затраченных циклов обучения epoch
и достигнутая ошибка E, для отбора наилучшего среди градиентных методов
обучения МНС целесообразно для различных прикладных задач сравнить методы по
каждому из данных критериев, зафиксировав поочередно остальные.
Для неитеративных методов синтеза МНС следует оценивать время обучения
tоб. и достигнутую точность (ошибку) E.
Значения критериев Nv и Nп.а. будут сильно зависеть от особенностей програм-
мной реализации каждого метода обучения. При этом для градиентных методов большое
значение будет иметь способ вычисления производной целевой функции по весам. В связи
с данными обстоятельствами приведенные выше теоретические оценки данных крите-
риев целесообразно на практике заменить на следующие:
14342312п.а. MMMMMMMMN ,
vv NMM 34 , Mв NNSMM .12 , ww NMM 23 ,
где M1 – размер занятой памяти ЭВМ до загрузки обучающей выборки, M2 – размер
занятой памяти ЭВМ после загрузки обучающей выборки перед созданием пере-
менных модели НС, M3 – размер занятой памяти ЭВМ после создания переменных
модели и перед обучением НС, M4 – размер занятой памяти ЭВМ перед окончанием
процедуры обучения НС. Таким образом, для оценки значений критериев Nv и Nп.а.
следует измерять размеры занятой памяти ЭВМ M1, M3 и М4.
Критерии Nп.а., E, Nн., Nп.м., tp.о., tp.т., KI, T1, T2, KR, KC, KM, KL, KN, KT, KS, KU и KA
необходимо оценивать для моделей, полученных в результате использования как
итеративных, так и неитеративных методов. При этом значение критерия Nп.м., будем
определять следующим образом: 23п.м. MMN .
В том случае, когда в НС доля синапсов с единичными весами велика и зависит
только от размерности данных, а не от их значений, а сами единичные веса являются
константными и задаются некоторым несложным правилом, эти веса можно не
хранить в памяти, используя соответствующее правило в процессе работы модели.
Тогда эти веса можно исключить из общего числа весов при определении KI, получив
таким образом формулу для скорректированного коэффициента избыточности KI
':
NS
NK
NS
NNNK w
I
www
I
110'
.
В этом случае KI
' будет учитывать только те веса, которые обеспечивают на-
стройку НС на решение конкретной задачи, а фактическая избыточность сети в этом
случае окажется существенно меньше.
Эксперименты и результаты
Для исследования практической применимости предложенных критериев, а также
выявления их взаимосвязей было разработано программное обеспечение, автома-
тизирующее расчет комплекса предложенных критериев для нейромоделей. Построение
нейромоделей осуществлялось на основе обучающих выборок данных, различной
размерности для задач распознавания образов, технического и медицинского диагно-
стирования.
Критерии сравнения распознающих моделей на основе нейронных сетей...
«Штучний інтелект» 2014 № 1 149
3С
На рис. 1. и рис. 2 приведены экспериментально полученные графики зависимостей
между предложенными показателями свойств нейромоделей на комплексе обучающих вы-
борок для различных задач распознавания.
а б
в г
д е
Рисунок 1 – Графики зависимостей:а – KI от Nн. в полулогарифмической системе координат;
б – Nп.м. от KI в логарифмической системе координат; в – T1 от KI в логарифмической системе
координат; г – tр.о. от KI в логарифмической системе координат; д – T1 от KU
в логарифмической системе координат; е – T2 от KI в логарифмической системе координат
Субботин С.А.
«Искусственный интеллект» 2014 № 1 150
3С
Как видно из рис. 1а, коэффициент избыточности KI тесно связан с количест-
вом нейронов в сети Nн.: он возрастает с увеличением и убывает с уменьшением Nн..
Объем памяти ЭВМ, занимаемый моделью МНС, Nп.м. возрастает с увеличением
коэффициента избыточности KI (рис. 1б). А поскольку ресурсы памяти ЭВМ ограни-
чены, объем занимаемой памяти Nп.м. может быть уменьшен либо путем уменьшения
Nн. и Nw (что, в свою очередь, частично может быть достигнуто за счет уменьшения
числа признаков и входов N, количества слоев M и числа нейронов в каждом слое
N ), либо за счет использования более эффективных структур данных.
На рис. 1в изображён график зависимости времени работы нейромодели при после-
довательной реализации вычислений от коэффициента избыточности сети. С увеличе-
нием коэффициента избыточности НС наблюдается увеличение времени работы нейро-
модели при последовательной реализации вычислений. Поэтому для сокращения времени
T1 необходимо уменьшить избыточность нейромодели.
На рис. 1г изображён график зависимости времени работы нейромодели для
обучающей выборки от коэффициента избыточности нейромодели в логарифми-
ческой системе координат. С увеличением избыточности нейромодели наблюдается
увеличение времени работы НС для обучающей выборки.
Теоретические оценки времени распознавания экземпляра на ЭВМ для МНС возра-
стают с увеличением избыточности KI и логической прозрачности KU (рис. 1д и рис. 1е).
а б
в г
Рисунок 2 – Графики зависимостей KU от: а – KI; б – KL; в – KR в полулогарифмической
системе координат; г – KT в полулогарифмической системе координат
Критерии сравнения распознающих моделей на основе нейронных сетей...
«Штучний інтелект» 2014 № 1 151
3С
Как видно из рис. 2, коэффициент логической прозрачности KU возрастает с
увеличением KI, KL, KR и KT, и наоборот – убывает с их уменьшением. Следователь-
но, логическая прозрачность МНС будет возрастать с увеличением долей единичных
и нулевых весов. При этом существенное увеличение логической прозрачности на
практике предполагает повышение избыточности нейромодели, что связано, прежде
всего, с обеспечивающейся при этом структуризацией модели.
Проведенные эксперименты подтвердили практическую полезность предложен-
ного комплекса критериев сравнения МНС и позволяют рекомендовать его для исполь-
зования при решении задач распознавания образов и диагностирования на основе МНС.
Выводы
В статье предложено новое решение актуальной проблемы автоматизации
построения и анализа распознающих и диагностических моделей на основе НС
посредством разработки критериев сравнения методов построения и моделей МНС.
Научная новизна полученных результатов состоит в том, что предложен комплекс
критериев сравнения нейромоделей и методов их синтеза, содержащий в дополнение
к традиционно используемым критериям времени и точности критерии, характери-
зующие логическую прозрачность. Это дает возможность автоматизировать выбор
наиболее удобных для последующего использования нейромоделей и методов их синтеза.
Практическая значимость полученных результатов заключается в том, что
проведены вычислительные эксперименты по исследованию предложенных крите-
риев сравнения МНС путём решения практических задач распознавания образов и
диагностирования, результаты которого подтверждают практическую пригодность
предложенного комплекса критериев.
Дальнейшие исследования могут быть сосредоточены на разработке аналогич-
ных предложенным критериям критериев сравнения нейронных сетей с латераль-
ными и обратными связями.
Работа выполнена в рамках госбюджетной научно-исследовательской темы
Запорожского национального технического университета «Интеллектуальные ин-
формационные технологии автоматизации проектирования, моделирования, управ-
ления и диагностирования производственных процессов и систем» (номер гос.
регистрации 0112U005350).
Список литературы
1. Круглов В. В. Искусственные нейронные сети: Теория и практика / В. В. Круглов, В. В. Борисов. –
М.: Горячая линия-Телеком, 2001. – 382 с.
2. Рамбиди Н. Г. Биомолекулярные нейросетевые устройства / Н. Г. Рамбиди. – М.: ИПРЖР, 2002.–
224 c.
3. Интеллектуальные средства диагностики и прогнозирования надежности авиадвигателей:
монография / [В. И. Дубровин, С. А. Субботин, А. В. Богуслаев, В. К. Яценко]. – Запорожье: ОАО
"Мотор-Сич", 2003. – 279 с.
4. Интеллектуальные информационные технологии проектирования автоматизированных систем
диагностирования и распознавания образов : монография / [С. А. Субботин, Ан. А. Олейник,
Е. А. Гофман, С. А. Зайцев, Ал. А. Олейник] ; под ред. С. А. Субботина. – Харьков : ООО
«Компания Смит», 2012. – 317 с.
5. Прогрессивные технологии моделирования, оптимизации и интеллектуальной автоматизации
этапов жизненного цикла авиационных двигателей : монография / [А. В. Богуслаев, Ал. А. Олейник,
Ан. А. Олейник, Д. В. Павленко, С. А. Субботин] ; под ред. Д. В. Павленко, С. А. Субботина. –
Запорожье: ОАО "Мотор Сич", 2009. – 468 с.
Субботин С.А.
«Искусственный интеллект» 2014 № 1 152
3С
References
1. Kruglov V. V. Iskusstvennye nejronnye seti: Teorija i praktika / V. V. Kruglov, V. V. Borisov. – M.:
Gorjachaja linija-Telekom, 2001. – 382 p.
2. Rambidi N. G. Biomolekuljarnye nejrosetevye ustrojstva / N. G. Rambidi. – M.: IPRZhR, 2002.– 224 c.
3. Intellektual'nye sredstva diagnostiki i prognozirovanija nadezhnosti aviadvigatelej: mono-grafija / [V. I. Dubrovin,
S. A. Subbotin, A. V. Boguslaev, V. K. Jacenko]. – Zaporozh'e: OAO "Motor-Sich", 2003. – 279 p.
4. Intellektual'nye informacionnye tehnologii proektirovanija avtomatizirovannyh sistem diagnostirovanija i
raspoznavanija obrazov : monografija / [S. A. Subbotin, An. A. Olejnik, E. A. Gofman, S. A. Zajcev, Al.
A. Olejnik] ; pod red. S. A. Subbotina. – Har'kov : OOO «Kom-panija Smit», 2012. – 317 p.
5. Progressivnye tehnologii modelirovanija, optimizacii i intellektual'noj avtomatizacii jeta-pov zhiznennogo
cikla aviacionnyh dvigatelej : monografija / [A. V. Boguslaev, Al. A. Olejnik, An. A. Olejnik, D. V.
Pavlenko, S. A. Subbotin] ; pod red. D. V. Pavlenko, S. A. Subbotina. – Zaporozh'e: OAO "Motor Sich",
2009. – 468 p.
S.A. Subbotin
Criteria for Comparison of Recognition Models Based on Neural
Networks and Analysis of Their Mutual Relations
The artificial neural networks have received a widespread usage in practice in the
tasks of recognition and diagnostic model building.
The great diversity of known methods of neural network training makes actual the
comparison and selection of the most practically useful methods, which in turn requires the
development of appropriate comparison criteria .
The aim of this work is to create criteria to evaluate quantitatively the main
properties of the models based on multilayer neural networks and methods for their
construction.
The paper proposes a new solution of the urgent problems of automation of construction
and analysis of recognition and diagnostic models based on neural networks through the
development of criteria for comparing methods for constructing and models of multilayer
neural networks.
The scientific novelty of the results is that the set of criteria for comparing neural
network models and methods for their synthesis is proposed, including, in addition to the
traditionally used time and accuracy criteria the criteria characterizing the logical
transparency. This makes possible to automate the choice of the most suitable neural
network models and methods for their synthesis for the subsequent usage.
To investigate the practical applicability of the proposed criteria, as well as to
identify their relationships the software automatising evaluation of the proposed criteria
complex for neural models were developed. The neural network model synthesis was
based on the training data samples with different dimensionality for pattern recognition
technical and medical diagnosis problems.
The practical significance of obtained results is that the computational experiments
were conducted to study the proposed criteria for comparison of multilayer neural
networks by solving practical problems of pattern recognition and diagnosis, which results
confirms the practical relevance of the proposed set of criteria.
The further research may focus on the development of similar to the proposed criteria
the comparison criteria of neural networks with lateral and feedback links.
Статья поступила в редакцию 27.12.2013.
|