Нейроуправление нелинейным динамическим объектом с использованием метода обобщенного управления с предсказанием
В работе предложено использовать нейросетевой регулятор с предсказанием для обеспечения высоких динамических характеристик системы управления нелинейным динамическим объектом. При построении регулятора используется эффективная реализация обобщенного управления с предсказанием с применением многослой...
Збережено в:
| Дата: | 2008 |
|---|---|
| Автори: | , , |
| Формат: | Стаття |
| Мова: | Russian |
| Опубліковано: |
Інститут технічних проблем магнетизму НАН України
2008
|
| Назва видання: | Електротехніка і електромеханіка |
| Теми: | |
| Онлайн доступ: | https://nasplib.isofts.kiev.ua/handle/123456789/143062 |
| Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Цитувати: | Нейроуправление нелинейным динамическим объектом с использованием метода обобщенного управления с предсказанием / Б.И. Кузнецов, Т.Е. Василец, А.А. Варфоломеев // Електротехніка і електромеханіка. — 2008. — № 4. — С. 34-41. — Бібліогр.: 6 назв. — рос. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraine| id |
nasplib_isofts_kiev_ua-123456789-143062 |
|---|---|
| record_format |
dspace |
| spelling |
nasplib_isofts_kiev_ua-123456789-1430622025-02-05T20:28:43Z Нейроуправление нелинейным динамическим объектом с использованием метода обобщенного управления с предсказанием Nonlinear dynamic object neuro-control using a generalized predictive control method Кузнецов, Б.И. Василец, Т.Е. Варфоломеев, А.А. Електричні машини та апарати В работе предложено использовать нейросетевой регулятор с предсказанием для обеспечения высоких динамических характеристик системы управления нелинейным динамическим объектом. При построении регулятора используется эффективная реализация обобщенного управления с предсказанием с применением многослойной прямонаправленной нейронной сети, как нелинейной модели объекта управления. Разработана схема системы управления, выполнен синтез регулятора и проведено моделирование системы. У роботі запропоновано використовувати нейромережевий регулятор з прогнозом для забезпечення високих динамічних характеристик системи управління нелінійним динамічним об'єктом. При побудові регулятора використовується ефективна реалізація узагальненого управління з прогнозом із застосуванням багатошарової прямонаправленої нейронної мережі, як нелінійній моделі об'єкту управління. Розроблена схема системи управління, виконаний синтез регулятора і проведено моделювання системи. In the given paper, utilizing a predictive neuro-controller for providing high performance characteristics of a nonlinear dynamic object control system is proposed. For the controller design, efficient implementation of generalized predictive control is applied by utilizing a multi-layer feedforward neural network as a nonlinear model of the control object. A chart of the control system is developed, the controller synthesis and the system modeling made. 2008 Article Нейроуправление нелинейным динамическим объектом с использованием метода обобщенного управления с предсказанием / Б.И. Кузнецов, Т.Е. Василец, А.А. Варфоломеев // Електротехніка і електромеханіка. — 2008. — № 4. — С. 34-41. — Бібліогр.: 6 назв. — рос. 2074-272X https://nasplib.isofts.kiev.ua/handle/123456789/143062 681.5.01.23 ru Електротехніка і електромеханіка application/pdf Інститут технічних проблем магнетизму НАН України |
| institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| collection |
DSpace DC |
| language |
Russian |
| topic |
Електричні машини та апарати Електричні машини та апарати |
| spellingShingle |
Електричні машини та апарати Електричні машини та апарати Кузнецов, Б.И. Василец, Т.Е. Варфоломеев, А.А. Нейроуправление нелинейным динамическим объектом с использованием метода обобщенного управления с предсказанием Електротехніка і електромеханіка |
| description |
В работе предложено использовать нейросетевой регулятор с предсказанием для обеспечения высоких динамических характеристик системы управления нелинейным динамическим объектом. При построении регулятора используется эффективная реализация обобщенного управления с предсказанием с применением многослойной прямонаправленной нейронной сети, как нелинейной модели объекта управления. Разработана схема системы управления, выполнен синтез регулятора и проведено моделирование системы. |
| format |
Article |
| author |
Кузнецов, Б.И. Василец, Т.Е. Варфоломеев, А.А. |
| author_facet |
Кузнецов, Б.И. Василец, Т.Е. Варфоломеев, А.А. |
| author_sort |
Кузнецов, Б.И. |
| title |
Нейроуправление нелинейным динамическим объектом с использованием метода обобщенного управления с предсказанием |
| title_short |
Нейроуправление нелинейным динамическим объектом с использованием метода обобщенного управления с предсказанием |
| title_full |
Нейроуправление нелинейным динамическим объектом с использованием метода обобщенного управления с предсказанием |
| title_fullStr |
Нейроуправление нелинейным динамическим объектом с использованием метода обобщенного управления с предсказанием |
| title_full_unstemmed |
Нейроуправление нелинейным динамическим объектом с использованием метода обобщенного управления с предсказанием |
| title_sort |
нейроуправление нелинейным динамическим объектом с использованием метода обобщенного управления с предсказанием |
| publisher |
Інститут технічних проблем магнетизму НАН України |
| publishDate |
2008 |
| topic_facet |
Електричні машини та апарати |
| url |
https://nasplib.isofts.kiev.ua/handle/123456789/143062 |
| citation_txt |
Нейроуправление нелинейным динамическим объектом с использованием метода обобщенного управления с предсказанием / Б.И. Кузнецов, Т.Е. Василец, А.А. Варфоломеев // Електротехніка і електромеханіка. — 2008. — № 4. — С. 34-41. — Бібліогр.: 6 назв. — рос. |
| series |
Електротехніка і електромеханіка |
| work_keys_str_mv |
AT kuznecovbi nejroupravlenienelinejnymdinamičeskimobʺektomsispolʹzovaniemmetodaobobŝennogoupravleniâspredskazaniem AT vasilecte nejroupravlenienelinejnymdinamičeskimobʺektomsispolʹzovaniemmetodaobobŝennogoupravleniâspredskazaniem AT varfolomeevaa nejroupravlenienelinejnymdinamičeskimobʺektomsispolʹzovaniemmetodaobobŝennogoupravleniâspredskazaniem AT kuznecovbi nonlineardynamicobjectneurocontrolusingageneralizedpredictivecontrolmethod AT vasilecte nonlineardynamicobjectneurocontrolusingageneralizedpredictivecontrolmethod AT varfolomeevaa nonlineardynamicobjectneurocontrolusingageneralizedpredictivecontrolmethod |
| first_indexed |
2025-11-25T07:09:03Z |
| last_indexed |
2025-11-25T07:09:03Z |
| _version_ |
1849745258929192960 |
| fulltext |
34 Електротехніка і Електромеханіка. 2008. №4
УДК 681.5.01.23
НЕЙРОУПРАВЛЕНИЕ НЕЛИНЕЙНЫМ ДИНАМИЧЕСКИМ ОБЪЕКТОМ
С ИСПОЛЬЗОВАНИЕМ МЕТОДА ОБОБЩЕННОГО УПРАВЛЕНИЯ
С ПРЕДСКАЗАНИЕМ
Кузнецов Б.И., д.т.н., проф., Василец Т.Е., к.т.н., доц., Варфоломеев А.А.
Украинская инженерно – педагогическая академия
Украина, 61003, Харьков, ул. Университетская, 16, УИПА, кафедра СУТПиО
тел. (057) 733-79-59
У роботі запропоновано використовувати нейромережевий регулятор з прогнозом для забезпечення високих динаміч-
них характеристик системи управління нелінійним динамічним об'єктом. При побудові регулятора використову-
ється ефективна реалізація узагальненого управління з прогнозом із застосуванням багатошарової прямонаправленої
нейронної мережі, як нелінійній моделі об'єкту управління. Розроблена схема системи управління, виконаний синтез
регулятора і проведено моделювання системи.
В работе предложено использовать нейросетевой регулятор с предсказанием для обеспечения высоких динамических
характеристик системы управления нелинейным динамическим объектом. При построении регулятора использу-
ется эффективная реализация обобщенного управления с предсказанием с применением многослойной прямонаправ-
ленной нейронной сети, как нелинейной модели объекта управления. Разработана схема системы управления, выпол-
нен синтез регулятора и проведено моделирование системы.
Постановка проблемы. Наиболее эффективным
направлением при модернизации систем управления
огнём легкобронированных машин является совер-
шенствование системы стабилизации основного и
вспомогательного вооружения. В настоящее время
широко используются двухканальные системы стаби-
лизации вооружения. Боевой модуль таких систем
устанавливается на корпусе машины с помощью по-
гонной шестерни, относительно оси, которой он по-
ворачивается в горизонтальной плоскости, а блок
вооружения крепится на боевом модуле с помощью
цапф, относительно оси, которых он поворачивается в
вертикальной плоскости. Такое построение обеспечи-
вает стабилизацию и стабилизированное наведение
средств ведения огня в горизонтальной и вертикаль-
ной плоскости, создавая условия для ведения боевых
действий с места и с ходу по наземным и воздушным
целям. Однако используемые в настоящее время сис-
темы стабилизации вооружения не могут обеспечи-
вать требуемых для эффективного ведения огня зна-
чений ошибки стабилизации, диапазона регулирова-
ния скорости, неплавности наведения и др. Поэтому
разработка систем управления вооружением легко-
бронированных машин, имеющих высокие динамиче-
ские характеристики, является важной и актуальной.
Одним из наиболее перспективных направлений явля-
ется построение нейросетевых систем управления.
Анализ последних достижений и публикаций.
Количество структур систем нейрорегулирования,
предложенных и опробованных на сегодняшний день,
очень велико. Их обзор приводится, например, в [1].
Одни системы нейрорегулирования используют ана-
литический закон регулирования и нейромодель.
Нейронная сеть восстанавливает при этом элементы
матриц модели объекта. Это так называемые структу-
рированные методы регулирования. Однако полно-
стью использовать весь аппроксимационный потен-
циал нейронных сетей позволяют неструктурирован-
ные методы регулирования, Среди структур систем
нейрорегулирования, актуальных на сегодняшний
день, можно отметить следующие. 1. Прямое инверс-
ное регулирование [2], при котором сначала в режиме
offline формируют модель инверсной динамики объ-
екта регулирования, а затем полученная инверсная
модель включается последовательно с объектом и
используется в качестве регулятора. 2. Регулирование
с Feedback-Error-Learning [3] аналогично прямому
инверсному регулированию с классическим, напри-
мер, ПИД-регулятором. 3. Регулирование методом
компенсации задания [4], при котором компенсация
имеющихся нелинейностей осуществляется на уровне
сигналов задания, а не сигналов воздействия на объ-
ект. Преимущество данной техники – простота
встраивания в готовый контур регулирования. Слож-
ность метода заключается в выборе начальных значе-
ний параметров сети, т.к. иначе возможно формиро-
вание небезопасных сигналов задания. Существует
ряд других методов, например: косвенное инверсное
нейрорегулирование, регулирование с внутренней
моделью, Instantaneous linearization и др. Наиболее
эффективным для решения поставленной в настоящей
работе задачи, является метод предиктивного регули-
рования на основе модели объекта [5].
Цель статьи. Целью работы является синтез
нейроконтроллера, использующего принцип нелиней-
ного предиктивного регулирования, для построения
нейросетевой системы управления вооружением лег-
кобронированной машины, имеющей заданные дина-
мические характеристики.
Изложение материала исследования, полу-
ченных научных результатов. В работе использует-
ся эффективная реализация обобщенного управления
с предсказанием (Generalized Predictive Control, GPC)
с использованием многослойной прямонаправленной
нейронной сети, как нелинейной модели объекта
управления [6]. Благодаря использованию оптимиза-
ционного алгоритма Ньютона – Рафсона, число ите-
раций, необходимых для сходимости, значительно
меньше, чем при использовании других методов.
Главные затраты алгоритма Ньютона-Рафсона в вы-
Електротехніка і Електромеханіка. 2008. №4 35
числении Гессиана, но даже с этими дополнительны-
ми расчетами низкое число итераций делает алгоритм
Ньютона-Рафсона более быстрым, чем другие мето-
ды, при этом он может использоваться для управле-
ния в режиме реального времени (real-time control).
Алгоритм нейроуправления с предсказанием
Рассмотрим кратко основные положения обобщенно-
го алгоритма нейро-управления с предсказанием
(Neural Generalized Predictive Control algorithm) c при-
менением оптимизационного алгоритма Ньютона-
Рафсона. Обобщенное управление с предсказанием,
принадлежит к классу методов цифрового управле-
ния, называемых модель-ориентированное управле-
ние с предсказанием (Model-Based Predictive Control,
MBPC) [6]. MBPC техники были успешно проанали-
зированы и внедрены в процесс управления, т.к. они
системно учитывают ограничения реальных объектов
в режиме реального времени. GPC применяются в
управлении не-минимально фазовыми объектами,
неустойчивыми объектами с открытым циклом и объ-
ектами, с переменным или неизвестным временем
задержки. Обобщенное управление с предсказанием
также является робастным по отношению к ошибкам
моделирования, переопределению и недоопределе-
нию значений параметров и шумам датчиков. GPC
было первоначально разработано для моделей линей-
ных объектов, что приводит к уравнениям, которые
могут быть решены аналитически. При использова-
нии нелинейных моделей необходимы нелинейные
оптимизационные алгоритмы. Это влияет на качество
и эффективность вычислений, определяющих управ-
ляющие входные сигналы. Для нелинейных объектов,
способность GPC делать точные предсказания может
быть усовершенствована, если для изучения динами-
ки объекта вместо стандартных методов нелинейного
моделирования применять нейронные сети. Выбор
минимизационного алгоритма влияет на вычисли-
тельную эффективность алгоритма. Как было указано,
при использовании для оптимизации алгоритма Нью-
тона-Рафсона, число итерации, необходимых для схо-
димости, существенно меньше, чем при использова-
нии других методов.
Схема системы обобщенного нейро-управления с
предсказанием (Neural Generalized Predictive Control,
NGPC) показана на рис. 1.
( )r n
S
( )u n
( )y n
( )my n
S
Объект Алгоритм
оптимиза-
ции
Эталонная
модель
1−Z
( )ny nНейронная
модель
объекта
Рис. 1. Схема системы обобщенного нейроуправления с предсказанием
Она состоит из четырех компонент: управляемо-
го объекта, эталонной модели, которая описывает же-
лаемое качество объекта, моделирующей объект ней-
ронной сети, и алгоритма минимизации функционала
качества (Cost Function Minimization, CFM), опреде-
ляющего входной сигнал, необходимый для достиже-
ния желаемого поведения объекта. NGPC алгоритм
состоит из блока CFM и блока нейронной сети.
Принцип работы системы состоит в следующем.
Входной сигнал ( )nr подается эталонной модели. Эта
модель выдает эталонный сигнал ( )nym , который
служит входом для CFM блока. CFM алгоритм рас-
считывает сигнал, который служит входом для объек-
та или модели объекта. Двухполюсной двухпозици-
онный переключатель S устанавливается в положение
к объекту, когда CFM алгоритм используется для оп-
ределения оптимального входного сигнала ( )nu , ко-
торый минимизирует выбранный критерий качества
управления. Между тактами переключатель установ-
лен в положение к модели объекта, где CFM алгоритм
использует эту модель для расчета следующего
управляющего входа ( )1+nu , путем предсказания
ответного сигнала, полученного от модели объекта.
Как только функционал качества минимизирован,
этот входной сигнал подаётся на объект.
Обобщенный алгоритм нейроуправления с пред-
сказанием состоит из следующих основных шагов:
1) генерируется задающая траектория; если бу-
дущая траектория ( )nym неизвестна, полагается
( ) constnym = ;
2) используя предварительно рассчитанный
управляющий входной вектор и нейронную модель
объекта управления, выполняется предсказание пове-
дения объекта;
3) рассчитывается новый управляющий входной
сигнал, минимизирующий функционал качества;
4) повторяются шаги 2 и 3, пока ни будет дос-
тигнута требуемая минимизация;
5) посылается первый управляющий входной
сигнал на объект;
6) повторяется весь процесс для каждого вре-
менного шага.
36 Електротехніка і Електромеханіка. 2008. №4
Качество вычисления при реализации обобщен-
ного управления с предсказанием в основном зависит
от выбора минимизирующего алгоритма для CFM
блока. Существуют несколько минимизационных ал-
горитмов, которые реализуются в CFM, такие как
Non-gradient, Simplex и Successive Quadratic
Programming. Выбор минимизационного метода мо-
жет быть основан на следующих критериях: число
итераций, вычислительные затраты и точность реше-
ния. В общем случае, эти алгоритмы требуют боль-
шого числа итераций, что делает управление в режи-
ме реального времени затруднительным. Очень не-
большое число публикаций посвящены реализациям
управления в режиме реального времени для объек-
тов, имеющих большие постоянные времени. Для
возможности использования в системах с объектами,
имеющими малые постоянные времени, требуется
более быстрый оптимизационный алгоритм. Алго-
ритм Ньютона-Рафсона. обладает квадратичной схо-
димостью, в то время как другие алгоритмы имеют
более низкую скорость сходимости. Более высокая
скорость сходимости алгоритма Ньютона-Рафсона
требует высоких вычислительных затрат, но оправды-
вается показателем скорости сходимости.
Качество модели объекта влияет на точность
предсказания. Для реализации обобщенного управле-
ния с предсказанием требуется адекватная модель
объекта. Существуют методы, обеспечивающие высо-
кую точность моделирование в случае линейного объ-
екта. Но, в случае нелинейного объекта, задача явля-
ется более сложной. На сегодняшний день есть два
подхода для моделирования нелинейных объектов.
Первый заключается в линеаризации объекта на мно-
жестве рабочих точек. Если объект существенно не-
линейный, то множество рабочих точек может быть
очень большим. Второй подход заключается в разра-
ботке нелинейной модели, которая зависит от допу-
щений относительно динамики нелинейного объекта.
Если эти допущения не верны, то снижается точность
модели. Модели с использованием нейросетей дают
возможность справиться с нелинейной динамикой.
Для нелинейного объекта способность GPS делать
точные предсказания может быть значительно улуч-
шена, если для изучения динамики объекта использо-
вать нейронную сеть, вместо стандартных подходов
моделирования.
Обобщенный алгоритм нейроуправления с пред-
сказанием основывается на минимизации функциона-
ла качества на конечном диапазоне предсказаний.
Функционала качества используемый в настоящей
работе, имеет следующий вид
( ) ( )[ ] ( ) ( )[ ]∑∑
==
+Δλ++−+=
uN
j
N
Nj
nm jnujjnyjnyJ
1
22
2
1
, (1)
где N1 – нижний предел предсказания; N2 - верхний
предел предсказания; uN – диапазон управления; my
– желаемая траектория; ny – предсказанный выход
нейронной сети; λ – весовой множитель; ( )jnu +Δ –
изменение u, определяемое следующим образом:
( ) ( )1−+−+ jnujnu .
Этот функционал минимизирует не только сред-
неквадратическую ошибку между эталонным сигна-
лом и сигналом, выдаваемым моделью объекта, но
также взвешенную среднеквадратическую скорость
изменения управляющего сигнала.
Когда функционал качества минимизирован, ге-
нерируется управляющий входной сигнал, что позво-
ляет объекту отслеживать заданную траекторию с
некоторой точностью. Функционал качества содержит
четыре настраиваемых параметра, N1, N2, uN , λ. Па-
раметры N1 и N2, задают пределы, внутри которых
вычисляется ошибка слежения. uN является границей
диапазона управления. Единственное ограничение,
накладываемое на значения uN и N1 следующее: они
должны быть меньше или равны N2. Вторая сумма
содержит весовой множитель λ, который введен для
управления балансом между первой и второй суммой.
Для реализации оптимального управления,
функционал качества минимизируется с помощью
алгоритма Ньютона-Рафсона. Цель алгоритма – ми-
нимизировать функционал J (1) по вектору
( ) ( ) ( )[ ]TuNnununu +++ ,2,1 . Обозначим данный век-
тор как U. Используя в качестве алгоритма CFM алго-
ритм Ньютона-Рафсона, итерационно минимизирует-
ся функционал J для определения оптимального U.
Итерационный процесс определяет значение J на ка-
ждой итерации, которое обозначим как ( )kJ . Для ка-
ждой итерации рассчитывается также значение
управляющего вектора:
( ) ( ) ( ) ( )[ ]TuNnununuk +++= ;...,2;1U ,
где k = 1,… - номер итерации, T - знак транспониро-
вания.
Правило обновления ( )1+kU в алгоритме Нью-
тона-Рафсона выглядит следующим образом
( ) ( ) ( ) ( )kkkk
U
J
U
JUU
∂
∂
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
∂
∂
−=+
−1
2
2
1 , (2)
где якобиан обозначен
( )
( )
( )⎥
⎥
⎥
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎢
⎢
⎢
⎣
⎡
+∂
∂
+∂
∂
=
∂
∂
uNnu
J
nu
J
k M
1
U
J ,
а гессиан
( )
( ) ( ) ( )
( ) ( ) ( ) ⎥
⎥
⎥
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎢
⎢
⎢
⎣
⎡
+∂
∂
+∂+∂
∂
+∂+∂
∂
+∂
∂
=
∂
∂
uu
u
Nnu
J
nuNnu
J
Nnunu
J
nu
J
k
22
2
2
2
2
2
1
11
K
MOM
K
U
J
Решение уравнения (2) требует явного обраще-
ния матрицы Гессе. Этот процесс может потребовать
больших вычислительных затрат. Одним из подходов,
используемых, чтобы избежать обращения матрицы,
служит LU декомпозиция [8] для получения входного
вектора ( )1+kU . Это достигается путем записи урав-
нения (2) в виде системы линейных уравнений
bAx = , что приводит к выражению
Електротехніка і Електромеханіка. 2008. №4 37
( ) ( ) ( )( ) ( )kkkk
U
JUU
U
J
∂
∂
−=−+
∂
∂ 12
2
, (3)
где ( ) A
U
J
=
∂
∂ k2
2
; ( ) b
U
J
=
∂
∂
− k ; ( ) ( ) xUU =−+ kk 1 .
В данной форме уравнение (3) может быть реше-
но с помощью двух процедур, содержащихся в [6],
процедура LU декомпозиции, ludcmp, и процедура
решения системы линейных уравнений lubksb. После
того, как вычислен вектор x, ( )1+kU получается из
соотношения ( ) ( ) xUU +=+ kk 1 . Процедура повторя-
ется до тех пор, пока изменение каждой компоненты
( )1+kU не становится меньшим некоторого ε. При
решении системы относительно x, для каждой итера-
ции алгоритма Ньютона-Рафсона необходимо вычис-
ление каждого элемента якобиана и гессиана. Эле-
мент якобиана с индексом h имеет следующий вид
( ) ( ) ( )[ ] ( )
( )
( ) ( )[ ] ( )
( ) u
N
j
n
N
Nj
nm
Nh
hnu
jnujnuj
hnu
jnyjnyjny
hnu
J
u
,...,1,2
2
1
2
1
=
+∂
+Δ∂
+Δλ+
+
+∂
+∂
+−+−=
+∂
∂
∑
∑
=
=
Если расписать выражение ( )
( )hnu
jnu
+∂
+Δ∂ и вос-
пользоваться символом Кронекера дельта функции,
которая определяется как ( ) 1, =δ jh если jh = и
( ) 0, =δ jh если jh ≠ , получим
( )
( )
( )
( ) ( ) ( )1,,1
−δ−δ=
+∂
−+∂
−
+∂
+∂ jhjh
hnu
jnu
hnu
jnu .
Элемент с индексами m, h гессиана определяется
следующим образом:
( ) ( )
( )
( )
( )
( )
( )
( ) ( ) ( ) ( )[ ]
( ) ( )
( )
( )
( )
( ) ( )
( ) ( )
.,...,1;,...,1
,
2
2
2
1
2
2
2
1
uu
N
j
nm
n
N
Nj
nn
NmNh
hnumnu
jnujnu
hnu
jnu
mnu
jnuj
jnyjny
hnumnu
jny
hnu
jny
mnu
jny
hnumnu
J
u
==
⎪⎭
⎪
⎬
⎫
+∂+∂
+Δ∂
+Δ+
+∂
+Δ∂
⎩
⎨
⎧
+∂
+Δ∂
λ+
+
⎪⎭
⎪
⎬
⎫
+−+
+∂+∂
+∂
⎩
⎨
⎧
+
+∂
+∂
+∂
+∂
=
=
+∂+∂
∂
∑
∑
=
=
Можно воспользоваться также определением
дельта-функции для выражения
( )
( )
( )
( )
( ) ( )( ) ( ) ( )( )1,,1,, −δ−δ−δ−δ=
=
+∂
+Δ∂
+∂
+Δ∂
jmjmjhjh
hnu
jnu
mnu
jnu
.
Выражение ( )
( ) ( )hnumnu
jnu
+∂+∂
+Δ∂2
всегда равняется
нулю.
Последняя компонента, требуемая для получения
( )1+kU , это вычисление выхода объекта ( )jnyn + и
его производных. Для этого используется нейронная
сеть.
Структуры нейронной сети для моделирова-
ния объекта. Моделью объекта в алгоритме NGPC
служит нейронная сеть. Начальная тренировка ней-
ронной сети обычно выполняется в автономном ре-
жиме (offline), до применения управления. Блочная
схема для тренировки нейронной сети, моделирую-
щей объект, приведена на рис. 2
( )u n ( )y n
1−Z
( )ny n
( )e n
−
Нейронная
модель
объекта
Объект
Рис. 2. Схема тренировки сети в режиме offline
Нейронная сеть и объект получают одно и то же
входное значение u(n). Нейронная сеть также имеет
дополнительный вход, на который подается либо вы-
ходное значением объекта, y(n), либо нейронной сети,
( )nyn . Выбор значения зависит от шага предсказания.
В процессе тренировки сети ее веса настраиваются
таким образом, что множество входных значений
продуцирует желаемые выходные значения. Ошибка
формируется между ответами нейронной сети, ( )nyn ,
и объекта, y(n). В дальнейшем эта ошибка использу-
ется для обновления весов с помощью градиентного
спуска. Этот процесс повторяется до тех пор, пока
ошибка не достигнет допустимого уровня.
Так как для моделирования объекта будет ис-
пользована нейронная сеть, должна быть рассмотрена
конфигурация архитектуры нейронной сети. Нейрон-
ная сеть может быть настроена либо для моделирова-
ния входа/выхода, либо для моделирования простран-
ства состояний. В данной реализации алгоритм NGPC
используются модели, использующие только вход-
ные/выходные координаты, т.к. моделирование про-
странства состояний требует измерения состояний
объекта, что не всегда возможно. Сети типа много-
слойный персептрон (МП) отличаются универсально-
стью при моделировании различных объектов регули-
рования. В связи с этим дальнейшие исследования
ведутся только с этим типом сети.
МП в настоящее время – наиболее полно теоре-
тически исследованная сеть. Существующие теоремы
утверждают, что МП при условии достаточного коли-
чества нейронов могут отражать практически любые
взаимосвязи. Поэтому они часто используются для
38 Електротехніка і Електромеханіка. 2008. №4
построения нейросетевых моделей нелинейных объ-
ектов. Однако первое, с чем сталкиваются исследова-
тели, это вопрос о том, какую структуру должна
иметь сеть. Нахождение оптимальной структуры сети
- проблема, которая до сих пор полностью не решена.
В этом случае на помощь приходит целенаправленное
моделирование и практический опыт.
Определение структуры нейронной сети состоит,
во-первых, из определения входов сети и, во-вторых,
из определения внутренней топологии сети (количе-
ство слоев и нейронов). На рис. 3, приведена много-
слойная нейронная сеть прямого распространения со
структурой, имеющей узлы задержек по времени. В
данном примере входы сети состоят из внешних вхо-
дов, u(n) и ( )1−ny и соответствующих им узлов за-
держек ( )1−nu ,…, ( )dnnu − и ( )2−ny ,…, ( )ddny − .
( )ny n
( )u n ( 1)y n − ( 2)y n − ( 1)u n − ( )du n n− ( )dy n d−
Рис. 3. Многослойная нейронная сеть прямого
распространения с элементами задержек по времени
Параметры dn , dd отражают число узлов за-
держки, относящихся к соответствующим узлам вхо-
да. Второй вход сети может иметь внешний вход
( )nyn и соответствующие задержанные значения.
Сеть имеет один скрытый слой, состоящий из не-
скольких скрытых нейронов, которые используют
общую функцию вывода (активации) ( )⋅jf . Выходной
нейрон использует линейную функцию вывода с еди-
ничным наклоном для масштабирования выходных
значений. Уравнения сети с данной архитектурой вы-
глядят следующим образом
( ) ( )( )∑
−
=
+=
1
1
LS
j
jjjn bnnetfwny ,
( ) ( ) ( )∑∑
=
++
=
+−+−=
d
d
d d
i
jinj
n
i
ijj bilywinuwln
1
1,
0
, , (4)
где ( )nyn – выход нейронной сети; ( )⋅jf – функция
активации для j-го нейрона скрытого слоя; ( )nnet j –
аргумент функции активизации j-го нейрона; 1−LS –
число нейронов в скрытом слое; dn – число узлов
входа, ассоциированных с ( )⋅u без учета ( )nu ); dd –
число узлов входа, ассоциированных с ( )y ⋅ ; jw – вес,
соединяющий j-й скрытый нейрон с нейроном выхо-
да; ijw , вес, соединяющий i-й узел входа с j-м скры-
тым нейроном; ( )iny − – задержанный выход объек-
та, используемый как вход для сети; ( )iny − – вход
сети и его задержки; jb – смещение j-го скрытого
нейрона; b – смещение нейрона выхода.
Предсказание с использованием нейронной
сети. NGPC алгоритм использует выход модели объ-
екта для предсказания динамики объекта для произ-
вольного входа от текущего момента времени n до
некоторого будущего момента n + k. Это достигается
сдвигом уравнений (4) на k, имеем:
( ) ( )( ){ } bknnetfwkny
LS
j
jjjn ++=+ ∑
−
=
1
1
, (5)
( ) ( )
( ) +
⎩
⎨
⎧
≥−+
<−−+
=+ ∑
=
+ iNkNnu
iNkiknu
wknn
uu
u
n
i
ijj
d
,
,
0
1,
( )( )
( )
+−++ ∑
=
++
d
d
dk
i
ninj iknyw
,min
1
1,
( )∑
+=
++ +−++
d
d
d
ki
jninj biknyw
1
1, . 6)
Особенности уравнения (6) связаны с рекурсив-
ным характером предсказания. Первая сумма в (6)
определяется в соответствии с приведенными усло-
виями. Условие iNk u <− управляет предваритель-
ными будущими значениями u до ( )1−+ uNnu . Ус-
ловие iNk u ≥− устанавливает входы от ( )uNnu + до
( )knu + равными ( )uNnu + . Второе условие возника-
ет только, если uNN >2 . Следующее суммирование в
(6) управляют рекурсивной частью предсказания.
Суммирование соответствует обратной связи по вы-
ходу нейронной сети ny , и выполняется k либо dd
раз, в зависимости от того, какое значение меньше.
Последняя сумма в (6) содержит предыдущие значе-
ния y. В следующем подразделе выводятся производ-
ные от уравнений (5) и (6) для входа ( )hnu + .
Производные уравнений нейронной сети. Для
минимизации функционала качества в режиме реаль-
ного времени с помощью итерационного решения,
основанного на градиенте, необходимо использовать
формулы для эффективного вычисления градиента
нейронной сети.
Для вычисления якобиана и гессиана необходи-
мы первая и вторая производная сети по входному
вектору. Элементы якобиана получаются дифферен-
цированием ( )knyn + из уравнения (6) по ( )hnu +
( )
( )
( )( )
( )∑
−
= +∂
+∂
=
+∂
+∂
1
1
LS
j
jj
j
n
hnu
knnetf
w
hnu
kny . (7)
Применяя правило дифференцирования сложной
функции для
( )( )
( )hnu
knnetf jj
+∂
+∂
имеем
( )( )
( )
( )( )
( )
( )
( )hnu
knnet
knnet
knnetf
hnu
knnetf j
j
jjjj
+∂
+∂
+∂
+∂
=
+∂
+∂
, (8)
где
( )( )
( )knnet
knnetf
j
jj
+∂
+∂
– производная функции выхода и
Електротехніка і Електромеханіка. 2008. №4 39
( )
( )
( )
( ) +
⎩
⎨
⎧
≥−δ
<−−δ
=
+∂
+∂
∑
=
+ iNkhN
iNkhik
w
hnu
knnet
uu
u
n
i
ij
j d
,,
,,
0
1,
( )
( ) ( )
( )
∑
=
++ ⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
−−δ
+∂
−+
+
d
d
dk
i
n
inj ik
hnu
iknyw
,min
1
11, 1 . (9)
Заметим, что в (9) в последней сумме введена
ступенчатая функция δ1. Это было сделано, чтобы
подчеркнуть, что сумма равна нулю для k – i < 1, сле-
довательно слагаемые, удовлетворяющие этому усло-
вию, не требуют вычислений. Чтобы получить эле-
менты гессиана, необходимо продифференцировать
уравнения (7), (8) и (9) по u(n + m), в результате имеем
( )
( ) ( )
( )( )
( ) ( )∑
−
= +∂+∂
+∂
=
+∂+∂
+∂
1
1
22 LS
j
jj
j
n
mnuhnu
knnetf
w
mnuhnu
kny , (10)
( )( )
( ) ( )
( )( )
( )
( )( )
( ) ( ) ++∂+∂
+∂
+∂
+∂
=
+∂+∂
+∂
mnuhnu
knnetf
knnet
knnetf
mnuhnu
knnetf jj
j
jjjj
22
( )( )
( )
( )
( )
( )
( ) )11(,2
2
mnu
knnet
hnu
knnet
knnet
knnetf jj
j
jj
+∂
+∂
+∂
+∂
+∂
+∂
+
( )
( ) ( )
( ) ( )
( ) ( ) ( )11
2,min
1
,
2
1
−−δ
+∂+∂
−+∂
=
=
+∂+∂
+∂
∑
=
++
ik
mnuhnu
iknyw
mnuhnu
knnet
n
dk
i
nj
j
d
id
.
Уравнение (11) является результатом примене-
ния правила дифференцирования сложной функции
дважды.
Следует заметить, что нелинейные оптимизации
являются процессами, требующими больших вычис-
лительных затрат. Алгоритм Ньютона-Рафсона ис-
пользуется для создания эффективного вычислитель-
ного процесса. При написании кода, реализующего
данный алгоритм, все значения, посчитанные в одной
процедуре, передаются другим процедурам для избе-
жания повторения расчета. Наиболее важная часть
кода – вычисление гессиана. Переменные
( )
( )hnu
knnet j
+∂
+∂
и ( )
( )hnu
knyn
+∂
+ вычисляемые для якобиана,
также используются для вычисления гессиана, поэто-
му они передаются в процедуру вычисления гессиана.
Т.к. гессиан симметричен, только верхнетреугольная
часть матрицы подлежит определению. Использова-
ния данных двух замечаний, позволяет значительно
снизить время загрузки процессора.
Таким образом, обобщенное нейроуправления с
предсказанием с использование оптимизационного
алгоритма Ньютона-Рафсона для минимизации функ-
ционала качества позволяет получить высокое качест-
во управления в случае сложных нелинейностей в
объекте и даёт возможность применения алгоритма в
режиме реального времени.
Контроллер с предсказанием (NN Predictive
Controller). В пакете прикладных программ Neural
Network Toolbox системы MATLAB реализован кон-
троллер с предсказанием NN Predictive Controller, при
построении которого использован принцип нелинейно-
го приедиктивного управления, описанный выше. При
синтезе нейроконтроллера NN Prediction Controller ис-
пользуются следующие файлы, размещенные в катало-
ге toolbox/nnet/ nncontrol системы SIMULINK.
Функции одномерной оптимизации: Csrchbac –
поиск с обратной прогонкой; Csrchbre – метод Брента,
объединяющий методы золотого сечения и квадра-
тичной интерполяции; Csrchcha – метод кубической
интерполяции Чараламбуса; Csrchgol – метод золото-
го сечения; Csrchhyb – гибридный метод бисекции и
кубической интерполяции.
Функции для синтеза управления с предсказани-
ем: Calcjjdjj – вычисление функционала качества и
его градиента; Predopt – оптимизация регулятора с
предсказанием; Dyduvar – вычисление частных про-
изводных выхода по входу.
Модели SIMULINK. Predcstr – GUI – приложение
для контроллера с предсказанием;Prest3sim2 – нейросе-
тевая модель объекта управления используемая М –
функцией deport для предсказания процесса в будущем.
Вспомогательные функции: Sfunxy2 – функция
для вывода графиков; Nncontrolutil – поддержка, обес-
печивающая возможность обращения к частным
функциям из системы SIMULINK; Nnident.m – основ-
ная функция, используемая при идентификации объ-
екта, находящаяся в каталоге private. Обеспечивает
GUI пользователя, генерацию обучающей выборки,
создание и тренировку сети.
В качестве примера выполним синтез нейросете-
вой системы наведения и стабилизации вооружения
легкобронированных машин с использованием нейро-
контроллера NN Predictive Controller. Исполнительное
устройство стабилизатора вооружения состоит из
усилителя (преобразователя) мощности, приводного
двигателя и кинематического устройства сопряжения.
Реальная кинематическая схема системы наведения и
стабилизации содержит упругие элементы (элементы
конечной жесткости). Наличие упругих элементов
усложняет расчетную схему механической части сис-
темы, превращая её в многомассовую. Исследования
показали, что с достаточной для практических расчё-
тов точностью механическую часть системы может
быть представлена в виде двухмассовой системы.
В результате исследований установлено, что эф-
фективной является система с нейронной компенса-
цией нелинейностей исполнительного устройства ста-
билизатора вооружения в контуре скорости, при этом
в контуре положения может быть использован про-
стой П – регулятор. Структурная схема нейросетевой
системы управления, разработанная в Simulink систе-
мы MATLAB показана на рис. 4. Схема включает
блок контроллера NN Prediction Controller, блоки ге-
нерации эталонного ступенчатого сигнала со случай-
ной амплитудой Random Reference, блоки построения
графиков и блоки, относящиеся к объекту управле-
ния. Схема модели объекта управления приведена на
рис. 5. В схеме не учитывается возмущающий мо-
мент, обусловленный колебаниями корпуса носителя
придвижении машины по пересечённой местности и
люфт между зубьями ведущей и ведомой шестерни.
Схема объекта управления составлена с учётом мо-
мента сухого трения в подшипниках ПД и момента
сухого трения кинематического устройства сопряже-
ния. Для их задания использованы два блока
MATLAB Fcn, предназначенные для написания вы-
ражений на языке MATLAB.
40 Електротехніка і Електромеханіка. 2008. №4
f
df
1
s
In Out
Subsystem
Random
Reference
Plant
Output
Reference
Control
Signal
Optim.
NN
Model
NN Predictive Control ler
Kp
Рис. 4. Схема нейросетевой системы управления
1
Out
WmWd
Ud
1
Jm.s
1
Jd.s
1/Re
Te.s+1
1/N
s
My
Mtr_mMtr_d
Md
MATLAB
Function
MATLAB Fcn1
MATLAB
Function
MATLAB Fcn
Ia
CFKym
N
c
N
1/N
CF
0
Constant
1
In
Рис. 5. Схема модели объекта управления
Процесс синтеза нейроконтроллера NN Prediction
Controller начинается с построения нейросетевой мо-
дели объекта управления. Процедура идентификации
позволяет построить нейронную сеть, которая будет
моделировать динамику объекта. Поскольку модель
должна использоваться при настройке контроллера,
то её следует создать прежде, чем начнется расчет
контроллера. Вначале задаются параметры и архитек-
тура сети, а затем выполняется процедура её обуче-
ния. Для этого используется предварительно сгенери-
рованная обучающая последовательность, которая
формируется путем воздействия ряда случайных сту-
пенчатых сигналов на модель SIMULINK управляе-
мого объекта (рис. 5). После завершения обучения
сети параметры нейросетевой модели управляемого
объекта вводятся в блок NN Predictive Controller сис-
темы Simulink. В системе Simulink формируется так
же схема ptest3sim2, показанная на рис. 6.
6
Outport6
5
Outport5 (gUd)
4
Outport4 (gU)
3
Outport3
2
Outport2
1
Outport1
In1
In2
Out1
Out2
Out3
Out4
Out5
Out2a
Subsystem
2
Inport1
1
Inport
Рис. 6. Cхема ptest3sim2, используемая М-функцией predopt
для предсказания процесса в будущем
При активизации блока Subsystem открывается
окно со схемой рис. 7. Данная схема так же является
нейросетевой моделью объекта управления, имеющей
дополнительные выходы, и используется М-функцией
predopt для предсказания процесса в будущем.
После завершения построения нейросетевой мо-
дели управляемого объекта задаются параметры оп-
тимизации. Затем они вводятся в блок NN Predictive
controller системы Simulink.
На рис. 8 приведены графики переходных про-
цессов переменных состояния синтезированной сис-
темы. Все обозначения переменных соответствуют
рис. 4 и рис. 5. Переходные процессы приведены для
значений скачков задающего воздействия, находя-
щихся в пределах 1,01,0з ÷−=ϕ рад.
Как видно из графиков, переходные процессы
имеют высокие динамические характеристики. Отра-
ботка угла происходит за минимально возможное
время, определяемое постоянными времени электро-
привода, при номинальном напряжении двигателя
дU . Так, например, угол 05,0з =ϕ рад отрабатывается
за время 12,0=t с. Ограничение напряжения двигате-
ля достигается путём задания соответствующих зна-
чений параметров обучающей последовательности
Maximum Plant Input и Minimum Plant Input при вы-
полнении процедуры идентификации объекта управ-
ления. Параметры устанавливались равными +1 и -1
соответственно.
Выводы. В данной работе для обеспечения вы-
соких динамических характеристик системы стабили-
зации основного и вспомогательного вооружения лег-
кобронированной машины предложено использовать
нейросетевой регулятор, при построении которого
используется метод обобщённого управления с пред-
сказанием. Рассмотрена эффективная реализация
обобщенного управления с предсказанием с исполь-
зованием многослойной прямонаправленной нейрон-
ной сети, как нелинейной модели объекта управления.
Електротехніка і Електромеханіка. 2008. №4 41
6
Out2a
5
Out5
4
Out4
3
Out3
2
Out2
1
Out1tansig
purelin
+
netsum1
+
netsum
z
1
Unit Delay3 z
1
Unit Delay2
Sum1
Sum
dyduvar
S-Function
Product1
Product
Mux
Mux6
K*u
Matrix
Gain4
LW1_2
K*u
Matrix
Gain3
IW_dU
K*u
Matrix
Gain2
LW2_1
K*u
Matrix
Gain1
LW1_2
K*u
Matrix
Gain
IW
K*u
LW2_1
y(n)=Cx(n)+Du(n)
x(n+1)=Ax(n)+Bu(n)
Discrete State-Space2
y(n)=Cx(n)+Du(n)
x(n+1)=Ax(n)+Bu(n)
Discrete State-Space
ones(S1,1)
Constant3
1
Constant2
B2
Constant1
B1
Constant
2
In2
1
In1
Рис. 7. Схема блока Subsystem системы ptest3sim2
а)
0 0.5 1 1.5 2
-30
-20
-10
0
10
20
30
t, c
Ud, B
0 0.5 1 1.5 2
-200
-100
0
100
200
300
t, c
Id,
A
0 0.5 1 1.5 2
-0.06
-0.04
-0.02
0
0.02
0.04
0.06
t, c
f, rad
з
1
2
ϕ
ϕ
−
−
1 2
0 0.5 1 1.5 2
-1
-0.5
0
0.5
1
t, c
Wm, c-1
0 0.5 1 1.5 2
-400
-300
-200
-100
0
100
200
300
400
t, c
Wd, c-1
0 0.5 1 1.5 2
-6000
-4000
-2000
0
2000
4000
6000
8000
t, c
My, Nm
б) в)
г) д) е)
Рис. 8. Графики переходные процессы переменных состояния системы:
а) – отработки заданного угла ϕ; б) – напряжения двигателя дU ; в) – ток двигателя дI ;
г) – скорости механизма мω ; д) – скорости двигателя дω ; е) – момента упругости уM
В работе выполнен синтез нейроконтроллера с
предсказанием NN Prediction Controller, который реа-
лизован в пакете прикладных программ Neural
Network Toolbox системы MATLAB. В режиме Simu-
link разработана система управления с нейроконтрол-
лером и проведено моделирование системы. Анализ
переходных процессов основных переменных состоя-
ния системы показал, что синтезированный нейрокон-
троллер обеспечивает высокие динамические харак-
теристики проектируемой системы.
ЛИТЕРАТУРА
[1] Sen P., Hearn G.E., Zhang Y. Adaptive Neural Controller //
In Neural Network Systems Techniques and Aplications.
Hrsg. Leondes C.T. 1998.- Vol.4.- Р. 274 - 343.
[2] Werbos P.J. Backpropagation and neurocontrol: A review
and prospects // Proc. of International Joint Conf. On Neu-
ral Networks.- Washington, DC. - 1989. -Vol.1.-P.209-216.
[3] Park Y.-M., Choi M.S.; Lee Y. An optimal tracking neuro-
controller for nonlinear dynamic systems // IEEE Trans.
Neural Networks.- 1996.- №7.- Р. 1099-1110.
[4] Jung S.; Hsia T.C. A new neural network control technique
for robot manipulators // Robotica.- 1995.- Vol 13, Р. 477-
484.
[5] Garcia C.E., Prett D.M., Morari M. Model predictive con-
trol: theory and practice-a survey // Automatica.- 1989.-
Vol.25.- Р.335-348.
[6] Clarke D. W. Advances in model-based predictive control.-
In Advances in Model-Based Predictive Controled / D. W.
Clarke: Oxford University Press.- 1994.-274 р.
Поступила 09.11.2007
|