Численное решение задач оптимального управления нелинейными динамическими системами

Запропоновано чисельний метод розв’язання задач оптимального керування об’єктами, які описуються системою нелінійних звичайних диференціальних рівнянь на класах кусково-сталих, кусково-лінійних і кусково-заданих керувань. В задачах оптимізуються кусково-сталі значення коефіцієнтів з формул для керув...

Повний опис

Збережено в:
Бібліографічні деталі
Опубліковано в: :Проблемы управления и информатики
Дата:2012
Автор: Рагимов, А.Б.
Формат: Стаття
Мова:Російська
Опубліковано: Інститут кібернетики ім. В.М. Глушкова НАН України 2012
Теми:
Онлайн доступ:https://nasplib.isofts.kiev.ua/handle/123456789/207541
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Численное решение задач оптимального управления нелинейными динамическими системами / А.Б. Рагимов // Проблемы управления и информатики. — 2012. — № 6. — С. 54–66. — Бібліогр.: 13 назв. - рос.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1859717569803452416
author Рагимов, А.Б.
author_facet Рагимов, А.Б.
citation_txt Численное решение задач оптимального управления нелинейными динамическими системами / А.Б. Рагимов // Проблемы управления и информатики. — 2012. — № 6. — С. 54–66. — Бібліогр.: 13 назв. - рос.
collection DSpace DC
container_title Проблемы управления и информатики
description Запропоновано чисельний метод розв’язання задач оптимального керування об’єктами, які описуються системою нелінійних звичайних диференціальних рівнянь на класах кусково-сталих, кусково-лінійних і кусково-заданих керувань. В задачах оптимізуються кусково-сталі значення коефіцієнтів з формул для керувань, і, що найважливіше, оптимізуються межі інтервалів сталості цих значень. Отримано аналітичні формули градієнта функціонала за параметрами, які оптимізуються. Проведено порівняння формул градієнта функціонала, отриманих для вихідної неперервної і відповідної дискретизованої задач оптимального керування на класі кусково-сталих керувань. Наведено результати чисельних експериментів на прикладі розв’язання модельних задач. Numerical method of solving to optimal control problems is proposed for objects described by the system of ordinary nonlinear differential equations on the classes of piecewise constant, piecewise linear and piecewise given controls. Both the piecewise constant values of the coefficients in the expression of controls as well as the boundaries of constancy intervals of these values are optimized. Analytical formulas for the gradient of the functional with respect to the optimized parameters are obtained. Comparison of the formulas for the gradient of the functional obtained for the initial continuous optimal control problem and for the corresponding discretized optimal control problem on the class of piecewise constant controls is carried out. Results of numerical experiments carried out through the examples of the solutions to some model problems are also given.
first_indexed 2025-12-01T08:26:42Z
format Article
fulltext © А.Б. РАГИМОВ, 2012 54 ISSN 0572-2691 УДК 519.6, 517.977.5 А.Б. Рагимов ЧИСЛЕННОЕ РЕШЕНИЕ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ НЕЛИНЕЙНЫМИ ДИНАМИЧЕСКИМИ СИСТЕМАМИ Введение При управлении многими реальными процессами осуществление частых из- менений значений управляющих воздействий либо связано с большими трудно- стями реализации, либо вообще невозможно. Поэтому с практической точки зре- ния возникает необходимость исследования задач оптимального управления, например на классах кусочно-постоянных, кусочно-линейных и других легко реа- лизуемых классах управляющих воздействий. В статье исследуются нелинейные задачи оптимального управления процессами, описываемые системами обыкно- венных дифференциальных уравнений. В рассматриваемых задачах управление принадлежит классам кусочно-постоянных, кусочно-линейных и кусочно-задан- ных управляющих функций; оптимизируемыми являются кусочно-постоянные значения коэффициентов, участвующих в выражении управлений и оптимизиру- ются сами интервалы постоянства этих коэффициентов. Важным в рассматривае- мых задачах является также то, что границы интервалов постоянства коэффици- ентов неизвестны и оптимизируются. Предложен метод численного определения оптимальных кусочно-постоянных значений коэффициентов, участвующих в вы- ражении управлений, и интервалов постоянства этих коэффициентов, основанный на методах конечномерной оптимизации первого порядка и полученных форму- лах градиента функционала по оптимизируемым параметрам. Отметим, что различные другие аспекты оптимального управления на классе кусочно-постоянных функций исследовались многими авторами [1–6]. В частности, в [3] для решения линейно-квадратичной задачи управления на классе кусочно- постоянных управляющих функций с оптимизируемыми временами их переключе- ния использована фундаментальная матрица решений. В [5] получены условия оп- тимальности для случая, когда управления принимают значения из заданного мно- жества с конечным числом значений. В [6] получены формулы для градиента функ- ционала в задаче оптимального управления объектами, описываемыми системами обыкновенных дифференциальных уравнений на классе кусочно-постоянных функ- ций при неточной информации о начальных условиях и параметрах. 1. Постановка задачи Рассматривается задача оптимального управления объектами, описываемыми системой обыкновенных в общем случае нелинейных дифференциальных уравнений. Пусть состояние управляемого объекта описывается следующей задачей Коши: ,)0(],,0(),,,()( 0xxTttuxftx  (1) где ,],0[,)( TtEtxx n  — фазовое состояние объекта; ],,0[,)( TtEtuu r  — управление; вектор-функция )...,,,( 21 nffff  вместе с частными производными непрерывны по ).,( ux Момент времени T и начальная точка nEx 0 заданы. Рас- смотрены три типа задач в зависимости от наложения на управление различных условий. Международный научно-технический журнал «Проблемы управления и информатики», 2012, № 6 55 1.1. Управления из класса кусочно-постоянных функций. Управление ,)( rEtu  ,],0[ Tt является постоянным [7] на каждом полуинтервале ),,[ 1 jj   ,,...,1 Lj  полученном разбиением отрезка ],0[ T )1( L оптимизируемыми точ- ками ,1,...,1,  Ljj (рис. 1), т.e. ,),,[,const)( 1 r jjjj Evtvtu   (2) ,,0,,...,1, 01 TLj Ljj   (3) а значения управления ,,...,1, LjEv r j  принадлежат некоторому множеству U, в частности, следующему параллелепипеду: .},...,1,,,,),,...,(:{ 1 LjEvvvvvvU r jjjjjjL  (4) Задача заключается в нахожде- нии кусочно-постоянных значений управления ),(tu т.е. значений ко- нечномерных векторов ,rj Ev  ,,...,1 Lj  и границ интервалов по- стоянства этих значений, определя- емых вектором ),,...,( 11  L при которых заданный функционал ))((),,(),()( 0 0 TxdttuxfvJuJ T   (5) при условиях (1)–(4) принимает минимальное значение, 1)1(),(  rLEv . Предпола- гается, что заданные функции 0f и  непрерывны вместе с частными производны- ми по своим аргументам и число интервалов постоянства управлений L задано. 1.2. Управления из класса кусочно-линейных функций. Уп- равление ,)( rEtu  ,],0[ Tt яв- ляется линейной функцией на каждом полуинтервале ),,[ 1 jj   ,...,,1 Lj  (рис. 2), полученном разбиением отрезка ],0[ T )1( L оптимизируемыми точками ,j ,1...,,1  Lj т.е. ,,,1,,),,[,)()( 211211 LjEcctctctu rjj jj j j j   (6) а допустимые значения управления принадлежат некоторому множеству U, в част- ности параллелепипеду .]},0[,,,)(),(:{ TtEtutuuuU r  (7) Если обозначить ),,,...,,,,()...,,( 21 2 2 2 1 1 2 1 1 1 LLL ccccccCCC  то будет ясно, что функционал (5) зависит от параметров C и : .))((),,(),()( 0 0 TxdttuxfCJuJ T   (8) v1 v2 vL u t 0 t0 t1 t2 0 1 2 L  1 L t3 t4 t5 t6 t7 t8 t9 tN  1 tN Рис. 1 u t 0 t0 t1 t2 0 1 2 L  1 L t3 t4 t5 t6 t7 t8 t9 tN  1 tN ,)( 1 20 1 1 ctc  ,)( 2 21 2 1 ctc  L L L ctc 211 )(   …, Рис. 2 56 ISSN 0572-2691 Задача заключается в нахожде- нии при условиях (1), (6), (3), (7) таких векторов ...,( 1CC  )..., LC и ),,...,( 11  L при которых заданный функцио- нал (8) принимает мини- мальное значение. 1.3. Управления из клас- са кусочно-заданных функ- ций. Управление ,)( rEtu  ,],0[ Tt определяется задан- ными базисными функциями ),( 1 jm t ,,...,1 Mm  ),,[ 1 jjt   с неизвестны- ми оптимизируемыми постоянными коэффициентами ),...,,( 1 j M jj ccC  ,,...,1 Lj  на каждом полуинтервале ),,[ 1 jj   полученном разбиением отрезка ],0[ T )1( L оптимизируемыми точками ,j 1,...,1  Lj (рис. 3), т.е. ,...,,1,),,[,)()( 1 1 1 MmEcttctu rj mjj M m jm j m     (9) а допустимые значения управлений принадлежат некоторому множеству U, в част- ности параллелепипеду (7). Задача заключается в нахождении векторов ,...,...,()...,,( 11 1 1 M L ccCCC  )...,,..., 1 L M L cc и ),...,( 11  L при условиях (1), (9), (3), (7), при которых задан- ный функционал (8) принимает минимальное значение. Предполагается, что за- данные функции ),( 1 jm t ),,[,...,,1 1 jjtMm   вместе с частными про- изводными по ),( ux непрерывны. Таким образом, в зависимости от выбора управления в форме (2), (6) или (9) будем рассматривать три типа задач оптимального управления: задача 1: (1)–(5); задача 2: (1), (6), (3), (7), (8); задача 3: (1), (9), (3), (7), (8). 2. Численное решение дискретизированных задач Для численного решения поставленных выше трех задач используем схему, предложенную в [8, 9]. Для этого на отрезке ],0[ T введем равномерную сеточную область .}/,,...,0,:{ NThNiihtt ii  Здесь N — заданное натуральное число. Не умаляя общности, для простоты расчетных формул систему (1) аппрок- симируем явной схемой Эйлера: 001 ,1...,,0),,,( xxNituxhfxx iiiii  . (10) Рассмотрим каждую задачу по отдельности. 2.1. Формулы для решения задачи 1. Во введенной сеточной области аппрок- симируем значение управления ,)( rEtuu  ,],0[ Tt следующим образом: .1,...,0 ,1,...,1),,[,/))()(( ,...,,1),,[),[, 111 11          Ni Ljtthtvtv Ljttv u iijijjjij jjiij i (11) Интеграл, участвующий в выражении (5), аппроксимируем методом прямоугольников: .min),,()(),( , 1 0 0      v N i iiiN tuxfhxvI (12) В результате получим конечномерную задачу математического программирова- ния (10)–(12) с учетом условий (3), (4). u t 0 t0 t1 t2 0 1 2 L  1 L t3 t4 t5 t6 t7 t8 t9 tN  1 tN Рис. 3 Международный научно-технический журнал «Проблемы управления и информатики», 2012, № 6 57 Из (11) видно, что если момент времени переключения управления j нахо- дится между узловыми точками 1, ii tt , то значение управления iu аппроксими- руется линейной комбинацией значений ., 1jj vv Для решения задачи (10)–(12), т.е. для определения оптимальных значений векторов v и  используем численные методы конечномерной оптимизации перво- го порядка, в частности итерационный метод проекции градиента функционала в пространстве оптимизируемых параметров :),( v ,...,1,0)],/),(,/),((),[(),( )4(),3( 11   kvIvvIvPv kkkkkkkk (13) где )4(),3(P — оператор проектирования вектора ),( v на допустимую область параметров, определяемую ограничениями (3), (4); ),( 00 v — некоторое задан- ное начальное приближение для оптимизируемых параметров; векторы     )/,...,/(/),(,)/,...,/(/),( 111 LL ddIddIdvdIdvdIdvdIdvvdI (14) определяют градиент функционала задачи (10)–(12), формулы для компонент ко- торого получены ниже; T — знак транспонирования. Введем векторы импульсных переменных [7–9]: .,...,0,,/),( NiEpdxvdIp n iii  (15) Здесь производная понимается как полная, с учетом взаимозависимости значений ,,...,0, Nixi  из (10). Отсюда c учетом (10) имеем ,0...,,1, ),,(),,( 1 0 1 1                          Nip x tuxf hE x tuxf hp x x x I p i i iii i iii i i i i i (16) , )( N N N N x x x I p       (17) где E — n-мерная единичная матрица. Систему (16), (17) назовем сопряженной. Предположим, что момент переключения j находится между узловыми точками 1jkt и , jkt т.е. ),,[ 1 jj kkj tt  .1,...,1  Lj Тогда компоненты гради- ента ,...,,1,/ LjvddI j  определяются следующим образом:          j j k ks s j s jj p v x v I vd Id 1 ,...,,1, ),,(),,( 1 1 1 1111 1 111 0 Ljp v u u tuxf v u u tuxf h j j k ks s j s s sss j s s sss                             (18) а частные производные ,...,,1,1,...,1,/ 1 Ljkksvu jjjs   определяются из соотношения (11):              .1,/)( ,1,/)( ,2,...,,1 111 1 jsj jjs jj j s ksht ksht kks v u (19) Для компонент градиента ,1...,,1,/  LjddI j имеем                   j j j j j j k j k k k j k j k jj p u u xI p xI d dI 1 1 ....,,1, ),,(),,( 1 111 1 111 0 1 Ljp u tuxf u tuxfu h j j jjj j jjjj k k kkk k kkk j k                       (20) 58 ISSN 0572-2691 Частные производные ,1...,,1,/1   Lju jk j определяются непосредственно из соотношения (11): .1...,,1,/)(/ 11   Ljhvvu jjjk j (21) Тогда из (20) и (21) для 1,...,1  Lj получаем, что .1...,,1 , ),,(),,( )( 1 111 1 111 0 1                       Lj p u tuxf u tuxf vv d dI j j jjj j jjj k k kkk k kkk jj j (22) Формулы (18), (22) определяют компоненты градиента (14) функционала за- дачи (10)–(12). Реализация итерационного процесса (13) происходит в три этапа: 1) при текущих значениях вектора 12),(  Lkk Ev из формул (10), (11) определяется решение аппроксимированной задачи Коши NiEx n i ,...,0,  ; 2) из формул (16), (17) находим векторы импульсов n i Ep  в обратном по- рядке, начиная с Ni  до ;0i 3) из формул (18), (22) определяются компоненты вектора градиента (14); 4) выполняется процедура (13) с выбором  из условия одномерной миними- зации функционала (12) (учитывая «простоту» допустимой области параметров (3), (4) операция проектирования )4(),3(P не представляет сложности), определя- ется новое приближение ).,( 11  kkv В случае невыполнения условия оптималь- ности или останова итерационного процесса повторяются этапы 1)–4). 2.2. Формулы для решения задачи 2. Аппроксимируем во введенной сеточ- ной области значение управления ,)( rEtuu  ,],0[ Tt и функционал (8) сле- дующим образом: ,1...,0 ,1...,,1),,[)],)()(( ))()([( 1 ,...,,1),,[),[,)( 1211 1 21 1 11 11211                   Ni Ljttctct ctct h Ljttctc u iij j ji j ij j ji j ji jjii j ji j i (23) .min),,()(),( , 1 0 0      C N i iiiN tuxfhxCI (24) Из (23) видно, что если момент времени переключения управления j находится между узловыми точками ,, 1ii tt то значение управления iu аппроксимируется линейной комбинацией значений ),)(( 211 j ji j ctc   ).)(( 1 21 1 1     j ji j ctc Итак, аппроксимируя задачу (1), (6), (3), (7), (8), получаем конечномерную за- дачу математического программирования (10), (23), (24) с учетом условий (3), (7). Для решения задачи (10), (23), (24), т.е. для определения оптимальных значений векторов ),,...,,,,( 21 2 2 2 1 1 2 1 1 LL ccccccC  и  используем итерационный метод проек- ции градиента функционала в пространстве оптимизируемых параметров ),( C : ,...,1,0)],/),(,/),((),[(),( )7(,)3( 11   kdCdIdCCdICPC kkkkkkkk (25) Международный научно-технический журнал «Проблемы управления и информатики», 2012, № 6 59 где )7(),3(P — оператор проектирования вектора ),( C на допустимую область параметров, определяемую ограничениями (3), (7); ),( 00 C — некоторое задан- ное начальное приближение для оптимизируемых параметров; векторы T 21 2 1 1 2 1 1 T 11 )/,/,...,/,/,/(/ ,)/,...,/(/ LL L dcdIdcdIdcdIdcdIdcdICdId ddIdIddId    (26) определяют градиент функционала (24). После введения вектора импульсных переменных (15), определяемого из си- стемы (16), (17), получим формулы градиента (26). Предположим, что момент пере- ключения j находится между узловыми точками 1jkt и jkt , т.е. ,),[ 1 jj kkj tt  .1...,,1  Lj Тогда компоненты градиента ,2,1,/ mdcId j m ,...,,1 Lj  вычис- ляются следующим образом: ,2,1,...,,1 , ),,(),,( ),,( ),,( 1 1 11 1 1 1111 1 111 0 1 1 111 1 1 111 0                                                                              mLj p c u u tuxf c u u tuxf h p c u u tuxf h c u u tuxf hp c x c I cd Id j j j j j j j j k ks sj m s s sss j m s s sss k ks sj m s s sss k ks j m s s sss k ks sj m s j m j m (27) а частные производные ,1...,,1,/ 1   jj j ms kkscu ,2,1,...,,1  mLj опре- деляются из соотношения (23):               ,1,/))(( ,1,/)( ,2,...,, 1 1 2 11 11 1 jjssj jjs jjjs j s kshtt ksht kkst c u (28)              .1,/)( ,1,/)( ,2,...,,1 111 1 2 jsj jjs jj j s ksht ksht kks c u (29) Для компонент градиента ,1...,,1/  LjddI j используем соотношение (20). Частные производные ,1...,,1,/1   Lju jk j участвующие в (20), находим непосредственно из соотношения (23): .])()(2[ 1 2 1 2111 1 1 1 jj jk j kj j j k cctctc h u jj j       (30) Если учесть (30) в (20), для ,1...,,1,/  LjddI j получаем, что                      j j jjj j jjj k k kkk k kkk j p u tuxf u tuxf d Id 1 111 1 111 0 ),,(),,( .1...,,1],)()(2[ 2 1 2111 1 1     Ljcctctc jj jk j kj j jj (31) Формулы (27), (31) определяют компоненты градиента функционала (24) за- дачи (10), (23), (24). 60 ISSN 0572-2691 2.3. Формулы для решения задачи 3. Во введенной сеточной области ап- проксимируем значение управления ,],0[,)( TtEtuu r  следующим образом: iu                               ,1...,,1),,[,)()( 1 ,...,,1),,[),[, 1 1 1, 1 ,11 1 11 1 1, Ljttctct h Ljttc iij M m ji m j mij M m ji m j mji jjii M m ji m j m (32) ,1...,,0  Ni где .1...,,0,1...,,0,...,,1),(,  LjNiMmt jim ji m Итак, аппроксимируя задачу (1), (9), (3) (7), (8), получаем конечномерную за- дачу математического программирования (10), (32), (24) с учетом условий (3), (7). Для определения оптимальных значений векторов ),...,,...,,...,( 1 11 1 L M L M ccccC  и  используем процедуру (25). Здесь векторы T 1 11 1 T 11 )/,...,/,...,/,...,/(/ ,)/,...,/(/ L M L M L dcdIdcdIdcdIdcdIdCdI ddIddIddI    (33) определяют градиент функционала задачи (10), (32), (24). Введем вектор импульсных переменных (15) и предположим, что ,),[ 1 jj kkj tt  .1...,,1  Lj Тогда компоненты градиента ,...,,1,/ MmdcdI j m  ,...,,1 Lj  опре- деляются следующим образом: ,,...,1,,...,1 , ),,(),,( 1 1 1 1 1111 1 111 0 MmLj p c u u tuxf c u u tuxf h p c x c I cd Id j j j j k ks sj m s s sss j m s s sss k ks sj m s j m j m                                        (34) а частные производные ,1...,,1,/ 1   jj j ms kkscu ,...,,1,...,,1 MmLj  — из соотношения (32):                    .1,/)( ,1,/)( ,2,...,, 1, 1 1,1 11 1 1, j js msj j js mjs jj js m j m s ksht ksht kks c u (35) Для компонент градиента ,1...,,1,/  LjddI j используем соотношение (20). Частные производные ,1...,,1,/1   Lju jk j участвующие в (20), определя- ются непосредственно из соотношения (32): .)( 11 1 ,11,1 1 ,1 1 1,11                    M m jk m j m jk m j m M m jk m j m M m jk m j m j k jjjjj cc h cc h u (36) Тогда из (20), (36) для ,1...,,1,/  LjddI j получаем, что Международный научно-технический журнал «Проблемы управления и информатики», 2012, № 6 61                      j j jjj j jjj k k kkk k kkk j p u tuxf u tuxf d Id 1 111 1 111 0 ),,(),,( .1...,,1,)( 1 ,11,1     Ljcc M m jk m j m jk m j m jj (37) Формулы (34), (37) определяют компоненты градиента функционала (24) за- дачи (10), (32), (24). Замечание. Ясно, что выбор схемы метода Эйлера для аппроксимации по- ставленных выше трех задач не имел принципиального значения для предлагае- мого подхода. Полученные формулы несложно распространить и на другие схемы дискретизации исходной задачи [8, 9]. 3. Сравнение формул градиента функционала исходной непрерывной и дискретизированной задач на классе кусочно-постоянных управлений На классе кусочно-постоянных функций получим формулу градиента целево- го функционала непосредственно для исходной непрерывной задачи (1)–(5). При этом функция Гамильтона–Понтрягина и сопряженная система имеют следующий вид [10]: ,),,()(),,(),,,( 0 tuxfttuxftuxH  (38) , ))(( )(),( ),,(),,( )( 0 x Tx Tt x tuxf x tuxf t            (39) где nEt  )( — решение задачи Коши (39), соответствующее допустимому управлению .)( Utuu  Пусть допустимое управление )(tu получило прираще- ние ),(tuu  причем .)()( Ututu  Тогда соответствующее приращение функционала (5) можно записать следующим образом [10]: ,))(()( ),,,( )()()(),( 0       uodttu u tuxH uJuuJuJvJ T (40) где ,)()()( 2/1 0 2 ],0[2           T ETL dttututu r .0 )( lim 0     u uo u Для получения формул для компонент градиента ),(  vJv , учитывая кусоч- но-постоянство управления, приращение )(tu выберем из предположения, что произвольно выбранная i-я компонента управления, ri ,...,1 , на каком-либо j-м интервале постоянства, Lj ,...,1 , получила приращение ijv , т.е.          ,,const ,,0,0 )( 1 1 jjji jj tv Ttt tu (41) где .)0...,,0,,0...,,0( ijji vv  Преобразуем соответствующее приращению уп- равления (41) выражение приращения функционала (40):               dtu u tuxH dtu u tuxH uJvJ j j j v 1 1 ),,,(),,,( )(),( 0 ).)(( ),,,(        uodtu u tuxH T j (42) 62 ISSN 0572-2691 Если учесть (41) в (42), то, поскольку первое и третье слагаемые в выражении (42) обращаются в нуль, формула для приращения функционала примет вид          ))(( ),,,( ),( 1 uodtv u tuxH vJ j j jiv .))(( ),,,( 1          uodtv u tuxH j j ij i (43) Разделив обе части (43) на ijv и перейдя к пределу при ,0 ijv с учетом того, что ,0)/))(((  ijvuo будем иметь ....,,1,...,,1 ,)( ),,(),,(),,,(),( 11 0 riLj dtt u tuxf u tuxf dt u tuxH dv vJd j j j j iiiij                            (44) Теперь получим формулу для ).,(  vJ Пусть j получило приращение ,j причем 0 j и 1 jjj . Такое изменение значения j соответствует тому, что в этом случае управление получит приращение ),(tu которое можно записать в следующем виде:         ., ,,0,0 )( 1 jjjjj jjj tvv Ttt tu (45) Для приращения функционала (40), соответствующего приращению управления (45), будем иметь              dtu u tuxH dtu u tuxH uJvJ jj j j ),,,(),,,( )(),( 0        ))(( ),,,( uodtu u tuxH T jj ).)(( ),,,( )( 1          uodt u tuxH vv jj j jj (46) Разделим обе части (46) на j и перейдем к пределу 0 j . С учетом теоре- мы о среднем значении и в силу (45) имеет место .1...,,1,)( ),,(),,( )( ),( 0 1                       Ljt u tuxf u tuxf vv d vJd jt jj j (47) В случае, когда j получает отрицательное приращение 0 j такое, что 1 jjj , это соответствует тому, что управление )(tu получает прира- щение         ., ,,0,0 )( 1 jjjjj jjj tvv Ttt tu Повторив аналогичные формуле (46) выкладки, снова имеем формулу (47). Международный научно-технический журнал «Проблемы управления и информатики», 2012, № 6 63 Таким образом, в непрерывном случае компоненты градиента функционала (5) определяются формулами (44) и (47). Покажем, что эти формулы совпадают с выражениями, которые получаются при переходе к пределу в формулах градиента (18), (22) функционала (12) дискретной задачи (10)–(12). Преобразуя дискретную сопряженную систему (16), (17) и переходя к пределу при 0h , получим . ))(( )(, ),,(),,(0 x Tx Tpp x tuxf x tuxf p            (48) Переходя к пределу в (18) при ,0h учитывая при этом, что jkt стремится к j , получаем ....,,1, ),,(),,(),( 1 0 Ljdtp u tuxf u tuxf dv vdI j j j                      (49) Аналогично из (22) имеем .1...,,1, ),,(),,( )( ),( 0 1                      Ljp u tuxf u tuxf vv d vdI jt jj j (50) Если в системе (48) провести замену )()( ttp  (учитывая произвольность вектор-функции nEtp )( ), то формулы (49), (50) совпадут соответственно с формулами (44), (47) градиента функционала (5). 4. Результаты численных экспериментов Задача 1. Применим предложенный подход к решению тестовой задачи не- линейного оптимального управления на отрезке ]4/3,0[  [11]: ,4)(1,0)0(,1)0( ,)( , 21 12 21       tuxx xtux xx   .min)(1  TxJ (51) Здесь .356194,24/3,1,2  Tmn Точное решение задачи следующее (рис. 4):             , 4 3 4 ,1 , 4 0,4 )(* t t еu                                         , 4 3 4 , 4 cos2 , 4 0,2sin2 )( , 4 3 4 , 4 sin2 , 4 0,2cos )( * 2 * 1 tt tt tx tt tt tx а минимальное значение функционала .2)( * uJ Оптимальное управление в за- даче (51) имеет релейный тип с двумя интервалами постоянства, т.е. 2L . Опти- мальное значение вектора ),( v следующее: .)785392,0;1;4(),,(),( * 1 * 2 * 1 **  vvv В табл. 1 приведены результаты числен- ных экспериментов с использованием метода проекции сопряженных градиентов с точно- стью 001,0 при различных начальных значениях ),( 00 v управляющего вектора ),( v , шаг 0,01178.h v1  4 u t 0 4 1   v2  1 4 3 Рис. 4 64 ISSN 0572-2691 Таблица 1 N ),( 00 v 0I ),( ** v *I Число итераций 1 (3,200; 1,500; 1,231) 1,31334 (4,000000; 1,000000; 0,789326) 2,05638082 6 2 (2,850; 1,200; 0,522) 1,37611 (4,000000; 1,000000; 0,789323) 2,05638072 6 3 (3,150; 2,430; 0,953) 0,88576 (4,000000; 1,000000; 0,789325) 2,05638083 7 4 (3,540; 1,820; 1,847) 0,46159 (4,000000; 1,000000; 0,789325) 2,05638084 8 5 (2,180; 1,470; 1,368) 1,21106 (4,000000; 1,000000; 0,789329) 2,05638077 4 6 (1,890; 0,750; 2,092) 1,05994 (4,000000; 1,000000; 0,789325) 2,05638084 4 Задача 2. Рассмотрим следующую тестовую задачу [12]: .min)5()5( ,1)(,0)0(,5)0(,]5;0(,sin, 2 2 2 1 211221   xxJ tuxxtxuxxx  (52) Здесь 5,1,2  Tmn . Оптимальное управление в данной задаче имеет релей- ный тип с тремя интервалами постоянства (рис. 5), т.е. 3L : ;]5,50,4[,1)();50,4,95,0[,1)(;)95,0,0[,1)( ***  ttuttuttu .)50,4,95,0,1,1,1(),,,,(),( * 2 * 1 * 3 * 2 * 1 **  vvvv В табл. 2 приведены результаты численных экспериментов с использованием ме- тода проекции сопряженных градиентов с точностью 001,0 при различных начальных значениях ),( 00 v управляющего вектора ),( v , шаг 05,0h . v1  1 u t 0 95,01  v2  1 v3  1 5 5,42  Рис. 5 Таблица 2 N ),( 00 v 0I ),( ** v *I Число итераций 1 (0.78;3.46;0.7;-0.6;0.5) 32.38 (0.950;4.511;1.0;-1.0;1.0) 11.6681 24 2 (0.78;3.46;2;-2;0.5) 9.15 (0.950;4.501;1.0;-1.0;1.0) 11.6686 19 3 (0.52;2.73;0.8;-0.8;0.4) 44.39 (0.950;4.528;1.0;-1.0;1.0) 11.6699 40 4 (0.28;3.26;0.26;-0.4;0.32) 42.78 (0.950;4.512;1.0;-1.0;1.0) 11.6681 22 Задача 3. Рассмотрим следующую тестовую задачу [13] на отрезке ]8,0[ : .min)()()( ,1)(,0)0(,0)0(,16)0( , , , 2 3 2 2 2 1 321 3 32 21          TxTxTxJ tuxxx ux xx xx    (53) Здесь 8,1,3  Tmn . Точное решение задачи слудующее:         ,86,1 ,62,1 ,20,1 )(* t t t tu Международный научно-технический журнал «Проблемы управления и информатики», 2012, № 6 65 а минимальное значение функ- ционала .0)( * uJ Оптималь- ное управление в задаче (53) имеет релейный тип с тремя ин- тервалами постоянства, т.е. 3L . Оптимальное значение вектора ),( v следующее:  ),,,,(),( * 2 * 1 * 3 * 2 * 1 ** vvvv .)6,2,1,1,1(  В табл. 3, 4 приведены результаты численных экспериментов с использованием ме- тода проекции сопряженных градиентов с точностью 001,0 при различных начальных значениях ),( 00 v управляющего вектора ),( v , шаг 0,04h . Таблица 4 N ),( ** v *I Число итераций 1 (0,99866; 0,99820; 1,00000; 2,00052; 6,00382) 0,0000057 87 2 (1,00000; 0,99998; 1,00000; 2,00002; 6,00011) 0,0000007 70 3 (1,00000; 1,00000; 0,99956; 1,99997; 5,99966) 0,0000001 95 4 (0,99991; 0,99164; 0,99999; 1,99331; 6,01179) 0,0000523 93 5 (1,00000; 0,99998; 0,99895; 2,00002; 5,99977) 0,0000036 55 6 (0,99997; 1,00000; 0,99972; 2,00031; 6,00196) 0,0000429 90 Заключение Получены аналитические формулы для градиента целевого функционала в задаче оптимального управления на классах кусочно-постоянных, кусочно- линейных и кусочно-заданных управлений с оптимизируемыми временами пере- ключений. Формулы для градиента целевого функционала позволяют применять методы оптимизации первого порядка для численного решения задач оптималь- ного управления. Учитывая существенную техническую простоту реализации кусочно-посто- янных, кусочно-линейных и кусочно-заданных управляющих воздействий, ре- зультаты данной работы могут применяться при разработке математического обеспечения систем автоматизированного и автоматического управления техно- логическими процессами различного назначения. А.Б. Рагімов ЧИСЕЛЬНЕ РОЗВ’ЯЗАННЯ ЗАДАЧ ОПТИМАЛЬНОГО КЕРУВАННЯ НЕЛІНІЙНИМИ ДИНАМІЧНИМИ СИСТЕМАМИ Запропоновано чисельний метод розв’язання задач оптимального керування об’єктами, які описуються системою нелінійних звичайних диференціальних рівнянь на класах кусково-сталих, кусково-лінійних і кусково-заданих керу- вань. В задачах оптимізуються кусково-сталі значення коефіцієнтів з формул для керувань, і, що найважливіше, оптимізуються межі інтервалів сталості цих значень. Отримано аналітичні формули градієнта функціонала за параметрами, які оптимізуються. Проведено порівняння формул градієнта функціонала, отриманих для вихідної неперервної і відповідної дискретизованої задач опти- мального керування на класі кусково-сталих керувань. Наведено результати чисельних експериментів на прикладі розв’язання модельних задач. Таблица 3 N ),( 00 v 0I 1 (0,530; 0,760; 0,700; 0,382; 6,321) 4435,0140 2 (0,600; 0,500; 0,800; 0,782; 4,647) 655,9553 3 (0,300; 0,780; 0,550; 1,191; 3,463) 703,9213 4 (0,840; 0,710; 0,670; 1,665; 6,742) 100,1715 5 (0,100; 0,640; 0,410; 2,357; 5,745) 1554,4936 6 (0,260; 0,400; 0,320; 3,281; 7,069) 713,2167 66 ISSN 0572-2691 A.B. Rahimov NUMERICAL SOLUTION TO OPTIMAL CONTROL PROBLEMS OF NONLINEAR DYNAMICAL SYSTEMS Numerical method of solving to optimal control problems is proposed for objects de- scribed by the system of ordinary nonlinear differential equations on the classes of piecewise constant, piecewise linear and piecewise given controls. Both the piece- wise constant values of the coefficients in the expression of controls as well as the boundaries of constancy intervals of these values are optimized. Analytical formulas for the gradient of the functional with respect to the optimized parameters are ob- tained. Comparison of the formulas for the gradient of the functional obtained for the initial continuous optimal control problem and for the corresponding discretized op- timal control problem on the class of piecewise constant controls is carried out. Re- sults of numerical experiments carried out through the examples of the solutions to some model problems are also given. 1. Systems and control encyclopedia / Ed. M.G. Singh. — Vol. 1–8. — Oxford; New York; Pekin : Pergamon Press, 1987. 2. The control handbook / Ed. W.S. Levine. — Boca Raton : CDC Press, 1996. — 1566 p. 3. Табак Д., Куо Б. Оптимальное управление и математическое программирование. — М.: Наука, 1975. — 280 с. 4. Bryson A.E., Ho Yu-Chi. Applied optimal control: optimization, estimation, and control. — Wal- tham : Blaisdell Publ. Co., 1975. — 481 p. 5. Моисеев А.А. Оптимальное управление при дискретных управляющих воздействиях // Ав- томатика и телемеханика. — 1991. — № 9. — С. 123–132. 6. Айда-заде К.Р., Рагимов А.Б. Релейное управление нелинейной системой при неточно за- данных значениях параметров // Международный научно-технический журнал «Проблемы управления и информатики». — 2010. — № 4. — С. 53–63. 7. Айда-заде К.Р., Рагимов А.Б. О решении задач оптимального управления на классе кусоч- но-постоянных функций // Автоматика и вычислительная техника. — 2007. — 41, № 1. — С. 27–36. 8. Айда-заде К.Р., Евтушенко Ю.Г. Быстрое автоматическое дифференцирование на ЭВМ // Математическое моделирование. — 1989. — 1, № 1. — С. 120–131. 9. Айда-заде К.Р. Исследование и численное решение конечно-разностных аппроксимаций задач управления распределенными системами // Журн. вычисл. математики и мат. физики. — 1989. — 29, № 3. — С. 346–354. 10. Габасов Р., Кириллова Ф.М. Принцип максимума в теории оптимального управления. — М. : Наука и техника, 1974. — 272 с. 11. Александров В.В., Бахвалов Н.С., Григорьев К.Г. и др. Практикум по численным методам в задачах оптимального управления. — М. : Изд-во МГУ, 1988. — 80 с. 12. Васильев О.В., Тятюшкин А.И. Об одном методе решения задач оптимального управления, основанном на принципе максимума // Журн. вычисл. математики и мат. физики. — 1981. — 21, № 6. — С. 1376–1384. 13. Федоренко Р.П. Приближенное решение задач оптимального управления. — М.: Наука, 1978. — 486 с. Получено 12.03.2012
id nasplib_isofts_kiev_ua-123456789-207541
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 0572-2691
language Russian
last_indexed 2025-12-01T08:26:42Z
publishDate 2012
publisher Інститут кібернетики ім. В.М. Глушкова НАН України
record_format dspace
spelling Рагимов, А.Б.
2025-10-09T11:44:36Z
2012
Численное решение задач оптимального управления нелинейными динамическими системами / А.Б. Рагимов // Проблемы управления и информатики. — 2012. — № 6. — С. 54–66. — Бібліогр.: 13 назв. - рос.
0572-2691
https://nasplib.isofts.kiev.ua/handle/123456789/207541
519.6, 517.977.5
10.1615/JAutomatInfScien.v44.i11.50
Запропоновано чисельний метод розв’язання задач оптимального керування об’єктами, які описуються системою нелінійних звичайних диференціальних рівнянь на класах кусково-сталих, кусково-лінійних і кусково-заданих керувань. В задачах оптимізуються кусково-сталі значення коефіцієнтів з формул для керувань, і, що найважливіше, оптимізуються межі інтервалів сталості цих значень. Отримано аналітичні формули градієнта функціонала за параметрами, які оптимізуються. Проведено порівняння формул градієнта функціонала, отриманих для вихідної неперервної і відповідної дискретизованої задач оптимального керування на класі кусково-сталих керувань. Наведено результати чисельних експериментів на прикладі розв’язання модельних задач.
Numerical method of solving to optimal control problems is proposed for objects described by the system of ordinary nonlinear differential equations on the classes of piecewise constant, piecewise linear and piecewise given controls. Both the piecewise constant values of the coefficients in the expression of controls as well as the boundaries of constancy intervals of these values are optimized. Analytical formulas for the gradient of the functional with respect to the optimized parameters are obtained. Comparison of the formulas for the gradient of the functional obtained for the initial continuous optimal control problem and for the corresponding discretized optimal control problem on the class of piecewise constant controls is carried out. Results of numerical experiments carried out through the examples of the solutions to some model problems are also given.
ru
Інститут кібернетики ім. В.М. Глушкова НАН України
Проблемы управления и информатики
Оптимальное управление и методы оптимизации
Численное решение задач оптимального управления нелинейными динамическими системами
Чисельне розв’язання задач оптимального керування нелінійними динамічними системами
Numerical Solution to Optimal Control Problems of Nonlinear Dynamical Systems
Article
published earlier
spellingShingle Численное решение задач оптимального управления нелинейными динамическими системами
Рагимов, А.Б.
Оптимальное управление и методы оптимизации
title Численное решение задач оптимального управления нелинейными динамическими системами
title_alt Чисельне розв’язання задач оптимального керування нелінійними динамічними системами
Numerical Solution to Optimal Control Problems of Nonlinear Dynamical Systems
title_full Численное решение задач оптимального управления нелинейными динамическими системами
title_fullStr Численное решение задач оптимального управления нелинейными динамическими системами
title_full_unstemmed Численное решение задач оптимального управления нелинейными динамическими системами
title_short Численное решение задач оптимального управления нелинейными динамическими системами
title_sort численное решение задач оптимального управления нелинейными динамическими системами
topic Оптимальное управление и методы оптимизации
topic_facet Оптимальное управление и методы оптимизации
url https://nasplib.isofts.kiev.ua/handle/123456789/207541
work_keys_str_mv AT ragimovab čislennoerešeniezadačoptimalʹnogoupravleniânelineinymidinamičeskimisistemami
AT ragimovab čiselʹnerozvâzannâzadačoptimalʹnogokeruvannânelíníinimidinamíčnimisistemami
AT ragimovab numericalsolutiontooptimalcontrolproblemsofnonlineardynamicalsystems