Метод усереднення в деяких задачах оптимального керування

Обосновано применение метода усреднения к задаче оптимального управления системами дифференциальных уравнений в стандартной по Боголюбову форме. Построено ε-оптимальное управление We substantiate a use of an averaging method for an optimal control problem for differential systems in the Bogolyubov...

Повний опис

Збережено в:
Бібліографічні деталі
Опубліковано в: :Нелінійні коливання
Дата:2008
Автори: Носенко, Т.В., Станжицький, О.М.
Формат: Стаття
Мова:Українська
Опубліковано: Інститут математики НАН України 2008
Онлайн доступ:https://nasplib.isofts.kiev.ua/handle/123456789/178193
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Метод усереднення в деяких задачах оптимального керування / Т.В. Носенко, О.М. Станжицький // Нелінійні коливання. — 2008. — Т. 11, № 4. — С. 512-519. — Бібліогр.: 5 назв. — укр.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1859675809457897472
author Носенко, Т.В.
Станжицький, О.М.
author_facet Носенко, Т.В.
Станжицький, О.М.
citation_txt Метод усереднення в деяких задачах оптимального керування / Т.В. Носенко, О.М. Станжицький // Нелінійні коливання. — 2008. — Т. 11, № 4. — С. 512-519. — Бібліогр.: 5 назв. — укр.
collection DSpace DC
container_title Нелінійні коливання
description Обосновано применение метода усреднения к задаче оптимального управления системами дифференциальных уравнений в стандартной по Боголюбову форме. Построено ε-оптимальное управление We substantiate a use of an averaging method for an optimal control problem for differential systems in the Bogolyubov form. We construct an ε-optimal control.
first_indexed 2025-11-30T16:14:41Z
format Article
fulltext УДК 517.9 МЕТОД УСЕРЕДНЕННЯ В ДЕЯКИХ ЗАДАЧАХ ОПТИМАЛЬНОГО КЕРУВАННЯ Т. В. Носенко, О. М. Станжицький* Київ. нац. ун-т iм. Т. Шевченка Україна, 01033, Київ, вул. Володимирська, 64 e-mail: notava@ukr.net stom@mail.univ.kiev.ua We substantiate a use of an averaging method for an optimal control problem for differential systems in the Bogolyubov form. We construct an ε-optimal control. Обосновано применение метода усреднения к задаче оптимального управления системами диф- ференциальных уравнений в стандартной по Боголюбову форме. Построено ε-оптимальное управление. Вступ. Ефективним методом розв’язання задач оптимального керування є метод усеред- нення. При його використаннi початковiй неавтономнiй задачi оптимального керування ставиться у вiдповiднiсть усереднена автономна задача оптимального керування, розв’я- зок якої знаходиться простiше за розв’язок початкової задачi. Даним питанням присвяче- но низку робiт (див., наприклад, [1 – 3]). У данiй роботi будемо використовувати iнший пiдхiд до застосування методу усеред- нення, а саме здiйснювати усереднення за часом, що явно входить у правi частини сис- теми, вважаючи u параметром, далi при розв’язаннi усередненої системи розглядатиме- мо тi самi керування, що i для початкової системи. Таким чином, множини керувань U для початкової та усередненої систем збiгаються, при цьому не вимагається, щоб U була компактом. У данiй роботi встановлено зв’язок мiж оптимальним керуванням усередненої та точної систем, а саме доведено, що оптимальне керування усередненою системою є ε-оптимальним для точної системи. Постановка задачi. Будемо розглядати задачу оптимального керування системою ди- ференцiальних рiвнянь ẋ = εX(t, x, u), x(0) = x0, (1) де ε > 0 — малий параметр, x ∈ D — фазовий вектор, D — область в Rn, u ∈ U ⊂ Rm — вектор керування, t ≥ 0, T > 0 — деяка константа, X — вектор-функцiя, неперервна за сукупнiстю змiнних. Керування u(t) вважаються допустимими, якщо виконується умова *Пiдтримано Державним фондом фундаментальних дослiджень України (проекти № 14.1/007 та Ф25.1/01). c© Т. В. Носенко, О. М. Станжицький, 2008 512 ISSN 1562-3076. Нелiнiйнi коливання, 2008, т . 11, N◦ 4 МЕТОД УСЕРЕДНЕННЯ В ДЕЯКИХ ЗАДАЧАХ ОПТИМАЛЬНОГО КЕРУВАННЯ 513 А) u(t) ∈ U при t ≥ 0, u(t) є вимiрними, локально iнтегровними при t ≥ 0 i для кожного u(t) iснує стала u0 ∈ U така, що |u(t) − u0| ≤ ϕ(t), де ϕ(t) не залежить вiд u(t) i ∫ ∞ 0 ϕ(t)dt < ∞. Множину допустимих керувань позначимо через F. Для кожного допустимого керу- вання u(t) x(t, u) — розв’язок системи (1) при u = u(t). Потрiбно знайти такi керування u ∈ U ⊂ Rm, що забезпечують мiнiмальне значення функцiонала Jε(u) = Φ ( x ( T ε , u )) , де Φ(x) — деяка функцiя. Jε = inf u(t)∈F Jε(u). Поставимо у вiдповiднiсть системi (1) на [ 0, T ε ] усереднену систему ẏ = εX0(y, u), (2) y(0) = x0, де X0(x, u) = lim T→∞ 1 T T ∫ 0 X(t, x, u)dt, (3) та J̄ε(u) = Φ ( y ( T ε , u )) . Нехай u∗ 2(t, ε) — оптимальне керування усередненою системою (2), тобто J̄ε = inf u(t)∈F J̄ε(u) = J̄ε(u ∗ 2(t, ε)). У роботi доведено, що керування u∗ 2(t, ε) є η-оптимальним для системи (1), а саме, для будь-якого η > 0 iснує ε0 > 0 таке, що для всiх 0 < ε < ε0 виконується нерiвнiсть |Jε(u ∗ 2(t, ε)) − Jε| < η. Допомiжнi твердження. Для доведення згаданого вище твердження нам потрiбна на- ступна лема, що є узагальненням принципу усереднення на випадок залежностi правих частин вiд функцiональних параметрiв. Лема 1. Нехай в областi Q = {x ∈ D ⊂ Rn, t ≥ 0, u ∈ U ⊂ Rm} виконано умови: 1) X(t, x, u) є неперервною за сукупнiстю змiнних, обмеженою та задовольняє умову Лiпшиця по x та u з константою M ; 2) розв’язок y = y(t, u), y(0, u(0)) = x0 усередненої системи є визначеним при всiх допустимих u(t) для t ≥ 0 i належить областi D разом з деяким ρ-околом; ISSN 1562-3076. Нелiнiйнi коливання, 2008, т . 11, N◦ 4 514 Т. В. НОСЕНКО, О. М. СТАНЖИЦЬКИЙ 3) рiвномiрно вiдносно x ∈ D та u ∈ U iснує границя (3). Тодi для будь-яких η > 0 i T > 0 iснує ε0(η, T ) > 0 таке, що для довiльного 0 < ε < ε0 та 0 < t < T ε розв’язок x(t, u) визначено на [ 0, T ε ] i справедливою є оцiнка |x(t, u) − y(t, u)| ≤ η для кожного допустимого керування. Доведення. Виберемо довiльне 0 < η < ρ 2 та зафiксуємо його. Для ε > 0 i довiльного допустимого u(t) оцiнимо на [ 0, T ε ] норму рiзницi мiж розв’язками системи (1) та системи ˙̄x = εX(t, x̄, u0), (4) x̄(0) = x0, x̄(t) = x̄(t, u0), де u0 вибрано з умови А) для u(t). Переходячи в (1) i (4) до iнтегральних зображень, для довiльного t ≥ 0 до виходу хоча б одного з розв’язкiв на межу областi D маємо x(t) = x0 + ε t ∫ 0 X(s, x(s), u(s))ds (5) та x̄(t) = x0 + ε t ∫ 0 X(s, x̄(s), u0)ds, (6) де x(t) = x(t, u). Вiд (5) вiднiмемо (6) i до правої частини рiвностi додамо та вiднiмемо X(s, x̄(s), u(s)): x(t) − x̄(t) = ε t ∫ 0 [X(s, x(s), u(s)) − X(s, x̄(s), u(s))] ds+ + ε t ∫ 0 [X(s, x̄(s), u(s)) − X(s, x̄(s), u0)] ds. Використовуючи умову 1 леми, отримуємо |x(t) − x̄(t)| ≤ εM t ∫ 0 |x(s) − x̄(s)|ds + εM t ∫ 0 |u(s) − u0|ds. ISSN 1562-3076. Нелiнiйнi коливання, 2008, т . 11, N◦ 4 МЕТОД УСЕРЕДНЕННЯ В ДЕЯКИХ ЗАДАЧАХ ОПТИМАЛЬНОГО КЕРУВАННЯ 515 З урахуванням умови А) для довiльного t ∈ [ 0, T ε ] справедливою є оцiнка |x(t) − x̄(t)| ≤ εM t ∫ 0 |x(s) − x̄(s)|ds + εM t ∫ 0 ϕ(s)ds. Оскiльки ∫ ∞ 0 ϕ(s)ds < ∞, то |x(t) − x̄(t)| ≤ εM t ∫ 0 |x(s) − x̄(s)|ds + εMC, де C = ∫ ∞ 0 ϕ(s)ds. З леми Гронуолла – Беллмана маємо оцiнку |x(t) − x̄(t)| ≤ εMCeTM , справедливу до моменту виходу розв’язкiв на межу областi D. Аналогiчно на [ 0, T ε ] отримуємо оцiнку для розв’язкiв y(t) = y(t, u) системи (2) та розв’язкiв ȳ(t) = ȳ(t, u) системи ˙̄y = εX0(ȳ, u0), (7) ȳ(0) = x0. Отже, |y(t) − ȳ(t)| ≤ εMCeTM . Але для систем (4) та (7) для достатньо малих ε справедливою є оцiнка |x̄(t) − ȳ(t)| ≤ η 2 , (8) що випливає з теореми 1.1 [4, с.10]. З (8) випливає, що розв’язок x̄(t) належить областi D для довiльного t ∈ [ 0, T ε ] , оскiльки ȳ(t) задовольняє умову 2 леми. З оцiнки |x(t) − −x̄(t)| ≤ εMCeTM вибором достатньо малого ε отримуємо, що x(t) також належить областi D для t ∈ [ 0, T ε ] . Тому справедливими є оцiнки |x(t) − y(t)| ≤ |x(t) − x̄(t)| + |x̄(t) − ȳ(t)| + |y(t) − ȳ(t)| ≤ 2εMCeTM + η 2 := η для t ∈ [ 0, T ε ] . Лему доведено. Основний результат. Перейдемо до викладення основного результату роботи. ISSN 1562-3076. Нелiнiйнi коливання, 2008, т . 11, N◦ 4 516 Т. В. НОСЕНКО, О. М. СТАНЖИЦЬКИЙ Теорема. Нехай в областi Q = {x ∈ D ⊂ Rn, t ≥ 0, u ∈ U ⊂ Rm} виконуються наступнi умови: 1) X(t, x, u) є неперервною за сукупнiстю змiнних, обмеженою сталою K та задо- вольняє умову Лiпшиця по x та u з константою M ; 2) розв’язок y = y(t, u), y(0, u(0)) = x0 усередненої системи є визначеним при всiх допустимих u(t, ε) для t ≥ 0 i належить областi D разом з деяким ρ-околом; 3) рiвномiрно вiдносно x ∈ D та u ∈ U iснує границя (3); 4) функцiя Φ(x) задовольняє умову Лiпшиця з константою L в областi D; 5) iснує оптимальне керування u∗ 2(t, ε) системи (2). Тодi для будь-якого η > 0 iснує ε0 = ε0(η) > 0 таке, що: a) для довiльного 0 < ε < ε0 Jε > −∞; б) виконується нерiвнiсть |Jε(u ∗ 2(t, ε)) − Jε)| ≤ η. Доведення. a) Покажемо, що для системи (1) Jε = inf uε∈F Jε(u) > −∞. Доведення про- ведемо вiд супротивного. Нехай iснує послiдовнiсть {εn} така, що εn → 0, n → ∞, a Jεn = −∞. (9) Для кожного з εn за означенням iнфiмуму iснує послiдовнiсть керувань un m таких, що Jεn (un m) → −∞ при m → ∞. При керуваннях un m системи (1) та (2) мають вiдповiдно розв’язки xn m та yn m. Зауважимо, що Jεn (un m) = Φ ( xn m ( T εn )) . Оскiльки для системи (2) для кожного ε iснує оптимальне керування, то J̄εn (yn m) > J̄εn > −∞. Зафiксуємо деяке 0 < η0 < ρ 2 . З викладеного вище випливає iснування натурального n0 такого, що для εn < εn0 справджуються оцiнки ∣ ∣Jεn (un m) − J̄εn (un m) ∣ ∣ = ∣ ∣ ∣ ∣ Φ ( xn m ( T εn )) − Φ ( yn m ( T εn )) ∣ ∣ ∣ ∣ ≤ ≤ L ∣ ∣ ∣ ∣ xn m ( T εn ) − yn m ( T εn ) ∣ ∣ ∣ ∣ < Lη0. Звiдси маємо Jεn (un m) = Jεn (un m) + J̄εn (un m) − J̄εn (un m) > Jεn (un m) − J̄εn (un m) + J̄ > J̄ − Lη0, що приводить до суперечностi з (9). б) Доведемо тепер наступне твердження теореми. Для цього запишемо нерiвнiсть Jε ≤ Jε(u ∗ 2(t, ε)) = J̄ε + [Jε(u ∗ 2(t, ε)) − J̄ε(u ∗ 2(t, ε))]. Оцiнимо рiзницю |Jε(u ∗ 2(t, ε)) − J̄ε(u ∗ 2(t, ε))| = ∣ ∣ ∣ ∣ Φ ( x ( T ε , u∗ 2(t, ε) )) − Φ ( y ( T ε , u∗ 2(t, ε) )) ∣ ∣ ∣ ∣ . ISSN 1562-3076. Нелiнiйнi коливання, 2008, т . 11, N◦ 4 МЕТОД УСЕРЕДНЕННЯ В ДЕЯКИХ ЗАДАЧАХ ОПТИМАЛЬНОГО КЕРУВАННЯ 517 Тут x ( T ε , u∗ 2(t, ε) ) — розв’язок системи (1) при оптимальному керуваннi u∗ 2(t, ε) усередне- ною системою, а y ( T ε , u∗ 2(t, ε) ) — оптимальний розв’язок системи (2). Використовуючи умову 4 теореми, маємо ∣ ∣ ∣ ∣ Φ ( x ( T ε , u∗ 2(t, ε) )) − Φ ( y ( T ε , u∗ 2(t, ε) )) ∣ ∣ ∣ ∣ ≤ L ∣ ∣ ∣ ∣ x ( T ε , u∗ 2(t, ε) ) − y ( T ε , u∗ 2(t, ε) ) ∣ ∣ ∣ ∣ . Застосовуючи доведену вище лему, для довiльного 0 < η1 < ρ 2 при всiх достатньо малих ε отримуємо оцiнку Jε ≤ J̄ε + Lη1. (10) За означенням iнфiмуму для вибраного η1 > 0 iснує керування uη1 (t, ε) з виконанням нерiвностi Jε(uη1 (t, ε)) < Jε + η1. З останнього отримуємо оцiнку J̄ε = J̄ε(u ∗ 2(t, ε)) ≤ J̄ε(uη1 (t, ε)) ≤ J̄ε(uη1 (t, ε)) + Jε + η1 − Jε(uη1 (t, ε)). Оцiнимо рiзницю |J̄ε(uη1 (t, ε))−Jε(uη1 (t, ε))|, знову використавши лiпшицевiсть функ- цiї Φ(x) та доведену лему. Отримаємо |J̄ε(uη1 (t, ε)) − Jε(uη1 (t, ε))| = ∣ ∣ ∣ ∣ Φ ( y ( T ε , uη1 (t, ε) )) − Φ ( x ( T ε , uη1 (t, ε) )) ∣ ∣ ∣ ∣ ≤ ≤ L ∣ ∣ ∣ ∣ y ( T ε , uη1 (t, ε) ) − x ( T ε , uη1 (t, ε) ) ∣ ∣ ∣ ∣ ≤ Lη1. Отже, J̄ε ≤ Jε + (L + 1)η1, а звiдси на пiдставi (10) маємо |Jε − J̄ε| ≤ (L + 1)η1. (11) Далi розглянемо рiзницю |Jε(u ∗ 2(t, ε)) − Jε| = |Jε(u ∗ 2(t)) − J̄ε + J̄ε − Jε| ≤ |Jε(u ∗ 2(t)) − J̄ε| + |J̄ε − Jε|. Використовуючи вигляд критерiю оптимальностi, маємо |Jε(u ∗ 2(t, ε)) − J̄ε| = ∣ ∣ ∣ ∣ Φ ( x ( T ε , u∗ 2(t, ε) )) − Φ ( y ( T ε , u∗ 2(t, ε) )) ∣ ∣ ∣ ∣ ≤ ≤ L ∣ ∣ ∣ ∣ x ( T ε , u∗ 2(t, ε) ) − y ( T ε , u∗ 2(t, ε) ) ∣ ∣ ∣ ∣ ≤ Lη1. ISSN 1562-3076. Нелiнiйнi коливання, 2008, т . 11, N◦ 4 518 Т. В. НОСЕНКО, О. М. СТАНЖИЦЬКИЙ Далi, застосовуючи попередню оцiнку та нерiвнiсть (11), отримуємо |Jε(u ∗ 2(t, ε)) − Jε| ≤ η, де η := η1(2L + 1). Теорему доведено. Приклад. Розглянемо задачу керування коливним об’єктом з малим керуючим впли- вом: ẍ + x = ε(−2ẋ + x3 + 2ẋu), x(0) = x0, ẋ(0) = x1, |x0| + |x1| < 1, (12) |u(t)| ≤ 1, L = T ε, J [u] = 1 2 (x2(L) + ẋ2(L)) → min . Амплiтудно-фазова замiна змiнних x = a sin(t + ϕ), ẋ = a cos(t + ϕ) зводить систему (12) до вигляду (1), стандартного за Боголюбовим: ȧ = ε[−2a cos(t + ϕ) + a3 sin3(t + ϕ) + 2ua cos(t + ϕ)] cos(t + ϕ), ϕ̇ = −ε[−2 cos(t + ϕ) + a2 sin3(t + ϕ) + 2u cos(t + ϕ)] sin(t + ϕ), (13) a(0) = a0, ϕ(0) = ϕ0, J [u] = 1 2 a2(L) → min . Запишемо усереднену систему для системи (13): dξ dτ = ξ(u − 1), dη dτ = − 3 8 ξ2, (14) ξ(0) = a0, η(0) = ϕ0, J [u] = 1 2 ξ2(T ) → min . ISSN 1562-3076. Нелiнiйнi коливання, 2008, т . 11, N◦ 4 МЕТОД УСЕРЕДНЕННЯ В ДЕЯКИХ ЗАДАЧАХ ОПТИМАЛЬНОГО КЕРУВАННЯ 519 Для отримання розв’язку достатньо розглядати рiвняння, що мiстять змiнну ξ. Оскiль- ки зазначене рiвняння є лiнiйним, а критерiй якостi — квадратичним, можемо, викорис- тавши принцип максимуму та метод множникiв Лагранжа, знайти оптимальне керування задачi (14) (див. [5]). Запишемо спряжену систему та умови трансверсальностi: ṗ = −p(u − 1), Lξ(0) = λ1 = p(0), Lξ(T ) = −λ0ξ(T ) = p(T ). Вiдповiдна функцiя Лагранжа має вигляд L = λ0 ξ2(T ) 2 + λ1(ξ(0) − a0), а функцiя Понтрягiна даної задачi H(t, ξ, p) = pξ(u − 1). Знайдемо max |u|≤1 H(t, ξ, p) = max |u|≤1 pξ(u − 1). Аналiзуючи функцiю Понтрягiна, можемо зро- бити висновок, що при pξ > 0 uopt = 1, а при pξ < 0 uopt = −1. З умов трансверсальностi отримуємо, що знаки функцiй p(t) та ξ(t) завжди є протилежними. У цьому випадку опти- мальним є керування uopt = −1. Отже, ми знайшли оптимальне керування усередненою системою, що є η-оптимальним для системи (12). 1. Плотников В. А. Метод усреднения в задачах управления. — Киев; Одесса: Лыбидь, 1992. — 188 с. 2. Плотников В. А., Плотников А. В., Витюк А. Н. Дифференциальные уравнения с многозначной пра- вой частью. Асимптотические методы. — Одесса: Астропринт, 1999. — 354 с. 3. Плотников В. А., Бойцова И. А. Усреднение в задачах оптимального управления системами с быстры- ми и медленными переменными // Проблемы управления и информатики. — 2000. — № 5. — С. 152 – 156. 4. Хапаев М. М. Усреднение в теории устойчивости. — М.: Наука, 1996. — 192 с. 5. Алексеев В. М., Тихомиров В. М., Фомин С. В. Оптимальное управление. — М.: Наука, 1979. — 432 с. Одержано 12.05.08 ISSN 1562-3076. Нелiнiйнi коливання, 2008, т . 11, N◦ 4
id nasplib_isofts_kiev_ua-123456789-178193
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 1562-3076
language Ukrainian
last_indexed 2025-11-30T16:14:41Z
publishDate 2008
publisher Інститут математики НАН України
record_format dspace
spelling Носенко, Т.В.
Станжицький, О.М.
2021-02-18T08:11:35Z
2021-02-18T08:11:35Z
2008
Метод усереднення в деяких задачах оптимального керування / Т.В. Носенко, О.М. Станжицький // Нелінійні коливання. — 2008. — Т. 11, № 4. — С. 512-519. — Бібліогр.: 5 назв. — укр.
1562-3076
https://nasplib.isofts.kiev.ua/handle/123456789/178193
517.9
Обосновано применение метода усреднения к задаче оптимального управления системами дифференциальных уравнений в стандартной по Боголюбову форме. Построено ε-оптимальное управление
We substantiate a use of an averaging method for an optimal control problem for differential systems in the Bogolyubov form. We construct an ε-optimal control.
Пiдтримано Державним фондом фундаментальних дослiджень України (проекти № 14.1/007 та Ф25.1/01).
uk
Інститут математики НАН України
Нелінійні коливання
Метод усереднення в деяких задачах оптимального керування
Метод усреднения в некоторых задачах оптимального управления
An averaging method for certain optimal control problems
Article
published earlier
spellingShingle Метод усереднення в деяких задачах оптимального керування
Носенко, Т.В.
Станжицький, О.М.
title Метод усереднення в деяких задачах оптимального керування
title_alt Метод усреднения в некоторых задачах оптимального управления
An averaging method for certain optimal control problems
title_full Метод усереднення в деяких задачах оптимального керування
title_fullStr Метод усереднення в деяких задачах оптимального керування
title_full_unstemmed Метод усереднення в деяких задачах оптимального керування
title_short Метод усереднення в деяких задачах оптимального керування
title_sort метод усереднення в деяких задачах оптимального керування
url https://nasplib.isofts.kiev.ua/handle/123456789/178193
work_keys_str_mv AT nosenkotv metoduserednennâvdeâkihzadačahoptimalʹnogokeruvannâ
AT stanžicʹkiiom metoduserednennâvdeâkihzadačahoptimalʹnogokeruvannâ
AT nosenkotv metodusredneniâvnekotoryhzadačahoptimalʹnogoupravleniâ
AT stanžicʹkiiom metodusredneniâvnekotoryhzadačahoptimalʹnogoupravleniâ
AT nosenkotv anaveragingmethodforcertainoptimalcontrolproblems
AT stanžicʹkiiom anaveragingmethodforcertainoptimalcontrolproblems