Асимптотически оптимальное управление в линейной по управлению задаче с быстрыми и медленными переменными
Задача оптимального керування описується системою диференцiальних рiвнянь зi швидкими та повiльними змiнними i термiнальним критерiєм якостi. Керування у задачi є лiнiйним. Доведено, що оптимальне керування усередненої задачi є асимптотично оптимальним керуванням заданої задачi. The optimal control...
Gespeichert in:
| Veröffentlicht in: | Нелінійні коливання |
|---|---|
| Datum: | 2016 |
| 1. Verfasser: | |
| Format: | Artikel |
| Sprache: | Russisch |
| Veröffentlicht: |
Інститут математики НАН України
2016
|
| Online Zugang: | https://nasplib.isofts.kiev.ua/handle/123456789/177261 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Zitieren: | Асимптотически оптимальное управление в линейной по управлению задаче с быстрыми и медленными переменными / И.А. Бойцова // Нелінійні коливання. — 2016. — Т. 19, № 3. — С. 349-361 — Бібліогр.: 5 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| _version_ | 1860093141535686656 |
|---|---|
| author | Бойцова, И.А. |
| author_facet | Бойцова, И.А. |
| citation_txt | Асимптотически оптимальное управление в линейной по управлению задаче с быстрыми и медленными переменными / И.А. Бойцова // Нелінійні коливання. — 2016. — Т. 19, № 3. — С. 349-361 — Бібліогр.: 5 назв. — рос. |
| collection | DSpace DC |
| container_title | Нелінійні коливання |
| description | Задача оптимального керування описується системою диференцiальних рiвнянь зi швидкими та повiльними змiнними i термiнальним критерiєм якостi. Керування у задачi є лiнiйним. Доведено, що оптимальне керування усередненої задачi є асимптотично оптимальним керуванням заданої задачi.
The optimal control problem is described by adifferential system with fast and slow variables, and a terminal quality criterion. The control in the problem is linear. We prove that an optimal control of the averaged problem is asymptotically optimal for the initial problem.
|
| first_indexed | 2025-12-07T17:24:41Z |
| format | Article |
| fulltext |
УДК 517.93
АСИМПТОТИЧЕСКИ ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ
В ЛИНЕЙНОЙ ПО УПРАВЛЕНИЮ ЗАДАЧЕ
С БЫСТРЫМИ И МЕДЛЕННЫМИ ПЕРЕМЕННЫМИ
И. А. Бойцова
Одес. нац. ун-т им. И. И. Мечникова
ул. Дворянская, 2, Одесса, 65026, Украина
e-mail: boitsova.irina@mail.ru
The optimal control problem is described by adifferential system with fast and slow variables, and a termi-
nal quality criterion. The control in the problem is linear. We prove that an optimal control of the averaged
problem is asymptotically optimal for the initial problem.
Задача оптимального керування описується системою диференцiальних рiвнянь зi швидкими
та повiльними змiнними i термiнальним критерiєм якостi. Керування у задачi є лiнiйним. Дове-
дено, що оптимальне керування усередненої задачi є асимптотично оптимальним керуванням
заданої задачi.
1. Введение. Поведение динамических систем с разными скоростями изменения состав-
ляющих движения обычно описывается дифференциальными уравнениями, содержащи-
ми быстрые и медленные переменные. Особый интерес представляют задачи оптималь-
ного управления. Применяя метод усреднения, получают соответствующие усредненные
задачи, решение которых оказывается проще первоначально заданных.
В работах [1, 2] обосновано применение различных алгоритмов построения асимпто-
тически оптимальных управлений задачи, если найдено оптимальное управление соот-
ветствующей усредненной задачи.
В работах [3, 4] рассмотрены нелинейные и линейные по управлению задачи опти-
мального управления, которые описываются дифференциальными уравнениями в стан-
дартном виде. Доказано, что оптимальное управление усредненной задачи при опреде-
ленных условиях является асимптотически оптимальным управлением данной задачи.
В предлагаемой работе получены аналогичные результаты для задачи оптимального
управления, в которой дифференциальные уравнения содержат быстрые и медленные
переменные, и в которую управление входит линейно.
2. Постановка задачи. Рассмотрим задачу оптимального управления, которая опи-
сывается системой дифференциальных уравнений с быстрыми и медленными перемен-
ными
ẋ = ε[f(t, x, y) +A(x)u], x(0) = x0,
ẏ = g(t, x, y), y(0) = y0,
(1)
и терминальным критерием качества
J [u] = ϕ(x(T )) → min
u∈U
, (2)
c© И. А. Бойцова, 2016
ISSN 1562-3076. Нелiнiйнi коливання, 2016, т . 19, N◦ 3 349
350 И. А. БОЙЦОВА
где время t ∈ [0, T ], T = Lε−1, L > 0 — заданная постоянная, ε > 0 — малый параметр,
x(t) ∈ Dx ⊂ Rn — медленные переменные, y(t) ∈ Dy ⊂ Rm — быстрые перемен-
ные, f(t, x, y) — заданная вектор-функция размерности n, g(t, x, y) — заданная вектор-
функция размерности m, A(x) — заданная матрица размерности n × r, ϕ(x) — заданная
скалярная функция, u(t) ∈ U ⊂ conv (Rr) — управление, принадлежащее выпуклому
компактному множеству U в пространстве Rr, значения x0, y0 — заданные начальные
условия задачи.
Условие 1. Пусть функции f(t, x, y), g(t, x, y) измеримы по переменной t, функции
f(t, x, y), g(t, x, y), A(x), ϕ(x) удовлетворяют условию Липшица по фазовым переменным
с постоянной λ для всех t, функции f(t, x, y) и A(x) равномерно ограничены постоян-
ной M.
Определение 1. Допустимыми управлениями задачи (1) назовем измеримые функции
u = u(t) из выпуклого и компактного множества U, для которых найдется ε0 > 0, не
зависящее от u(t) и такое, что для всех ε ∈ (0, ε0] соответствующие этим управлени-
ям решения x(t) ∈ Dx, y(t) ∈ Dy системы дифференциальных уравнений (1) определены
при всех t ∈ [0, T ], T = Lε−1.
Определение 2. Оптимальным управлением задачи (1), (2) назовем такое допусти-
мое управление u∗(t), на котором критерий качества (2) принимает минимальное зна-
чение J∗ = J [u∗].
Особенностью задачи оптимального управления (1), (2) является то, что допусти-
мые управления u(t) входят в нее линейно и выбираются из выпуклого и компактного
множества U. Это означает [5] (п. 4.3), что для задачи (1), (2) существуют оптимальное
управление u∗(t), соответствующая оптимальная траектория x∗(t) и оптимальное значе-
ние критерия качества J∗ = J [u∗].
Для системы дифференциальных уравнений (1) рассмотрим соответствующую выро-
жденную задачу при ε = 0, считая x параметром:
ẋ = 0, x(0) = x0,
ẏ = g(t, x, y), y(0) = y0.
(3)
Условие 2. Пусть решение y = h(t, x, y0) вырожденной задачи (3) существует для лю-
бого y0, определено при t ≥ 0 и удовлетворяет условию Липшица по переменной x.
Условие 3. Пусть равномерно относительно x, y0, t0 существует предел
f0(x) = lim
T→∞
1
T
t0+T∫
t0
f(s, x, h(s, x, y0))ds. (4)
Заметим, что при выполнении условия 1 полученная предельная функция f0(x) удов-
летворяет условию Липшица по переменной x.
Задаче оптимального управления (1), (2) поставим в соответствие усредненную зада-
чу оптимального управления, которая описывается системой дифференциальных урав-
нений
ż = ε[f0(z) +A(z)v], z(0) = x0, (5)
ISSN 1562-3076. Нелiнiйнi коливання, 2016, т . 19, N◦ 3
АСИМПТОТИЧЕСКИ ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ В ЛИНЕЙНОЙ ПО УПРАВЛЕНИЮ ЗАДАЧЕ . . . 351
и терминальным критерием качества
J0[v] = ϕ(z(T )) → min
v∈U
, (6)
где функция v = v(t) является допустимым управлением для задачи (5) и также выбира-
ется из выпуклого и компактного множества U. Следовательно [5] (п. 4.3), для усреднен-
ной задачи (5), (6) существуют оптимальное управление v∗(t), соответствующая опти-
мальная траектория z∗(t) и оптимальное значение критерия качества J∗0 = J0[v∗].
3. Нахождение асимптотического решения задачи. Покажем, что любое допустимое
управление системы (1) будет допустимым и для системы (5), при этом соответствующие
этому управлению траектории систем (1) и (5) будут близки на конечном асимптотиче-
ски большом промежутке времени. Кроме того, любое допустимое управление системы
(5) будет допустимым и для системы (1), а соответствующие ему траектории близки на
том же промежутке времени.
Теорема 1. Пусть для систем дифференциальных уравнений (1) и (5) в области D =
= {t ≥ 0, x ∈ Dx ⊂ Rn, y ∈ Dy ⊂ Rm, u ∈ U ⊂ comp (Rr)} выполнены условия 1 – 3.
Кроме того,
4) для любого управления v(t) ∈ U соответствующее решение z(t), z(0) = x0 ∈
∈ D0 ⊂ Dx, усредненной системы (5) определено при t ≥ 0 и лежит вместе со своей
ρ-окрестностью в области Dx.
Тогда для любых η > 0 и L > 0 существует такое ε0(η, L) > 0, что для всех ε ∈
∈ (0, ε0] и t ∈ [0, T ] выполняется следующее:
а) любое допустимое управление u(t) ∈ U системы (1) является допустимым управ-
лением усредненной системы (5) и соответствующие траектории x(t) ∈ Dx системы
(1) и z(t) ∈ Dx системы (5) при условии x(0) = z(0) = x0 ∈ D0 ⊂ Dx удовлетворяют
неравенству
‖x(t)− z(t)‖ ≤ η; (7)
б) любое допустимое управление v(t) ∈ U усредненной системы (5) является допу-
стимым управлением системы (1) и соответствующие траектории z(t) ∈ Dx систе-
мы (5) и x(t) ∈ Dx системы (1) при условии z(0) = x(0) = x0 ∈ D0 ⊂ Dx удовлетворя-
ют неравенству (7).
Доказательство. Для доказательства первой части теоремы выберем произвольное
допустимое управление u(t) ∈ U системы (1), тогда x(t), y(t, x0, y0) — соответствующее
решение этой системы, которое определено для всех t ≥ 0 до выхода решения на гра-
ницу области, h(t, x, y0) — решение вырожденной задачи (3) для быстрых переменных,
которое существует и определено для всех t ≥ 0. Из выполнения условия 4 теоремы сле-
дует, что для произвольно выбранного управления u(t) ∈ U соответствующее решение
z(t), z(0) = x0 ∈ D0 ⊂ Dx, усредненной системы (5) определено при t ≥ 0 и лежит вмес-
те со своей ρ-окрестностью в области Dx, не выходя на ее границу. А это означает, что
управление u(t) ∈ U является допустимым и для усредненной системы (5).
Выберем произвольное η > 0 такое, что η < ρ, и зафиксируем его. Оценим разность
ISSN 1562-3076. Нелiнiйнi коливання, 2016, т . 19, N◦ 3
352 И. А. БОЙЦОВА
между соответствующими решениями систем (1) и (5):
‖x(t)− z(t)‖ ≤ ε
∥∥∥∥∥∥
t∫
0
[f(s, x(s), y(s, x0, y0))− f0(z(s))]ds
∥∥∥∥∥∥+
+ ε
∥∥∥∥∥∥
t∫
0
[A(x(s))u(s)−A(z(s))u(s)]ds
∥∥∥∥∥∥ ≤
≤ ε
∥∥∥∥∥∥
t∫
0
[f(s, x(s), y(s, x0, y0))− f0(x(s))]ds
∥∥∥∥∥∥+
+ ε
∥∥∥∥∥∥
t∫
0
[f0(x(s))− f0(z(s))]ds
∥∥∥∥∥∥+
+ ε
∥∥∥∥∥∥
t∫
0
[A(x(s))u(s)−A(z(s))u(s)]ds
∥∥∥∥∥∥ ≤
≤ ε
∥∥∥∥∥∥
t∫
0
[f(s, x(s), y(s, x0, y0))− f0(x(s))]ds
∥∥∥∥∥∥+
+ ελ
t∫
0
‖x(s)− z(s)‖ds+ ελ
t∫
0
‖u(s)‖ ‖x(s)− z(s)‖ds ≤
≤ ε
∥∥∥∥∥∥
t∫
0
[f(s, x(s), y(s, x0, y0))− f0(x(s))]ds
∥∥∥∥∥∥+
+ ελ
t∫
0
(1 + ‖u(s)‖) ‖x(s)− z(s)‖ds.
Управление u(t) выбирается из компактного множества U, значит, найдется такая по-
стоянная величина K > 0, что для любого t ≥ 0
‖u(t)‖ ≤ K. (8)
Тогда неравенство примет вид
‖x(t)− z(t)‖ ≤ I + ελ(1 +K)
t∫
0
‖x(s)− z(s)‖ds, (9)
ISSN 1562-3076. Нелiнiйнi коливання, 2016, т . 19, N◦ 3
АСИМПТОТИЧЕСКИ ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ В ЛИНЕЙНОЙ ПО УПРАВЛЕНИЮ ЗАДАЧЕ . . . 353
где
I = ε
∥∥∥∥∥∥
t∫
0
[f(s, x(s), y(s, x0, y0))− f0(x(s))]ds
∥∥∥∥∥∥ . (10)
Для проведения дальнейшего доказательства теоремы необходимо оценить разность
быстрых решений системы (1) и вырожденной системы (3). При выполнении условия 1 и
соотношения (8) получим
‖y(t, x0, y0)− h(t, x0, y0)‖ ≤
t∫
0
‖g(s, x(s), y(s, x0, y0))− g(s, x0, h(s, x0, y0))‖ds ≤
≤ λ
t∫
0
‖x(s)− x0‖ds+ λ
t∫
0
‖y(s, x0, y0)− h(s, x0, y0)‖ds ≤
≤ λ
t∫
0
∥∥∥∥∥∥ε
s∫
0
[f(τ, x(τ), y(τ, x0, y0)) +A(x(τ))u(τ)]dτ
∥∥∥∥∥∥ ds+
+ λ
t∫
0
‖y(s, x0, y0)− h(s, x0, y0)‖ds ≤
≤ ελM(1 +K)
t∫
0
sds+ λ
t∫
0
‖y(s, x0, y0)− h(s, x0, y0)‖ds,
откуда по лемме Гронуолла – Беллмана следует, что
‖y(t, x0, y0)− h(t, x0, y0)‖ ≤ ελM(1 +K)
t2
2
eλt = εβ(t). (11)
Очевидно, что β = β(t) — неубывающая по t функция. Обозначим через t∗(ε) корень
уравнения
β(t) =
C√
ε
,
где C — некоторая постоянная. Тогда limε→0 εβ(t∗) = limε→0C
√
ε = 0.
Введем в рассмотрение функцию
∆(ε) = min
{
1√
ε
; t∗(ε)
}
, (12)
которая имеет свойства
lim
ε→0
∆(ε) = +∞, lim
ε→0
ε∆(ε) = 0. (13)
ISSN 1562-3076. Нелiнiйнi коливання, 2016, т . 19, N◦ 3
354 И. А. БОЙЦОВА
Разобьем промежуток времени [0, T ] на отрезки длины ∆ точками деления ti = i∆,
i = 0, 1, . . . , N, N = E
(
T
∆
)
, E(a) — целая часть числа a.
Из (11) следует, что на каждом частичном промежутке t ∈ [ti, ti+1] разность быстрых
решений оценивается величиной
‖y(t, xi, yi)− h(t, xi, yi)‖ ≤ εβ(∆) = C
√
ε. (14)
Зафиксируем произвольный момент времени t ∈ [0, T ], для которого найдется час-
тичный промежуток [tk, tk+1) такой, что t ∈ [tk, tk+1). При этом k будет наибольшим
значением индекса, при котором tk ≤ t. Тогда будут выполняться соотношения
k∆ ≤ T =
L
ε
, εk∆ ≤ L. (15)
Вернемся к выражению (10) и оценим его с учетом того, что t ∈ [tk, tk+1):
ε
∥∥∥∥∥∥
t∫
0
[f(s, x(s), y(s, x0, y0))− f0(x(s))]ds
∥∥∥∥∥∥ =
= ε
∥∥∥∥∥∥
tk∫
0
[f(s, x(s), y(s, x0, y0))− f0(x(s))]ds
∥∥∥∥∥∥+
+ ε
∥∥∥∥∥∥
t∫
tk
[f(s, x(s), y(s, x0, y0))− f0(x(s))]ds
∥∥∥∥∥∥ . (16)
В (16) оценим второе слагаемое. При выполнении условия 1 получим
ε
∥∥∥∥∥∥
t∫
tk
[f(s, x(s), y(s, x0, y0))− f0(x(s))]ds
∥∥∥∥∥∥ ≤
≤ ε
∥∥∥∥∥∥
t∫
tk
f(s, x(s), y(s, x0, y0))ds
∥∥∥∥∥∥+ ε
∥∥∥∥∥∥
t∫
tk
f0(x(s))ds
∥∥∥∥∥∥ ≤
≤ εM∆ + εM∆ = 2ε∆M. (17)
Первое слагаемое в (16) преобразуем к виду
ε
∥∥∥∥∥∥
tk∫
0
[f(s, x(s), y(s, x0, y0))− f0(x(s))]ds
∥∥∥∥∥∥ ≤
≤ ε
∥∥∥∥∥∥
k−1∑
i=0
ti+1∫
ti
[f(s, x(s), y(s, x0, y0))− f0(x(s))]ds
∥∥∥∥∥∥ ≤
ISSN 1562-3076. Нелiнiйнi коливання, 2016, т . 19, N◦ 3
АСИМПТОТИЧЕСКИ ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ В ЛИНЕЙНОЙ ПО УПРАВЛЕНИЮ ЗАДАЧЕ . . . 355
≤ ε
∥∥∥∥∥∥
k−1∑
i=0
ti+1∫
ti
[f(s, x(s), y(s, x0, y0))− f(s, x(ti), y(s, x(ti), y(ti)))]ds
∥∥∥∥∥∥+
+ ε
∥∥∥∥∥∥
k−1∑
i=0
ti+1∫
ti
[f(s, x(ti), y(s, x(ti), y(ti)))− f(s, x(ti), h(s, x(ti), y(ti)))]ds
∥∥∥∥∥∥+
+ ε
∥∥∥∥∥∥
k−1∑
i=0
ti+1∫
ti
[f(s, x(ti), h(s, x(ti), y(ti)))− f0(x(ti))]ds
∥∥∥∥∥∥+
+ ε
∥∥∥∥∥∥
k−1∑
i=0
ti+1∫
ti
[f0(x(ti))− f0(x(s))]ds
∥∥∥∥∥∥ (18)
и оценим последовательно каждое слагаемое в (18). Для первого слагаемого при выпол-
нении условия 1 и соотношений (15) получаем
ε
∥∥∥∥∥∥
k−1∑
i=0
ti+1∫
ti
[f(s, x(s), y(s, x0, y0))− f(s, x(ti), y(s, x(ti), y(ti)))]ds
∥∥∥∥∥∥ ≤
≤ ε
k−1∑
i=0
ti+1∫
ti
λ(‖x(s)− x(ti‖+ ‖y(s, x0, y0)− y(s, x(ti), y(ti))‖)ds ≤
≤ ελ
k−1∑
i=0
ti+1∫
ti
εM(1 +K)∆ds+ ελ
k−1∑
i=0
ti+1∫
ti
‖y(s, x0, y0)− y(s, x(ti), y(ti))‖ds ≤
≤ ελ · k∆ε ·M(1 +K)∆ + 0 ≤ ε∆λLM(1 +K). (19)
Для второго слагаемого в (18) из условия 1 и соотношений (14), (15) имеем
ε
∥∥∥∥∥∥
k−1∑
i=0
ti+1∫
ti
[f(s, x(ti), y(s, x(ti), y(ti)))− f(s, x(ti), h(s, x(ti), y(ti)))]ds
∥∥∥∥∥∥ ≤
≤ ελ
k−1∑
i=0
ti+1∫
ti
‖y(s, x(ti), y(ti))− h(s, x(ti), y(ti))‖ds ≤
≤ ελk∆εβ(∆) ≤ εβ(∆)λL. (20)
Из условия 3 следует, что существует монотонно убывающая функция ψ = ψ(∆) такая,
ISSN 1562-3076. Нелiнiйнi коливання, 2016, т . 19, N◦ 3
356 И. А. БОЙЦОВА
что lim∆→∞ ψ(∆) = 0, и для третьего слагаемого в (18) справедлива оценка
ε
∥∥∥∥∥∥
k−1∑
i=0
ti+1∫
ti
[f(s, x(ti), h(s, x(ti), y(ti)))− f0(x(ti))]ds
∥∥∥∥∥∥ ≤
≤ ε
∥∥∥∥∥∥
k−1∑
i=0
ti+1∫
ti
f(s, x(ti), h(s, x(ti), y(ti)))ds−∆f0(x(ti))
∥∥∥∥∥∥ ≤
≤ ε∆
∥∥∥∥∥∥
k−1∑
i=0
1
∆
ti+1∫
ti
f(s, x(ti), h(s, x(ti), y(ti)))ds− f0(x(ti))
∥∥∥∥∥∥ ≤
≤ εk∆ψ(∆) ≤ Lψ(∆). (21)
Оценка последнего слагаемого в (18) получается при выполнении условия 1 и соотноше-
ний (15):
ε
∥∥∥∥∥∥
k−1∑
i=0
ti+1∫
ti
[f0(x(ti))− f0(x(s))]ds
∥∥∥∥∥∥ ≤ ελ
k−1∑
i=0
ti+1∫
ti
‖x(ti)− x(s)‖ds ≤
≤ ελk∆ · εM(1 +K)∆ ≤ ε∆λLM(1 +K). (22)
Принимая во внимание оценки (19) – (22) для слагаемых, входящих в представление
(18), получаем
ε
∥∥∥∥∥∥
tk∫
0
[f(s, x(s), y(s, x0, y0))− f0(x(s))]ds
∥∥∥∥∥∥ ≤
≤ ε∆λLM(1 +K) + εβ(∆)λL+ Lψ(∆) + ε∆λLM(1 +K), (23)
откуда с учетом соотношения (16) и оценки (17) следует оценка для интеграла (10) в виде
I = ε
∥∥∥∥∥∥
t∫
0
[f(s, x(s), y(s, x0, y0))− f0(x(s))]ds
∥∥∥∥∥∥ ≤
≤ 2ε∆λLM(1 +K) + εβ(∆)λL+ Lψ(∆) + 2ε∆M =
= 2ε∆M(1 + λL(1 +K)) + εβ(∆)λL+ Lψ(∆). (24)
Оценку разности решений системы (1) и соответствующей усредненной системы (5)
по медленным переменным, исходя из неравенства (9) и полученной оценки (24), можно
ISSN 1562-3076. Нелiнiйнi коливання, 2016, т . 19, N◦ 3
АСИМПТОТИЧЕСКИ ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ В ЛИНЕЙНОЙ ПО УПРАВЛЕНИЮ ЗАДАЧЕ . . . 357
записать в виде
‖x(t)− z(t)‖ ≤ 2ε∆M(1 + λL(1 +K)) + εβ(∆)λL+ Lψ(∆)+
+ ελ(1 +K)
t∫
0
‖x(s)− z(s)‖ds,
откуда по лемме Гронуолла – Беллмана получаем
‖x(t)− z(t)‖ ≤ (2ε∆M(1 + λL(1 +K)) + εβ(∆)λL+ Lψ(∆))eλL(1+K). (25)
Из обозначения (12) следует, что ∆ ≤ 1√
ε
, откуда ε∆ ≤
√
ε. Из определения функции
β = β(t) в (11) и ее свойств следует, что εβ(∆) = C
√
ε, где C — некоторая постоянная.
Тогда часть выражения в правой части неравенства (25) удовлетворяет соотношению
lim
ε→0
√
ε(2M(1 + λL(1 +K)) + CλL)eλL(1+K) = 0,
откуда следует, что для любого η1 > 0 найдется ε1(η1) > 0 такое, что для всех ε ∈ (0, ε1]
выполняется неравенство
√
ε(2M(1 + λL(1 +K)) + CλL)eλL(1+K) ≤ η1. (26)
Это означает, что ε1 можно взять равным
ε1 =
(
η1
(2M(1 + λL(1 +K)) + CλL)eλL(1+K)
)2
. (27)
Далее, из свойств функций lim∆→∞ ψ(∆) = 0 и limε→0 ∆(ε) = +∞ следует, что для
любого η2 > 0 найдутся ∆2(η2) > 0 и соответственно
ε2 =
(
1
∆2
)2
(28)
такие, что для всех ∆ ≥ ∆2 и ε ∈ (0, ε2] выполняется неравенство
‖ψ(∆(ε))‖ ≤ η2. (29)
Из соотношений (26) и (29) следует, что для любого 0 < η < ρ и L найдутся значения
η1 > 0 и η2 > 0 такие, что η1 +Lη2e
λL(1+K) ≤ η.По ним, учитывая (27) и (28), определяем
ε0 = min{ε1; ε2} такое, что для всех ε ∈ (0, ε0] и t ∈ [0, T ], T = Lε−1, из неравенства (25)
следует, что
‖x(t)− z(t)‖ ≤ η < ρ.
Полученная оценка ‖x(t) − z(t)‖ < ρ для всех t ∈ [0, T ], T = Lε−1, означает, что для
любого допустимого управления u(t) решение x(t) системы (1) находится в ρ-окрестности
ISSN 1562-3076. Нелiнiйнi коливання, 2016, т . 19, N◦ 3
358 И. А. БОЙЦОВА
решения z(t) усредненной системы (5) и не выходит на границу области Dx ни для какого
момента времени. Следовательно, для всех ε ∈ (0, ε0] и t ∈ [0, T ] справедлива оценка (7).
Первая часть теоремы доказана.
Доказательство второй части теоремы проводится аналогично. При этом полученная
оценка ‖x(t)−z(t)‖ < ρ для всех t ∈ [0, T ] означает, что для любого допустимого управле-
ния v(t) и решения z(t) усредненной системы (5) соответствующее этому же управлению
решение x(t) системы (1) находится в ρ-окрестности решения z(t) усредненной системы
(5), которая в силу выполнения условия 4 теоремы полностью принадлежит области Dx.
Значит, выбранное допустимое управление v(t) усредненной системы (5) действительно
является допустимым и для системы (1). Следовательно, для всех ε ∈ (0, ε0] и t ∈ [0, T ]
справедлива оценка (7).
Теорема доказана.
4. Нахождение асимптотически оптимального решения задачи. Установим соотноше-
ние между оптимальными решениями задачи (1), (2) и усредненной задачи (5), (6).
Теорема 2. Пусть для задач оптимального управления (1), (2) и (5), (6) в области
D = {t ≥ 0, x ∈ Dx ⊂ Rn, y ∈ Dy ⊂ Rm, u ∈ U ⊂ comp (Rr)} выполнены условия
теоремы 1.
Тогда оптимальное решение задачи (5), (6) является асимптотически оптималь-
ным решением задачи (1), (2), т. е. для любых η > 0 и L > 0 существует такое
ε0(η, L) > 0, что для всех ε ∈ (0, ε0] справедливы оценки
|J∗0 − J∗| ≤ η, J [v∗]− J∗ ≤ η, (30)
где J∗0 и J∗ — оптимальные значения критериев качества усредненной задачи (5), (6) и
задачи (1), (2) соответственно, J [v∗] — значение критерия качества задачи (1), (2) на
оптимальном управлении усредненной задачи.
Доказательство. Пусть известны оптимальное управление u∗(t), соответствующая оп-
тимальная траектория x∗(t) и оптимальное значение критерия качества J∗ = J [u∗] зада-
чи (1), (2), а также оптимальное управление v∗(t), соответствующая оптимальная тра-
ектория z∗(t) и оптимальное значение критерия качества J∗0 = J0[v∗] усредненной зада-
чи (5), (6).
При выполнении условий теоремы оптимальное управление u∗(t) задачи (1), (2) яв-
ляется допустимым управлением для задачи (5), (6). Следовательно, для любых η0 > 0 и
L > 0 существует ε0(η0, L) > 0 такое, что для всех ε ∈ (0, ε0] и t ∈ [0, T ] соответствующая
этому управлению траектория z̃(t), z̃(0) = x∗(0) = x0 ∈ D0 ⊂ Dx, усредненной системы
(5) удовлетворяет неравенству
‖x∗(t)− z̃(t)‖ ≤ η0.
Неравенство выполняется для любого t ∈ [0, T ], а значит и для t = T. Следовательно,
при выполнении условия теоремы∣∣∣J∗ − J̃0
∣∣∣ = |J [u∗(t)]− J0 [u∗(t)]| =
= |ϕ (x∗(T ))− ϕ(z̃(T ))| ≤ λ ‖x∗(T )− z̃(T )‖ ≤ λη0 = η. (31)
ISSN 1562-3076. Нелiнiйнi коливання, 2016, т . 19, N◦ 3
АСИМПТОТИЧЕСКИ ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ В ЛИНЕЙНОЙ ПО УПРАВЛЕНИЮ ЗАДАЧЕ . . . 359
Аналогично, оптимальное управление v∗(t) задачи (5), (6) является допустимым управ-
лением для задачи (1), (2). Следовательно, соответствующая этому управлению траекто-
рия x̃(t), x̃(0) = z∗(0) = x0 ∈ D0 ⊂ Dx, системы (1) удовлетворяет неравенству
‖z∗(t)− x̃(t)‖ ≤ η0
и, соответственно,∣∣∣J∗0 − J̃∣∣∣ = |J0 [v∗(t)]− J [v∗(t)]| =
= |ϕ (z∗(T ))− ϕ (x̃(T ))| ≤ λ ‖z∗(T )− x̃(T )‖ ≤ λη0 = η. (32)
Очевидно, что для оптимальных значений критериев качества (2) и (6) выполняются
неравенства
J∗ ≤ J̃ , J∗0 ≤ J̃0 (33)
и одно из соотношений
J∗ ≥ J∗0 , J∗ < J∗0 . (34)
В первом случае из (33), (34), (32) следует цепочка неравенств
J̃ ≥ J∗ ≥ J∗0 ≥ J̃ − η,
откуда
|J∗0 − J∗| ≤ η.
Во втором случае из (33), (34), (31) следует цепочка неравенств
J̃0 ≥ J∗0 > J∗ ≥ J̃0 − η,
откуда
|J∗0 − J∗| ≤ η.
Следовательно, в обоих случаях выполняется первое из неравенств (30). Выполнение
второго неравенства в (30) следует из (32) и полученного неравенства.
Теорема доказана.
Пример. Рассмотрим задачу управления системой, содержащей быстрые и медленные
переменные, вида
ẋ1 = ε[(y2 − y1)x2 + u1 sinx2 + u2 cosx2], x1(0) = x0
1,
ẋ2 = ε
[
e−ty2x1 + u1 cosx2 − u2 sinx2
]
, x2(0) = x0
2,
ẏ1 = y2 + 1, y1(0) = 0,
ẏ2 = y1, y2(0) = 0,
U = {u(t) : ‖u(t)‖ ≤ 1},
ISSN 1562-3076. Нелiнiйнi коливання, 2016, т . 19, N◦ 3
360 И. А. БОЙЦОВА
где
f(t, x, y) =
(
(y2 − y1)x2
e−ty2x1
)
, u =
(
u1
u2
)
, A(x) =
(
sinx2 cosx2
cosx2 − sinx2
)
.
Найдем решение вырожденной задачи в виде
h1(t) = 0, 5 et − 0, 5 e−t,
h2(t) = 0, 5 et + 0, 5 e−t − 1.
Усредняя правые части уравнений медленной подсистемы вдоль решений вырожден-
ной задачи, получаем усредненную задачу управления вида
ż1 = ε [−z2 + u1 sin z2 + u2 cos z2] , z1(0) = x0
1,
ż2 = ε [0, 5 z1 + u1 cos z2 − u2 sin z2] , z2(0) = x0
2.
В качестве допустимых управлений выберем функции
u =
(
cos 0, 5 t
sin 0, 5 t
)
.
Сравним решение усредненной системы и данной системы по медленным перемен-
ным на одних и тех же управлениях. Для этого зададим L = 1 и начальные условия для
медленных переменных x1 = 1, 0; x2 = −0, 5.
Результаты вычислений при различных значениях малого параметра ε представлены
в таблице, где N — число шагов интегрирования данной системы, а N0 — число шагов
интегрирования усредненной системы в медленном времени.
ε N N0 max |x1 − z1| max |x2 − z2| max ‖x− z‖
0,05 2 000 12 0,0706 0,0227 0,0716
0,03 3 333 21 0,0435 0,0198 0,0439
0,01 10 000 63 0,0255 0,0036 0,0261
0,005 20 000 127 0,0138 0,0018 0,0138
Сравнивая полученные результаты, можно сделать вывод, что при уменьшении зна-
чения малого параметра уменьшается и разность между решениями данной и усреднен-
ной задач. При этом количество вычислений, необходимых для получения результата в
усредненной задаче, значительно меньше за счет перехода к медленному времени и чис-
ленному интегрированию на конечном промежутке времени.
5. Заключение. Для решения задач оптимального управления с быстрыми и медлен-
ными переменными вида (1), (2), в которые управление входит линейно, можно приме-
нять метод усреднения. Усредненная задача оптимального управления (5), (6) является
автономной, содержит только медленную подсистему, поэтому решается гораздо про-
ще данной. При этом оптимальное управление усредненной задачи при определенных
условиях может быть взято в качестве асимптотически оптимального управления данной
ISSN 1562-3076. Нелiнiйнi коливання, 2016, т . 19, N◦ 3
АСИМПТОТИЧЕСКИ ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ В ЛИНЕЙНОЙ ПО УПРАВЛЕНИЮ ЗАДАЧЕ . . . 361
задачи. Это означает, что соответствующие траектории и значения критериев качества
обеих задач являются достаточно близкими.
Литература
1. Плотников В. А. Метод усреднения в задачах управления. — Киев; Одесса: Лыбидь, 1992. — 188 с.
2. Плотников В. А., Бойцова И. А. Усреднение в задачах оптимального управления системами с быстры-
ми и медленными переменными // Проблемы управления и информатики. — 2000. — № 5. — С. 152 –
156.
3. Добродзiй Т. В. Дослiдження задач оптимального керування системами диференцiальних рiвнянь, лi-
нiйних по керуванню, методом усереднення // Укр. мат. вiсн. — 2009. — 6, № 2. — С. 150 – 172.
4. Добродзiй Т. В. Метод усереднення в задачах керування перiодичними системами // Нелiнiйнi коливан-
ня. — 2010. — 13, № 2. — С. 147 – 154.
5. Ли Э. Б., Маркус Л. Основы теории оптимального управления. — М.: Наука, 1972. — 576 с.
Получено 20.01.15,
после доработки — 14.10.15
ISSN 1562-3076. Нелiнiйнi коливання, 2016, т . 19, N◦ 3
|
| id | nasplib_isofts_kiev_ua-123456789-177261 |
| institution | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| issn | 1562-3076 |
| language | Russian |
| last_indexed | 2025-12-07T17:24:41Z |
| publishDate | 2016 |
| publisher | Інститут математики НАН України |
| record_format | dspace |
| spelling | Бойцова, И.А. 2021-02-13T21:00:09Z 2021-02-13T21:00:09Z 2016 Асимптотически оптимальное управление в линейной по управлению задаче с быстрыми и медленными переменными / И.А. Бойцова // Нелінійні коливання. — 2016. — Т. 19, № 3. — С. 349-361 — Бібліогр.: 5 назв. — рос. 1562-3076 https://nasplib.isofts.kiev.ua/handle/123456789/177261 517.93 Задача оптимального керування описується системою диференцiальних рiвнянь зi швидкими та повiльними змiнними i термiнальним критерiєм якостi. Керування у задачi є лiнiйним. Доведено, що оптимальне керування усередненої задачi є асимптотично оптимальним керуванням заданої задачi. The optimal control problem is described by adifferential system with fast and slow variables, and a terminal quality criterion. The control in the problem is linear. We prove that an optimal control of the averaged problem is asymptotically optimal for the initial problem. ru Інститут математики НАН України Нелінійні коливання Асимптотически оптимальное управление в линейной по управлению задаче с быстрыми и медленными переменными Асимптотично оптимальне керування в лінійній за керуванням задачі зі швидкими та повільними змінними Asymptotically optimal control for a control-linear problem with fast and slow variables Article published earlier |
| spellingShingle | Асимптотически оптимальное управление в линейной по управлению задаче с быстрыми и медленными переменными Бойцова, И.А. |
| title | Асимптотически оптимальное управление в линейной по управлению задаче с быстрыми и медленными переменными |
| title_alt | Асимптотично оптимальне керування в лінійній за керуванням задачі зі швидкими та повільними змінними Asymptotically optimal control for a control-linear problem with fast and slow variables |
| title_full | Асимптотически оптимальное управление в линейной по управлению задаче с быстрыми и медленными переменными |
| title_fullStr | Асимптотически оптимальное управление в линейной по управлению задаче с быстрыми и медленными переменными |
| title_full_unstemmed | Асимптотически оптимальное управление в линейной по управлению задаче с быстрыми и медленными переменными |
| title_short | Асимптотически оптимальное управление в линейной по управлению задаче с быстрыми и медленными переменными |
| title_sort | асимптотически оптимальное управление в линейной по управлению задаче с быстрыми и медленными переменными |
| url | https://nasplib.isofts.kiev.ua/handle/123456789/177261 |
| work_keys_str_mv | AT boicovaia asimptotičeskioptimalʹnoeupravlenievlineinoipoupravleniûzadačesbystrymiimedlennymiperemennymi AT boicovaia asimptotičnooptimalʹnekeruvannâvlíníiníizakeruvannâmzadačízíšvidkimitapovílʹnimizmínnimi AT boicovaia asymptoticallyoptimalcontrolforacontrollinearproblemwithfastandslowvariables |