Application of the method of averaging to the problems of optimal control for ordinary differential equations on the semiaxis

The method of averaging is applied to the nonlinear and linear (with respect to control) problems of optimal control on the semiaxis with small parameter and rapidly oscillating coefficients. It is shown that the solutions of the exact problem converge to the solutions of the averaged problem.

Gespeichert in:

Bibliographische Detailangaben
Datum:	2018
Hauptverfasser:	Kichmarenko, O. D., Кічмаренко, О. Д.
Format:	Artikel
Sprache:	Ukrainisch
Veröffentlicht:	Institute of Mathematics, NAS of Ukraine 2018
Online Zugang:	https://umj.imath.kiev.ua/index.php/umj/article/view/1584
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:	Ukrains’kyi Matematychnyi Zhurnal
Завантажити файл:

Institution

Ukrains’kyi Matematychnyi Zhurnal

_version_	1865788545142095872
author	Kichmarenko, O. D. Кічмаренко, О. Д.
author_facet	Kichmarenko, O. D. Кічмаренко, О. Д.
author_institution_txt_mv	[ { "author": "О. Д. Кічмаренко", "institution": null } ]
author_sort	Kichmarenko, O. D.
baseUrl_str	https://umj.imath.kiev.ua/index.php/umj/oai
collection	OJS
datestamp_date	2019-12-05T09:19:33Z
description	The method of averaging is applied to the nonlinear and linear (with respect to control) problems of optimal control on the semiaxis with small parameter and rapidly oscillating coefficients. It is shown that the solutions of the exact problem converge to the solutions of the averaged problem.
first_indexed	2026-03-24T02:08:34Z
format	Article
fulltext	УДК 517.9 О. Д. Кiчмаренко (Одес. нац. ун-т iм. I. I. Мечникова) ЗАСТОСУВАННЯ МЕТОДУ УСЕРЕДНЕННЯ ДО ЗАДАЧ ОПТИМАЛЬНОГО КЕРУВАННЯ ДЛЯ ЗВИЧАЙНИХ ДИФЕРЕНЦIАЛЬНИХ РIВНЯНЬ НА ПIВОСI The method of averaging is applied to the nonlinear and linear (with respect to control) problems of optimal control on the semiaxis with small parameter and rapidly oscillating coefficients. It is shown that the solutions of the exact problem converge to the solutions of the averaged problem. Метод усреднения применен к нелинейным и линейным по управлению задачам оптимального управления на полуоси с малыми параметром и быстро осциллирующими коэффициентами. Доказана сходимость решений точной задачи к решениям усредненной. 1. Вступ. У данiй роботi розглянуто двi задачi оптимального керування на пiвосi зi швидко осцилюючими коефiцiєнтами: а) нелiнiйну \.x = X \biggl( t \varepsilon , x, u (t) \biggr) , x (0, u (0)) = x0, (1.1) з критерiєм якостi J\varepsilon [u] = \infty \int 0 e - jtL (t, x\varepsilon (t) , u (t)) dt - \rightarrow \mathrm{i}\mathrm{n}\mathrm{f}, (1.2) де \.x = dx dt ; б) лiнiйну за керуванням \.x = f \biggl( t \varepsilon , x \biggr) + f1 (x)u (t) , x (0, u (0)) = x0, (1.3) з критерiєм якостi J\varepsilon [u] = \infty \int 0 [e - jtA (t, x\varepsilon (t)) +B (t, u (t))]dt - \rightarrow \mathrm{i}\mathrm{n}\mathrm{f} . (1.4) Тут \varepsilon > 0 — малий параметр, j > 0 — фiксована стала, що характеризує дисконт, x — фазовий вектор iз Rd, u(t) — m-вимiрний вектор керування, який набуває значень у деякiй множинi U \subset Rm. Для задачi (1.3) також буде розглянуто квадратичний за керуванням критерiй якостi J\varepsilon [u] = \infty \int 0 [e - jtA(t, x\varepsilon (t)) + u2(t)]dt - \rightarrow \mathrm{i}\mathrm{n}\mathrm{f} . (1.5) У подальшому через x(t, u) будемо позначати розв’язок задачi Кошi (1.1) або (1.3), який вiдповiдає керуванню u(t). Якщо не буде двозначностi у трактовцi, то залежнiстю вiд u будемо нехтувати i писатимемо x(t). c\bigcirc О. Д. КIЧМАРЕНКО, 2018 642 ISSN 1027-3190. Укр. мат. журн., 2018, т. 70, № 5 ЗАСТОСУВАННЯ МЕТОДУ УСЕРЕДНЕННЯ ДО ЗАДАЧ ОПТИМАЛЬНОГО КЕРУВАННЯ . . . 643 Нехай iснують рiвномiрно по x \in Rd i u \in Rm середнi \mathrm{l}\mathrm{i}\mathrm{m} s\rightarrow \infty 1 s s\int 0 X(t, x, u)dt = X0(x, u), (1.6) \mathrm{l}\mathrm{i}\mathrm{m} s\rightarrow \infty 1 s s\int 0 f(t, x)dt = f0(x). (1.7) Тодi задачам оптимального керування на пiвосi (1.1), (1.2) i (1.3), (1.4) зi швидко осцилюючими коефiцiєнтами ставиться у вiдповiднiсть бiльш проста (згладжена) усереднена задача керування \.y = X0 (y, u (t)) , y (0, u (0)) = x0, (1.8) i \.y = f0 (y) + f1 (y)u (t) , y (0, u (0)) = x0, (1.9) з критерiями якостi вiдповiдно J0 [u] = \infty \int 0 e - jtL(t, y (t) , u (t))dt \rightarrow \mathrm{i}\mathrm{n}\mathrm{f} (1.10) та J0 [u] = \infty \int 0 [e - jtA (t, y (t)) +B (t, u (t))]dt \rightarrow \mathrm{i}\mathrm{n}\mathrm{f}, (1.11) J0 [u] = \infty \int 0 [e - jtA (t, y (t)) + u2 (t)]dt \rightarrow \mathrm{i}\mathrm{n}\mathrm{f} . (1.12) Основним результатом роботи є встановлення умов збiжностi оптимальних керувань i опти- мальних траєкторiй, а також оптимальних значень критерiю якостi до оптимальних керувань, траєкторiй i оптимальних значень критерiю якостi вiдповiдних усереднених задач. При цьо- му також показано, що оптимальне керування усередненої задачi є „майже оптимальним” для точної, тобто з точнiстю до малого параметра \varepsilon реалiзує мiнiмум критерiю якостi точної задачi. До рiзних задач прикладного характеру метод усереднення застосовувався ще Ньютоном у 1682 роцi, однак його строге обґрунтування було вперше наведено М. М. Боголюбовим в [1]. У подальшому даний метод узагальнювався й розвивався для рiзних класiв диференцiальних рiвнянь, наприклад iмпульсних [2], функцiонально-диференцiальних [3] та iн. Щодо застосування методу усереднення до задач оптимального керування, то вкажемо на роботи М. М. Моїсеєва [4, 5], де вперше на це зверталась увага. Однак тут акцентувалась увага на застосуваннi усереднення до розв’язування конкретних прикладних задач, без достатнього математичного обґрунтування. В роботах В. О. Плотнiкова i його учнiв (див., наприклад, [6]) дано строге математичне обґрунтування застосування методу усереднення до розв’язування задач керування. Однак при ISSN 1027-3190. Укр. мат. журн., 2018, т. 70, № 5 644 О. Д. КIЧМАРЕНКО цьому множина допустимих керувань усередненої задачi будувалась спецiальним чином за множиною допустимих керувань вихiдної системи з використанням теорiї багатозначних вi- дображень, а також необхiдно було розробити алгоритм вiдповiдностi керувань вихiдної та усередненої систем. У роботi [7] запропоновано iнший пiдхiд до дослiдження задач оптимального керування методом усереднення. А саме, спочатку проводилось усереднення за часом, що явно входить у систему, при цьому функцiя керування u(t) вважалась параметром i по нiй усереднення не проводилося. Даний пiдхiд має низку переваг: по-перше, усереднений об’єкт будувався досить просто усередненням правих частин за часом; по-друге, множини допустимих керувань вихiдної та усереднених задач збiгалися мiж собою i не потрiбно було, як у [6], будувати нiяких додаткових конструкцiй. Однак авторам довелося накласти на функцiї керування u(t) умову асимптотичної сталостi в тому сенсi, що для кожного керування u(t) iснує стала u0 така, що \| u (t) - u0\| \leq \varphi (t), де \int \infty 0 \varphi (t)dt < \infty , i \varphi (t) не залежить вiд u(t). У роботi [8] застосовано пiдхiд iз роботи [7] до розв’язування задач оптимального керуван- ня, однак при цьому знято досить жорстку умову асимптотичної сталостi. Тут дослiдження проведене на скiнченному часовому iнтервалi. Мета даної роботи — отримати подiбнi результати на пiвосi. Опишемо коротко будову статтi. У другому пунктi наведено строгу постановку задачi i результати. Третiй пункт присвячено доведенню основних результатiв. Вiн складається з двох пiдпунктiв. У пiдпунктi 3.1 доведено теорему про вiдповiднiсть розв’язкiв точної та усередне- ної задач оптимального керування в нелiнiйному випадку. Пiдпункт 3.2 присвячено розгляду аналогiчних питань для лiнiйних за керуванням задач. 2. Постановка задачi та основнi результати. Через \| \cdot \| будемо позначати евклiдову норму вектора в Rd, а через \\| \cdot \\| — норму матрицi, узгоджену з нормою вектора. Для задачi (1.1), (1.2) та вiдповiдної їй усередненої задачi (1.8), (1.10) будемо вважати виконаними такi умови: 2.1) допустимими керуваннями є m-вимiрнi вектор-функцiї u(t), що майже для всiх t \geq 0 набувають значень у деякому компактi U \subset Rm, i u(\cdot ) для кожного T > 0 належить компакту \scrU T в Lp([0, T ]) при деякому p \geq 1; 2.2) функцiя X(t, x, u) визначена i неперервна за сукупнiстю змiнних в областi Q = \{ t \geq \geq 0, x \in Rd, u \in U\} та виконано умови: а) iснує M > 0 така, що \| X(t, x, u)\| \leq M для кожних (t, x, u) \in Q; б) X(t, x, u) задовольняє в Q умову Лiпшиця за змiнними x, u, тобто iснує стала K > 0 така, що для довiльних (t, x, u) i (t, x1, u1) \in Q виконується нерiвнiсть \| X (t, x, u) - X(t, x1, u1)\| \leq K(\| x - x1\| + \| u - u1\| ); 2.3) рiвномiрно по x \in Rd i u \in U iснує границя (1.6); 2.4) скалярна функцiя L(t, x, u) визначена i неперервна за сукупнiстю змiнних в областi Q = \bigl\{ t \geq 0, x \in Rd, u \in U \bigr\} , задовольняє в областi Q за змiнними x i u умову лiнiйного зростання зi сталою M, тобто \| L(t, x, u)\| \leq M(1 + \| x\| + \| u\| ). Для задачi (1.3), (1.4) i вiдповiдної їй усередненої задачi (1.9), (1.11) або (1.9), (1.12) будемо вважати виконаними такi умови: ISSN 1027-3190. Укр. мат. журн., 2018, т. 70, № 5 ЗАСТОСУВАННЯ МЕТОДУ УСЕРЕДНЕННЯ ДО ЗАДАЧ ОПТИМАЛЬНОГО КЕРУВАННЯ . . . 645 2.5) допустимими керування є m-вимiрнi вектор-функцiї u(\cdot ) \in L2([0,\infty )), що набувають значень у замкненiй опуклiй множинi V \subset Rm, та 0 \in V ; 2.6) функцiя f(t, x) визначена i неперервна за сукупнiстю змiнних в областi Q1 = \{ t \geq \geq 0, x \in Rd\} , а (n\times m)-вимiрна матриця f1(x) визначена для x \in Rd та виконано умови: а) f(t, x) i f1(x) обмеженi в областях визначення сталою M > 0; б) f(t, x) i f1(x) задовольняють в областях визначення умову Лiпшиця за змiнною x зi сталою Лiпшиця K > 0; 2.7) рiвномiрно по x \in Rd iснує границя (1.7); 2.8) скалярнi функцiї A(t, x), B(t, u) i \partial B \partial u (t, x) визначенi при t \geq 0, x \in Rd, u \in V i неперервнi за сукупнiстю змiнних, причому: а) A (t, x) \geq 0 i задовольняє по x \in Rd умову лiнiйного зростання зi сталою M, тобто \| A(t, x)\| \leq M(1 + \| x\| ) для кожного t \geq 0 i x \in Rd; б) a1\| u\| \geq B(t, u) \geq a\| u\| 2 для деяких сталих a > 0 i a1 > 0 при кожному t \geq 0, B(t, u) опукла по u \in V i iснує a2 > 0 така, що \bigm\| \bigm\| \bigm\| \bigm\| \partial B\partial u (y, u) \bigm\| \bigm\| \bigm\| \bigm\| \leq a2\| u\| . Для задачi (1.3), (1.5) допустимими керування будемо також вважати m-вимiрнi вектор- функцiї u(\cdot ) \in L2([0,\infty )), що набувають значень у V. При цьому також виконано умови 2.6 i 2.7. Зазначимо, що, згiдно з умовами а), б) iз 2.2 i 2.6, iз теореми Каратеодорi випливає, що для кожного допустимого керування u(t) розв’язки x(t, u) задач Кошi (1.1) i (1.3) iснують, єдинi на [0,\infty ) та є абсолютно неперервними функцiями. При цьому для розв’язкiв задач (1.1) i (1.3) справджується оцiнка \| x (t)\| \leq \| x0\| +Mt, (2.1) а для розв’язку задачi (1.3) аналогiчно маємо \| x (t)\| \leq \| x0\| +Mt+Mt1/2\\| u\\| L2 . (2.2) Тому для критерiю якостi (1.2) з урахуванням нерiвностi (2.1) i умови 2.1 отримуємо \| J\varepsilon [u]\| \leq \infty \int 0 e - jtM(1 + \| x(t)\| + \| u(t)\| )dt \leq \leq \infty \int 0 e - jtM(1 + \| x0\| +Mt)dt+ C \infty \int 0 e - jtdt < \infty для деякої сталої C > 0. При цьому для критерiю якостi (1.4), враховуючи (2.2) та умову б) iз 2.8, маємо \| J\varepsilon [u]\| \leq \infty \int 0 e - jtM(1 + \| x(t)\| )dt+ \infty \int 0 B(t, u(t))dt \leq \leq \infty \int 0 e - jtM(1 + \| x0\| +Mt+Mt1/2\\| u\\| L2)dt+ a1\\| u\\| 2L2 < \infty . ISSN 1027-3190. Укр. мат. журн., 2018, т. 70, № 5 646 О. Д. КIЧМАРЕНКО Таким чином, критерiї якостi (1.2) i (1.4) мають сенс для всiх допустимих керувань. Iз (2.2) i умов 2.7 випливає, що аналогiчнi висновки справедливi i для усереднених задач. Перша теорема гарантує збiжнiсть розв’язкiв точної системи (1.1) до вiдповiдних розв’язкiв усередненої системи (1.9) на пiвосi. Теорема 2.1. Нехай виконанo умови 2.2 i 2.3. Тодi якщо u\varepsilon 0 \rightarrow u0, \varepsilon 0 \rightarrow 0 за нормою простору Lp([0, T ]) для T > 0, то розв’язок задачi Кошi (1.1) x\varepsilon (t) \rightrightarrows y0(t), \varepsilon \rightarrow 0, на [0, T ], де y0(t) — розв’язок задачi Кошi (1.8) при u = u0. Зауваження 2.1. Iз даної теореми випливає, що якщо u\varepsilon \rightarrow u0(t), \varepsilon \rightarrow 0, за нормою Lp([0, T ]) для кожного T > 0, то x\varepsilon (t) збiгається до y(t) рiвномiрно на кожному вiдрiзку [0, T ], а тому x\varepsilon (t) \rightarrow y0(t), \varepsilon \rightarrow 0, для будь-якого t \geq 0. Отже, в цьому випадку маємо поточ- кову збiжнiсть розв’язкiв вихiдної задачi до вiдповiдних розв’язкiв усередненої. На вiдмiну, наприклад, вiд робiт [9, 10] тут не гарантується рiвномiрна збiжнiсть на пiвосi, але i ситуацiя тут бiльш загальна, а умови слабкiшi у порiвняннi з [9]. Проте для задач оптимального керування поточкової збiжностi буде достатньо. Наступна теорема встановлює зв’язок мiж оптимальними керуваннями, оптимальними тра- єкторiями i критерiями якостi точної (1.2) i (1.4) та усередненої (1.8), (1.10) задач. Позначимо J\ast \varepsilon = \mathrm{i}\mathrm{n}\mathrm{f}u J\varepsilon [u], J\ast 0 = \mathrm{i}\mathrm{n}\mathrm{f}u J0[u], де iнфiмум береться по всiх допустимих керуваннях. Теорема 2.2. Нехай виконано умови 2.1 – 2.4 та iснує \varepsilon 0 > 0 таке, що при всiх \varepsilon \in (0, \varepsilon 0) задачi (1.1), (1.2) i (1.8), (1.10) мають розв’язки (x\ast \varepsilon (t) , u \ast \varepsilon (t)), (y \ast (t) , u\ast (t)) вiдповiдно. Тодi: 1) J\ast \varepsilon \rightarrow J\ast 0 при \varepsilon \rightarrow 0; 2) для кожного \eta > 0 iснує \varepsilon 0 таке, що при 0 \leq \varepsilon < \varepsilon 0 \| J\ast \varepsilon - J\varepsilon (u \ast )\| < \eta , тобто оптимальне керування усередненої задачi є майже оптимальним для точної; 3) iснує послiдовнiсть \varepsilon n \rightarrow 0, n \rightarrow \infty , така, що x\ast \varepsilon n(t) \rightarrow y\ast (t) (2.3) рiвномiрно на кожному вiдрiзку [0, T ], T > 0, а u\ast \varepsilon n(t) \rightarrow u\ast (t) (2.4) майже скрiзь на [0,\infty ) i u\ast \varepsilon n(\cdot ) збiгається до u\ast (\cdot ) за нормою Lp([0, T ]) для кожного T > 0. Якщо при цьому усереднена задача (1.8), (1.10) має єдиний розв’язок, то збiжностi у (2.3), (2.4) мають мiсце при всiх \varepsilon \rightarrow 0. Зауваження 2.2. Якщо в умовах теореми 2.1 u(\cdot ) належить U -компакту в Lp([0,\infty )), а L задовольняє по u в областi Q умову Лiпшиця зi сталою K, то задачi (1.1), (1.2) та (1.8), (1.10) мають розв’язки. Звичайно, вимога компактностi множини \scrU T є досить жорсткою. Однак якщо обмежитися класом задач типу (1.3), (1.4), що є досить важливим для застосувань, то вимогу сильної компактностi можна зняти, замiнивши її слабкою компактнiстю. Має мiсце така теорема. ISSN 1027-3190. Укр. мат. журн., 2018, т. 70, № 5 ЗАСТОСУВАННЯ МЕТОДУ УСЕРЕДНЕННЯ ДО ЗАДАЧ ОПТИМАЛЬНОГО КЕРУВАННЯ . . . 647 Теорема 2.3. Нехай виконано умови 2.5 – 2.8. Тодi задачi (1.3), (1.4) та (1.9), (1.11) мають вiдповiдно розв’язки (x\ast \varepsilon (t) , u \ast \varepsilon (t)) i (y\ast (t) , u\ast (t)). При цьому: 1) J\ast \varepsilon \rightarrow J\ast 0 , \varepsilon \rightarrow 0; 2) для кожного \eta > 0 iснує \varepsilon 0 = \varepsilon 0(\eta ) таке, що при 0 < \varepsilon < \varepsilon 0 маємо \| J\ast \varepsilon - J\varepsilon [u \ast ]\| < \eta ; 3) iснує послiдовнiсть \varepsilon n \rightarrow 0, n \rightarrow \infty , така, що x\ast \varepsilon n (t) \rightarrow y (t) (2.5) рiвномiрно на кожному вiдрiзку [0, T ] для довiльного T > 0, а u\ast \varepsilon n w\rightarrow u\ast (2.6) слабко в L2([0,\infty )). Якщо при цьому усереднена задача (1.9), (1.11) має єдиний розв’язок, то збiжностi (2.5) i (2.6) мають мiсце при всiх \varepsilon \rightarrow 0. Для функцiонала якостi (1.12) твердження (2.6) можна посилити, замiнивши слабку збiж- нiсть на сильну. Зауваження 2.3. В умовах теореми 2.2 для задачi (1.8), (1.12) справедливi всi твердження даної теореми iз замiною слабкої збiжностi (2.6) оптимальних керувань на сильну збiжнiсть в L2([0,\infty )). 3. Доведення теорем i зауважень. 3.1. Доведення теорем 2.1, 2.2 i зауваження 2.2. Доведення теореми 2.1. Окрiм систем (1.1) i (1.8) розглянемо допомiжну систему \.z\varepsilon = X \biggl( t \varepsilon , z\varepsilon , u0 \biggr) , z\varepsilon (0, u0(0)) = x0. (3.1) Тодi \bigm\| \bigm\| z\varepsilon (t) - x\varepsilon (t) \bigm\| \bigm\| \leq t\int 0 \bigm\| \bigm\| \bigm\| X \Bigl( \Bigl( s \varepsilon \Bigr) , z\varepsilon (s), u0(s) \Bigr) - X \Bigl( \Bigl( s \varepsilon \Bigr) , x\varepsilon (s), u\varepsilon (s) \Bigr) \bigm\| \bigm\| \bigm\| ds \leq \leq K t\int 0 \| z\varepsilon (s) - x\varepsilon (s)\| ds+K T\int 0 \| u\varepsilon (s) - u0 (s)\| ds. Звiдси у випадку p = 1 маємо оцiнку \| z\varepsilon (t) - x\varepsilon (t)\| \leq eKTK \\| u\varepsilon - u0\\| L1 , (3.2) а у випадку p > 1 вiдповiдно \| z\varepsilon (t) - x\varepsilon (t)\| \leq KT 1/q \\| u\varepsilon - u0\\| Lp , (3.3) де 1 p + 1 q = 1. Отже, z\varepsilon (t) - x\varepsilon (t) \rightrightarrows 0, \varepsilon \rightarrow 0, на [0, T ]. ISSN 1027-3190. Укр. мат. журн., 2018, т. 70, № 5 648 О. Д. КIЧМАРЕНКО Далi, з роботи [8] випливає рiвномiрна на [0, T ] збiжнiсть z\varepsilon (t) до y0(t) при \varepsilon \rightarrow 0, оскiльки замiна класу L2 \bigl( \bigl[ 0, T \bigr] \bigr) на клас Lp \bigl( \bigl[ 0, T \bigr] \bigr) не приводить до змiн у доведеннi, тому що довiльну функцiю iз Lp \bigl( \bigl[ 0, T \bigr] \bigr) , p \geq 1, можна також апроксимувати кусково-сталими функцiями [11]. Останнє доводить теорему. Доведення теореми 2.2. Вiзьмемо довiльну послiдовнiсть \{ \varepsilon n\} \infty 1 таку, що \varepsilon n \rightarrow 0, n \rightarrow \infty . За умовами теореми iснує n0 \in \BbbN таке, що при n \geq n0 задача (1.1), (1.2) має розв’язок\bigl( x\ast \varepsilon n(t), u \ast \varepsilon n(t) \bigr) . Iз умов 2.1 випливає iснування на \bigl[ 0, 1 \bigr] збiжної в Lp \bigl( \bigl[ 0, 1 \bigr] \bigr) пiдпослiдовностi u\ast \varepsilon n1 (\cdot ) послiдовностi u+\varepsilon n(\cdot ). Нехай u1(\cdot ) — її Lp-границя. Тодi iснує пiдпослiдовнiсть послiдовностi u\ast \varepsilon n1 (t) (позначимо її знову u\ast \varepsilon n1 (t)), що збiгається поточково до u1(t) скрiзь на [0, 1], за винятком, можливо, множини A1 нульової лебегової мiри. Аналогiчними мiркуваннями iз послiдовностi u\ast \varepsilon n1 (\cdot ) видiляємо на [0, 2] збiжну за нормою Lp \bigl( \bigl[ 0, 2 \bigr] \bigr) послiдовнiсть u\ast \varepsilon n2 (\cdot ). Нехай u2(\cdot ) — її Lp-границя. Тодi iснує пiдпослiдовнiсть послiдовностi u\ast \varepsilon n2 (t) (позначимо її знову u\ast \varepsilon n2 (t)), що збiгається поточково до u2(t) скрiзь на [0, 2] , за винятком, можливо, деякої множини A2 нульової лебегової мiри. Очевидно, що u1(t) = u2(t) на множинi [0, 1] /(A1 \cup A2). Продовжуючи дану процедуру на [0, k] , k \in \BbbN , можна побудувати пiдпослiдовнiсть u\ast \varepsilon nk (\cdot ) послiдовностi u\ast \varepsilon nk - 1 (\cdot ), що збiгається до деякої функцiї uk(\cdot ) \in \scrU k за нормою Lp \bigl( \bigl[ 0, k \bigr] \bigr) . Iз неї також видiляємо збiжну поточково, за винятком, можливо, множини Ak \subset [0, k] нульової мiри, пiдпослiдовнiсть, позначену знову через u\ast \varepsilon nk . Очевидно, що uk(t) = uk - 1(t) на множинi [0, k - 1] \setminus \biggl( \bigcup k i=1 Ai \biggr) . Позначимо B = \bigcup \infty i=1 Ai. Очевидно, що множина B має нульову лебегову мiру. Побудуємо функцiю u0(t) таку, що u0(t) = uk(t) при t \in [0, k] . За своєю побудовою вона має такi властивостi: а) u0(t) визначена на [0,\infty ) \setminus B, тобто майже скрiзь; б) u0(t) \in U для всiх [0,\infty ) \setminus B; в) u0(\cdot ) \in \scrU T для кожного T > 0. Отже, u0(t) є допустимим керуванням для задачi (1.1), (1.2). Використовуючи тепер дiагональний метод Кантора, можна побудувати пiдпослiдовнiсть u\ast \varepsilon nn (\cdot ) вихiдної послiдовностi u\ast \varepsilon n(\cdot ), що має такi властивостi: а) u\ast \varepsilon nn (\cdot ) збiгається за нормою Lp \bigl( \bigl[ 0, T \bigr] \bigr) для кожного T > 0 до u0(\cdot ) при n \rightarrow \infty ; б) u\ast \varepsilon nn збiгається до u0(t) для всiх t \in [0,\infty ) \setminus B. Далi позначимо u\ast \varepsilon nn (\cdot ) через u\ast \varepsilon m . Тодi x\ast \varepsilon m(t) — оптимальна траєкторiя задачi (1.1), (1.2). Через y0(t) позначимо розв’язок усередненої задачi (1.8), що вiдповiдає керуванню u0(t). Iз теореми 2.1 випливає рiвномiрна на кожному вiдрiзку [0, T ] поточкова на [0,\infty ) збiжнiсть x\ast \varepsilon m(t) до y0(t) при m \rightarrow \infty . Оскiльки u\ast \varepsilon m(t) — оптимальне керування, а x\ast \varepsilon m(t) — оптимальна траєкторiя для задачi (1.1), (1.2), то J\ast \varepsilon m \leq J\ast \varepsilon m(u \ast ) = J\ast 0 + J\varepsilon m(u \ast ) - J0(u \ast ). (3.4) Але ISSN 1027-3190. Укр. мат. журн., 2018, т. 70, № 5 ЗАСТОСУВАННЯ МЕТОДУ УСЕРЕДНЕННЯ ДО ЗАДАЧ ОПТИМАЛЬНОГО КЕРУВАННЯ . . . 649 \| J\varepsilon m(u\ast ) - J0(u \ast )\| \leq \infty \int 0 e - jt \| L (t, x\varepsilon m(t), u \ast (t)) - L (t, y\ast (t), u\ast (t))\| dt. (3.5) Застосувавши знову теорему 2.1 до системи \.x\varepsilon m = X \biggl( t \varepsilon , x\varepsilon m , u \ast \biggr) i \.y\ast = X0 (y \ast , u\ast ) , отримаємо поточкову для кожного t > 0 збiжнiсть x\varepsilon m(t) до y\ast (t) при \varepsilon m \rightarrow 0. Використовуючи тепер умову лiнiйного зростання для L, оцiнку (2.1) i умову 2.1 для пiдiнтегрального виразу у (3.5), знаходимо iнтегровну мажоранту e - jtM (1 + \| x0\| +Mt+ C) , де C — деяка стала, що характеризує обмеженiсть компакта U з умови 2.1. Внаслiдок неперервностi функцiї L, згiдно з теоремою Лебега про мажоровану збiжнiсть, у (3.5) тодi можливий граничний перехiд. Звiдси отримуємо, що J\varepsilon m(u \ast ) \rightarrow J0(u \ast ), \varepsilon m \rightarrow 0. (3.6) З iншого боку, оскiльки u\ast \varepsilon m — допустиме керування усередненої задачi, то J\ast 0 \leq J0 \bigl( u\ast \varepsilon m \bigr) = J\ast \varepsilon m + J0(u \ast \varepsilon m) - J\varepsilon m(u \ast \varepsilon m). (3.7) Але \bigm\| \bigm\| J0(u\ast \varepsilon m) - J\varepsilon m(u \ast \varepsilon m) \bigm\| \bigm\| \leq \leq \bigm\| \bigm\| J0(u\ast \varepsilon m) - J0(u0) \bigm\| \bigm\| + \bigm\| \bigm\| J\varepsilon m(u\ast \varepsilon m) - J\varepsilon m(u0) \bigm\| \bigm\| + \| J\varepsilon m(u0) - J0(u0)\| . (3.8) Оскiльки \bigm\| \bigm\| J0(u\ast \varepsilon m) - J0(u0) \bigm\| \bigm\| = \infty \int 0 e - jt \bigm\| \bigm\| L \bigl( t, y\varepsilon m(t), u \ast \varepsilon m(t) \bigr) - L (t, y0(t), u0(t)) \bigm\| \bigm\| dt, де y\varepsilon m(t) — розв’язок задачi Кошi \.y\varepsilon m = X0 (y\varepsilon m , u\varepsilon m) , y\varepsilon m (0, u\varepsilon m(0)) = x0, то аналогiчно (3.6) маємо J0 \bigl( u\ast \varepsilon m \bigr) \rightarrow J0(u0), \varepsilon m \rightarrow 0. (3.9) Покажемо, що J\varepsilon m(u \ast \varepsilon m) - J\varepsilon m(u0) \rightarrow 0, \varepsilon m \rightarrow 0. (3.10) ISSN 1027-3190. Укр. мат. журн., 2018, т. 70, № 5 650 О. Д. КIЧМАРЕНКО Дiйсно, \bigm\| \bigm\| J\varepsilon m(u\ast \varepsilon m) - J\varepsilon m(u0) \bigm\| \bigm\| \leq \leq \infty \int 0 e - jt \bigm\| \bigm\| L \bigl( t, x\ast \varepsilon m(t), u \ast \varepsilon m(t) \bigr) - L (t, z\varepsilon m(t), u0(t)) \bigm\| \bigm\| dt, де z\varepsilon m — розв’язок задачi Кошi (3.1) з \varepsilon = \varepsilon m. Враховуючи тепер збiжнiсть майже скрiзь u\ast \varepsilon m до u0(t) при \varepsilon m i мiркуючи, як i при встановленнi (3.6), приходимо до (3.10). Очевидно також, що J\varepsilon m(u0) - J0(u0) \rightarrow 0, \varepsilon m \rightarrow 0. (3.11) Тодi iз (3.4), (3.6) – (3.11) одержуємо оцiнки J\varepsilon m(u \ast \varepsilon m) - J\ast 0 \leq J\ast \varepsilon m - J\ast 0 \leq J\varepsilon m(u \ast ) - J0(u \ast ). Звiдси випливає, що J\ast \varepsilon m \rightarrow J\ast 0 , \varepsilon m \rightarrow 0. (3.12) Таким чином, iз довiльної послiдовностi J\ast \varepsilon n видiлено збiжну до J\ast 0 пiдпослiдовнiсть, звiдки випливає перше твердження теореми. Покажемо, що u0 — оптимальне керування усередненої задачi, а y0(t) — оптимальна тра- єкторiя. Аналогiчно попередньому, за теоремою Лебега маємо J\ast \varepsilon m = \infty \int 0 e - jtL \bigl( t, x\ast \varepsilon m(t), u \ast \varepsilon m(t) \bigr) dt \rightarrow \infty \int 0 e - jtL (t, y0(t), u0(t)) dt. Звiдси та з (3.12) випливає оптимальнiсть пари (u0(t), y0(t)) , що i доводить третє твердження теореми. Для доведення другого твердження зазначимо, що \| J\ast \varepsilon - J\varepsilon (u0)\| \leq \| J\ast \varepsilon - J\ast 0 \| + \| J0(u0) - J\varepsilon (u0)\| . Застосовуючи теорему 2.1 до системи \.x\varepsilon = X \biggl( t \varepsilon , x\varepsilon , u0 \biggr) i \.y0 = X0 (y0, u0) , аналогiчно (3.6) отримуємо, що J0(u0) - J\varepsilon (u0) \rightarrow 0, \varepsilon \rightarrow 0. Звiдси i з першого твердження теореми отримуємо друге твердження. ISSN 1027-3190. Укр. мат. журн., 2018, т. 70, № 5 ЗАСТОСУВАННЯ МЕТОДУ УСЕРЕДНЕННЯ ДО ЗАДАЧ ОПТИМАЛЬНОГО КЕРУВАННЯ . . . 651 Якщо усереднена задача (1.8), (1.10) має єдиний розв’язок, то з наведеного вище випливає, що з довiльної послiдовностi \bigl( x\ast \varepsilon m , u \ast \varepsilon m \bigr) можна видiлити збiжну пiдпослiдовнiсть i всi такi пiдпослiдовностi збiгаються до однiєї i тiєї ж границi, що i доводить останнє твердження теореми. Теорему доведено. Доведення зауваження 2.2. Покажемо неперервнiсть J\varepsilon (u) для кожного \varepsilon > 0 по u \in \in Lp ([0,\infty )) . Використовуючи умову a) iз 2.2 i нерiвнiсть Гронуолла – Беллмана, аналогiчно (3.2), (3.3) для розв’язкiв x(t, un) i x(t, u0) задачi (1.1), що вiдповiдають керуванням un i u0, отримуємо оцiнки для кожного t \in [0, T ] при T > 0: \| x(t, un) - x(t, u0)\| \leq KeKT \\| un - u0\\| L1 у випадку L1 ([0,\infty )) i \| x(t, un) - x(t, u0)\| \leq KT 1/q \\| un - u0\\| Lp у випадку p > 1, з яких випливає поточкова при t \geq 0 збiжнiсть x(t, un) до x(t, u0), якщо un збiгається до u0 за Lp-нормою. Тодi \| J\varepsilon (un) - J\varepsilon (u0)\| \leq \infty \int 0 e - jt \| L (t, x(t, un), u0(t)) - L (t, x(t, u0), u0(t))\| dt+ + \infty \int 0 e - jtK \| un(t) - u0(t)\| dt \rightarrow 0, n \rightarrow \infty , згiдно з теоремою Лебега. Отже, J\varepsilon (u) неперервна по u на компактi. Аналогiчно доводиться i неперервнiсть J0(u). 3.2. Доведення теореми 2.3 i зауваження 2.3. Доведення теореми 2.3. Доведення iсну- вання для кожного \varepsilon оптимальної пари (x\ast \varepsilon , u \ast \varepsilon ) задачi (1.3), (1.4) проводиться за стандартною схемою (див., наприклад, [12]) iз видiленням мiнiмiзуючої послiдовностi, що слабко збiгається до u\ast \varepsilon . Оптимальнiсть u\ast \varepsilon встановлюється граничним переходом iз використанням того факту, що якщо в умовах теореми un w - \rightarrow u0 в L2 ([0,\infty )) , n \rightarrow \infty , то \mathrm{l}\mathrm{i}\mathrm{m} n\rightarrow \infty \infty \int 0 B (t, un(t)) dt \geq \infty \int 0 B (t, u0(t)) dt. (3.13) Останнє випливає iз вiдомої для опуклих функцiй нерiвностi B (t, v) \geq B (t, u0(t)) + \biggl( \partial B \partial u (t, u0(t)) , v - u0(t) \biggr) . (3.14) Тут другий доданок — скалярний добуток векторiв у \BbbR m. Взявши в (3.14) v = un(t), матимемо \infty \int 0 B (t, un(t)) dt \geq \infty \int 0 B (t, u0(t)) dt+ \infty \int 0 \biggl( \partial B \partial u (t, u0(t)) , un(t) - u0(t) \biggr) dt. (3.15) ISSN 1027-3190. Укр. мат. журн., 2018, т. 70, № 5 652 О. Д. КIЧМАРЕНКО Врахувавши тепер умову б) iз 2.8, отримаємо \infty \int 0 \bigm\| \bigm\| \bigm\| \bigm\| \partial B\partial u B(t, u(t)) \bigm\| \bigm\| \bigm\| \bigm\| 2 dt \leq \infty \int 0 a2 \| u(t)\| 2 dt \leq \infty . Отже, другий доданок у (3.15) прямує до нуля внаслiдок слабкої збiжностi un(t) до u0 в L2 ([0,\infty ]) . Належнiсть u\ast \varepsilon (t) множинi V для кожного t \geq 0 випливає з леми Мазура [13]. Аналогiчно доводиться iснування оптимальної пари (y\ast , u\ast ) задачi (1.9), (1.11). Далi, для довiльного \varepsilon > 0 маємо J\ast \varepsilon = J\ast \varepsilon (u \ast \varepsilon ) \leq J\varepsilon (0). (3.16) При u = 0 для розв’язку x\varepsilon (t) задачi Кошi (1.3) внаслiдок першої умови з 2.6 маємо оцiнку \| x\varepsilon (t)\| \leq \| x0\| +Mt, t \geq 0, а тому за умовою 2.8 J\varepsilon (0) = \infty \int 0 e - jtA (t, x\varepsilon (t)) dt \leq \infty \int 0 e - jtM (1 + x0 +Mt) dt \leq C1, (3.17) де стала C1 не залежить анi вiд \varepsilon , анi вiд u. Тодi з умов 2.8, (3.16) i (3.17) маємо оцiнку \infty \int 0 \| u\ast \varepsilon (t)\| 2 dt \leq C1 a . (3.18) Тому послiдовнiсть u\ast \varepsilon слабко компактна в L2 ([0,\infty )) . Нехай u\ast \varepsilon n — слабко збiжна до u0 послiдовнiсть оптимальних керувань. Очевидно, що u0 — допустиме керування. Нехай x0(t) — розв’язок задачi Кошi (1.9) з u(t) = u0(t). Оскiльки зi слабкої збiжностi в L2 ([0,\infty )) випливає слабка збiжнiсть в L2 ([0, T ]) для довiльного T > 0, то з теореми 2.8 [8] маємо, що розв’язок x\ast \varepsilon n(t) задачi Кошi (1.3) рiвномiрно на [0, T ] прямує до x0(t) при \varepsilon n \rightarrow 0. Внаслiдок довiльностi T звiдси випливає поточкова збiжнiсть x\ast \varepsilon n(t) до x0(t) при кожному t \geq 0. Аналогiчний факт має мiсце i для розв’язкiв x\ast \varepsilon n(t, u \ast ) i y\ast (t) задач Кошi (1.3) i (1.9) вiдповiдно. Тодi J\ast \varepsilon m \leq J\ast 0 + J\varepsilon n(u \ast ) - J0(u \ast ). (3.19) Але \| J\varepsilon n(u\ast ) - J0(u \ast )\| \leq \infty \int 0 e - jt \| A(t, x\varepsilon n(t, u \ast ) - A(t, y\ast (t))\| dt \rightarrow 0, \varepsilon n \rightarrow 0, (3.20) згiдно з теоремою Лебега, оцiнкою (2.2) i лiнiйним по x зростанням A(t, x). З iншого боку, J\ast 0 \leq J\ast \varepsilon n + J0(u \ast \varepsilon n) - J\varepsilon n(u \ast \varepsilon n). (3.21) ISSN 1027-3190. Укр. мат. журн., 2018, т. 70, № 5 ЗАСТОСУВАННЯ МЕТОДУ УСЕРЕДНЕННЯ ДО ЗАДАЧ ОПТИМАЛЬНОГО КЕРУВАННЯ . . . 653 Розглянемо допомiжну систему \.zn = f0(zn) + f1(zn)u \ast \varepsilon n i \.x0 = f0(x0) + f1(x0)u0. Знову застосувавши до неї теорему 2.8 [8], переконаємося, що zn(t) рiвномiрно на [0, T ] i поточково на пiвосi t \geq 0 прямує до x0(t) при \varepsilon n \rightarrow 0. Звiдси з урахуванням збiжностi x\ast zn(t) до x0 отримаємо, що x\varepsilon n(t) \ast - zn(t) \rightarrow 0, zn \rightarrow 0, (3.22) для кожного t \geq 0. Тому \bigm\| \bigm\| J\varepsilon n(u\ast \varepsilon n) - J0(u \ast \varepsilon n) \bigm\| \bigm\| \leq \infty \int 0 e - jt \bigm\| \bigm\| A \bigl( t, x\ast \varepsilon n(t) \bigr) - A (t, x0(t)) \bigm\| \bigm\| dt+ + \infty \int 0 e - jt \| A (t, zn(t)) - A (t, x0(t))\| dt \rightarrow 0, \varepsilon n \rightarrow 0, згiдно з теоремою Лебега, оцiнками (2.2), (3.18) i лiнiйним по x зростанням A(t, x). Тодi з (3.19) – (3.22) випливає, що J\ast \varepsilon n \rightarrow J\ast 0 , \varepsilon n \rightarrow 0. Як i в пiдпунктi 3.1, приходимо до висновку, що J\ast \varepsilon \rightarrow J\ast 0 , \varepsilon \rightarrow 0, (3.23) що й доводить перше твердження теореми. Покажемо, що u0 — оптимальне керування усередненої задачi. Дiйсно, J\ast \varepsilon n = \infty \int 0 e - jtA \bigl( t, x\ast \varepsilon n(t) \bigr) dt+ \infty \int 0 B \bigl( t, u\ast \varepsilon n(t) \bigr) dt. (3.24) Враховуючи тепер умови 2.8, (3.23), (3.13), теорему Лебега i переходячи до границi у (3.24) при \varepsilon n \rightarrow 0, маємо J\ast 0 = \infty \int 0 e - jtA (t, x0(t)) dt+ \mathrm{l}\mathrm{i}\mathrm{m} \varepsilon n\rightarrow 0 \infty \int 0 B \bigl( t, u\ast \varepsilon n(t) \bigr) dt \geq \geq \infty \int 0 e - jtA (t, x0(t)) dt+ \infty \int 0 B (t, u0(t)) dt. Звiдси випливає оптимальнiсть пари (x0, u0) , що i доводить третє твердження. Друге твердження доводиться аналогiчно вiдповiдному твердженню iз теореми 2.2. Останнє твердження теореми доводиться аналогiчно такому ж твердженню теореми 2.2. Доведення зауваження проводиться аналогiчно вiдповiдному факту для скiнченного iнтервалу з [8]. ISSN 1027-3190. Укр. мат. журн., 2018, т. 70, № 5 654 О. Д. КIЧМАРЕНКО Лiтература 1. Боголюбов Н. Н. О некоторых статистических методах в математической физике. – Киев: Изд-во АН УССР, 1945. 2. Самойленко А. М., Перестюк Н. А. Вторая теорема Н. Н. Боголюбова для систем дифференциальных уравнений с импульсным воздействием // Дифференц. уравнения. – 1974. – 10, № 11. – С. 2001 – 2010. 3. Hale G. Theory of functional-differential equations. – New York: Springer-Verlag, 1977. 4. Моисеев Н. Н. Элементы теории оптимальных систем. – М.: Наука, 1975. – 528 с. 5. Моисеев Н. Н. Асимптотические методы нелинейной механики. – М.: Наука, 1981. – 400 с. 6. Плотников В. А. Метод усреднения в задачах оптимального управления. – Киев; Одесса: Лыбидь, 1992. – 188 с. 7. Носенко Т. В., Станжицький О. М. Метод усереднення в деяких задачах оптимального керування // Нелiнiйнi коливання. – 2008. – 11, № 4. – С. 512 – 519. 8. Kichmarenko O. D. Application of the averaging method to optimal control problem of system with fast parameters // J. Pure and Appl. Math. – 2017. – 115, № 1. – P. 93 – 114. 9. Самойленко А. М., Станжицкий А. Н. Об усреднении дифференциальных уравнений на бесконечном интер- вале // Дифференц. уравнения. – 2006. – 42, № 4. – С. 476 – 482. 10. Станжицкий А. Н., Добродзий Т. В. Исследование задач оптимального управления на полуоси методом усреднения // Дифференц. уравнения. – 2011. – 47, № 2. – С. 264 – 277. 11. Макаров Б. М., Подкорытов А. Н. Лекции по вещественному анализу. – Санкт-Петербург: БХВ-Петербург, 2011. – 688 с. 12. Ли Э. Б., Маркус Л. Основы теории оптимального управления. – М.: Наука, 1972. – 576 с. 13. Yosida K. Functional analysis. – Berlin; New York: Springer-Verlag, 1980. Одержано 16.06.17 ISSN 1027-3190. Укр. мат. журн., 2018, т. 70, № 5
id	umjimathkievua-article-1584
institution	Ukrains’kyi Matematychnyi Zhurnal
keywords_txt_mv	keywords
language	Ukrainian
last_indexed	2026-03-24T02:08:34Z
publishDate	2018
publisher	Institute of Mathematics, NAS of Ukraine
record_format	ojs
resource_txt_mv	umjimathkievua/65/ad62134039b79e49159c48946f309065.pdf
spelling	umjimathkievua-article-15842019-12-05T09:19:33Z Application of the method of averaging to the problems of optimal control for ordinary differential equations on the semiaxis Застосування методу усереднення до задач оптимального керування для звичайних диференціальних рівнянь на півосі Kichmarenko, O. D. Кічмаренко, О. Д. The method of averaging is applied to the nonlinear and linear (with respect to control) problems of optimal control on the semiaxis with small parameter and rapidly oscillating coefficients. It is shown that the solutions of the exact problem converge to the solutions of the averaged problem. Метод усреднения применен к нелинейным и линейным по управлению задачам оптимального управления на полуоси с малыми параметром и быстро осциллирующими коэффициентами. Доказана сходимость решений точной задачи к решениям усредненной. Institute of Mathematics, NAS of Ukraine 2018-05-25 Article Article application/pdf https://umj.imath.kiev.ua/index.php/umj/article/view/1584 Ukrains’kyi Matematychnyi Zhurnal; Vol. 70 No. 5 (2018); 642-654 Український математичний журнал; Том 70 № 5 (2018); 642-654 1027-3190 uk https://umj.imath.kiev.ua/index.php/umj/article/view/1584/566 Copyright (c) 2018 Kichmarenko O. D.
spellingShingle	Kichmarenko, O. D. Кічмаренко, О. Д. Application of the method of averaging to the problems of optimal control for ordinary differential equations on the semiaxis
title	Application of the method of averaging to the problems of optimal control for ordinary differential equations on the semiaxis
title_alt	Застосування методу усереднення до задач оптимального керування для звичайних диференціальних рівнянь на півосі
title_full	Application of the method of averaging to the problems of optimal control for ordinary differential equations on the semiaxis
title_fullStr	Application of the method of averaging to the problems of optimal control for ordinary differential equations on the semiaxis
title_full_unstemmed	Application of the method of averaging to the problems of optimal control for ordinary differential equations on the semiaxis
title_short	Application of the method of averaging to the problems of optimal control for ordinary differential equations on the semiaxis
title_sort	application of the method of averaging to the problems of optimal control for ordinary differential equations on the semiaxis
url	https://umj.imath.kiev.ua/index.php/umj/article/view/1584
work_keys_str_mv	AT kichmarenkood applicationofthemethodofaveragingtotheproblemsofoptimalcontrolforordinarydifferentialequationsonthesemiaxis AT kíčmarenkood applicationofthemethodofaveragingtotheproblemsofoptimalcontrolforordinarydifferentialequationsonthesemiaxis AT kichmarenkood zastosuvannâmetoduuserednennâdozadačoptimalʹnogokeruvannâdlâzvičajnihdiferencíalʹnihrívnânʹnapívosí AT kíčmarenkood zastosuvannâmetoduuserednennâdozadačoptimalʹnogokeruvannâdlâzvičajnihdiferencíalʹnihrívnânʹnapívosí

Application of the method of averaging to the problems of optimal control for ordinary differential equations on the semiaxis

Institution

Ähnliche Einträge