Iснування оптимальних керувань на нескiнченних часових промiжках для деяких класiв диференцiальних рiвнянь

Доказано существование оптимального управления для систем дифференциальных уравнений без решения уравнения динамического программирования Беллмана с использованием прямых методов решения экстремальных уравнений. We prove that there exists an optimal control for a differential system by using direct...

Full description

Saved in:

Bibliographic Details
Published in:	Нелінійні коливання
Date:	2012
Main Author:	Самойленко, О.О.
Format:	Article
Language:	Ukrainian
Published:	Інститут математики НАН України 2012
Online Access:	https://nasplib.isofts.kiev.ua/handle/123456789/176016
Tags:	Add Tag No Tags, Be the first to tag this record!
Journal Title:	Digital Library of Periodicals of National Academy of Sciences of Ukraine
Cite this:	Iснування оптимальних керувань на нескiнченних часових промiжках для деяких класiв диференцiальних рiвнянь / О.О. Самойленко // Нелінійні коливання. — 2012. — Т. 15, № 4. — С. 515-527. — Бібліогр.: 12 назв. — укр.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine

_version_	1859977048702844928
author	Самойленко, О.О.
author_facet	Самойленко, О.О.
citation_txt	Iснування оптимальних керувань на нескiнченних часових промiжках для деяких класiв диференцiальних рiвнянь / О.О. Самойленко // Нелінійні коливання. — 2012. — Т. 15, № 4. — С. 515-527. — Бібліогр.: 12 назв. — укр.
collection	DSpace DC
container_title	Нелінійні коливання
description	Доказано существование оптимального управления для систем дифференциальных уравнений без решения уравнения динамического программирования Беллмана с использованием прямых методов решения экстремальных уравнений. We prove that there exists an optimal control for a differential system by using direct methods for solving extremum equations and without solving the Bellman dynamic programming equation.
first_indexed	2025-12-07T16:24:06Z
format	Article
fulltext	УДК 517.9 IСНУВАННЯ ОПТИМАЛЬНИХ КЕРУВАНЬ НА НЕСКIНЧЕННИХ ЧАСОВИХ ПРОМIЖКАХ ДЛЯ ДЕЯКИХ КЛАСIВ ДИФЕРЕНЦIАЛЬНИХ РIВНЯНЬ О. О. Самойленко Київ. нац. ун-т iм. Т. Шевченка Україна, 01033, Київ, вул. Володимирська, 64 e-mail: anelka.s@mail.ru We prove that there exists an optimal control for a differential system by using direct methods for solving extremum equations and without solving the Bellman dynamic programming equation. Доказано существование оптимального управления для систем дифференциальных уравнений без решения уравнения динамического программирования Беллмана с использованием прямых методов решения экстремальных уравнений. 1. Вступ. У данiй роботi розглядається задача оптимального керування системою дифе- ренцiальних рiвнянь ẋ = A(t)x+ f1(t, x) + f2(t, x)u(t), (1) x(0) = x0, з критерiєм якостi J(u) = ∞∫ 0 L(t, x(t), u(t)) dt → inf, (2) де t ∈ [0,∞), x ∈ D, D — деяка область у Rd. Бiльш точну постановку задачi наведено в основнiй частинi роботи. У статтi доведено теорему iснування оптимального керування задачею (1), (2) у термi- нах правої частини системи (1) та функцiї L(t, x, u), що входить у критерiй якостi. Ранiше подiбнi задачi розглядалися, наприклад, у роботах [1 – 6] (див. також наведену в них бiб- лiографiю). Для їх дослiдження, як правило, використовується метод динамiчного прог- рамування Беллмана або принцип максимуму Понтрягiна. Використання методу динамiчного програмування пов’язане з необхiднiстю розв’я- зання вiдповiдного рiвняння Беллмана, яке є нелiнiйним диференцiальним рiвнянням з частинними похiдними першого порядку, i це є досить складною задачею. Умови прин- ципу максимуму Понтрягiна дозволяють звести знаходження оптимального керування до розв’язку деякої двоточкової крайової задачi. Принцип максимуму надає можливiсть знаходити оптимальне керування для багатьох важливих прикладних задач. Однак часто розв’язання двоточкової крайової задачi може виявитись досить складним. Тому важли- во отримати умови iснування оптимального керування в термiнах коефiцiєнтiв вихiдної системи та функцiї L(t, x, u), що входить у критерiй якостi. c© О. О. Самойленко, 2012 ISSN 1562-3076. Нелiнiйнi коливання, 2012, т . 15, N◦ 4 515 516 О. О. САМОЙЛЕНКО Такi умови можна отримати, використовуючи прямi методи дослiдження екстремаль- них задач. Даним способом у роботах [1, 2] доведено iснування оптимального керування для за- дач Майєра та Больца на фiксованому промiжку часу без обмежень на керування. У данiй роботi розглядається бiльш загальний випадок. Iнший пiдхiд до питань iснування оптимальних керувань iз застосуванням методу усе- реднення можна знайти, наприклад, у роботах [10 – 12]. 2. Постановка задачi. Розглянемо задачу оптимального керування (1), (2), де x0 ∈ D — фiксований вектор, t ∈ [0,∞), x ∈ D — фазовий вектор, D — область iз Rd така, що мiстить в собi замкнену кулю деякого радiуса R, u ∈ U ⊂ Rm — вектор керування, U — опукла замкнена множина, що мiстить 0, вектор-функцiя f1(t, x) : [0,∞) × D → Rd та матрицi A(t) : [0,∞) → Rd × Rd, f2(t, x) : [0,∞) × D → Rd × Rm є неперервними за сукупнiстю змiнних. Позначимо через \|.\| евклiдову норму d-вимiрного вектора, через ‖.‖ норму матрицi, узгоджену з нормою вектора. Будемо вважати, що для функцiй f1(t, x) та f2(t, x) виконується умова лiнiйного зро- стання, тобто iснує стала L1 > 0 така, що \|f1(t, x)\| ≤ L1\|x\|, ‖f2(t, x)‖ ≤ L1\|x\| при x ∈ D, t ∈ [0,∞), (3) та умова Лiпшиця по змiннiй x ∈ D. Функцiї L(t, x, u), Lx(t, x, u) та Lu(t, x, u) є неперервними для будь-яких t ∈ [0,∞), x ∈ D, u ∈ U i задовольняють наступнi умови: 1) iснують такi сталi k > 0 та p > 2, що виконується нерiвнiсть L(t, x, u) ≥ k\|u\|p (4) для t ∈ [0,∞), x ∈ D, u ∈ U ; 2) iснують такi сталi C > 0 та a > 1, що виконується нерiвнiсть L(t, x, u) ≤ C(\|x\|a + \|u\|p); (5) 3) iснує таке K > 0, що \|Lx(t, x, u)\|+ \|Lu(t, x, u)\| ≤ K(\|x\|a−1 + \|u\|p−1); (6) 4) L(t, x, u) є опуклою по u для будь-яких фiксованих t ∈ [0,∞), x ∈ D. Керування u(t) вважатимемо допустимим, якщо: а1) u(t) ∈ Lp([0,∞)) для p з умови 1; а2) u(t) ∈ U для будь-якого t ≥ 0; a3) для керування u(t) розв’язок задачi Кошi (1) визначений i належить множинi D при t ≥ 0; a4) J(u) < ∞. Множину допустимих керувань, що задовольняють умови a1) – a4), будемо називати допустимою для задачi (1), (2) i позначатимемо через V. ISSN 1562-3076. Нелiнiйнi коливання, 2012, т . 15, N◦ 4 IСНУВАННЯ ОПТИМАЛЬНИХ КЕРУВАНЬ НА НЕСКIНЧЕННИХ ЧАСОВИХ ПРОМIЖКАХ . . . 517 Будемо також вважати, що матрицант X(t, s) системи ẋ = A(t)x (7) задовольняє наступну умову: iснують такi сталi K1 > 0 i γ > 0, що має мiсце оцiнка \|X(t, s)\| ≤ K1e −γ(t−s), t ≥ s. (8) Як вiдомо, умова (8) рiвносильна експоненцiальнiй стiйкостi нульового розв’язку системи (7). Умови такої стiйкостi є добре вивченими (див. [8, 9]). 3. Основний результат. Основним результатом даної работи є наступна теорема. Теорема 1. Нехай для системи (1) з критерiєм якостi (2) виконуються умови пунк- ту 2. Тодi якщо 3q−1Kq 1L q 1 (( 1 γ )q/p +M q ) − γ ≤ 0, (9) де q = p/(p− 1) i M = ( 6a/pRaCq ak(γ − 2(q−1)Lq1K q 1γ 1/(1−p)) + 1 k ) 1 p , то задача (1), (2) з початковими даними x0, що задовольняють умову \|x0\| ≤ R p √ 3 K1 , (10) має розв’язок у класi допустимих керувань V, тобто iснує допустиме керування u∗(t) ∈ ∈ V, що мiнiмiзує критерiй якостi (2). Доведення. Спочатку покажемо, що множина допустимих керувань V не є порожньою. Для цього доведемо, що 0 ∈ V. Дiйсно, виконання умов а1) i а2) є очевидним. Покажемо виконання умов а3) та а4). Для u = 0 система (1) набирає вигляду ẋ = A(t)x+ f1(t, x), x(0) = x0. До моменту виходу розв’язку цiєї системи iз областi D має мiсце iнтегральне зображення x(t) = X(t, 0)x0 + t∫ 0 X(t, s)f1(s, x(s)) ds. (11) ISSN 1562-3076. Нелiнiйнi коливання, 2012, т . 15, N◦ 4 518 О. О. САМОЙЛЕНКО Використовуючи нерiвностi (3), (8) та нерiвнiсть Гельдера, отримуємо \|x(t)\|q = ∣∣∣∣∣∣X(t, 0)x0 + t∫ 0 X(t, s)f1(s, x(s)) ds ∣∣∣∣∣∣ q ≤ ≤ 2q−1Kq 1 \|e−γtx0\|q + ∣∣∣∣∣∣ t∫ 0 e−γ(t−s)f1(s, x(s)) ds ∣∣∣∣∣∣ q ≤ ≤ 2q−1Kq 1L q 1 e−γqtL−q1 \|x0\| q +  t∫ 0 e−γ(t−s)\|x(s)\| ds q ≤ ≤ 2q−1Kq 1L q 1 e−γqtL−q1 \|x0\| q + e−γqt  t∫ 0 eγs/peγs/q\|x(s)\| ds q ≤ ≤ 2q−1Kq 1L q 1 e−γqtL−q1 \|x0\| q + e−γqt  t∫ 0 eγs ds q/p t∫ 0 eγs\|x(s)\|q ds  ≤ ≤ 2q−1Kq 1L q 1 e−γqtL−q1 \|x0\| q + e−γqt  t∫ 0 eγs ds q/p t∫ 0 eγs\|x(s)\|q ds  ≤ ≤ 2q−1Kq 1L q 1 e−γqtL−q1 \|x0\| q +  t∫ 0 e−γ(t−s) ds q/p e−γt t∫ 0 eγs\|x(s)\|q ds  , або eγt\|x(t)\|q ≤ 2q−1Kq 1 \|x0\| q + 2q−1Kq 1L q 1 ( 1 γ )q/p t∫ 0 eγs\|x(s)\|q ds. Тодi за лемою Гронуолла – Беллмана маємо eγt\|x(t)\|q ≤ 2q−1Kq 1 \|x0\| qe 2q−1Kq 1L q 1 ( 1 γ )q/p t або \|x(t)\|q ≤ 2q−1Kq 1 \|x0\| qe (2q−1Kq 1L q 1 ( 1 γ )q/p −γ)t i \|x(t)\| ≤ 21/pK1\|x0\|e (2q−1K q 1L q 1( 1 γ )q/p−γ)t q ≤ R. Останнє випливає з (10). Отже, розв’язок x(t) лежить в областi D при всiх t ≥ 0. ISSN 1562-3076. Нелiнiйнi коливання, 2012, т . 15, N◦ 4 IСНУВАННЯ ОПТИМАЛЬНИХ КЕРУВАНЬ НА НЕСКIНЧЕННИХ ЧАСОВИХ ПРОМIЖКАХ . . . 519 Покажемо виконання умови а4). Використовуючи нерiвнiсть (5), отримуємо J(0) = ∞∫ 0 L(t, x(t), 0) dt≤C ∞∫ 0 \|x(t)\|a dt≤C2a/pKa 1 \|x0\|a ∞∫ 0 e (2q−1K q 1L q 1( 1 γ ) q/p −γ)ta q dt = = C2a/pKa 1 \|x0\|aq 1 (γ − 2q−1Kq 1L q 1 ( 1 γ )q/p )a ≤ C6a/pRaq (γ − 2q−1Kq 1L q 1 ( 1 γ )q/p )a < ∞. Отже, керування u(t) ≡ 0 ∈ V. Оскiльки критерiй якостi є невiд’ємною величиною, то iснує невiд’ємна нижня грани- ця m значень J(u), а тому iснує послiдовнiсть допустимих керувань {un(t), n ≥ 1} таких, що J(un) → m при n → ∞ монотонно, тобто J(un) = ∞∫ 0 L(t, xn(t), un(t)) dt → m при n → ∞, де xn(t) — розв’язки системи (1), що вiдповiдають керуванням un(t). Значення m можна оцiнити таким чином: m ≤ J(0) ≤ C6a/pRaq (γ − 2q−1Kq 1L q 1 ( 1 γ ) q/p ) a . Зауважимо, що для достатньо великих n J(un) ≤ m+ 1. Використовуючи умову (4), маємо k ∞∫ 0 \|un(t)\|p dt ≤ ∞∫ 0 L(t, xn(t), un(t)) dt ≤ m+ 1, ∞∫ 0 \|un(t)\|p dt ≤ m+ 1 k , ‖un(·)‖p ≤ ( m+ 1 k )1/p ≤ ( C6a/pRaq k(γ − 2q−1Kq 1L q 1( 1 γ ) q/p)a + 1 k )1/p , (12) що означає слабку компактнiсть сiм’ї керувань {un(·)}. Тому можна вибрати пiдпослiдов- нiсть (яку також будемо позначати через un(t)), що слабко збiгається до границi u∗(t) ∈ ∈ Lp([0,∞)), що задовольняє умову (12). Тодi за лемою Мазура [4, с. 173] знайдеться опук- ла комбiнацiя bk(t) = ∑n(k) i=1 αi(k)ui(t) елементiв ui(t) ∈ U ( αi ≥ 0, ∑n(k) i=1 αi = 1 ) така, що bk → u∗, k → ∞, за нормою Lp. Отже, iснує збiжна майже скрiзь на [0,∞) за мiрою Лебега пiдпослiдовнiсть bkl така, що bkl(t) → u∗(t), l → ∞, для майже всiх t. Оскiльки ISSN 1562-3076. Нелiнiйнi коливання, 2012, т . 15, N◦ 4 520 О. О. САМОЙЛЕНКО U — опукла i замкнена множина, то ∑n(k) i=1 αiui(t) ∈ U. Тодi iз замкненостi множини U випливає, що u∗(t) ∈ U майже для всiх t ∈ [0,∞). Розглянемо тепер послiдовнiсть розв’язкiв системи (1), що вiдповiдають послiдовностi керувань {un(t), n ≥ 1} при t ∈ [0,∞). Доведемо рiвномiрну обмеженiсть функцiй xn(t) при t ≥ 0. З iнтегрального зображення xn(t) = X(t, 0)x0 + t∫ 0 X(t, s)f1(s, xn(s)) ds+ t∫ 0 X(t, s)f2(s, xn(s))u(t) ds, використовуючи нерiвностi (3), (8) та нерiвнiсть Гельдера, отримуємо \|xn(t)\|q = ∣∣∣∣∣∣X(t, 0)x0 + t∫ 0 X(t, s)f1(s, xn(s)) ds+ t∫ 0 X(t, s)f2(s, xn(s))un(s) ds ∣∣∣∣∣∣ q ≤ ≤ 3q−1Kq 1 \|e−γtx0\|q + ∣∣∣∣∣∣ t∫ 0 e−γ(t−s)f1(s, xn(s)) ds ∣∣∣∣∣∣ q + + ∣∣∣∣∣∣ t∫ 0 e−γ(t−s)f2(s, xn(s))un(s) ds ∣∣∣∣∣∣ q ≤ ≤ 3q−1Kq 1L q 1 e−γqtL−q1 \|x0\| q +  t∫ 0 e−γ(t−s)\|xn(s)\| ds q + +  t∫ 0 e−γ(t−s)\|xn(s)\|\|un(s)\| ds q ≤ ≤ 3q−1Kq 1L q 1 e−γqtL−q1 \|x0\| q + e−γqt  t∫ 0 eγs/peγs/q\|xn(s)\| ds q + + e−γqt  t∫ 0 eγs\|xn(s)\|\|un(s)\| ds q ≤ ≤ 3q−1Kq 1L q 1 e−γqtL−q1 \|x0\| q + e−γqt  t∫ 0 eγs ds q/p t∫ 0 eγs\|xn(s)\|q ds + + e−γqt‖un(t)‖qp t∫ 0 eγqs\|xn(s)\|q ds  ≤ ISSN 1562-3076. Нелiнiйнi коливання, 2012, т . 15, N◦ 4 IСНУВАННЯ ОПТИМАЛЬНИХ КЕРУВАНЬ НА НЕСКIНЧЕННИХ ЧАСОВИХ ПРОМIЖКАХ . . . 521 ≤ 3q−1Kq 1L q 1 e−γqtL−q1 \|x0\| q + e−γqt  t∫ 0 eγs ds q/p t∫ 0 eγs\|xn(s)\|q ds + + e−γqt‖un(t)‖qp t∫ 0 eγqs\|xn(s)\|q ds  ≤ ≤ 3q−1Kq 1L q 1 e−γqtL−q1 \|x0\| q +  t∫ 0 e−γ(t−s) ds q/p e−γt t∫ 0 eγs\|xn(s)\|q ds + + e−γt‖un(t)‖qp t∫ 0 eγs\|xn(s)\|q ds  або eγt\|xn(t)\|q ≤ 3q−1Kq 1 \|x0\| q + 3q−1Kq 1L q 1 (( 1 γ )q/p +M q ) t∫ 0 eγs\|xn(s)\|q ds. Тодi за лемою Гронуолла – Беллмана маємо eγt\|xn(t)\|q ≤ 3q−1Kq 1 \|x0\| qe 3q−1Kq 1L q 1 (( 1 γ )q/p +Mq ) t або \|xn(t)\|q ≤ 3q−1Kq 1 \|x0\| qe ( 3q−1Kq 1L q 1 (( 1 γ )q/p +Mq ) −γ ) t < R (13) на пiдставi умов (9) та (10). Звiдки й випливає рiвномiрна обмеженiсть функцiй xn(t) при t ≥ 0. Виберемо довiльний момент T, що належить пiвосi [0,∞). Доведемо рiвностепеневу неперервнiсть розв’язкiв xn(t), n ≥ 1, t ∈ [0, T ]. Використо- вуючи iнтегральне зображення xn(t) = x0 + t∫ 0 [A(t)xn(t) + f1(s, xn(s)) + f2(s, xn(s))un(s)] ds та нерiвнiсть Гельдера для будь-яких s1, s2 ∈ [0, T ] таких, що s1 < s2, маємо \|xn(s1)− xn(s2)\| = ∣∣∣∣∣∣ s2∫ s1 A(t)xn(t) dt+ s2∫ s1 f1(t, xn(t)) dt+ s2∫ s1 f2(t, xn(t))un(t) dt ∣∣∣∣∣∣ ≤ ISSN 1562-3076. Нелiнiйнi коливання, 2012, т . 15, N◦ 4 522 О. О. САМОЙЛЕНКО ≤ L1 s2∫ s1 \|A(t)\| \|xn(t)\| dt+ L1 s2∫ s1 \|xn(t)\| dt+ L1 s2∫ s1 \|xn(t)\| \|un(t)\| dt ≤ ≤ L1R\|A(t)\|(s2 − s1) + L1R(s2 − s1)+ + L1R(s2 − s1)1/q\|‖un(t)‖p → 0 при s2 − s1 → 0. Отже, сiм’я функцiй {xn(t), n ≥ 1}, t ∈ [0, T ], рiвностепенево неперервна та рiвно- мiрно обмежена. Тодi за теоремою Асколлi на кожному обмеженому вiдрiзку часу [0, T ] можна видiлити рiвномiрно збiжну пiдпослiдовнiсть (яку також будемо позначати через {xn(t), n ≥ 1}) таку, що xn(t) ⇒ x∗(t) при n → ∞ на вiдрiзку t ∈ [0, T ]. Оскiльки xn(t) лежать у замкненiй кулi радiуса R, яка в свою чергу лежить в областi D, то i x∗(t) також лежить у данiй кулi. Покажемо, що функцiя x∗(t) є розв’язком системи (1), що вiдповiдає керуванню u∗(t) на [0, T ]. Оскiльки xn(t) — розв’язки системи (1), то xn(t) = x0 + t∫ 0 [A(s)xn(s) + f1(s, xn(s)) + f2(s, xn(s))un(s)] ds± t∫ 0 A(s)x∗(s) ds± ± t∫ 0 f2(s, xn(s))u ∗(s) ds± t∫ 0 f2(s, x ∗(s))un(s) ds± t∫ 0 f2(s, x ∗(s))u∗(s) ds = x0+ + t∫ 0 A(s)(xn(s)− x∗(s)) ds+ t∫ 0 A(s)x∗(s) ds+ t∫ 0 [f1(s, xn(s))+f2(s, xn(s))u ∗(s)] ds+ + t∫ 0 [f2(s, xn(s))− f2(s, x∗(s))](un(s)− u∗(s)) ds+ t∫ 0 f2(s, x ∗(s))[un(s)− u∗(s)]ds ≤ ≤ x0 + t∫ 0 A(s)(xn(s)− x∗(s)) ds+ t∫ 0 A(s)x∗(s) ds+ + t∫ 0 [f1(t, xn(s)) + f2(t, xn(s))u ∗(s)] ds+  t∫ 0 [f2(t, xn(s))− f2(t, x∗(s))]q ds 1/q × ×  t∫ 0 (un(s)− u∗(s))p ds 1/p + t∫ 0 f2(t, x ∗(s))(un(s)− u∗(s)) ds ≤ ≤ x0 + t∫ 0 A(s)(xn(s)− x∗(s)) ds+ t∫ 0 A(s)x∗(s) ds+ ISSN 1562-3076. Нелiнiйнi коливання, 2012, т . 15, N◦ 4 IСНУВАННЯ ОПТИМАЛЬНИХ КЕРУВАНЬ НА НЕСКIНЧЕННИХ ЧАСОВИХ ПРОМIЖКАХ . . . 523 + t∫ 0 [f1(t, xn(s)) + f2(t, xn(s))u ∗(s)] ds+ +  t∫ 0 [L1\|xn(s)− x∗(s)\|]q ds 1/q (‖un(s)‖p + ‖u∗(s)‖p)+ + t∫ 0 L1\|x∗(s)\|(un(s)− u∗(s)) ds. Третiй, п’ятий та шостий iнтеграли прямують до 0 при n → ∞. Це випливає з рiвно- мiрної збiжностi xn(t) до x∗(t) та слабкої збiжностi послiдовностi керувань un(t) до u∗(t) при n → ∞ на вiдрiзку t ∈ [0, T ]. Тому x∗(t) = x0 + t∫ 0 A(s)x∗(s) ds+ t∫ 0 [f1(s, x ∗(s)) dt+ f2(s, x ∗(s))u∗(s)] ds для будь-якого t ∈ [0, T ]. Оскiльки розв’язок задачi Кошi (1) єдиний i момент T вибрано довiльним чином, то x∗(t) є розв’язком системи (1), що вiдповiдає керуванню u∗(t) при t ≥ 0. Очевидно, що для x∗(t) виконується нерiвнiсть \|x∗(t)\|q ≤ 3q−1Kq 1 \|x0\| qe ( 3q−1Kq 1L q 1 (( 1 γ )q/p +Mq ) −γ ) t ≤ R. (14) Залишилось довести, що керування u∗(t) є оптимальним. Спочатку покажемо, що функцiя L(t, x∗(t), un(t)) iнтегровна на [0,∞] : \|L(t, x∗(t), un(t))\| ≤ \|L(t, x∗(t), un(t))− L(t, x∗(t), u∗(t))\|+ \|L(t, x∗(t), u∗(t))\| ≤ ≤ ∣∣∣∣∣∣ 1∫ 0 Lu(t, x ∗(t), (1− λ)u∗(t) + λun(t))(un(t)− u∗(t)) dλ ∣∣∣∣∣∣+ \|L(t, x∗(t), u∗(t))\| ≤ ≤ K 1∫ 0 ( \|x∗(t)\|a−1 + \|(1− λ)u∗(t) + λun(t)\|p−1 ) \|un(t)− u∗(t)\|dλ+ \|L(t, x∗(t), u∗(t))\| ≤ ≤ K\|x∗(t)\|a−1\|un(t)− u∗(t)\|+K 1∫ 0 ((1− λ)\|u∗(t)\|p−1 + λ\|un(t)\|p−1)\|un(t)− u∗(t)\| dλ+ + \|L(t, x∗(t), u∗(t))\| ≤ K\|x∗(t)\|a−1\|un(t)− u∗(t)\|+K(\|u∗(t)\|p−1+ + \|un(t)\|p−1)(\|un(t)\|+ \|u∗(t)\|) + \|L(t, x∗(t), u∗(t))\| ≤ K\|x∗(t)\|a−1\|un(t)− u∗(t)\|+ +K\|u∗(t)\|p +K\|un(t)\|p +K\|un(t)\| \|u∗(t)\|p−1 +K\|u∗(t)\| \|un(t)\|p−1 + \|L(t, x∗(t), u∗(t))\|. ISSN 1562-3076. Нелiнiйнi коливання, 2012, т . 15, N◦ 4 524 О. О. САМОЙЛЕНКО Другий, третiй та шостий доданки iнтегровнi. Розглянемо окремо перший, четвертий та п’ятий доданки. Маємо ∞∫ 0 \|x∗(t)\|a−1\|un(t)− u∗(t)\| dt ≤  ∞∫ 0 \|x∗(t)\|(a−1)q dt 1/q ∞∫ 0 \|un(t)− u∗(t)\|p dt 1/p ≤ ≤ 3(a−1)/pKa−1 1 \|x0\|a−1  ∞∫ 0 e (a−1) ( 3q−1Kq 1L q 1 (( 1 γ )q/p +Mq ) −γ ) t dt 1/q 2p−1× ×  ∞∫ 0 \|un(t)\|p dt+ ∞∫ 0 \|u∗(t)\|p dt 1/p ≤ ≤ 2p−13(a−1)/pKa−1 1 \|x0\|a−1 (a− 1)1/q ( 3q−1Kq 1L q 1 (( 1 γ )q/p +M q ) − γ )1/q 21/pM < ∞. Отже, перший доданок iнтегровний. Розглянемо четвертий доданок: ∞∫ 0 \|u∗(t)\|p−1\|un(t)\| dt ≤  ∞∫ 0 \|u∗(t)\|p dt 1/q ∞∫ 0 \|un(t)\|p dt 1/p = = ‖u∗(t)‖q/pp ‖un(t)‖p < ∞. Аналогiчно доводиться й iнтегровнiсть п’ятого доданка. Отже, функцiя L(t, x∗(t), un(t)) є iнтегровною на [0,∞]. Нехай χR(t) — характеристична функцiя множини {t : \|u∗(t)\| < R1}. Оскiльки L(t, x, ·) є опуклою, то виконується нерiвнiсть L(t, x∗(t), v(t))χR1(t) ≥ L(t, x∗(t), u∗(t))χR1(t)+ + (v(t)− u∗(t))Lv(t, x∗(t), u∗(t))χR1(t) ∀v(t) ∈ V, t ∈ [0,∞). Покладемо v(t) = un(t), тодi ∞∫ 0 L(t, x∗(t), un(t))χR1(t) dt ≥ ∞∫ 0 L(t, x∗(t), u∗(t))χR1(t) dt+ + ∞∫ 0 (un(t)− u∗(t))Lu(t, x∗(t), u∗(t))χR1(t) dt. (15) З умови (6) маємо \|Lu(t, x∗(t), u∗(t))χR1(t)\| ≤ K(\|x∗(t)\|a−1 + \|u∗(t)\|p−1) ≤ K(Ra−1 +Rp−11 ). ISSN 1562-3076. Нелiнiйнi коливання, 2012, т . 15, N◦ 4 IСНУВАННЯ ОПТИМАЛЬНИХ КЕРУВАНЬ НА НЕСКIНЧЕННИХ ЧАСОВИХ ПРОМIЖКАХ . . . 525 Тому другий iнтеграл в нерiвностi (15) прямує до 0 при n → ∞ внаслiдок слабкої збiжнос- тi un(t) до u∗(t). Отже, lim n→∞ inf ∞∫ 0 L(t, x∗(t), un(t))χR1(t) dt ≥ ∞∫ 0 L(t, x∗(t), u∗(t))χR1(t) dt. Оскiльки lim n→∞ inf ∞∫ 0 L(t, x∗(t), un(t)) dt ≥ lim n→∞ inf ∞∫ 0 L(t, x∗(t), un(t))χR1(t) dt та L(t, x, u) ≥ 0, χR1(t) ≤ 1 i χR1(t) → 1 при R1 → ∞, то згiдно з теоремою Лебега маємо lim n→∞ inf ∞∫ 0 L(t, x∗(t), un(t)) dt ≥ ∞∫ 0 L(t, x∗(t), u∗(t)) dt. (16) Розглянемо також величину∣∣∣∣∣∣ ∞∫ 0 [L(t, xn(t), un(t))− L(t, x∗(t), un(t))] dt ∣∣∣∣∣∣ = = ∣∣∣∣∣∣ ∞∫ 0 1∫ 0 Lx(t, (1− λ)x∗(t) + λxn(t), un(t))(xn(t)− x∗(t)) dλ dt ∣∣∣∣∣∣ ≤ ≤ K ∞∫ 0 1∫ 0 \|xn(t)− x∗(t)\| (\|(1− λ)x∗(t) + λxn(t)\|a−1 + \|un(t)\|p−1) dλ dt ≤ ≤ K ∞∫ 0 1∫ 0 \|xn(t)− x∗(t)\|((1− λ)\|x∗(t)\|a−1 + λ\|xn(t)\|a−1) dλ dt+ +K ∞∫ 0 \|xn(t)− x∗(t)\| \|un(t)\|p−1 dt ≤ K ∞∫ 0 \|xn(t)− x∗(t)\|(\|x∗(t)\|a−1 + \|xn(t)\|a−1) dt+ +K  ∞∫ 0 \|xn(t)− x∗(t)\|p dt 1/p ∞∫ 0 \|un(t)\|p 1/q ≤ 2KR ∞∫ 0 \|xn(t)− x∗(t)\| dt+ +KMp/q  ∞∫ 0 \|xn(t)− x∗(t)\|p dt 1/p . (17) ISSN 1562-3076. Нелiнiйнi коливання, 2012, т . 15, N◦ 4 526 О. О. САМОЙЛЕНКО Оскiльки xn(t) та x∗(t) згiдно з нерiвностями (13) та (14) обмеженi iнтегровною функ- цiєю, то за теоремою Лебега права частина нерiвностi (17) прямує до 0 при n → ∞. Далi маємо J(un) = ∞∫ 0 L(t, xn(t), un(t)) dt = ∞∫ 0 [L(t, xn(t), un(t))− L(t, x∗(t), un(t))] dt+ + ∞∫ 0 [L(t, x∗(t), un(t))− L(t, x∗(t), u∗(t))] dt+ ∞∫ 0 L(t, x∗(t), u∗(t)) dt. Використовуючи (16) та (17), з останньої рiвностi отримуємо lim n→∞ inf J(un(t)) ≥ J(u∗). Оскiльки inf u∈U J(u) ≤ J(u∗) ≤ lim n→∞ inf J(un) = m, то J(u∗) = m. Отже, u∗(t) — оптимальне керування. Теорему доведено. Приклад. Нехай задача оптимального керування (1), (2) має вигляд ẋ = −2x+ sinx 2 + t + x− cos2 x 2 + t2 u(t), (18) x(0) = 1, з критерiєм якостi J(u) = ∞∫ 0 (x4 + 2u6) dt → inf, (19) де \|x\| < 2, t ∈ [0,∞), u ∈ U, U — довiльна опукла замкнена множина, що мiстить 0. Неважко перевiрити, що задача (18), (19) задовольняє всi умови теореми при p = 6, a = 4, K = 12, k = 2, C = 2, K1 = 1, L1 = 0, 5, γ = 2. Отже, задача (18), (19) має розв’язок. 1. Fleming W. H., Soner H. M. Controlled Markov processes and viscosity solution. — Springer, 2005. — 448 p. 2. Флеминг У., Ришел Р. Оптимальное управление детерминированными и стохастическими системами. — М.: Мир, 1978. 3. Ли Э. Б., Маркус Л. Основы теории оптимального управления. — М.: Наука, 1972. ISSN 1562-3076. Нелiнiйнi коливання, 2012, т . 15, N◦ 4 IСНУВАННЯ ОПТИМАЛЬНИХ КЕРУВАНЬ НА НЕСКIНЧЕННИХ ЧАСОВИХ ПРОМIЖКАХ . . . 527 4. Иосида К. Функциональный анализ. — М.: Мир, 1967. — 624 с. 5. Киселев Ю. Н., Аввакумов С. Н., Орлов М. В. Оптимальное управление: линейная теория и приложе- ния. — М.: Макс Пресс, 2007. 6. Красовский Н. Н. Теория управления движением. — М.: Наука, 1968. — 476 с. 7. Асеев С. М., Кряжимский А. В. Принцип максимума Понтрягина и задачи оптимального экономиче- ского роста. — М.: Наука, 2007. — 272 с. 8. Демидович Б. П. Лекции по математической теории устойчивости. — М.: Наука, 1967. — 472 с. 9. Еругин Н. П., Штокало И. З., Бондаренко П. С. и др. Курс обыкновенных дифференциальных урав- нений. — Киев: Вища шк., 1974. — 472 с. 10. Плотников В. А. Метод усреднения в задачах оптимального управления. — Киев, Одесса: Лыбедь, 1992. — 188 с. 11. Плотников В. А., Плотников А. В., Витюк А. Н. Дифференциальние уравнения с многозначной пра- вой частью. Асимптотические методы. — Одесса: Астропринт, 1999. — 354 с. 12. Станжицкий А. Н., Добродзий Т. В. Исследование задач оптимального управления на полуоси мето- дом усреднения // Дифференц. уравнения. — 2011. — 47, № 2. — С. 264 – 277. Одержано 14.03.12 ISSN 1562-3076. Нелiнiйнi коливання, 2012, т . 15, N◦ 4
id	nasplib_isofts_kiev_ua-123456789-176016
institution	Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn	1562-3076
language	Ukrainian
last_indexed	2025-12-07T16:24:06Z
publishDate	2012
publisher	Інститут математики НАН України
record_format	dspace
spelling	Самойленко, О.О. 2021-02-03T09:14:11Z 2021-02-03T09:14:11Z 2012 Iснування оптимальних керувань на нескiнченних часових промiжках для деяких класiв диференцiальних рiвнянь / О.О. Самойленко // Нелінійні коливання. — 2012. — Т. 15, № 4. — С. 515-527. — Бібліогр.: 12 назв. — укр. 1562-3076 https://nasplib.isofts.kiev.ua/handle/123456789/176016 517.9 Доказано существование оптимального управления для систем дифференциальных уравнений без решения уравнения динамического программирования Беллмана с использованием прямых методов решения экстремальных уравнений. We prove that there exists an optimal control for a differential system by using direct methods for solving extremum equations and without solving the Bellman dynamic programming equation. uk Інститут математики НАН України Нелінійні коливання Iснування оптимальних керувань на нескiнченних часових промiжках для деяких класiв диференцiальних рiвнянь Существование оптимальных управлений на бесконечных временных промежутках для некоторых классов дифференциальных уравнений Existence of optimal controls on infinite time intervals for some classes of differential equations Article published earlier
spellingShingle	Iснування оптимальних керувань на нескiнченних часових промiжках для деяких класiв диференцiальних рiвнянь Самойленко, О.О.
title	Iснування оптимальних керувань на нескiнченних часових промiжках для деяких класiв диференцiальних рiвнянь
title_alt	Существование оптимальных управлений на бесконечных временных промежутках для некоторых классов дифференциальных уравнений Existence of optimal controls on infinite time intervals for some classes of differential equations
title_full	Iснування оптимальних керувань на нескiнченних часових промiжках для деяких класiв диференцiальних рiвнянь
title_fullStr	Iснування оптимальних керувань на нескiнченних часових промiжках для деяких класiв диференцiальних рiвнянь
title_full_unstemmed	Iснування оптимальних керувань на нескiнченних часових промiжках для деяких класiв диференцiальних рiвнянь
title_short	Iснування оптимальних керувань на нескiнченних часових промiжках для деяких класiв диференцiальних рiвнянь
title_sort	iснування оптимальних керувань на нескiнченних часових промiжках для деяких класiв диференцiальних рiвнянь
url	https://nasplib.isofts.kiev.ua/handle/123456789/176016
work_keys_str_mv	AT samoilenkooo isnuvannâoptimalʹnihkeruvanʹnaneskinčennihčasovihpromižkahdlâdeâkihklasivdiferencialʹnihrivnânʹ AT samoilenkooo suŝestvovanieoptimalʹnyhupravleniinabeskonečnyhvremennyhpromežutkahdlânekotoryhklassovdifferencialʹnyhuravnenii AT samoilenkooo existenceofoptimalcontrolsoninfinitetimeintervalsforsomeclassesofdifferentialequations

Iснування оптимальних керувань на нескiнченних часових промiжках для деяких класiв диференцiальних рiвнянь

Institution

Similar Items