Viscous solutions for the Hamilton – Jacobi – Bellman equation on time scales

We introduce the concept of viscous solution for the Bellman equation on time scales and establish сonditions for the existence and uniqueness of this solution.

Gespeichert in:

Bibliographische Detailangaben
Datum:	2017
Hauptverfasser:	Danilov, V. Ya., Lavrova, O. E., Stanzhitskii, A. N., Данилов, В. Я., Лаврова, О. Є., Станжицький, О. М.
Format:	Artikel
Sprache:	Ukrainisch
Veröffentlicht:	Institute of Mathematics, NAS of Ukraine 2017
Online Zugang:	https://umj.imath.kiev.ua/index.php/umj/article/view/1747
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:	Ukrains’kyi Matematychnyi Zhurnal
Завантажити файл:

Institution

Ukrains’kyi Matematychnyi Zhurnal

_version_	1865788722176327680
author	Danilov, V. Ya. Lavrova, O. E. Stanzhitskii, A. N. Данилов, В. Я. Лаврова, О. Є. Станжицький, О. М.
author_facet	Danilov, V. Ya. Lavrova, O. E. Stanzhitskii, A. N. Данилов, В. Я. Лаврова, О. Є. Станжицький, О. М.
author_institution_txt_mv	[ { "author": "В. Я. Данилов", "institution": null }, { "author": "О. Є. Лаврова", "institution": null }, { "author": "О. М. Станжицький", "institution": null } ]
author_sort	Danilov, V. Ya.
baseUrl_str	https://umj.imath.kiev.ua/index.php/umj/oai
collection	OJS
datestamp_date	2019-12-05T09:25:34Z
description	We introduce the concept of viscous solution for the Bellman equation on time scales and establish сonditions for the existence and uniqueness of this solution.
first_indexed	2026-03-24T02:11:53Z
format	Article
fulltext	УДК 517.9 В. Я. Данiлов, О. Є. Лаврова, О. М. Станжицький (Київ. нац. ун-т iм. Т. Шевченка) В’ЯЗКI РОЗВ’ЯЗКИ РIВНЯННЯ ГАМIЛЬТОНА – ЯКОБI – БЕЛЛМАНА НА ЧАСОВИХ ШКАЛАХ We introduce the concept of viscous solution for the Bellman equation on time scales and establish сonditions for the existence and uniqueness of this solution. Введена концепция вязкого решения уравнения Беллмана на временных шкалах. Получены условия существования и единственности такого решения. Вступ. Метод динамiчного програмування Беллмана є одним iз основних методiв дослiдження задач оптимального керування. Основну роль тут вiдiграє функцiя Беллмана (функцiя цiни), що є мiнiмальним значенням критерiю якостi. Для звичайних диференцiальних рiвнянь функцiя Беллмана, у випадку її гладкостi, задовольняє рiвняння динамiчного програмування — нелiнiй- не диференцiальне рiвняння першого порядку в частинних похiдних типу Гамiльтона – Якобi — рiвняння Беллмана. Бiльш того, гладка функцiя Беллмана є єдиним розв’язком такого рiвняння з вiдповiдними крайовими умовами [9]. З iншого боку, iснування гладкого розв’язку рiвняння Беллмана дозволяє досить просто знайти оптимальне керування у формi оберненого зв’язку (див. [9, 14]). Зазначимо, що в цьому випадку можна розв’язувати задачi оптимального ке- рування не лише для звичайних рiвнянь, але, наприклад, i для iмпульсних [15]. Однак дана процедура реалiзується досить рiдко, оскiльки, як правило, функцiя Беллмана не є гладкою, що є наслiдком нелiнiйностi рiвняння Беллмана. Ця обставина змусила шукати бiльш слабке поняття розв’язку рiвняння Беллмана. У 1983 ро- цi Crandall i Lions [8] увели поняття в’язкого розв’язку рiвняння Гамiльтона – Якобi – Беллмана. При цьому виявилось, що при досить широких умовах неперервна функцiя Беллмана є єдиним, в такому сенсi, розв’язком крайової задачi (задачi Кошi) для рiвняння Беллмана. Аналогiчнi питання для рiвнянь на ейлерових часових шкалах \BbbT = h\BbbZ +, h > 0, тобто для рiзницевих рiвнянь з кроком h, розглядалися, наприклад, у роботах [6, 7, 10]. При цьому вiдповiднi рiвняння Беллмана є рiзницевими рiвняннями, розв’язки яких можна розглядати у класi неперервних функцiй. Основним результатом цих робот є доведення збiжностi даних розв’язкiв при h \rightarrow 0 до єдиного в’язкого розв’язку рiвняння Беллмана вiдповiдної задачi оптимiзацiї для звичайного диференцiального рiвняння. Щодо рiвнянь на загальних часових шкалах зауважимо, що їх теорiя почалася з роботи [12], де було введено поняття \Delta -похiдної. Останнє дало змогу з єдиної точки зору розглянути непе- рервний i дискретний аналiз. Основи цiєї теорiї викладено в монографiях [2, 3]. У англомовнiй лiтературi такi рiвняння називаються динамiчними. У роботах [5, 17] для задач оптимального керування на часових шкалах отримано певнi варiанти принципу максимуму, а в роботах [13, 16] виведено аналог для часових шкал рiвняння Беллмана. В данiй роботi розвинуто концепцiю в’язких розв’язкiв рiвняння Беллмана на часових шкалах. Тут основна складнiсть дослiдження пов’язана зi складною топологiчною структурою часової шкали, що зумовлює нетривiальну взаємну поведiнку граничних i iзольованих точок. При цьому в граничних i iзольованих точках тип рiвняння Беллмана рiзний: в граничних точ- ках — це диференцiальне рiвняння, а в iзольованих — рiзницеве. c\bigcirc В. Я. ДАНIЛОВ, О. Є. ЛАВРОВА, О. М. СТАНЖИЦЬКИЙ, 2017 ISSN 1027-3190. Укр. мат. журн., 2017, т. 69, № 7 933 934 В. Я. ДАНIЛОВ, О. Є. ЛАВРОВА, О. М. СТАНЖИЦЬКИЙ Робота складається зi вступу i трьох пунктiв. У першому пунктi наведено основнi понят- тя, пов’язанi з теорiєю часових шкал. У другому пунктi дано постановку задачi та вивчено деякi властивостi функцiї Беллмана. Означенню в’язкого розв’язку та встановленню умов його iснування i єдиностi присвячено третiй пункт. 1. Основнi поняття, пов’язанi з теорiєю часових шкал. Наведемо необхiднi для подаль- ших дослiджень поняття i означення з теорiї рiвнянь на часових шкалах. Часовою шкалою \BbbT називається довiльна, непорожня, замкнена пiдмножина дiйсних чисел. Для кожної множини A \subset \BbbR позначимо A\BbbT = A \cap \BbbT . Визначимо прямий i обернений оператори стрибка \sigma , \rho : \BbbT \rightarrow \BbbT таким чином: \sigma (t) = = \mathrm{i}\mathrm{n}\mathrm{f}\{ s \in \BbbT : s > t\} i \rho (t) = \mathrm{s}\mathrm{u}\mathrm{p}\{ s \in \BbbT : s < t\} (причому \mathrm{i}\mathrm{n}\mathrm{f} \varnothing := \mathrm{s}\mathrm{u}\mathrm{p}\BbbT i \mathrm{s}\mathrm{u}\mathrm{p}\varnothing := \mathrm{i}\mathrm{n}\mathrm{f} \BbbT ). Функцiя зернистостi \mu : \BbbT \rightarrow [0,\infty ) визначається як \mu (t) = \sigma (t) - t. Точка t \in \BbbT називається лiво-граничною (\mathrm{L}\mathrm{D}) \bigl( лiво-розсiяною (\mathrm{L}\mathrm{S}), право-граничною (\mathrm{R}\mathrm{D}) або право-розсiяною (\mathrm{R}\mathrm{S}) \bigr) , якщо \rho (t) = t \bigl( \rho (t) < t, \sigma (t) = t або \sigma (t) > t \bigr) . Якщо \BbbT має лiво-розсiяний максимум M, то визначимо \BbbT k = \BbbT \setminus \{ M\} ; у протилежному випадку покладемо \BbbT k = \BbbT . Функцiя f : \BbbT \rightarrow \BbbR d називається \Delta -диференцiйовною в точцi t \in \BbbT k, якщо границя f\Delta (t) = \mathrm{l}\mathrm{i}\mathrm{m} s\rightarrow t f(\sigma (t)) - f(s) \sigma (t) - s iснує в \BbbR d. Нагадаємо вiдомi результати (див. [3]): a) якщо t \in \BbbT k — право-гранична точка \BbbT , то f — \Delta -диференцiйовна в t тодi i тiльки тодi, коли границя f\Delta (t) = \mathrm{l}\mathrm{i}\mathrm{m} s\rightarrow t f(t) - f(s) t - s iснує в \BbbR d; b) якщо t \in \BbbT k — право-розсiяна точка \BbbT i f є неперервною по t, тоf — \Delta -диференцiйовна в t i f\Delta (t) = f(\sigma (t)) - f(t) \mu (t) . Наступна теорема є аналогом похiдної складної функцiї. Теорема 1 [16]. Нехай V : \BbbT \times \BbbR \rightarrow \BbbR , V \in C1(\BbbT \times \BbbR ) i функцiя x : \BbbT \rightarrow \BbbR є \Delta - диференцiйовною. Припустимо, що z : \BbbT \rightarrow \BbbR , z(\cdot ) = V (\cdot , x(\cdot )). Тодi для t0 \in \BbbT k i x0 = x(t0) функцiя z є \Delta -диференцiйовною i має мiсце формула z\Delta (t0) = 1\int 0 \partial V \partial x \bigl( \sigma (t0), x0 + h\mu (t0)x \Delta (t0) \bigr) dhx\Delta (t0) + \partial V \Delta t (t0, x0). Для будь-яких a, b \in \BbbT i довiльного s \in [a, b)\BbbT \cap \mathrm{R}\mathrm{D} покладемо \scrV b s = \bigl\{ \beta \geq 0 : s+ \beta \in [s, b)\BbbT \bigr\} . 2. Постановка задачi. Властивостi функцiї Беллмана. Нехай \BbbT — така часова шкала, що \mathrm{s}\mathrm{u}\mathrm{p}\BbbT = +\infty i t0, t1 \in \BbbT ; Q = [t0, t1)\BbbT \times \BbbR d, Q = [t0, t1]\BbbT \times \BbbR d; замикання множини Q, а \partial Q = \{ t1\} \times \BbbR d — її границя. Розглянемо сiм’ю задач оптимального керування на вiдрiзку [t, t1]\BbbT , t \in [t0, t1)\BbbT : x\Delta = f(t, x, u), (1) ISSN 1027-3190. Укр. мат. журн., 2017, т. 69, № 7 В’ЯЗКI РОЗВ’ЯЗКИ РIВНЯННЯ ГАМIЛЬТОНА – ЯКОБI – БЕЛЛМАНА НА ЧАСОВИХ ШКАЛАХ 935 x(t) = x, (2) J(t, x, u) = \int [t,t1)\BbbT L \bigl( s, x(s), u(s) \bigr) \Delta s+ \psi \bigl( x(t1) \bigr) \rightarrow \mathrm{i}\mathrm{n}\mathrm{f} . (3) Тут x \in \BbbR d — фазовий вектор, u = u(t) — вектор керування. Нехай U \subset \BbbR m — компакт в \BbbR m. Допустимими керуваннями u = u(t) вважаємо функцiї з класу \scrU (t) = L\infty ([t, t1]\BbbT , U) обмеже- них, \Delta -вимiрних [3] функцiй, якi визначенi на [t, t1]\BbbT i набувають значень в U. Стандартним чином вводиться функцiя Беллмана V (t, x) = \mathrm{i}\mathrm{n}\mathrm{f} u(\cdot )\in \scrU (t) J(t, x, u). (4) Вiдносно функцiй f : [t0, t1]\BbbT \times \BbbR d \times U \rightarrow \BbbR d, L : [t0, t1]\BbbT \times \BbbR d \times U \rightarrow \BbbR 1 i \psi : \BbbR d \rightarrow \BbbR 1 будемо вважати виконаними такi умови: 1) f — неперервна за сукупнiстю аргументiв функцiя, задовольняє глобальну по x умову Лiпшиця зi сталою K; 2) L i \psi — неперервнi за своїми аргументами функцiї, що задовольняють за змiнною x глобальну умову Лiпшиця зi сталою K. Щодо властивостей функцiї Беллмана справедливою є така теорема. Теорема 2. Нехай функцiї f, L i \psi задовольняють умови 1 i 2. Тодi функцiя Беллмана є локально обмеженою i локально лiпшицевою в Q. Доведення. Зафiксуємо r > 0 i розглянемо Br = \{ x \in \BbbR d : \| x\| \leq r\} — кулю радiуса r. Виберемо (t, x), (t, y) \in Q так, щоб x, y \in Br i u(\cdot ) \in \scrU (t). Нехай x(\cdot ) i y(\cdot ) — такi розв’язки рiвняння (1), що x(t) = x, y(t) = y вiдповiдно. Тодi для s \in [t, t1]\BbbT внаслiдок неперервностi функцiї f i компактностi U маємо\bigm\| \bigm\| x(s)\bigm\| \bigm\| \leq \| x\| + \int [t,s)\BbbT K \| x(s)\| \Delta s+ \int [t,s)\BbbT \bigm\| \bigm\| f(s, 0, u(s))\bigm\| \bigm\| \Delta s \leq \| x\| +A+ \int [t,s)\BbbT K \| x(s)\| \Delta s. (5) З аналога нерiвностi Гронуолла для часових шкал [2, с. 257] при s \in [t, t1]\BbbT отримуємо \| x(t)\| \leq (r +A)eK(s, t), (6) де eK(s, t) — експоненцiальна функцiя [1, 2]. Для подальшого доведення нам потрiбна така лема. Лема 1. Експоненцiальна функцiя eK(t, t0) обмежена на [t0, t1]\BbbT з оцiнкою, що не зале- жить вiд часової шкали. Доведення. Вiдомо, що eK(t, t0) — розв’язок задачi Кошi x\Delta = Kx, x(t0) = 1. Тодi x(t) = 1 +K \int [t0,t)\BbbT x(\tau )\Delta \tau . (7) Розв’язуючи (7) методом послiдовних наближень, маємо ISSN 1027-3190. Укр. мат. журн., 2017, т. 69, № 7 936 В. Я. ДАНIЛОВ, О. Є. ЛАВРОВА, О. М. СТАНЖИЦЬКИЙ \| x1(t)\| \leq 1 +K \int [t0,t)\BbbT \Delta s \leq 1 +K(t - t0). Тому з леми 3 [4] отримуємо \| x2(t)\| \leq 1 +K \int [t0,t)\BbbT \| x1(s)\| \Delta s \leq 1 +K(t - t0) + K2(t - t0) 2 2 . Отже, для всiх n \in \BbbN \| xn(t)\| \leq eK(t - t0), що i доводить лему 1. Звiдси i з леми 1 для t \in [t0, t1]\BbbT i x \in Br випливає нерiвнiсть \| x(t)\| \leq (r +A)eK(t1 - t0) = A1. (8) Тодi локальна обмеженiсть функцiї Беллмана легко випливає з обмеженостi L i \psi для t \in \in [t0, t1]\BbbT , \| x\| \leq A1 i u \in U. Для s \in [t, t1]\BbbT справджується оцiнка \| x(s) - y(s)\| \leq \| x - y\| eK(s, t). (9) З (9) i леми 1 отримуємо оцiнку \bigm\| \bigm\| x(s) - y(s) \bigm\| \bigm\| \leq C1\| x - y\| (10) для довiльних s \in [t, t1]\BbbT , x \in \BbbR d i деякої сталої C1 > 0, що не залежить вiд t, x, u. Отже,\bigm\| \bigm\| J(t, x, u) - J(t, y, u) \bigm\| \bigm\| \leq \int [t,t1)\BbbT \bigm\| \bigm\| L(s, x(s), u(s)) - L(s, y(s), u(s)) \bigm\| \bigm\| \Delta s+ \bigm\| \bigm\| \psi (x(t1)) - \psi (y(t1)) \bigm\| \bigm\| \leq \leq KC1(t1 - t)\| x - y\| +KC1\| x - y\| \leq C2\| x - y\| . (11) Таким чином, з (11) випливає, що\bigm\| \bigm\| V (t, x) - V (t, y) \bigm\| \bigm\| \leq \mathrm{s}\mathrm{u}\mathrm{p} u(\cdot )\in \scrU (t) \bigm\| \bigm\| J(t, x, u) - J(t, y, u) \bigm\| \bigm\| \leq C3\| x - y\| . (12) Зафiксуємо (t, x) \in Q, \| x\| \leq r, \tau \in [t, t1]\BbbT i u(\cdot ) \in \scrU (t). Звуження u(\cdot ) на [\tau , t1] є елементом \scrU (\tau ), яке ми знову позначимо через u(\cdot ). В цих позначеннях з урахуванням (11) маємо\bigm\| \bigm\| J(t, x, u) - J(\tau , x, u) \bigm\| \bigm\| \leq \bigm\| \bigm\| J(t, x, u) - J(\tau , x(\tau ), u) \bigm\| \bigm\| + \bigm\| \bigm\| J(\tau , x(\tau ), u) - J(\tau , x, u) \bigm\| \bigm\| \leq \leq \bigm\| \bigm\| \bigm\| \bigm\| \bigm\| \bigm\| \bigm\| \int [t,\tau )\BbbT L(s, x(s), u(s))\Delta s \bigm\| \bigm\| \bigm\| \bigm\| \bigm\| \bigm\| \bigm\| + \bigm\| \bigm\| J(\tau , x(\tau ), u) - J(\tau , x, u) \bigm\| \bigm\| \leq C(r)\| \tau - t\| + C2\| x(\tau ) - x\| . (13) Стала C(r) внаслiдок локальної обмеженостi L залежить вiд r, але x(\tau ) = x+ \int [t,\tau )\BbbT f(s, x(s), u(s))\Delta s. ISSN 1027-3190. Укр. мат. журн., 2017, т. 69, № 7 В’ЯЗКI РОЗВ’ЯЗКИ РIВНЯННЯ ГАМIЛЬТОНА – ЯКОБI – БЕЛЛМАНА НА ЧАСОВИХ ШКАЛАХ 937 Тодi з обмеженостi f на t \in [t0, t1]\BbbT , \| x\| \leq r, u \in U маємо\bigm\| \bigm\| x(\tau ) - x \bigm\| \bigm\| \leq C(r)\| \tau - t\| . Таким чином iз (13) отримуємо\bigm\| \bigm\| V (t, x) - V (\tau , x) \bigm\| \bigm\| \leq \mathrm{s}\mathrm{u}\mathrm{p} u(\cdot )\in \scrU (t) \bigm\| \bigm\| J(t, x, u) - J(\tau , x, u) \bigm\| \bigm\| \leq C(r)\| \tau - t\| + C2C\| \tau - t\| =C4(r)\| \tau - t\| . (14) Тодi з (12) i (14) для (t, x) i (s, y) \in Q маємо\bigm\| \bigm\| V (t, x) - V (s, y) \bigm\| \bigm\| \leq \bigm\| \bigm\| V (t, x) - V (s, x) \bigm\| \bigm\| + \bigm\| \bigm\| V (s, x) - V (s, y) \bigm\| \bigm\| \leq C4(r)\| t - s\| + C3\| x - y\| , що i доводить теорему. Зауваження 1. Якщо функцiї f, L, \psi обмеженi, то з доведення теореми в цьому випадку можна легко отримати, що функцiя Беллмана є глобально лiпшицевою по x, t i глобально обмеженою. 3. В’язкi розв’язки на часових шкалах. 3.1. Абстрактний принцип динамiчного про- грамування. В роботi [16] для часової шкали отримано аналог принципу динамiчного програ- мування V (t, x) = \mathrm{i}\mathrm{n}\mathrm{f} u(\cdot )\in \scrU (t) \left[ \int [t,\tau )\BbbT L(s, x(s), u(s))\Delta s+ V (\tau , x(\tau )) \right] \forall \tau \in [t, t1]\BbbT . (15) Там же, а також у роботi [13] для бiльш загальної ситуацiї введено аналог рiвняння Гамiльтона – Якобi – Беллмана на часових шкалах V \Delta t (t, x) + \mathrm{m}\mathrm{i}\mathrm{n} v\in U \left\{ 1\int 0 V \prime x(\sigma (t), x+ h\mu (t)f(t, x, v))dhf(t, x, v) + L(t, x, v) \right\} = 0 (16) з граничною умовою V (t1, x) = \psi (x), x \in \BbbR d. (17) Рiвняння (16) запишемо у бiльш природному виглядi, що фiгурує в неперервному випадку: - V \Delta t (t, x) + \mathrm{s}\mathrm{u}\mathrm{p} v\in U \left\{ - 1\int 0 V \prime x(\sigma (t), x+ h\mu (t)f(t, x, v))dhf(t, x, v) - L(t, x, v) \right\} = 0. (18) Останнє рiвняння в право-граничних точках набирає вигляду класичного рiвняння Гамiль- тона – Якобi – Беллмана - \partial V (t, x) \partial t +H \biggl( t, x, \partial V (t, x) \partial x \biggr) = 0, де H(t, x, p) = \mathrm{s}\mathrm{u}\mathrm{p}v\in V \bigl\{ - f(t, x, v)p - L(t, x, v) \bigr\} — гамiльтонiан. Нехай t0 \leq t \leq r \leq t1, t, r \in \BbbT . Визначимо для обмеженої знизу функцiї \psi (x) : \BbbR d \rightarrow \BbbR 1 i функцiї u(\cdot ) \in \scrU (t) ISSN 1027-3190. Укр. мат. журн., 2017, т. 69, № 7 938 В. Я. ДАНIЛОВ, О. Є. ЛАВРОВА, О. М. СТАНЖИЦЬКИЙ Tt,r;u\psi (x) = \int [t,r)\BbbT L(s, x(s), u(s))\Delta s+ \psi (x(r)). (19) Тут x(s) — розв’язок рiвняння (1) з початковою умовою x(t) = x. За допомогою (19) утворимо нелiнiйну напiвгрупу (\scrT t,r\psi )(x) = \mathrm{i}\mathrm{n}\mathrm{f} u(\cdot )\in \scrU (t) Tt,r;u\psi (x). (20) Оскiльки L i \psi — обмеженi знизу функцiї, то i \scrT t,r\psi також обмежена знизу. Зрозумiло, що \scrT t,r — монотонний оператор, тобто \scrT t,r\phi \leq \scrT t,r\psi , якщо \phi \leq \psi . (21) Таким чином, принцип динамiчного програмування можна записати у виглядi\bigl( \scrT t,t1\psi \bigr) (x) = \bigl( \scrT t,r(\scrT r,t1\psi ) \bigr) (x) (22) для довiльного t0 \leq t \leq r \leq t1, t0, t, r, t1 \in \BbbT . Отже, напiвгрупова властивiсть для \scrT t,r виконується при r = t1. Неважко бачити, що без будь-яких змiн можна отримати (15) на довiльному вiдрiзку [t, s]\BbbT , s \in \BbbT , s \in [t, t1]\BbbT . Звiдси випливає напiвгрупова властивiсть (\scrT t,s\psi )(x) = \bigl( \scrT t,r(\scrT r,s\psi ) \bigr) (x). (23) З (20) випливає, що функцiя Беллмана має вигляд V (t, x) = (\scrT t,t1\psi )(x). Тодi, викорис- товуючи напiвгрупову властивiсть (23), переконуємося, що функцiя Беллмана задовольняє спiв- вiдношення V (t, x) = \bigl( \scrT t,rV (r, \cdot ) \bigr) (x) (24) для довiльного x \in \BbbR d, t0 \leq t \leq r \leq t1, t0, t, r, t1 \in \BbbT . Спiввiдношення (24) назвемо абстрактним принципом динамiчного програмування. 3.2. Генератор напiвгрупи \{ \bfscrT \bfitt ,\bfitr \} i означення в’язкого розв’язку. Введемо поняття генера- тора Gt напiвгрупи \{ \scrT t,r\} . На вiдмiну вiд неперервної часової шкали (\BbbR 1) (див., наприклад, [9]) тут потрiбно розрiзняти випадки \mu (t) > 0 i \mu (t) = 0. Вiзьмемо довiльне t \in [t0, t1)\BbbT , тодi: 1) якщо \mu (t) > 0, то покладемо (Gtw(t, \cdot ))(x) = 1 \mu (t) \bigl[ (\scrT t,\sigma (t)w(\sigma (t), \cdot ))(x) - w(t, x) \bigr] ; (25) 2) якщо \mu (t) = 0, то (Gtw(t, \cdot ))(x) = \mathrm{l}\mathrm{i}\mathrm{m} h\downarrow 0 1 h \bigl[ (\scrT t,t+hw(t+ h, \cdot ))(x) - w(t, x) \bigr] , (26) де h \in \scrV t1 t = \bigl\{ \beta \geq 0 : t+ \beta \in [t, t1]\BbbT \bigr\} . Позначимо через Dt область визначення генератора Gt, тобто тi функцiї w(t, x), для яких мають змiст спiввiдношення (25), (26). Якщо W (t, \cdot ) \in Dt для всiх t \in [t0, t1]\BbbT , то з (24) формально отримуємо (GtW (t, \cdot ))(x) = 0, (t, x) \in Q. (27) ISSN 1027-3190. Укр. мат. журн., 2017, т. 69, № 7 В’ЯЗКI РОЗВ’ЯЗКИ РIВНЯННЯ ГАМIЛЬТОНА – ЯКОБI – БЕЛЛМАНА НА ЧАСОВИХ ШКАЛАХ 939 Означення 1. Рiвняння (27) називається абстрактним рiвнянням динамiчного програму- вання. Означення 2. Функцiя W (t, x) \in Dt називається класичним розв’язком рiвняння (27), якщо W задовольняє (27) для всiх (t, x) \in Q. Взагалi, функцiя Беллмана не завжди належить Dt i, таким чином, вона не є класичним розв’язком рiвняння (27). У зв’язку з цим, як i в неперервному випадку, введемо поняття в’язкого розв’язку. Однак у розглядуваному випадку, у порiвняннi з неперервним випадком, є деяка вiдмiннiсть в областi Dt визначення генератора Gt. Звiсно, якщо \mu (t) = 0, то для iснування границi (26) вимагається деяка гладкiсть функцiї w(t, x). Але якщо \mu (t) > 0, то генератор Gt визначається спiввiдношенням (25), яке визначене, наприклад, для неперервних, обмежених знизу функцiй, зокрема i для самої функцiї Беллмана V. Останнє приводить до наступної концепцiї в’язкого розв’язку. Нехай Q = [t0, t1)\BbbT \times \BbbR d, Dt — область визначення Gt. Покладемо: 1) якщо \mu (t) > 0, то Dt = C(Q) \cap M(Q), тут M(Q) — множина всiх обмежених знизу функцiй; 2) якщо \mu (t) = 0, то Dt = C1(Q) \cap M(Q), при цьому похiдна по t розумiється, звiсно, як \Delta -похiдна. Означення 3. Нехай W \in C(Q) \cap M(Q). Тодi: 1) W — в’язкий суброзв’язок рiвняння (27) у Q, якщо: а) в довiльнiй точцi (t, x) \in Q такiй, що \mu (t) > 0, W (t, x) задовольняє (27); б) для довiльного w \in Dt (Gtw(t, \cdot ))(x) \geq 0 (28) в кожнiй точцi (\=t, \=x) \in Q такiй, що \mu (t) = 0 i (\=t, \=x) є точкою максимуму W - w в Q, а також W (\=t, \=x) = w(\=t, \=x); 2) W — в’язкий суперрозв’язок рiвняння (27) у Q, якщо: в) виконано умову а) з пункту 1; г) для кожного w \in Dt (Gtw(t, \cdot ))(x) \leq 0 (29) в кожнiй точцi (\=t, \=x) \in Q такiй, що \mu (t) = 0 i (\=t, \=x) є точкою мiнiмуму W - w в Q, а також W (\=t, \=x) = w(\=t, \=x); 3) функцiя W є в’язким розв’язком рiвняння (27) у Q, якщо вона одночасно є i суброзв’язком, i суперрозв’язком рiвняння (27) в Q. Встановимо умови, при яких функцiя Беллмана є в’язким розв’язком. Теорема 3. Нехай виконуються такi умови: 1) f : [t0, t1]\BbbT \times \BbbR d \times U \rightarrow \BbbR d, L : [t0, t1]\BbbT \times \BbbR d \times U \rightarrow \BbbR 1 i \psi : \BbbR d \rightarrow \BbbR 1; 2) f — неперервна по (t, x, u)функцiя iз областi визначення, L i \psi — рiвномiрно неперервнi функцiї в Q\times U i \BbbR d вiдповiдно; 3) f, L, \psi — глобально обмеженi функцiї зi сталою C, що задовольняють за змiнною x глобальну умову Лiпшиця зi сталою K. Тодi функцiя Беллмана V (t, x) є в’язким розв’язком рiвняння (27) у Q. ISSN 1027-3190. Укр. мат. журн., 2017, т. 69, № 7 940 В. Я. ДАНIЛОВ, О. Є. ЛАВРОВА, О. М. СТАНЖИЦЬКИЙ Доведення. Функцiя Беллмана визначається таким чином: V (t, x) = (\scrT t,t1\psi )(x). Згiдно iз зауваженням 1, функцiя Беллмана є глобально лiпшицевою по x, t i глобально обмеженою. Покажемо, що V (t, x) є в’язким суброзв’язком. Якщо точка t \in \mathrm{R}\mathrm{S}, то з (24) i (25) маємо (27). Нехай точка t \in \mathrm{R}\mathrm{D}, w \in Dt i (t, x) \in Q є точкою максимуму V - w в Q, що задовольняє V (t, x) = w(t, x). Тодi w(t, x) \geq V (t, x). Використовуючи напiвгрупову властивiсть (23) для s = t1 i r \in [t, t1]\BbbT , отримуємо w(r, x) \geq V (r, x) = (\scrT r,t1\psi (\cdot ))(x). Тодi з властивостi монотонностi (21) маємо\bigl( \scrT t,rw(r, \cdot ) \bigr) (x) \geq \scrT t,r (\scrT r,t1\psi (\cdot ))(x). Отже, \bigl( \scrT t,rw(r, \cdot ) \bigr) (x) \geq \bigl( \scrT t,t1\psi (\cdot ) \bigr) (x) = V (t, x) = w(t, x). Таким чином, для довiльного h \in \scrV t1 t , поклавши r = t+ h, одержимо \bigl( Gtw(t, \cdot ) \bigr) (x) = \mathrm{l}\mathrm{i}\mathrm{m} h\downarrow 0 1 h \bigl[ (\scrT t,t+hw(t+ h, \cdot ))(x) - w(t, x) \bigr] \geq 0. Отже, функцiя V є в’язким суброзв’язком рiвняння (27). Той факт, що функцiя V є супер- розв’язком, доводиться аналогiчно. Вивчимо тепер зв’язок мiж поняттям класичного розв’язку i поняттям в’язкого розв’язку. Як i в класичному (неперервному) випадку (див., наприклад, [9], лема 5.1) має мiсце наступна пропозицiя. Пропозицiя 1. Припустимо, що W (t, x) \in Dt. W є в’язким розв’язком рiвняння (27) у Q тодi i тiльки тодi, коли W є класичним розв’язком рiвняння (27). Доведення. Згiдно з означенням 3, в право-розсiяних точках має виконуватись рiвнiсть (GtW (t, \cdot ))(x) = 0 як для суброзв’язку, так i суперрозв’язку. Але, згiдно з означенням 2, така ж рiвнiсть виконується i для класичного розв’язку рiвняння (27). Для право-граничних точок доведення аналогiчне неперервному випадку ([9], лема 5.1). З’ясуємо тепер вигляд генератора Gt в розглядуваному випадку. Знову будемо розрiзняти випадки право-розсiяних i право-граничних точок. Вiзьмемо довiльне (t, x) \in Q. 1. Випадок \mu (t) > 0. Нехай v — довiльна точка з U, u(\cdot ) \in \scrU — таке керування, що u(t) = v, i x(t) — траєкторiя, що вiдповiдає керуванню u(\cdot ) i початковiй умовi x(t) = x. Нехай w(t, x) \in Dt, тобто w \in C(Q) \cap M(Q). Тодi, згiдно з (25), отримуємо (Gtw(t, \cdot ))(x) = 1 \mu (t) \bigl[ \bigl( \scrT t,\sigma (t)w(\sigma (t), \cdot ) \bigr) (x) - w(t, x) \bigr] \leq \leq 1 \mu (t) \left[ \int [t,\sigma (t))\BbbT L(s, x(s), u(s))\Delta s+ w(\sigma (t), x(\sigma (t))) - w(t, x) \right] = = 1 \mu (t) \bigl[ - w(t, x) - ( - w(\sigma (t), x+ \mu (t)f(t, x, v)) - L(t, x, v)\mu (t)) \bigr] . ISSN 1027-3190. Укр. мат. журн., 2017, т. 69, № 7 В’ЯЗКI РОЗВ’ЯЗКИ РIВНЯННЯ ГАМIЛЬТОНА – ЯКОБI – БЕЛЛМАНА НА ЧАСОВИХ ШКАЛАХ 941 Отже, (Gtw(t, \cdot ))(x) \leq 1 \mu (t) \bigl[ - w(t, x) - \{ - w(\sigma (t), x+ \mu (t)f(t, x, v)) - L(t, x, v)\mu (t)\} \bigr] . Ця нерiвнiсть виконується для всiх v \in U, а тому (Gtw(t, \cdot ))(x) \leq 1 \mu (t) \Bigl[ - w(t, x) - \mathrm{s}\mathrm{u}\mathrm{p} v\in U \{ - w(\sigma (t), x+ \mu (t)f(t, x, v)) - L(t, x, v)\mu (t)\} \Bigr] . (30) З iншого боку, оскiльки \bigl( \scrT t,\sigma (t)w(\sigma (t), \cdot ) \bigr) (x) = \mathrm{i}\mathrm{n}\mathrm{f} u(\cdot )\in \scrU (t) \left\{ \int [t,\sigma (t))\BbbT L(s, x(s), u(s))\Delta s+ w \bigl( \sigma (t), x(\sigma (t)) \bigr) \right\} , то для довiльного \varepsilon > 0 iснують допустиме керування u\varepsilon (\cdot ) i вiдповiдна траєкторiя x\varepsilon (\cdot ) такi, що \bigl( \scrT t,\sigma (t)w(\sigma (t), \cdot ) \bigr) (x) \geq \int [t,\sigma (t))\BbbT L(s, x\varepsilon (s), u\varepsilon (s))\Delta s+ w \bigl( \sigma (t), x\varepsilon (\sigma (t)) \bigr) - \varepsilon . Тодi 1 \mu (t) \bigl[ (\scrT t,\sigma (t)w(\sigma (t),\cdot ))(x) - w(t, x) \bigr] \geq L(t, x, u\varepsilon (t)) - \varepsilon \mu (t) + 1 \mu (t) \bigl[ w \bigl( \sigma (t), x\varepsilon (\sigma (t)) \bigr) - w(t, x) \bigr] = = 1 \mu (t) \bigl[ - w(t, x) + \bigl\{ w \bigl( \sigma (t), x+ \mu (t)f(t, x, u\varepsilon (t)) \bigr) + L(t, x, u\varepsilon (t))\mu (t) \bigr\} \bigr] - \varepsilon \mu (t) \geq \geq 1 \mu (t) \biggl[ - w(t, x) + \mathrm{i}\mathrm{n}\mathrm{f} v\in U \bigl\{ w(\sigma (t), x+ \mu (t)f(t, x, v)) + L(t, x, v)\mu (t) \bigr\} \biggr] - \varepsilon \mu (t) . (31) Остання нерiвнiсть виконується для довiльного \varepsilon > 0, отже, маємо 1 \mu (t) \bigl[ (\scrT t,\sigma (t)w(\sigma (t), \cdot ))(x) - w(t, x) \bigr] \geq \geq 1 \mu (t) \biggl[ - w(t, x) - \mathrm{s}\mathrm{u}\mathrm{p} v\in U \bigl\{ - w(\sigma (t), x+ \mu (t)f(t, x, v)) - L(t, x, v)\mu (t) \bigr\} \biggr] . Звiдси i з (30) для право-розсiяних точок отримуємо (Gtw(t, \cdot ))(x) = 1 \mu (t) \biggl[ - w(t, x) - \mathrm{s}\mathrm{u}\mathrm{p} v\in U \bigl\{ - w(\sigma (t), x+ \mu (t)f(t, x, v)) - L(t, x, v)\mu (t) \bigr\} \biggr] . (32) 2. Випадок \mu (t) = 0. В цьому випадку Dt = C1(Q) \cap M(Q). Нехай знову v — довiльна точка з U, u(\cdot ) \in \scrU (t) — таке керування, що \mathrm{l}\mathrm{i}\mathrm{m}s\downarrow t u(s) = v, а x(\cdot ) — фазова траєкторiя, яка вiдповiдає керуванню u(\cdot ) i початковiй умовi x(t) = x. Для h \in \scrV t1 t маємо 1 h \bigl[ (\scrT t,t+hw(t+ h, \cdot ))(x) - w(t, x) \bigr] \leq ISSN 1027-3190. Укр. мат. журн., 2017, т. 69, № 7 942 В. Я. ДАНIЛОВ, О. Є. ЛАВРОВА, О. М. СТАНЖИЦЬКИЙ \leq 1 h \int [t,t+h)\BbbT L(s, x(s), u(s))\Delta s+ 1 h \bigl[ w(t+ h, x(t+ h)) - w(t, x) \bigr] = = 1 h \left( \int [t,t+h)\BbbT L(s, x(s), u(s))\Delta s+ \int [t,t+h)\BbbT d \Delta t w(s, x(s))\Delta s \right) = = 1 h \int [t,t+h)\BbbT L(s, x(s), u(s))\Delta s+ + 1 h \int (t,t+h]\BbbT \left[ \partial w \partial \Delta t (s, x(s)) + 1\int 0 \partial w \partial x (\sigma (s), x(s) + \mu (s)\tau x\Delta (s))d\tau \cdot x\Delta (s) \right] \Delta s. (33) Перетворення другого iнтеграла проведено за допомогою аналога формули диференцiювання складної функцiї (теорема 1). Але \bigl( x(s), u(s) \bigr) \rightarrow \bigl( x(t), u(t) \bigr) при s \downarrow t, а L є неперервною, тому з (33) отримуємо \bigm\| \bigm\| \bigm\| \bigm\| \bigm\| \bigm\| \bigm\| 1 h \int [t,t+h)\BbbT L(s, x(s), u(s))\Delta s - L(t, x, v) \bigm\| \bigm\| \bigm\| \bigm\| \bigm\| \bigm\| \bigm\| \leq \leq 1 h \int [t,t+h)\BbbT \| L(s, x(s), u(s)) - L(t, x, v)\| \Delta s\rightarrow 0, h\rightarrow 0. Тодi 1 h \int [t,t+h)\BbbT L(s, x(s), u(s))\Delta s\rightarrow L(t, x, v), h\rightarrow 0. (34) Аналогiчно, враховуючи гладкiсть w(t, x), одержуємо 1 h \int [t,t+h)\BbbT \partial \Delta t w(s, x(s))\Delta s\rightarrow \partial \Delta t w(t, x). (35) Далi \bigm\| \bigm\| \bigm\| \bigm\| \bigm\| \bigm\| \bigm\| 1 h \int [t,t+h)\BbbT 1\int 0 \partial \partial x w(\sigma (s), x(s) + \mu (s)f(s, x(s), u(s))\tau ) d\tau \times \times f(s, x(s), u(s))\Delta s - \partial \partial x w(t, x)f(t, x, v) \bigm\| \bigm\| \bigm\| \bigm\| \bigm\| \bigm\| \bigm\| \leq \leq 1 h \int [t,t+h)\BbbT \left( 1\int 0 \bigm\| \bigm\| \bigm\| \bigm\| \partial \partial xw(\sigma (s), x(s) + \mu (s)f(s, x(s), u(s))\tau ) - \partial \partial x w(t, x) \bigm\| \bigm\| \bigm\| \bigm\| \times ISSN 1027-3190. Укр. мат. журн., 2017, т. 69, № 7 В’ЯЗКI РОЗВ’ЯЗКИ РIВНЯННЯ ГАМIЛЬТОНА – ЯКОБI – БЕЛЛМАНА НА ЧАСОВИХ ШКАЛАХ 943 \times \bigm\| \bigm\| f(s, x(s), u(s))\bigm\| \bigm\| d\tau + \bigm\| \bigm\| \bigm\| \bigm\| \partial \partial xw(t, x) \bigm\| \bigm\| \bigm\| \bigm\| \bigm\| \bigm\| f(s, x(s), u(s)) - f(t, x, v) \bigm\| \bigm\| \right) \Delta s. (36) Очевидно, що \sigma (s) \rightarrow t при s\rightarrow t i \mu (s) \rightarrow 0 при s\rightarrow t. Тодi з обмеженостi i неперервнос- тi f, а також iз гладкостi w випливає, що вираз (36) прямує до нуля при h \rightarrow 0. Отже, з (33) – (36) маємо \mathrm{l}\mathrm{i}\mathrm{m} h\downarrow 0 \mathrm{s}\mathrm{u}\mathrm{p} 1 h \Bigl[ \bigl( \scrT t,t+hw(t+ h, \cdot ) \bigr) (x) - w(t, x) \Bigr] \leq \leq \partial w \Delta t (t, x) - \mathrm{s}\mathrm{u}\mathrm{p} v\in U \biggl\{ - \partial w \partial x (t, x)f(t, x, v) - L(t, x, v) \biggr\} = = \partial w \Delta t (t, x) - H \biggl( t, x, \partial w \partial x (t, x) \biggr) . (37) Тут H(t, x, p) = \mathrm{s}\mathrm{u}\mathrm{p}v\in U \bigl\{ - f(t, x, v)p - L(t, x, v) \bigr\} — гамiльтонiан. Зафiксуємо (t, x) \in Q, u(\cdot ) \in \scrU (t). Нехай x(\cdot ) — розв’язок рiвняння (1), який вiдповiдає керуванню u(\cdot ). Оскiльки точка t є право-граничною, то iснує послiдовнiсть hn \in \scrV t1 t (hn \rightarrow \rightarrow 0, n\rightarrow \infty ). Виберемо допустиме керування un(\cdot ) \in \scrU (t) i через xn(s) позначимо траєкторiю, яка вiдповiдає керуванню un(\cdot ) з виконанням нерiвностi \bigl( \scrT t,t+hnw(t+ hn, \cdot ) \bigr) (x) \geq - h2n + \int [t,t+hn)\BbbT L \bigl( s, xn(s), un(s) \bigr) \Delta s+ w \bigl( t+ hn, x n(t+ hn) \bigr) . (38) Tодi 1 hn \Bigl[ \bigl( \scrT t,t+hnw(t+ hn, \cdot ) \bigr) (x) - w(t, x) \Bigr] \geq \geq - hn + 1 hn \int [t,t+hn)\BbbT L \bigl( s, xn(s), un(s) \bigr) \Delta s+ 1 hn \Bigl[ w \bigl( t+ hn, x n(t+ hn) \bigr) - w(t, x) \Bigr] = = - hn + 1 hn \int [t,t+hn)\BbbT \left[ L\bigl( s, xn(s), un(s)\bigr) + 1\int 0 \partial \partial x w(\sigma (s), xn(s) + \mu (s)f \bigl( s, xn(s), un(s) \bigr) \tau ) d\tau \times \times f \bigl( s, xn(s), un(s) \bigr) + \partial \Delta t w \bigl( s, xn(s) \bigr) \right] \Delta s = = \partial \Delta t w(t, x) + 1 hn \int [t,t+hn)\BbbT L \bigl( t, x, un(s) \bigr) \Delta s+ + 1 hn \int [t,t+hn)\BbbT \partial \partial x w(t, x)f \bigl( t, x, un(s) \bigr) \Delta s+ p(n), (39) де ISSN 1027-3190. Укр. мат. журн., 2017, т. 69, № 7 944 В. Я. ДАНIЛОВ, О. Є. ЛАВРОВА, О. М. СТАНЖИЦЬКИЙ p(n) = - hn + 1 hn \int [t,t+hn)\BbbT \Bigl( L \bigl( s, xn(s), un(s) \bigr) - L \bigl( t, x, un(s) \bigr) \Bigr) \Delta s+ + 1 hn \int [t,t+hn)\BbbT \biggl[ \partial \Delta t w(s, xn(s)) - \partial \Delta t w(t, x) \biggr] \Delta s - - 1 hn \int [t,t+hn)\BbbT 1\int 0 \partial \partial x w(t, x)f \bigl( t, x, un(s) \bigr) \Delta s+ + 1 hn \int [t,t+hn)\BbbT 1\int 0 \partial \partial x w \Bigl( \sigma (s), xn(s) + \mu (s)f \bigl( s, xn(s), un(s) \bigr) \tau \Bigr) d\tau f \bigl( s, xn(s), un(s) \bigr) \Delta s. (40) Оскiльки функцiя f є обмеженою, то \| x(s) - x\| \leq \int [t,s)\BbbT \bigm\| \bigm\| f(\tau , x(\tau ), u(\tau ))\bigm\| \bigm\| \Delta \tau \leq C(s - t), (41) а тому x(s) \rightarrow x, s\rightarrow t. (42) Оцiнка (41) показує, що xn(s) \rightarrow x при s \rightarrow t рiвномiрно по n. Тому з неперервностi L i f, як i для (34) – (36), маємо p(n) \rightarrow 0, n\rightarrow \infty . (43) Запишемо (39) у формi 1 hn \bigl[ (\scrT t,t+hnw(t+ hn, \cdot ))(x) - w(t, x) \bigr] \geq \partial \Delta t w(t, x) - \biggl\{ - \partial \partial x w(t, x)Fn - Ln \biggr\} + p(n), де (Fn, Ln) = 1 hn \int [t,t+hn)\BbbT \bigl( f(t, x, un(s)), L(t, x, un(s)) \bigr) \Delta s. Покладемо FL(t, x) = \Bigl\{ (f, l) \in \BbbR d+1 : (f, l) = (f(t, x, v), L(t, x, v)), v \in U \Bigr\} . Переходом до розширення \~un(s) на ввесь iнтервал [t, t+ hn] таким чином: \~un(t) = \left\{ u n(t), t \in [t, t+ hn], un(r), t \in [r, \sigma (r)), де r \in \mathrm{R}\mathrm{S}, i переходом до звичайного iнтеграла можна показати, що (Fn, Ln) належить опуклiй замкненiй оболонцi co \bigl[ FL(t, x) \bigr] множини FL(t, x). Отже, 1 hn \bigl[ \bigl( \scrT t,t+hnw(t+ hn, \cdot ) \bigr) (x) - w(t, x) \bigr] \geq ISSN 1027-3190. Укр. мат. журн., 2017, т. 69, № 7 В’ЯЗКI РОЗВ’ЯЗКИ РIВНЯННЯ ГАМIЛЬТОНА – ЯКОБI – БЕЛЛМАНА НА ЧАСОВИХ ШКАЛАХ 945 \geq \partial \Delta t w(t, x) - \mathrm{s}\mathrm{u}\mathrm{p} v\in U \biggl\{ - \partial \partial x w(t, x)f(t, x, v) - L(t, x, v) \biggr\} + p(n). Звiдси та з (37) i (43) випливає, що для \mu (t) = 0 (Gtw(t, \cdot ))(x) = \partial \Delta t w(t, x) - H \biggl( t, x, \partial \partial x w(t, x) \biggr) . (44) Таким чином, ми довели таку теорему. Теорема 4. При виконаннi умов 1 – 3 теореми 3 генератор Gt нелiнiйної напiвгрупи визна- чається формулою (32), якщо \mu (t) > 0, i формулою (44), якщо \mu (t) = 0. Зауваження 2. Генератору Gt можна надати однакового вигляду як у випадку право- граничних точок, так i у випадку право-розсiяних точок, якщо в останньому звузити область визначення генератора Dt до класу C1(Q) \cap M(Q). Дiйсно, нехай w(t, x) \in C1(Q)\cap M(Q), тодi з (30) iз використанням формули диференцiю- вання складної функцiї на \BbbT i (31) при \mu (t) > 0 отримуємо генератор Gt у виглядi (Gtw(t, \cdot ))(x)= \partial \Delta t w(t, x) - \mathrm{s}\mathrm{u}\mathrm{p} v\in U \left\{ - 1\int 0 \partial \partial x w(\sigma (t), x+ \mu (t)f(t, x, v)\tau )d\tau f(t, x, v) - L(t, x, v) \right\} . (45) Зазначимо, однак, що використання генератора Gt у виглядi (25) є, по-перше, бiльш зручним для застосування, а по-друге, в цьому випадку вiн заданий на бiльш широкому класi функцiй. Тому в подальшому ми будемо користуватися генератором Gt у виглядi (32). Зауваження 3. Формула (44) для вигляду генератора у неперервному випадку формально отримується iз (45) при \mu (t) = 0. Однак покладати в (45) \mu (t) = 0 не можна, оскiльки (45) отримано саме за умови \mu (t) > 0. Зауваження 4. З використанням теореми 4 абстрактне рiвняння динамiчного програмуван- ня (27) можна записати в бiльш зручнiй класичнiй формi, а саме: 1) якщо \mu (t) > 0, то W (t, x) + \mathrm{s}\mathrm{u}\mathrm{p} v\in U \bigl\{ - W (\sigma (t), x+ \mu (t)f(t, x, v)) - L(t, x, v)\mu (t) \bigr\} = 0, або, використовуючи зв’язок мiж супремумом i iнфiмумом, у виглядi W (t, x) = \mathrm{i}\mathrm{n}\mathrm{f} u\in U \bigl\{ W (\sigma (t), x+ \mu (t)f(t, x, u)) + L(t, x, u)\mu (t) \bigr\} ; (46) 2) якщо \mu (t) = 0, то - \partial \Delta t W (t, x) +H \biggl( t, x, \partial \partial x W (t, x) \biggr) = 0, (47) де H(t, x, p) = \mathrm{s}\mathrm{u}\mathrm{p}u\in U \bigl\{ - f(t, x, u)p - L(t, x, u) \bigr\} — функцiя Гамiльтона. У подальшому ми будемо користуватися саме формулами (46) i (47). Зауваження 5. Для узгодження з класичним означенням (неперервний випадок) в’язкого розв’язку означення 3 для диференцiальних операторiв переформулюємо у такiй еквiвалентнiй формi. ISSN 1027-3190. Укр. мат. журн., 2017, т. 69, № 7 946 В. Я. ДАНIЛОВ, О. Є. ЛАВРОВА, О. М. СТАНЖИЦЬКИЙ Означення 4. Нехай W \in C(Q) \cap M(Q). Тодi: 1) W є в’язким суброзв’язком рiвняння динамiчного програмування в Q, якщо: a) в кожнiй точцi (t, x) \in Q такiй, що \mu (t) > 0, W (t, x) задовольняє (46); b) для довiльної тестової функцiї w \in C1(Q) \cap M(Q) - \partial \Delta t w(\=t, \=x) +H \biggl( \=t, \=x, \partial \partial x w(\=t, \=x) \biggr) \leq 0 (48) в кожнiй точцi (\=t, \=x) \in Q такiй, що \mu (\=t) = 0 i (\=t, \=x) є точкою максимуму W - w в Q, а також W (\=t, \=x) = w(\=t, \=x); 2) W є в’язким суперрозв’язком рiвняння динамiчного програмування в Q, якщо: c) виконано умову a) пункту 1; d) для довiльної тестової функцiї w \in C1(Q) \cap M(Q) - \partial \Delta t w(\=t, \=x) +H \biggl( \=t, \=x, \partial \partial x w(\=t, \=x) \biggr) \geq 0 (49) в кожнiй точцi (\=t, \=x) \in Q такiй, що \mu (\=t) = 0 i (\=t, \=x) є точкою мiнiмуму W - w в Q, а також W (\=t, \=x) = w(\=t, \=x); 3) функцiя W є в’язким розв’язком рiвняння динамiчного програмування в Q, якщо вона одночасно є i суброзв’язком, i суперрозв’язком. Зауваження 6. Оскiльки (48) i (49) не змiнюються при замiнi w на w+C, де C — довiльна стала, то умову W (\=t, \=x) = w(\=t, \=x) в означеннях можна зняти. 3.3. Єдинiсть в’язкого розв’язку. Як випливає з теореми 3, функцiя Беллмана є в’язким розв’язком рiвняння динамiчного програмування (46), (47). Тому важливим є питання єдиностi такого розв’язку, що задовольняє крайову умову W (t1, x) = \psi (x), x \in \BbbR d. (50) Єдинiсть в’язкого розв’язку встановимо при виконаннi наступних умов на функцiї f, L i \psi : a1) f : [t0, t1]\BbbT \times \BbbR d \times U \rightarrow \BbbR d, L : [t0, t1]\BbbT \times \BbbR d \times U \rightarrow \BbbR 1; a2) f неперервна за сукупнiстю змiнних, причому рiвномiрно по x \in \BbbR d неперервна по t; a3) L, \psi рiвномiрно неперервнi в Q\times U i \BbbR d вiдповiдно; a4) f, L, \psi обмеженi в своїх областях визначення сталою C i задовольняють по x \in \BbbR d глобальну умову Лiпшиця зi сталою K. Накладемо також таку умову на часову шкалу: a5) будемо вважати, що будь-яка лiво-гранична точка часової шкали \BbbT є границею або тiльки право-граничних точок, або тiльки право-розсiяних точок. Очевидно, що будь-яка неперервна, тотально дискретна або ейлерова часовi шкали (в тер- мiнологiї [11]) задовольняють умову a5). Неважко також навести i бiльш складнi приклади дискретно неперервних часових шкал з виконанням умови a5). Нагадаємо, що U — компакт в \BbbR m. Має мiсце така теорема єдиностi. ISSN 1027-3190. Укр. мат. журн., 2017, т. 69, № 7 В’ЯЗКI РОЗВ’ЯЗКИ РIВНЯННЯ ГАМIЛЬТОНА – ЯКОБI – БЕЛЛМАНА НА ЧАСОВИХ ШКАЛАХ 947 Теорема 5. Нехай W i W1 — в’язкi розв’язки рiвняння динамiчного програмування (46), (47) в областi Q, що є обмеженими i рiвномiрно неперервними в Q та задовольняють крайову умову (50). Тодi якщо виконано умови a1) – a5), то W (t, x) =W1(t, x) \forall (t, x) \in Q. (51) Зауваження 7. В умовах теореми 5 виконано умови зауваження 1. Останнє означає, що функцiя Беллмана є глобально лiпшицевою за своїми змiнними i обмеженою. З урахуванням теореми 3 у теоремi 5 стверджується, що в цьому випадку єдиним розв’язком рiвняння дина- мiчного програмування (46), (47) є функцiя Беллмана. Доведення. По-перше, зауважимо, що, як i у випадку \BbbR 1 (див. [9], теорема10.1), при ви- конаннi умов a1) – a4) гамiльтонiан задовольняє таку умову: iснують стала M > 0 i функцiя h \in C([0,\infty )), h(0) = 0, такi, що для довiльних (t, x), (s, y) \in Q i p, p1 \in \BbbR d виконується нерiвнiсть\bigm\| \bigm\| H(t, x, p) - H(s, y, p1) \bigm\| \bigm\| \leq h \bigl( \| t - s\| + \| x - y\| \bigr) + h \bigl( \| t - s\| \bigr) \| p\| +M \| x - y\| \| p\| +M \| p - p1\| . (52) Нерiвнiсть (52) вiдiграє основну роль при доведеннi єдиностi у випадку дiйсної часової шкали. Нехай тепер W (t, x) i W1(t, x) — в’язкi розв’язки рiвняння (46), (47), що задовольняють умови теореми. З крайової умови (50) маємо W (t1, x) =W1(t1, x) = \psi (x). Точка t1 може бути або лiво-розсiяною, або лiво-граничною. Розглянемо цi випадки окремо. I. Нехай t1 \in \mathrm{L}\mathrm{S}. Тодi, згiдно з означенням в’язкого розв’язку, як W, так i W1 задовольня- ють рiвняння (46), отже, W (\rho (t1), x) = \mathrm{i}\mathrm{n}\mathrm{f} u\in U \bigl\{ W (t1, x+ \mu (\rho (t1))f(\rho (t1), x, u)) + L(\rho (t1), x, u)\mu (\rho (t1)) \bigr\} = = \mathrm{i}\mathrm{n}\mathrm{f} u\in U \bigl\{ \psi (x+ \mu (\rho (t1))f(\rho (t1), x, u)) + L(\rho (t1), x, u)\mu (\rho (t1)) \bigr\} . (53) Внаслiдок неперервностi \psi , f i L та компактностi U iнфiмум в (53) для кожного x \in \BbbR d дося- гається, а тому W (\rho (t1), x) визначено однозначно. Але аналогiчне спiввiдношення задовольняє i функцiя W1. Отже, W (\rho (t1), x) \equiv W1(\rho (t1), x). II. Нехай t1 \in \mathrm{L}\mathrm{D}. Тодi, згiдно з умовою a5), вона є границею або право-розсiяних точок, або право-граничних точок. Знову цi випадки розглянемо окремо. 1. Нехай t1 є границею право-розсiяних точок. Отже, iснує деякий лiвостороннiй \delta -окiл точки t1, у якому мiстяться лише право-розсiянi точки часової шкали, що складають збiжну до t1 числову послiдовнiсть. Позначимо цi точки в порядку зростання s0, s1, . . . , sn, . . . . При цьому для кожного n маємо \sigma (sn) = sn+1 i \mathrm{l}\mathrm{i}\mathrm{m}n\rightarrow \infty sn = t1. Оскiльки W (tn, x) задовольняє рiвняння (46), то маємо W (s0, x) = \mathrm{i}\mathrm{n}\mathrm{f} u\in U \bigl\{ W (s1, x+ \mu (s0)f(s0, x, u)) + L(s0, x, u)\mu (s0) \bigr\} . (54) Вiзьмемо довiльне u0 \in U. Тодi з (54) отримаємо W (s0, x) \leq W (s1, x+ \mu (s0)f(s0, x, u0)) + L(s0, x, u0)\mu (s0). З рiвняння (1) одержуємо x(s1) = x+ \mu (s0)f(s0, x, u0). Тодi W (s0, x) \leq W (s1, x(s1)) + L(s0, x, u0)\mu (s0). (55) ISSN 1027-3190. Укр. мат. журн., 2017, т. 69, № 7 948 В. Я. ДАНIЛОВ, О. Є. ЛАВРОВА, О. М. СТАНЖИЦЬКИЙ Далi з (46) знову отримуємо W \bigl( s1, x(s1) \bigr) = \mathrm{i}\mathrm{n}\mathrm{f} u\in U \bigl\{ W (s2, x(s1) + \mu (s1)f(s1, x(s1), u) + L(s1, x(s1), u)\mu (s1)) \bigr\} . (56) Тодi для довiльного u1 = u(s1) \in U звiдси знову одержуємо W (s1, x(s1)) \leq W (s2, x(s2)) + L(s1, x(s1), u(s1))\mu (s1), (57) де x(s2) = x(s1) + \mu (s1)f(s1, x(s1), u(s1)). З (55) та (57) знаходимо W (s0, x) \leq W (s2, x(s2)) + \mu (s0)L(s0, x, u0) + \mu (s1)L(s1, x(s1), u(s1)). Звiдси для кожного натурального n отримуємо нерiвнiсть W (s0, x) \leq W (sn+1, x(sn+1)) + n\sum k=0 \mu (sk)L(sk, x(sk), u(sk)), (58) де u(sk), k = 0, 1, . . . , — деяке допустиме керування, а x(sk) — вiдповiдна допустима траєк- торiя. Iз властивостей \Delta -iнтеграла [3] (теорема1.29) випливає, що n\sum k=0 \mu (sk)L(sk, x(sk), u(sk)) \rightarrow \int [s0,t1)\BbbT L(s, x(s), u(s))\Delta s. (59) Зауважимо також, що x(sk) за побудовою є розв’язком на [s0, t1]\BbbT системи рiвнянь x\Delta (s) = f(s, x(s), u(s)), x(s0) = x, де s = s0, s1, . . . . Зазначимо, що внаслiдок умов на f i множину допустимих керувань розв’язок задачi Кошi x\Delta = f(t, x(t), u(t)), x(s0) = x, iснує, єдиний на [s0, t1]\BbbT i є там абсолютно неперервною функцiєю [4] (теорема 4). Отже, iснує \mathrm{l}\mathrm{i}\mathrm{m} n\rightarrow \infty x(sn) = x(t1), а з урахуванням неперервностi W (t, x) i граничної умови (50) маємо W (sn+1, x(sn+1)) \rightarrow W \bigl( t1, x(t1) \bigr) = \psi (x(t1)). (60) Переходячи в (58) до границi при n\rightarrow \infty , з урахуванням (59) i (60) отримуємо W (s0, x) \leq \int [s0,t1)\BbbT L \bigl( t, x(t), u(t) \bigr) \Delta t+ \psi \bigl( x(t1) \bigr) . (61) ISSN 1027-3190. Укр. мат. журн., 2017, т. 69, № 7 В’ЯЗКI РОЗВ’ЯЗКИ РIВНЯННЯ ГАМIЛЬТОНА – ЯКОБI – БЕЛЛМАНА НА ЧАСОВИХ ШКАЛАХ 949 Але, з iншого боку, внаслiдок неперервностi W, f i L i компактностi множини U iнфiмум у правiй частинi (54) досягається для кожного s i x. Нехай u\ast = u\ast (s0) — точка, в якiй iнфiмум досягається (звичайно, вона залежить вiд x). Тодi W (s0, x) =W (s1, x+ \mu (s0)f(s0, x, u \ast (s0))) + L(s0, x, u \ast (s0))\mu (s0) = =W (s1, x \ast (s1)) + L(s0, x, u \ast (s0))\mu (s0). Аналогiчно з (56) одержуємо W \bigl( s1, x \ast (s1) \bigr) =W \bigl( s2, x \ast (s2) \bigr) + \mu (s1)L \bigl( s1, x \ast (s1), u \ast (s1) \bigr) . Звiдси для кожного натурального n отримуємо рiвнiсть W (s0, x) =W (sn+1, x \ast (sn+1)) + n\sum k=0 \mu (sk)L(sk, x \ast (sk), u \ast (sk)), (62) де u\ast (sk) — оптимальне керування, а x\ast (sk) — вiдповiдна траєкторiя, що визначається iз системи (x\ast )\Delta (s) = f(s, x\ast (s), u\ast (s)), x\ast (s0) = x, на [s0, t1]\BbbT . Переходячи в (62) до границi при n \rightarrow \infty , аналогiчно попередньому, отримуємо рiвнiсть W (s0, x) = \int [t0,t1)\BbbT L(t, x\ast (t), u\ast (t))\Delta t+ \psi (x\ast (t1)). (63) Iз (60) i (63) з огляду на довiльнiсть u(t) одержуємо W (s0, x) = \mathrm{i}\mathrm{n}\mathrm{f} u(\cdot )\in \scrU (s0) \left\{ \int [s0,t1)\BbbT L(t, x(t), u(t))\Delta t+ \psi (x(t1)) \right\} . Але аналогiчнi мiркування можна провести i для розв’язку W1 i отримати для нього нерiвнiсть W1(s0, x) \leq \int [s0,t1)\BbbT L(t, x(t), u(t))\Delta t+ \psi (x(t1)), (64) справедливу для довiльного керування u(\cdot ) \in \scrU (s0), а також рiвнiсть W1(s0, x) = \int [t0,t1)\BbbT L(t, y\ast (t), v\ast (t))\Delta t+ \psi (y\ast (t1)) (65) \bigl( при цьому, взагалi кажучи, u\ast (t) \not = v\ast (t) \bigr) . З (64) i (65) отримуємо W1(s0, x) = \mathrm{i}\mathrm{n}\mathrm{f} u(\cdot )\in \scrU (s0) \left\{ \int [s0,t1)\BbbT L(t, x(t), u(t))\Delta t+ \psi (x(t1)) \right\} . Отже, W (s0, x) =W1(s0, x) \forall x \in \BbbR d i маємо в цьому випадку єдинiсть. ISSN 1027-3190. Укр. мат. журн., 2017, т. 69, № 7 950 В. Я. ДАНIЛОВ, О. Є. ЛАВРОВА, О. М. СТАНЖИЦЬКИЙ 2. Нехай t1 є границею право-граничних точок. Отже, iснує вiдрiзок [t1 - \delta , t1]\BbbT (причому t1 - \delta \in \BbbT ), що повнiстю складається iз право-граничних точок, в кожнiй з яких \Delta -похiдна по t збiгається зi звичайною похiдною, тобто \partial \Delta t w(t, x) = \partial \partial t w(t, x). Зауважимо, що [t1 - \delta , t1]\BbbT — компакт. За цих обставин доведення єдиностi повнiстю збiгається з доведенням аналогiчного результату у класичному (неперервному) випадку (див., наприклад, [9], теорема 9.1), тому ми його не наводимо. Отже, у всiх випадках I, II iснує \delta > 0 таке, що на вiдрiзку [t1 - \delta , t1]\BbbT (причому t1 - \delta \in \BbbT ) W (t, x) =W1(t, x), а отже, W (t1 - \delta , x) =W1(t1 - \delta , x). (66) Проводячи тепер для точки t1 - \delta тi ж мiркування, що i для точки t1, i враховуючи (66), отримуємо єдинiсть розв’язку на деякому вiдрiзку [t1 - \delta - \delta 1, t1 - \delta ]\BbbT . Продовжуючи цю процедуру, через скiнченну кiлькiсть крокiв одержуємо рiвнiсть W (t, x) = W1(t, x) для t \in \in [t0, t1]\BbbT , x \in \BbbR d, що i доводить теорему. Лiтература 1. Agarwal R., Bohner M., Boichuk A., Strakh O. Fredholm boundary value problems for perturbed systems of dynamic equations on time scales // Math. Methods Appl. Sci., DOI: 10.1002/mma.3356, 2014. 2. Bohner M., Peterson A. Dynamic equations on time scales. An introduction with applications. – Boston, MA: Birkhäuser Boston Inc., 2001. 3. Bohner M., Peterson A. Advances in dynamic equations on time scales. – Boston, MA: Birkhäuser Boston Inc., 2003. 4. Bourdin L., Trelat L. General Cauchy – Lipschitz theory for \Delta -Cauchy problems with Caratheodory dynamics on time scales // J. Difference Equat. and Appl. – 2014. – 20, № 4. – P. 526 – 547. 5. Bourdin L., Trelat L. Pontryagin maximum principle for finite dimensional nonlinear optimal control problems on time scales // SIAM J. Control Optim. – 2013. – 51, № 5. – P. 3781 – 3813. 6. Capuzzo Dolcetta I. On discrete approximation of the Hamilton – Jacobi equation of dynamic programming // Appl. Math. and Optim. – 1983. – 10. – P. 367 – 377. 7. Capuzzo Dolcetta I., Ishii H. Approximate solutions of the Bellman equation of deterministic control theory // Appl. Math. and Optim. – 1984. – 11. – P. 161 – 181. 8. Crandal M. G., Lions P. L. Viscosity solutions of Hamilton – Belman – Jacobi equations // Trans Amer. Math. Soc. – 1983. – 277. – P. 1 – 45. 9. Fleming W. H., Soner H. M. Controlled Markov processes and viscosity solution. – Springer Sci. and Business Media, Inc., 2006. 10. Gonzales R. L., Tidball M. M. On discrete time approximation of the Hamilton – Jacobi equation of dynamics programming // INRIA Rapports de Recherch. – 1991. – № 1375. 11. Hall K., Oberste-Vorth R. Totally discrete and Eulerian time scales // Difference Equat., Spec. Funct. and Orthogonal Polynomials. – World Sci., 2007. – P. 462 – 470. 12. Hilger S. Ein Maßkettenkalkül mit Anwendungen auf Zentrums: PhD thesis. – Univ. Würzburg, 1988. 13. Lastivka L., Lavrova O. The method of dynamic programming for systems of differential equations on time scales // Bull. Kyiv Taras Shevchenko Nat. Univ. – 2014. – № 2. – P. 71 – 76 (in Ukrainian). 14. Lee E. B., Markus L. Foundations of optimal control theory. – New York: J. Wiley, 1967. 15. Samoilenko A. M., Perestyuk M. O. Impulsive differential equations. – Singapore etc.: World Sci., Inc., 1995. 16. Zhan Z., Wei W., Xu H. Hamilton – Jacobi – Bellman equations on time scales // Math. and Comput. Modelling. – 2009. – 49. – P. 2019 – 2028. 17. Zhan Z., Wei W. On existence of optimal control governed by a class of the first-order linear dynamic systems on time scales // Appl. Math. and Comput. – 2009. – 215, № 6. – P. 2070 – 2081. Одержано 21.10.16 ISSN 1027-3190. Укр. мат. журн., 2017, т. 69, № 7
id	umjimathkievua-article-1747
institution	Ukrains’kyi Matematychnyi Zhurnal
keywords_txt_mv	keywords
language	Ukrainian
last_indexed	2026-03-24T02:11:53Z
publishDate	2017
publisher	Institute of Mathematics, NAS of Ukraine
record_format	ojs
resource_txt_mv	umjimathkievua/5f/5e37495eb5ff1be71073d8d409e7bc5f.pdf
spelling	umjimathkievua-article-17472019-12-05T09:25:34Z Viscous solutions for the Hamilton – Jacobi – Bellman equation on time scales В’язкі розв’язки рівняння Гамільтона – Якобі – Беллмана на часових шкалах Danilov, V. Ya. Lavrova, O. E. Stanzhitskii, A. N. Данилов, В. Я. Лаврова, О. Є. Станжицький, О. М. We introduce the concept of viscous solution for the Bellman equation on time scales and establish сonditions for the existence and uniqueness of this solution. Введена концепция вязкого решения уравнения Беллмана на временных шкалах. Получены условия существования и единственности такого решения. Institute of Mathematics, NAS of Ukraine 2017-07-25 Article Article application/pdf https://umj.imath.kiev.ua/index.php/umj/article/view/1747 Ukrains’kyi Matematychnyi Zhurnal; Vol. 69 No. 7 (2017); 933-950 Український математичний журнал; Том 69 № 7 (2017); 933-950 1027-3190 uk https://umj.imath.kiev.ua/index.php/umj/article/view/1747/729 Copyright (c) 2017 Danilov V. Ya.; Lavrova O. E.; Stanzhitskii A. N.
spellingShingle	Danilov, V. Ya. Lavrova, O. E. Stanzhitskii, A. N. Данилов, В. Я. Лаврова, О. Є. Станжицький, О. М. Viscous solutions for the Hamilton – Jacobi – Bellman equation on time scales
title	Viscous solutions for the Hamilton – Jacobi – Bellman equation on time scales
title_alt	В’язкі розв’язки рівняння Гамільтона – Якобі – Беллмана на часових шкалах
title_full	Viscous solutions for the Hamilton – Jacobi – Bellman equation on time scales
title_fullStr	Viscous solutions for the Hamilton – Jacobi – Bellman equation on time scales
title_full_unstemmed	Viscous solutions for the Hamilton – Jacobi – Bellman equation on time scales
title_short	Viscous solutions for the Hamilton – Jacobi – Bellman equation on time scales
title_sort	viscous solutions for the hamilton – jacobi – bellman equation on time scales
url	https://umj.imath.kiev.ua/index.php/umj/article/view/1747
work_keys_str_mv	AT danilovvya viscoussolutionsforthehamiltonjacobibellmanequationontimescales AT lavrovaoe viscoussolutionsforthehamiltonjacobibellmanequationontimescales AT stanzhitskiian viscoussolutionsforthehamiltonjacobibellmanequationontimescales AT danilovvâ viscoussolutionsforthehamiltonjacobibellmanequationontimescales AT lavrovaoê viscoussolutionsforthehamiltonjacobibellmanequationontimescales AT stanžicʹkijom viscoussolutionsforthehamiltonjacobibellmanequationontimescales AT danilovvya vâzkírozvâzkirívnânnâgamílʹtonaâkobíbellmananačasovihškalah AT lavrovaoe vâzkírozvâzkirívnânnâgamílʹtonaâkobíbellmananačasovihškalah AT stanzhitskiian vâzkírozvâzkirívnânnâgamílʹtonaâkobíbellmananačasovihškalah AT danilovvâ vâzkírozvâzkirívnânnâgamílʹtonaâkobíbellmananačasovihškalah AT lavrovaoê vâzkírozvâzkirívnânnâgamílʹtonaâkobíbellmananačasovihškalah AT stanžicʹkijom vâzkírozvâzkirívnânnâgamílʹtonaâkobíbellmananačasovihškalah

Viscous solutions for the Hamilton – Jacobi – Bellman equation on time scales

Institution

Ähnliche Einträge