Оптимальна зупинка агрегованих та слабозбурених дезагрегованих марковських та напівмарковських моделей у дискретному часі

An investigated sequential analysis of optimal decision making problems for weakly disturbed Markov and semi-Markov models is based on the sequential solution of optimal stopping problems of nondisturbed aggregate and weakly disturbed dissaggregate models.

Saved in:

Bibliographic Details
Date:	2019
Main Author:	Andreev, N. V.
Format:	Article
Language:	Russian
Published:	The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2019
Online Access:	https://journal.iasa.kpi.ua/article/view/176474
Tags:	Add Tag No Tags, Be the first to tag this record!
Journal Title:	System research and information technologies
Download file:

Institution

System research and information technologies

_version_	1867334393319653376
author	Andreev, N. V.
author_facet	Andreev, N. V.
author_institution_txt_mv	[ { "author": "N. V. Andreev", "institution": null } ]
author_sort	Andreev, N. V.
baseUrl_str	http://journal.iasa.kpi.ua/oai
collection	OJS
datestamp_date	2019-08-20T18:16:43Z
description	An investigated sequential analysis of optimal decision making problems for weakly disturbed Markov and semi-Markov models is based on the sequential solution of optimal stopping problems of nondisturbed aggregate and weakly disturbed dissaggregate models.
first_indexed	2025-07-17T10:26:14Z
format	Article
fulltext	© Н.В. Андреев, 2002 Системні дослідження та інформаційні технології, 2002, 3 139 TIДC НОВІ МЕТОДИ В СИСТЕМНОМУ АНАЛІЗІ, ІНФОРМАТИЦІ ТА ТЕОРІЇ ПРИЙНЯТТЯ РІШЕНЬ УДК 519.24.5 ОПТИМАЛЬНАЯ ОСТАНОВКА АГРЕГИРОВАННЫХ И СЛАБОВОЗМУЩЕННЫХ ДЕЗАГРЕГИРОВАННЫХ МАРКОВСКИХ И ПОЛУМАРКОВСКИХ МОДЕЛЕЙ В ДИСКРЕТНОМ ВРЕМЕНИ Н.В. АНДРЕЕВ Исследуется последовательный анализ проблем принятия оптимальных решений для слабовозмущенных марковских и полумарковских моделей на основе последовательного решения задач оптимальной остановки невозмущенной агрегированной и слабовозмущенной дезагрегированной моделей. ВВЕДЕНИЕ Результаты этой статьи могут быть проинтерпретированы в терминах некоторых решений проблемы оптимального инвестирования, которая соответствует задаче оптимальной агрегированной остановки и принятия решения об обоснованном выборе более перспективного региона страны как объекта инвестирования на макроэкономическом уровне. В то же время задача дезагрегированной оптимальной остановки соответствует микроэко- номическому уровню, включая проблему оптимального выбора некоторого перспективного экономического или финансового объекта, находящегося в регионе, выбранном в задаче агрегированной оптимальной остановки. Рассматриваемые модели могут быть использованы при трактовке и исследовании не только инвестиционных, но также инновационных и других процессов. Область их применения охватывает различные сферы человеческой деятельности. Для описания детерминированных и стохастических моделей с малыми возмущениями характерно наличие в уравнениях модели аддитивной составляющей с малым параметром. Путем разложения в ряд по малому параметру некоторого функционала, заданного на траектории модели и характеризующего цену остановки, можно определить цену оптимальной остановки, удовлетворяющую уравнению оптимальности, выводу и исследованию которого здесь уделяется значительное внимание. В настоящей статье рассматривается вероятностная модель ),,( gPE ε с фазовым пространством состояний (ФПС) E , переходным оператором εP ( 0≥ε — достаточно малый числовой параметр) и с функцией выигрыша Н.В. Андреев ISSN 1681–6048 System Research & Information Technologies, 2002, 3 140 )(xg , характеризующей выигрыш от остановки модели { }0, ≥nX n ε в состоянии Exx ∈, . Переходный оператор εP , или в конечном случае матрица вероятностей перехода представляется в виде 10 PPP εε −= , 10 ≤≤ ε , (1) где 0P — матрица вероятностей перехода невозмущенной цепи Маркова, 1P — матрица возмущений. В этом контексте отождествление в некоторых местах терминов «переходный оператор» и «матрица переходных вероятностей» не вызывает недоразумений, поскольку они отражают специфику ФПС модели (бесконечное и конечное), в то время как методика построения модели и последующей ее оптимизации распространяется на общий случай конечного или счетного объединения произвольных измеримых ФПС. Матрица или оператор возмущений 1P играет существенную роль в последующем агрегировании модели, реализация которого осуществляется на основе общей теории возмущения приводимо-обратимых операторов на спектре [1, 5]. Набор ( )gPE ,, ε характеризует также возмущенный процесс марковского восстановления (ПМВ), представляющий собой возмущенный полумарковский процесс в дискретном времени. При этом E — его ФПС; εP — матрица вероятностей перехода вложенной цепи Маркова (ВЦМ) { }0; ≥nX n ε ; ( ){ }Exxgg ∈= ; — функция выигрыша, построенная с учетом характеристик, задающих ПМВ { }0,, ≥nX nn θε . Представление матрицы εP в виде разности стохастической матрицы 0P и матрицы возмущений 1P , умноженной на малый параметр ε в (1), приводит к двум альтернативным ситуациям: 1) существует поглощающее состояние модели (1); 2) поглощающего состояния не существует и появляется возможность агрегирования модели (1). Последнее имеет место при выполнении следующего условия, которому должна удовлетворять матрица возмущений 1P : сумма элементов каждой строки матрицы 1P равна нулю. Пусть { }xnn PFX ,, — однородный необрывающийся марковский процесс с дискретным временем 0≥n в измеримом пространстве ( )BE, , ( ){ }Exxgg ∈= , — неотрицательная B -измеримая функция. Обозначим M класс марковских моментов и будем говорить, что M∈τ задает некоторое правило остановки. Возникает задача выбора M∈τ с целью максимизации среднего «выигрыша» ( )τXgM x , где xM — символ математического ожидания, соответствующего вероятностной мере xP . Рассмотрим функцию ( ) ( )τ τ XgMxs x M∈ = sup , (2) Оптимальная остановка агрегированных и слабовозмущенных дезагрегированных моделей Системні дослідження та інформаційні технології, 2002, 3 141 называемую обычно ценой [2, 3]. Автором получено уравнение оптимальности типа Вальда для цены оптимальной остановки слабовозмущенных моделей (1), исследованы вопросы существования и единственности его решения, найдено это решение и на его основе предложен алгоритм построения оптимального правила остановки. Исследованы также асимптотические свойства решения уравнения оптимальности и соответствующее ему асимптотическое оптимальное правило остановки. МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТА Процесс марковского восстановления (ПМВ) { }0,, ≥nX nn θε с фазовым пространством состояний ∪ N k kEE 1= = , jiEE ji ≠= ,0∩ [1] определяется полумарковским ядром ( ) ( ) ∈= ttGptQ kkrkr ,εε [0,∞ ), где ;: εεε ε krkrkr ppp −= Erk ∈, — переходные вероятности ВЦМ. Очевидно, что расщепленное ФПС E индуцирует случай нескольких (здесь N ) слабозависимых цепей Маркова. Блочно-диагональная матрица вероятностей перехода (МВЦ) ( ),,...,10 NPPP diag= описывающая N невозмущенных независимых цепей Маркова, является эргодической со стационарным распределением ),...,( 00 1 0 Nρρρ = ; 1P — матрица возмущений, соответствующая матрице 0P ; ( )tGk — функция распределения времени пребывания непрерывной компоненты nθ в состоянии k . Если в состоянии k принято решение об остановке и время, проведенное в этом состоянии, равно t , то ожидаемый выигрыш равен ( )tkr , . Функция ( )tkr , — неотрицательная, измеримая по t и ограниченная по k . Необходимо выбрать правило остановки, обеспечивающее наибольший выигрыш. Эта задача сводится к задаче об оптимальной остановке ВЦМ { }0; ≥nX n ε с переходными вероятностями, заданными в виде { } ,,...,1,0,/: , 110 1 NiEkpppkXrXPp i Er krkrkrnnkr i =∈=−==== ∑ ∈ + εεεε (3) где МВП { }ErkpP kr ∈= ,;0 0 — невозмущенная цепь Маркова, эргодическая со стационарным распределением { }N 0 1 00 ,..., ρρρ = ; 1 krp — элемент матрицы возмущений { }ErkpP kr ∈= ,;1 1 и с функцией выигрыша =)(xg ( ) ( ) ( ) .,,, 0 ExdtGtkrkMr kk ∈== ∫ ∞ θ Пусть ( )EL — множество ограниченных неотрицательных функций на E ; ( )ELg∈ ; εM — множество моментов остановки, для которых { } 1=∞<τP для каждого ε и ( ) ( )ετ τ ε ε XgMxs x M sup ∈ = — цена оптимальной остановки. Н.В. Андреев ISSN 1681–6048 System Research & Information Technologies, 2002, 3 142 Функция ( ){ }Exxss ∈= ;εε является единственным решением уравнения типа Вальда [1, 4] { }cPgs += εε ,max , (4) где функция средней стоимости непрерывного наблюдения ( ){ }Ekkcc ∈= ; определена на E , ( ) ( )kkMckc θ,= , а функция ( )kkc θ, характеризует удельную стоимость наблюдения в состоянии k в течение времени kθ ; функция ( )tkc , — неотрицательная, измерима по t и ограничена по k . Марковский момент ετ , определенный формулой { }εετ Γ∈= nXn :inf , ( ) ( ){ }xgxsx ==Γ εε : , является оптимальным моментом остановки для заданного плана экспериментов при фиксированном ε . Для конструктивного нахождения оптимального момента остановки ετ используем метод укрупнения математической модели с преобразованием ФПС E в другое ФПС Ê — это первый этап последовательного решения этой задачи, к рассмотрению которого мы и переходим. ЗАДАЧА ОПТИМАЛЬНОЙ ОСТАНОВКИ В АГРЕГИРОВАННОМ СЛУЧАЕ Рассмотрим стохастическое укрупнение исходной модели с ФПС E при помощи функции i такой, что ( ) ., iExixi ∈= В результате мы приходим к задаче оптимальной остановки для последовательности ( ){ }0,ˆ ≥nig n и ( ){ }0,ˆ ≥nic n , где ( ) ( ) ( )xgdxig iE i∫= 0ˆ ρ , ( ) ( ) ( )xcdxic iE i∫= 0ˆ ρ . Последовательность { }0, ≥nin является марковской цепью с ФПС { }NE ,...,1ˆ = , и переходным оператором, для которого ( ) ( ) ( ) ( )11 ˆ 1 ,ˆˆ 1 ifiiPifMifP Ei i ∑ ∈ == , где ( ) ( ) ( ) ( ) ⎪⎭ ⎪ ⎬ ⎫ ⎪⎩ ⎪ ⎨ ⎧ == ∫ ∫ i iE E iijiij ExPdxExPdxpP ,/,ˆˆ 1 0 1 0 ρρ (5) ,iEx∈ NjijiEEE ii ,...,1,,,\ =≠= . Здесь все формулы, содержащие буквы с «крышкой сверху» pcg ˆ,ˆ,ˆ представляют собой результат стохастического агрегирования исходной Оптимальная остановка агрегированных и слабовозмущенных дезагрегированных моделей Системні дослідження та інформаційні технології, 2002, 3 143 функции цели g , функции средней стоимости наблюдения c и элементов стохастической матрицы ВЦМ εP соответственно. Мы также предположим, что агрегированная модель с МПВ { }EjipP ij ˆ,;ˆˆ ∈= соответствует эргодической укрупненной цепи Маркова { }0; ≥nin с одним эргодическим классом состояний со СР { }Nρρρ ˆ,...,ˆˆ 1= , ( )ELcg ˆˆ,ˆ ∈ ; M̂ — класс марковских моментов для агрегированной модели, ( ) ( )τ τ igMks k M ˆˆsupˆ ˆ∈ = ; ( )( )Ekkss ˆ,ˆˆ ∈= — цена оптимальной остановки. При вышеуказанных предположениях соответствующее уравнение типа Вальда }{ csPgs ˆˆˆ,ˆmaxˆ += (6) имеет единственное решение ŝ вида { }0ˆ,ˆmaxˆ sgs = , где функция 0ŝ является минимальным решением линейного уравнения csPs ˆˆˆˆ 00 += , представленного в виде 00 ˆˆˆˆ gcRs += 1, (7) где 1 00 )ˆˆ(ˆ −Π+−= PIR — обобщенный обратный оператор к оператору Π− ˆ);ˆ( 0PI — стационарный проектор, индуцированный СР ρ̂ ; постоянная { };ˆˆ),ˆ(ˆminˆ Eeegg ∈= символ 1 обозначает единицу в Ê . Поэтому решение агрегированного уравнения типа Вальда можно представить в виде { }0ˆ,ˆmaxˆ sgs = . (8) Марковский момент, определяемый формулой { }Γ∈= ˆ:inf* ninτ , где ( ) ( ){ }igisi ˆˆ:ˆ ==Γ является оптимальным моментом остановки планирования эксперимента для агрегированной модели. Обозначим через i состояние агрегированной модели { }0, ≥nin в момент τ , так, что ** τ ii = ЗАДАЧА ОПТИМАЛЬНОЙ ОСТАНОВКИ В ДЕЗАГРЕРИРОВАННОМ СЛУЧАЕ Дезагрегирование состояния i , с помощью преобразования ( ) 1 : iEii → − , а также рассмотрение дезагрегированной модели ( )gPE ,,* ε и соответствующего этому случаю критерия оптимизации представляют собой второй этап последовательного анализа задачи об оптимальной остановке. εM — множество моментов остановки ετ для которых { } 1* =< εε ζτP , где * εζ — момент выхода из множества E , индуцированный моделью, заданной МПВ Н.В. Андреев ISSN 1681–6048 System Research & Information Technologies, 2002, 3 144 { } { } 10 * ,;,, ErkppErkpP krkrkr ∈−=∈= εε ε , 1,0: 000* =>∈∃ εε ppEk k . (9) Здесь { }0 — поглощающее состояние модели, которое с положительной вероятностью достижимо при выходе модели из множества E . Пусть ( ) ( )ετ ετ ε XgMks k M∈ = sup , тогда ( )( ), Ekkss ∈= εε — цена оптимальной остановки, являющаяся единственным решением уравнения типа Вальда { }csPgs += εεε ,max . (10) Единственное решение уравнения (10) представляется в виде [4] { }0,max εε sgs = , (11) где { }* 00 , Ekss ∈= εε — решение линейного уравнения csPs += 00 εεε , (12) представимого в виде m m mss ∑ ∞ = = 0 0 εε , (13) где коэффициенты ms определяются рекуррентно в виде [1, 4] qcs ˆ/ˆ0 = 1, qRs mmm ˆ/ˆ 10 ++= ψϕ 1, 0≥m , ( )∑ ∈ = * 0ˆ Ek k kcc ρ , ∑ ∈ = * 1 0 0ˆ Ek kk pq ρ 1. Здесь 1 — единица в E ; 0 R — обобщенный обратный оператор оператора ( )0PI − ; { } qcqqc ˆ/ˆˆ0 −=ϕ , { } ,ˆ/ˆˆ 11 qqq mmm −− −= ψψϕ ( )km Ek km ψρψ ∑ ∈ = 0ˆ , 0≥m . Ряд (13), представляющий 0 εs , абсолютно сходится для достаточно малых ε . Марковский момент, заданный формулой { }** :inf ε ε ετ Γ∈= nXn , (14) где множество ( ) ( ){ }kgksEk =∈=Γ εε :* * , определяет оптимальный момент остановки при планировании эксперимента для исходной модели марковского восстановления с малыми возмущениями, которые соответствуют различным .1, ≤≤ εε o Оптимальная остановка агрегированных и слабовозмущенных дезагрегированных моделей Системні дослідження та інформаційні технології, 2002, 3 145 ЗАКЛЮЧЕНИЕ При решении исходной задачи принятия решений о выборе оптимального состояния модели мы строим множество εΓ , используя решение уравнения оптимальности (4), однако определение функции εs прямым путем является достаточно сложной задачей, принимая во внимание сложность структуры ФПС E исходной модели { }0,, ≥nX nn θε . Поэтому решение исходной задачи (4) предусматривает двойное применение решения задач оптимальной остановки агрегированных (6) и слабовозмущенных дезагрегированных (10) марковских и полумарковских моделей. Во-первых, с помощью метода агрегирования (5) иcходной модели мы построили множество ( ) ( ){ }igisEi ˆˆ:ˆˆ =∈=Γ , содержащее состояние i , момент достижения которого соответствует оптимальному моменту остановки τ̂ агрегированной модели { }0, ≥nin с функциями выиграша ĝ и стоимости наблюдений ĉ соответственно. Во-вторых, методом разукрупнения ФПС модели при помощи замены состояния i на * i EE = , мы нашли оптимальный момент остановки * ετ , построив множество * εΓ , которым определяется решение исходной проблемы принятия решения. Таким образом, предложен специфический метод декомпозиции решения задачи принятия решений для исходного случая нескольких слабозависимых цепей Маркова или процессов марковского восстановления, представляющий собой двухэтапный процесс случайного поиска. Сначала поиск проводится поверхностно на агрегированной модели, а последующий дезагрегированный участок, отобранный ранее, подвергается гораздо более тщательному изучению. На каждом из этих этапов решается поставленная задача оптимальной остановки случайного эксперимента, обеспечивающего максимизацию ожидаемого от поиска дохода. ЛИТЕРАТУРА 1. Андреев Н.В. Оптимальная остановка процесса марковского восстановления с малой вероятностью поглощения // Кибернетика и системный анализ.— 1994. — № 6. — С. 176–179. 2. Дынкин Е.Б. Оптимальный выбор момента остановки марковского процесса // ДАН СССР. — 1963. — 150, № 2. — С. 238–240. 3. Григелионис Б.И., Ширяев А.Н. О задаче Стефана и оптимальных правилах остановки марковских процессов // Теория вероятностей и ее применения. — 1966. — 11, № 4. 4. Andreev A.M., Andreev M.V. On the Solution of Optimal Stopping Problem for Markov Renewal Processes with Small Absorbtion Probability, Abstracts, Mathematical Theory of Systems and Networks. — Perpignan, France, 2000. 5. Korolyuk V.S., Turbin A.F. Mathematical Foundation of the Lumping of Large Systems. — 1993. — 264. — 278 p. Поступила 19.07.2002
id	journaliasakpiua-article-176474
institution	System research and information technologies
keywords_txt_mv	keywords
language	Russian
last_indexed	2025-07-17T10:26:14Z
publishDate	2019
publisher	The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute"
record_format	ojs
resource_txt_mv	journaliasakpiua/d4/74a39f08715e889518b3bbaa890100d4.pdf
spelling	journaliasakpiua-article-1764742019-08-20T18:16:43Z Optimal stopping of aggregate and weakly disturbed disaggregate Markov and semi-Markov models in discrete time Оптимальная остановка агрегированных и слабовозмущенных дезагрегированных марковских и полумарковских моделей в дискретном времени Оптимальна зупинка агрегованих та слабозбурених дезагрегованих марковських та напівмарковських моделей у дискретному часі Andreev, N. V. An investigated sequential analysis of optimal decision making problems for weakly disturbed Markov and semi-Markov models is based on the sequential solution of optimal stopping problems of nondisturbed aggregate and weakly disturbed dissaggregate models. Исследуется последовательный анализ проблем принятия оптимальных решений для слабовозмущенных марковских и полумарковских моделей на основе последовательного решения задач оптимальной остановки невозмущенной агрегированной и слабовозмущенной дезагрегированной моделей. Досліджується послідовний аналіз проблем прийняття оптимальних рішень для слабозбурених марковських та напівмарковських моделей на основі послідовного розв’язання задач оптимальної зупинки незбуреної агрегованої та слабозбуреної дезагрегованої моделей. The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2019-08-20 Article Article application/pdf https://journal.iasa.kpi.ua/article/view/176474 System research and information technologies; No. 3 (2002); 139-145 Системные исследования и информационные технологии; № 3 (2002); 139-145 Системні дослідження та інформаційні технології; № 3 (2002); 139-145 2308-8893 1681-6048 ru https://journal.iasa.kpi.ua/article/view/176474/176245 Copyright (c) 2021 System research and information technologies
spellingShingle	Andreev, N. V. Оптимальна зупинка агрегованих та слабозбурених дезагрегованих марковських та напівмарковських моделей у дискретному часі
title	Оптимальна зупинка агрегованих та слабозбурених дезагрегованих марковських та напівмарковських моделей у дискретному часі
title_alt	Optimal stopping of aggregate and weakly disturbed disaggregate Markov and semi-Markov models in discrete time Оптимальная остановка агрегированных и слабовозмущенных дезагрегированных марковских и полумарковских моделей в дискретном времени
title_full	Оптимальна зупинка агрегованих та слабозбурених дезагрегованих марковських та напівмарковських моделей у дискретному часі
title_fullStr	Оптимальна зупинка агрегованих та слабозбурених дезагрегованих марковських та напівмарковських моделей у дискретному часі
title_full_unstemmed	Оптимальна зупинка агрегованих та слабозбурених дезагрегованих марковських та напівмарковських моделей у дискретному часі
title_short	Оптимальна зупинка агрегованих та слабозбурених дезагрегованих марковських та напівмарковських моделей у дискретному часі
title_sort	оптимальна зупинка агрегованих та слабозбурених дезагрегованих марковських та напівмарковських моделей у дискретному часі
url	https://journal.iasa.kpi.ua/article/view/176474
work_keys_str_mv	AT andreevnv optimalstoppingofaggregateandweaklydisturbeddisaggregatemarkovandsemimarkovmodelsindiscretetime AT andreevnv optimalʹnaâostanovkaagregirovannyhislabovozmuŝennyhdezagregirovannyhmarkovskihipolumarkovskihmodelejvdiskretnomvremeni AT andreevnv optimalʹnazupinkaagregovanihtaslabozburenihdezagregovanihmarkovsʹkihtanapívmarkovsʹkihmodelejudiskretnomučasí

Оптимальна зупинка агрегованих та слабозбурених дезагрегованих марковських та напівмарковських моделей у дискретному часі

Institution

Similar Items