Оптимальные стратегии и оценка полунепрерывного обрывного управляемого марковского процесса

Рассмотрены обрывные управляемые марковские процессы с несчетными множествами состояний и управлений на конечном промежутке времени. Приведены определения обрывного управляемого марковского процесса, оценки пути и оптимальной стратегии, а также доказано фундаментальное уравнение в случае, когда мн...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Кибернетика и системный анализ
Datum:2016
Hauptverfasser: Шпак, П.Р., Елейко, Я.И.
Format: Artikel
Sprache:Russian
Veröffentlicht: Інститут кібернетики ім. В.М. Глушкова НАН України 2016
Schlagworte:
Online Zugang:https://nasplib.isofts.kiev.ua/handle/123456789/142007
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:Оптимальные стратегии и оценка полунепрерывного обрывного управляемого марковского процесса / П.Р. Шпак, Я.И. Елейко // Кибернетика и системный анализ. — 2016. — Т. 52, № 4. — С. 155-160. — Бібліогр.: 5 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id nasplib_isofts_kiev_ua-123456789-142007
record_format dspace
spelling Шпак, П.Р.
Елейко, Я.И.
2018-09-19T19:32:21Z
2018-09-19T19:32:21Z
2016
Оптимальные стратегии и оценка полунепрерывного обрывного управляемого марковского процесса / П.Р. Шпак, Я.И. Елейко // Кибернетика и системный анализ. — 2016. — Т. 52, № 4. — С. 155-160. — Бібліогр.: 5 назв. — рос.
0023-1274
https://nasplib.isofts.kiev.ua/handle/123456789/142007
519.21
Рассмотрены обрывные управляемые марковские процессы с несчетными множествами состояний и управлений на конечном промежутке времени. Приведены определения обрывного управляемого марковского процесса, оценки пути и оптимальной стратегии, а также доказано фундаментальное уравнение в случае, когда множествами состояний и управлений являются измеримые пространства. Предложен метод построения оптимальной стратегии и доказано существование равномерно оптимальной стратегии в случае, когда множествами состояний и управлений есть сепарабельные метрические пространства.
Розглянуто обривні керовані марковські процеси з незліченними множинами станів та керувань на скінченному часовому інтервалі. Наведено означення обривного керованого марковського процесу, оцінки шляху та оптимальної стратегії, а також доведено істинність фундаментального рівняння за умов, коли множини станів та керувань є вимірними просторами. Наведено метод побудови рівномірно оптимальної стратегії у випадку, коли множини станів та керувань являють собою сепарабельні метричні простори.
In the paper, we consider killed Markov decision processes with uncountable sets of states and controls on a finite time interval. Definitions of killed Markov decision process and assessment of the way and optimal policy are given, as well as fundamental equation is proved in the case where the set of states and set of controls are measurable spaces. We also proposed a method to construct the optimal strategy and proved the existence of a uniformly optimal policy in case where the set of states and set of controls are separable metric spaces.
ru
Інститут кібернетики ім. В.М. Глушкова НАН України
Кибернетика и системный анализ
Системный анализ
Оптимальные стратегии и оценка полунепрерывного обрывного управляемого марковского процесса
Оптимальні стратегії та оцінка напівнеперевних обривних керованих марковських процесів
Assessment and optimal policies of semi-continuous killed Markov decision processes
Article
published earlier
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
title Оптимальные стратегии и оценка полунепрерывного обрывного управляемого марковского процесса
spellingShingle Оптимальные стратегии и оценка полунепрерывного обрывного управляемого марковского процесса
Шпак, П.Р.
Елейко, Я.И.
Системный анализ
title_short Оптимальные стратегии и оценка полунепрерывного обрывного управляемого марковского процесса
title_full Оптимальные стратегии и оценка полунепрерывного обрывного управляемого марковского процесса
title_fullStr Оптимальные стратегии и оценка полунепрерывного обрывного управляемого марковского процесса
title_full_unstemmed Оптимальные стратегии и оценка полунепрерывного обрывного управляемого марковского процесса
title_sort оптимальные стратегии и оценка полунепрерывного обрывного управляемого марковского процесса
author Шпак, П.Р.
Елейко, Я.И.
author_facet Шпак, П.Р.
Елейко, Я.И.
topic Системный анализ
topic_facet Системный анализ
publishDate 2016
language Russian
container_title Кибернетика и системный анализ
publisher Інститут кібернетики ім. В.М. Глушкова НАН України
format Article
title_alt Оптимальні стратегії та оцінка напівнеперевних обривних керованих марковських процесів
Assessment and optimal policies of semi-continuous killed Markov decision processes
description Рассмотрены обрывные управляемые марковские процессы с несчетными множествами состояний и управлений на конечном промежутке времени. Приведены определения обрывного управляемого марковского процесса, оценки пути и оптимальной стратегии, а также доказано фундаментальное уравнение в случае, когда множествами состояний и управлений являются измеримые пространства. Предложен метод построения оптимальной стратегии и доказано существование равномерно оптимальной стратегии в случае, когда множествами состояний и управлений есть сепарабельные метрические пространства. Розглянуто обривні керовані марковські процеси з незліченними множинами станів та керувань на скінченному часовому інтервалі. Наведено означення обривного керованого марковського процесу, оцінки шляху та оптимальної стратегії, а також доведено істинність фундаментального рівняння за умов, коли множини станів та керувань є вимірними просторами. Наведено метод побудови рівномірно оптимальної стратегії у випадку, коли множини станів та керувань являють собою сепарабельні метричні простори. In the paper, we consider killed Markov decision processes with uncountable sets of states and controls on a finite time interval. Definitions of killed Markov decision process and assessment of the way and optimal policy are given, as well as fundamental equation is proved in the case where the set of states and set of controls are measurable spaces. We also proposed a method to construct the optimal strategy and proved the existence of a uniformly optimal policy in case where the set of states and set of controls are separable metric spaces.
issn 0023-1274
url https://nasplib.isofts.kiev.ua/handle/123456789/142007
citation_txt Оптимальные стратегии и оценка полунепрерывного обрывного управляемого марковского процесса / П.Р. Шпак, Я.И. Елейко // Кибернетика и системный анализ. — 2016. — Т. 52, № 4. — С. 155-160. — Бібліогр.: 5 назв. — рос.
work_keys_str_mv AT špakpr optimalʹnyestrategiiiocenkapolunepreryvnogoobryvnogoupravlâemogomarkovskogoprocessa
AT eleikoâi optimalʹnyestrategiiiocenkapolunepreryvnogoobryvnogoupravlâemogomarkovskogoprocessa
AT špakpr optimalʹnístrategíítaocínkanapívneperevnihobrivnihkerovanihmarkovsʹkihprocesív
AT eleikoâi optimalʹnístrategíítaocínkanapívneperevnihobrivnihkerovanihmarkovsʹkihprocesív
AT špakpr assessmentandoptimalpoliciesofsemicontinuouskilledmarkovdecisionprocesses
AT eleikoâi assessmentandoptimalpoliciesofsemicontinuouskilledmarkovdecisionprocesses
first_indexed 2025-12-01T20:39:25Z
last_indexed 2025-12-01T20:39:25Z
_version_ 1850860940517441536