Оптимальные стратегии и оценка полунепрерывного обрывного управляемого марковского процесса

Рассмотрены обрывные управляемые марковские процессы с несчетными множествами состояний и управлений на конечном промежутке времени. Приведены определения обрывного управляемого марковского процесса, оценки пути и оптимальной стратегии, а также доказано фундаментальное уравнение в случае, когда мн...

Full description

Saved in:
Bibliographic Details
Published in:Кибернетика и системный анализ
Date:2016
Main Authors: Шпак, П.Р., Елейко, Я.И.
Format: Article
Language:Russian
Published: Інститут кібернетики ім. В.М. Глушкова НАН України 2016
Subjects:
Online Access:https://nasplib.isofts.kiev.ua/handle/123456789/142007
Tags: Add Tag
No Tags, Be the first to tag this record!
Journal Title:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Cite this:Оптимальные стратегии и оценка полунепрерывного обрывного управляемого марковского процесса / П.Р. Шпак, Я.И. Елейко // Кибернетика и системный анализ. — 2016. — Т. 52, № 4. — С. 155-160. — Бібліогр.: 5 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1862651722807115776
author Шпак, П.Р.
Елейко, Я.И.
author_facet Шпак, П.Р.
Елейко, Я.И.
citation_txt Оптимальные стратегии и оценка полунепрерывного обрывного управляемого марковского процесса / П.Р. Шпак, Я.И. Елейко // Кибернетика и системный анализ. — 2016. — Т. 52, № 4. — С. 155-160. — Бібліогр.: 5 назв. — рос.
collection DSpace DC
container_title Кибернетика и системный анализ
description Рассмотрены обрывные управляемые марковские процессы с несчетными множествами состояний и управлений на конечном промежутке времени. Приведены определения обрывного управляемого марковского процесса, оценки пути и оптимальной стратегии, а также доказано фундаментальное уравнение в случае, когда множествами состояний и управлений являются измеримые пространства. Предложен метод построения оптимальной стратегии и доказано существование равномерно оптимальной стратегии в случае, когда множествами состояний и управлений есть сепарабельные метрические пространства. Розглянуто обривні керовані марковські процеси з незліченними множинами станів та керувань на скінченному часовому інтервалі. Наведено означення обривного керованого марковського процесу, оцінки шляху та оптимальної стратегії, а також доведено істинність фундаментального рівняння за умов, коли множини станів та керувань є вимірними просторами. Наведено метод побудови рівномірно оптимальної стратегії у випадку, коли множини станів та керувань являють собою сепарабельні метричні простори. In the paper, we consider killed Markov decision processes with uncountable sets of states and controls on a finite time interval. Definitions of killed Markov decision process and assessment of the way and optimal policy are given, as well as fundamental equation is proved in the case where the set of states and set of controls are measurable spaces. We also proposed a method to construct the optimal strategy and proved the existence of a uniformly optimal policy in case where the set of states and set of controls are separable metric spaces.
first_indexed 2025-12-01T20:39:25Z
format Article
fulltext
id nasplib_isofts_kiev_ua-123456789-142007
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 0023-1274
language Russian
last_indexed 2025-12-01T20:39:25Z
publishDate 2016
publisher Інститут кібернетики ім. В.М. Глушкова НАН України
record_format dspace
spelling Шпак, П.Р.
Елейко, Я.И.
2018-09-19T19:32:21Z
2018-09-19T19:32:21Z
2016
Оптимальные стратегии и оценка полунепрерывного обрывного управляемого марковского процесса / П.Р. Шпак, Я.И. Елейко // Кибернетика и системный анализ. — 2016. — Т. 52, № 4. — С. 155-160. — Бібліогр.: 5 назв. — рос.
0023-1274
https://nasplib.isofts.kiev.ua/handle/123456789/142007
519.21
Рассмотрены обрывные управляемые марковские процессы с несчетными множествами состояний и управлений на конечном промежутке времени. Приведены определения обрывного управляемого марковского процесса, оценки пути и оптимальной стратегии, а также доказано фундаментальное уравнение в случае, когда множествами состояний и управлений являются измеримые пространства. Предложен метод построения оптимальной стратегии и доказано существование равномерно оптимальной стратегии в случае, когда множествами состояний и управлений есть сепарабельные метрические пространства.
Розглянуто обривні керовані марковські процеси з незліченними множинами станів та керувань на скінченному часовому інтервалі. Наведено означення обривного керованого марковського процесу, оцінки шляху та оптимальної стратегії, а також доведено істинність фундаментального рівняння за умов, коли множини станів та керувань є вимірними просторами. Наведено метод побудови рівномірно оптимальної стратегії у випадку, коли множини станів та керувань являють собою сепарабельні метричні простори.
In the paper, we consider killed Markov decision processes with uncountable sets of states and controls on a finite time interval. Definitions of killed Markov decision process and assessment of the way and optimal policy are given, as well as fundamental equation is proved in the case where the set of states and set of controls are measurable spaces. We also proposed a method to construct the optimal strategy and proved the existence of a uniformly optimal policy in case where the set of states and set of controls are separable metric spaces.
ru
Інститут кібернетики ім. В.М. Глушкова НАН України
Кибернетика и системный анализ
Системный анализ
Оптимальные стратегии и оценка полунепрерывного обрывного управляемого марковского процесса
Оптимальні стратегії та оцінка напівнеперевних обривних керованих марковських процесів
Assessment and optimal policies of semi-continuous killed Markov decision processes
Article
published earlier
spellingShingle Оптимальные стратегии и оценка полунепрерывного обрывного управляемого марковского процесса
Шпак, П.Р.
Елейко, Я.И.
Системный анализ
title Оптимальные стратегии и оценка полунепрерывного обрывного управляемого марковского процесса
title_alt Оптимальні стратегії та оцінка напівнеперевних обривних керованих марковських процесів
Assessment and optimal policies of semi-continuous killed Markov decision processes
title_full Оптимальные стратегии и оценка полунепрерывного обрывного управляемого марковского процесса
title_fullStr Оптимальные стратегии и оценка полунепрерывного обрывного управляемого марковского процесса
title_full_unstemmed Оптимальные стратегии и оценка полунепрерывного обрывного управляемого марковского процесса
title_short Оптимальные стратегии и оценка полунепрерывного обрывного управляемого марковского процесса
title_sort оптимальные стратегии и оценка полунепрерывного обрывного управляемого марковского процесса
topic Системный анализ
topic_facet Системный анализ
url https://nasplib.isofts.kiev.ua/handle/123456789/142007
work_keys_str_mv AT špakpr optimalʹnyestrategiiiocenkapolunepreryvnogoobryvnogoupravlâemogomarkovskogoprocessa
AT eleikoâi optimalʹnyestrategiiiocenkapolunepreryvnogoobryvnogoupravlâemogomarkovskogoprocessa
AT špakpr optimalʹnístrategíítaocínkanapívneperevnihobrivnihkerovanihmarkovsʹkihprocesív
AT eleikoâi optimalʹnístrategíítaocínkanapívneperevnihobrivnihkerovanihmarkovsʹkihprocesív
AT špakpr assessmentandoptimalpoliciesofsemicontinuouskilledmarkovdecisionprocesses
AT eleikoâi assessmentandoptimalpoliciesofsemicontinuouskilledmarkovdecisionprocesses