Обобщенные градиенты в задачах динамической оптимизации, оптимального управления и машинного обучения

Рассмотрены негладкие невыпуклые задачи динамической оптимизации, оптимального управления (в дискретном времени), в том числе управления с обратной связью, и машинного обучения. Прослежена аналогия между задачами управления дискретными динамическими системами и задачами обучения многослойных нейронн...

Повний опис

Збережено в:
Бібліографічні деталі
Опубліковано в: :Кибернетика и системный анализ
Дата:2020
Автор: Норкин, В.И.
Формат: Стаття
Мова:Російська
Опубліковано: Інститут кібернетики ім. В.М. Глушкова НАН України 2020
Теми:
Онлайн доступ:https://nasplib.isofts.kiev.ua/handle/123456789/190363
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Обобщенные градиенты в задачах динамической оптимизации, оптимального управления и машинного обучения / В.И. Норкин // Кибернетика и системный анализ. — 2020. — Т. 56, № 2. — С. 89–107. — Бібліогр.: 59 назв. — рос.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
Опис
Резюме:Рассмотрены негладкие невыпуклые задачи динамической оптимизации, оптимального управления (в дискретном времени), в том числе управления с обратной связью, и машинного обучения. Прослежена аналогия между задачами управления дискретными динамическими системами и задачами обучения многослойных нейронных сетей с негладкими целевыми функционалами и связями. Обоснованы методы вычисления обобщенных градиентов для таких систем на основе функций Гамильтона - Понтрягина. Градиентные (стохастические) алгоритмы оптимального управления и обучения распространяются на невыпуклые негладкие динамические системы. Розглянуто негладкі неопуклі задачі динамічної оптимізації, оптимального керування (у дискретному часі), зокрема керування зі зворотним зв'язком, і машинного навчання. Простежено аналогію між задачами керування дискретними динамічними системами та задачами навчання багатошарових нейронних мереж з негладкими цільовими функціоналами та зв'язками. Обгрунтовано методи обчислення узагальнених градієнтів для таких систем на основі функцій Гамільтона Понтрягіна. Градієнтні (стохастичні) алгоритми оптимального керування і навчання поширюються на неопуклі негладкі динамічні системи. Problems of nonsmooth nonconvex dynamic optimization, optimal control (in discrete time), including feedback control, and machine learning are considered from a common point of view. An analogy between controlling discrete dynamical systems and multilayer neural networks learning problems with nonsmooth functionals and connections is traced. Methods for computing subgradients for such systems based on the Hamilton–Pontryagin functions are developed. Gradient (stochastic) algorithms for optimal control and learning are extended to nonconvex nonsmooth systems.
ISSN:1019-5262