Мультиагентне навчання з підкріпленням для оптимізації квантових схем

У статті представлено підхід до оптимізації квантових схем на основі мультиагентного навчання з підкріпленням (Multi-Agent Reinforcement Learning — MARL), у якому алгоритм MAPPO (Multi-Agent Proximal Policy Optimization — мультиагентна проксимальна оптимізація політики) поєднується з графовими нейро...

Повний опис

Збережено в:
Бібліографічні деталі
Опубліковано в: :Проблеми керування та інформатики
Дата:2025
Автори: Кирилов, І.І., Сініцин, І.П.
Формат: Стаття
Мова:Українська
Опубліковано: Інститут кібернетики ім. В.М. Глушкова НАН України 2025
Теми:
Онлайн доступ:https://nasplib.isofts.kiev.ua/handle/123456789/211413
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Мультиагентне навчання з підкріпленням для оптимізації квантових схем / І.І. Кирилов, І.П. Сініцин // Проблемы управления и информатики. — 2025. — № 4. — С. 109-123. — Бібліогр.: 16 назв. — укр.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine