Мультиагентне навчання з підкріпленням для оптимізації квантових схем
У статті представлено підхід до оптимізації квантових схем на основі мультиагентного навчання з підкріпленням (Multi-Agent Reinforcement Learning — MARL), у якому алгоритм MAPPO (Multi-Agent Proximal Policy Optimization — мультиагентна проксимальна оптимізація політики) поєднується з графовими нейро...
Збережено в:
| Опубліковано в: : | Проблеми керування та інформатики |
|---|---|
| Дата: | 2025 |
| Автори: | , |
| Формат: | Стаття |
| Мова: | Українська |
| Опубліковано: |
Інститут кібернетики ім. В.М. Глушкова НАН України
2025
|
| Теми: | |
| Онлайн доступ: | https://nasplib.isofts.kiev.ua/handle/123456789/211413 |
| Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Цитувати: | Мультиагентне навчання з підкріпленням для оптимізації квантових схем / І.І. Кирилов, І.П. Сініцин // Проблемы управления и информатики. — 2025. — № 4. — С. 109-123. — Бібліогр.: 16 назв. — укр. |