Зниження ризиків стратегій навчання з підкріпленням для догляду із дифузійними моделями

Care-giving and assistive robotics, driven by advancements in AI, offer promising solutions to meet the growing demand for care, particularly in the context of increasing numbers of individuals requiring assistance. It creates a pressing need for efficient and safe assistive devices, particularly in...

Повний опис

Збережено в:
Бібліографічні деталі
Дата:2024
Автор: Tytarenko, Andrii
Формат: Стаття
Мова:English
Опубліковано: The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2024
Теми:
Онлайн доступ:http://journal.iasa.kpi.ua/article/view/315284
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:System research and information technologies

Репозитарії

System research and information technologies
id journaliasakpiua-article-315284
record_format ojs
spelling journaliasakpiua-article-3152842024-11-16T18:06:34Z Reducing risk for assistive reinforcement learning policies with diffusion models Зниження ризиків стратегій навчання з підкріпленням для догляду із дифузійними моделями Tytarenko, Andrii допоміжна робототехніка навчання з підкріпленням дифузійні моделі навчання імітацією assistive robotics reinforcement learning diffusion models imitation learning Care-giving and assistive robotics, driven by advancements in AI, offer promising solutions to meet the growing demand for care, particularly in the context of increasing numbers of individuals requiring assistance. It creates a pressing need for efficient and safe assistive devices, particularly in light of heightened demand due to war-related injuries. While cost has been a barrier to accessibility, technological progress can democratize these solutions. Safety remains a paramount concern, especially given the intricate interactions between assistive robots and humans. This study explores the application of reinforcement learning (RL) and imitation learning in improving policy design for assistive robots. The proposed approach makes the risky policies safer without additional environmental interactions. The enhancement of the conventional RL approaches in tasks related to assistive robotics is demonstrated through experimentation using simulated environments. Допоміжна робототехніка для догляду, що розвивається завдяки досягненням штучного інтелекту, являє собою перспективу для вирішення зростаючого попиту на догляд, особливо в контексті збільшення кількості осіб, які його потребують. Ефективні та безпечні допоміжні пристрої могли б стати корисними, особливо в контексті підвищеного попиту через травми, пов'язані з війною. Хоча вартість є бар'єром для доступності, технологічний прогрес може зробити їх більш доступними. Безпека є найважливішою проблемою, особливо з огляду на модельну складність взаємодії між роботами та людьми. Досліджено застосування навчання з підкріпленням та навчання імітацією для поліпшення процесу проєктування стратегій для асистентних роботів. Запропонований підхід допомагає зробити неробастні стратегії підвищеного ризику більш безпечними без додаткових взаємодій із середовищем. Шляхом експериментів у симульованих середовищах продемонстровано перевагу, яку цей підхід дає в поєднанні з традиційними методами навчання з підкріплленням у завданнях, пов'язаних з допоміжною робототехнікою. The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2024-09-28 Article Article Peer-reviewed Article application/pdf http://journal.iasa.kpi.ua/article/view/315284 10.20535/SRIT.2308-8893.2024.3.09 System research and information technologies; No. 3 (2024); 148-154 Системные исследования и информационные технологии; № 3 (2024); 148-154 Системні дослідження та інформаційні технології; № 3 (2024); 148-154 2308-8893 1681-6048 en http://journal.iasa.kpi.ua/article/view/315284/306098
institution System research and information technologies
baseUrl_str
datestamp_date 2024-11-16T18:06:34Z
collection OJS
language English
topic допоміжна робототехніка
навчання з підкріпленням
дифузійні моделі
навчання імітацією
spellingShingle допоміжна робототехніка
навчання з підкріпленням
дифузійні моделі
навчання імітацією
Tytarenko, Andrii
Зниження ризиків стратегій навчання з підкріпленням для догляду із дифузійними моделями
topic_facet допоміжна робототехніка
навчання з підкріпленням
дифузійні моделі
навчання імітацією
assistive robotics
reinforcement learning
diffusion models
imitation learning
format Article
author Tytarenko, Andrii
author_facet Tytarenko, Andrii
author_sort Tytarenko, Andrii
title Зниження ризиків стратегій навчання з підкріпленням для догляду із дифузійними моделями
title_short Зниження ризиків стратегій навчання з підкріпленням для догляду із дифузійними моделями
title_full Зниження ризиків стратегій навчання з підкріпленням для догляду із дифузійними моделями
title_fullStr Зниження ризиків стратегій навчання з підкріпленням для догляду із дифузійними моделями
title_full_unstemmed Зниження ризиків стратегій навчання з підкріпленням для догляду із дифузійними моделями
title_sort зниження ризиків стратегій навчання з підкріпленням для догляду із дифузійними моделями
title_alt Reducing risk for assistive reinforcement learning policies with diffusion models
description Care-giving and assistive robotics, driven by advancements in AI, offer promising solutions to meet the growing demand for care, particularly in the context of increasing numbers of individuals requiring assistance. It creates a pressing need for efficient and safe assistive devices, particularly in light of heightened demand due to war-related injuries. While cost has been a barrier to accessibility, technological progress can democratize these solutions. Safety remains a paramount concern, especially given the intricate interactions between assistive robots and humans. This study explores the application of reinforcement learning (RL) and imitation learning in improving policy design for assistive robots. The proposed approach makes the risky policies safer without additional environmental interactions. The enhancement of the conventional RL approaches in tasks related to assistive robotics is demonstrated through experimentation using simulated environments.
publisher The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute"
publishDate 2024
url http://journal.iasa.kpi.ua/article/view/315284
work_keys_str_mv AT tytarenkoandrii reducingriskforassistivereinforcementlearningpolicieswithdiffusionmodels
AT tytarenkoandrii znižennârizikívstrategíjnavčannâzpídkríplennâmdlâdoglâduízdifuzíjnimimodelâmi
first_indexed 2024-12-15T20:42:07Z
last_indexed 2024-12-15T20:42:07Z
_version_ 1821920242239012864