Зниження ризиків стратегій навчання з підкріпленням для догляду із дифузійними моделями
Care-giving and assistive robotics, driven by advancements in AI, offer promising solutions to meet the growing demand for care, particularly in the context of increasing numbers of individuals requiring assistance. It creates a pressing need for efficient and safe assistive devices, particularly in...
Збережено в:
Дата: | 2024 |
---|---|
Автор: | |
Формат: | Стаття |
Мова: | English |
Опубліковано: |
The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute"
2024
|
Теми: | |
Онлайн доступ: | http://journal.iasa.kpi.ua/article/view/315284 |
Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
Назва журналу: | System research and information technologies |
Репозитарії
System research and information technologiesid |
journaliasakpiua-article-315284 |
---|---|
record_format |
ojs |
spelling |
journaliasakpiua-article-3152842024-11-16T18:06:34Z Reducing risk for assistive reinforcement learning policies with diffusion models Зниження ризиків стратегій навчання з підкріпленням для догляду із дифузійними моделями Tytarenko, Andrii допоміжна робототехніка навчання з підкріпленням дифузійні моделі навчання імітацією assistive robotics reinforcement learning diffusion models imitation learning Care-giving and assistive robotics, driven by advancements in AI, offer promising solutions to meet the growing demand for care, particularly in the context of increasing numbers of individuals requiring assistance. It creates a pressing need for efficient and safe assistive devices, particularly in light of heightened demand due to war-related injuries. While cost has been a barrier to accessibility, technological progress can democratize these solutions. Safety remains a paramount concern, especially given the intricate interactions between assistive robots and humans. This study explores the application of reinforcement learning (RL) and imitation learning in improving policy design for assistive robots. The proposed approach makes the risky policies safer without additional environmental interactions. The enhancement of the conventional RL approaches in tasks related to assistive robotics is demonstrated through experimentation using simulated environments. Допоміжна робототехніка для догляду, що розвивається завдяки досягненням штучного інтелекту, являє собою перспективу для вирішення зростаючого попиту на догляд, особливо в контексті збільшення кількості осіб, які його потребують. Ефективні та безпечні допоміжні пристрої могли б стати корисними, особливо в контексті підвищеного попиту через травми, пов'язані з війною. Хоча вартість є бар'єром для доступності, технологічний прогрес може зробити їх більш доступними. Безпека є найважливішою проблемою, особливо з огляду на модельну складність взаємодії між роботами та людьми. Досліджено застосування навчання з підкріпленням та навчання імітацією для поліпшення процесу проєктування стратегій для асистентних роботів. Запропонований підхід допомагає зробити неробастні стратегії підвищеного ризику більш безпечними без додаткових взаємодій із середовищем. Шляхом експериментів у симульованих середовищах продемонстровано перевагу, яку цей підхід дає в поєднанні з традиційними методами навчання з підкріплленням у завданнях, пов'язаних з допоміжною робототехнікою. The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2024-09-28 Article Article Peer-reviewed Article application/pdf http://journal.iasa.kpi.ua/article/view/315284 10.20535/SRIT.2308-8893.2024.3.09 System research and information technologies; No. 3 (2024); 148-154 Системные исследования и информационные технологии; № 3 (2024); 148-154 Системні дослідження та інформаційні технології; № 3 (2024); 148-154 2308-8893 1681-6048 en http://journal.iasa.kpi.ua/article/view/315284/306098 |
institution |
System research and information technologies |
baseUrl_str |
|
datestamp_date |
2024-11-16T18:06:34Z |
collection |
OJS |
language |
English |
topic |
допоміжна робототехніка навчання з підкріпленням дифузійні моделі навчання імітацією |
spellingShingle |
допоміжна робототехніка навчання з підкріпленням дифузійні моделі навчання імітацією Tytarenko, Andrii Зниження ризиків стратегій навчання з підкріпленням для догляду із дифузійними моделями |
topic_facet |
допоміжна робототехніка навчання з підкріпленням дифузійні моделі навчання імітацією assistive robotics reinforcement learning diffusion models imitation learning |
format |
Article |
author |
Tytarenko, Andrii |
author_facet |
Tytarenko, Andrii |
author_sort |
Tytarenko, Andrii |
title |
Зниження ризиків стратегій навчання з підкріпленням для догляду із дифузійними моделями |
title_short |
Зниження ризиків стратегій навчання з підкріпленням для догляду із дифузійними моделями |
title_full |
Зниження ризиків стратегій навчання з підкріпленням для догляду із дифузійними моделями |
title_fullStr |
Зниження ризиків стратегій навчання з підкріпленням для догляду із дифузійними моделями |
title_full_unstemmed |
Зниження ризиків стратегій навчання з підкріпленням для догляду із дифузійними моделями |
title_sort |
зниження ризиків стратегій навчання з підкріпленням для догляду із дифузійними моделями |
title_alt |
Reducing risk for assistive reinforcement learning policies with diffusion models |
description |
Care-giving and assistive robotics, driven by advancements in AI, offer promising solutions to meet the growing demand for care, particularly in the context of increasing numbers of individuals requiring assistance. It creates a pressing need for efficient and safe assistive devices, particularly in light of heightened demand due to war-related injuries. While cost has been a barrier to accessibility, technological progress can democratize these solutions. Safety remains a paramount concern, especially given the intricate interactions between assistive robots and humans. This study explores the application of reinforcement learning (RL) and imitation learning in improving policy design for assistive robots. The proposed approach makes the risky policies safer without additional environmental interactions. The enhancement of the conventional RL approaches in tasks related to assistive robotics is demonstrated through experimentation using simulated environments. |
publisher |
The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" |
publishDate |
2024 |
url |
http://journal.iasa.kpi.ua/article/view/315284 |
work_keys_str_mv |
AT tytarenkoandrii reducingriskforassistivereinforcementlearningpolicieswithdiffusionmodels AT tytarenkoandrii znižennârizikívstrategíjnavčannâzpídkríplennâmdlâdoglâduízdifuzíjnimimodelâmi |
first_indexed |
2024-12-15T20:42:07Z |
last_indexed |
2024-12-15T20:42:07Z |
_version_ |
1821920242239012864 |