2025-02-21T08:48:17-05:00 DEBUG: VuFindSearch\Backend\Solr\Connector: Query fl=%2A&wt=json&json.nl=arrarr&q=id%3A%22journaliasakpiua-article-322524%22&qt=morelikethis&rows=5
2025-02-21T08:48:17-05:00 DEBUG: VuFindSearch\Backend\Solr\Connector: => GET http://localhost:8983/solr/biblio/select?fl=%2A&wt=json&json.nl=arrarr&q=id%3A%22journaliasakpiua-article-322524%22&qt=morelikethis&rows=5
2025-02-21T08:48:17-05:00 DEBUG: VuFindSearch\Backend\Solr\Connector: <= 200 OK
2025-02-21T08:48:17-05:00 DEBUG: Deserialized SOLR response
Виявлення небезпечної поведінки в політиках імітації нейромережі для робототехніки для догляду
This paper explores the application of imitation learning in caregiving robotics, aiming at addressing the increasing demand for automated assistance in caring for the elderly and disabled. While leveraging advancements in deep learning and control algorithms, the study focuses on training neural ne...
Saved in:
Main Author: | |
---|---|
Format: | Article |
Language: | English |
Published: |
The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute"
2024
|
Subjects: | |
Online Access: | http://journal.iasa.kpi.ua/article/view/322524 |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
id |
journaliasakpiua-article-322524 |
---|---|
record_format |
ojs |
spelling |
journaliasakpiua-article-3225242025-02-09T21:55:38Z Detecting unsafe behavior in neural network imitation policies for caregiving robotics Виявлення небезпечної поведінки в політиках імітації нейромережі для робототехніки для догляду Tytarenko, Andrii assistive robotics reinforcement learning diffusion models imitation learning anomaly detection допоміжна робототехніка навчання з підкріпленням дифузійні моделі навчання імітацією виявлення аномалій This paper explores the application of imitation learning in caregiving robotics, aiming at addressing the increasing demand for automated assistance in caring for the elderly and disabled. While leveraging advancements in deep learning and control algorithms, the study focuses on training neural network policies using offline demonstrations. A key challenge addressed is the “Policy Stopping” problem, which is crucial for enhancing safety in imitation learning-based policies, particularly diffusion policies. Novel solutions proposed include ensemble predictors and adaptations of the normalizing flow-based algorithm for early anomaly detection. Comparative evaluations against anomaly detection methods like VAE and Tran-AD demonstrate superior performance on assistive robotics benchmarks. The paper concludes by discussing further research in integrating safety models into policy training, which is crucial for the reliable deployment of neural network policies in caregiving robotics. Досліджено застосування навчання за імітацією в задачах робототехніки для догляду, спрямоване на вирішення зростаючого попиту на автоматизовану допомогу в обслуговуванні літніх людей і людей з інвалідністю. На підставі досягнень у глибокому навчанні та керуванні дослідження зосереджено на навчанні стратегій, представлених нейронними мережами за допомогою попередньо зібраних демонстрацій. Однією з ключових проблем, яку вирішується, є проблема «зупинки стратегії», що є важливою для підвищення безпеки в стратегіях, заснованих на навчанні імітацією, таких як дифузійні стратегії. Пропонуються рішення проблеми на базі ансамблів прогнозів стану та адаптації алгоритму на основі нормалізаційного потоку для виявлення аномалій на ранніх стадіях виконання. Порівняльний аналіз з методами виявлення аномалій, такими як VAE та Tran-AD, демонструє перевагу в ефективності методів у задачах робототехніки для догляду. Запропоновано подальші напрями досліджень з інтеграції моделей безпеки в навчання нейромережевих стратегій, що є важливим для надійного впровадження нейромережевих рішень у робототехніку для догляду за людьми. The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2024-12-25 Article Article Peer-reviewed Article application/pdf http://journal.iasa.kpi.ua/article/view/322524 10.20535/SRIT.2308-8893.2024.4.07 System research and information technologies; No. 4 (2024); 86-96 Системные исследования и информационные технологии; № 4 (2024); 86-96 Системні дослідження та інформаційні технології; № 4 (2024); 86-96 2308-8893 1681-6048 en http://journal.iasa.kpi.ua/article/view/322524/312904 |
institution |
System research and information technologies |
baseUrl_str |
|
datestamp_date |
2025-02-09T21:55:38Z |
collection |
OJS |
language |
English |
topic |
допоміжна робототехніка навчання з підкріпленням дифузійні моделі навчання імітацією виявлення аномалій |
spellingShingle |
допоміжна робототехніка навчання з підкріпленням дифузійні моделі навчання імітацією виявлення аномалій Tytarenko, Andrii Виявлення небезпечної поведінки в політиках імітації нейромережі для робототехніки для догляду |
topic_facet |
assistive robotics reinforcement learning diffusion models imitation learning anomaly detection допоміжна робототехніка навчання з підкріпленням дифузійні моделі навчання імітацією виявлення аномалій |
format |
Article |
author |
Tytarenko, Andrii |
author_facet |
Tytarenko, Andrii |
author_sort |
Tytarenko, Andrii |
title |
Виявлення небезпечної поведінки в політиках імітації нейромережі для робототехніки для догляду |
title_short |
Виявлення небезпечної поведінки в політиках імітації нейромережі для робототехніки для догляду |
title_full |
Виявлення небезпечної поведінки в політиках імітації нейромережі для робототехніки для догляду |
title_fullStr |
Виявлення небезпечної поведінки в політиках імітації нейромережі для робототехніки для догляду |
title_full_unstemmed |
Виявлення небезпечної поведінки в політиках імітації нейромережі для робототехніки для догляду |
title_sort |
виявлення небезпечної поведінки в політиках імітації нейромережі для робототехніки для догляду |
title_alt |
Detecting unsafe behavior in neural network imitation policies for caregiving robotics |
description |
This paper explores the application of imitation learning in caregiving robotics, aiming at addressing the increasing demand for automated assistance in caring for the elderly and disabled. While leveraging advancements in deep learning and control algorithms, the study focuses on training neural network policies using offline demonstrations. A key challenge addressed is the “Policy Stopping” problem, which is crucial for enhancing safety in imitation learning-based policies, particularly diffusion policies. Novel solutions proposed include ensemble predictors and adaptations of the normalizing flow-based algorithm for early anomaly detection. Comparative evaluations against anomaly detection methods like VAE and Tran-AD demonstrate superior performance on assistive robotics benchmarks. The paper concludes by discussing further research in integrating safety models into policy training, which is crucial for the reliable deployment of neural network policies in caregiving robotics. |
publisher |
The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" |
publishDate |
2024 |
url |
http://journal.iasa.kpi.ua/article/view/322524 |
work_keys_str_mv |
AT tytarenkoandrii detectingunsafebehaviorinneuralnetworkimitationpoliciesforcaregivingrobotics AT tytarenkoandrii viâvlennânebezpečnoípovedínkivpolítikahímítacíínejromerežídlârobototehníkidlâdoglâdu |
first_indexed |
2025-02-10T04:08:37Z |
last_indexed |
2025-02-10T04:08:37Z |
_version_ |
1824638475107827712 |