2025-02-21T08:48:17-05:00 DEBUG: VuFindSearch\Backend\Solr\Connector: Query fl=%2A&wt=json&json.nl=arrarr&q=id%3A%22journaliasakpiua-article-322524%22&qt=morelikethis&rows=5
2025-02-21T08:48:17-05:00 DEBUG: VuFindSearch\Backend\Solr\Connector: => GET http://localhost:8983/solr/biblio/select?fl=%2A&wt=json&json.nl=arrarr&q=id%3A%22journaliasakpiua-article-322524%22&qt=morelikethis&rows=5
2025-02-21T08:48:17-05:00 DEBUG: VuFindSearch\Backend\Solr\Connector: <= 200 OK
2025-02-21T08:48:17-05:00 DEBUG: Deserialized SOLR response

Виявлення небезпечної поведінки в політиках імітації нейромережі для робототехніки для догляду

This paper explores the application of imitation learning in caregiving robotics, aiming at addressing the increasing demand for automated assistance in caring for the elderly and disabled. While leveraging advancements in deep learning and control algorithms, the study focuses on training neural ne...

Full description

Saved in:
Bibliographic Details
Main Author: Tytarenko, Andrii
Format: Article
Language:English
Published: The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2024
Subjects:
Online Access:http://journal.iasa.kpi.ua/article/view/322524
Tags: Add Tag
No Tags, Be the first to tag this record!
id journaliasakpiua-article-322524
record_format ojs
spelling journaliasakpiua-article-3225242025-02-09T21:55:38Z Detecting unsafe behavior in neural network imitation policies for caregiving robotics Виявлення небезпечної поведінки в політиках імітації нейромережі для робототехніки для догляду Tytarenko, Andrii assistive robotics reinforcement learning diffusion models imitation learning anomaly detection допоміжна робототехніка навчання з підкріпленням дифузійні моделі навчання імітацією виявлення аномалій This paper explores the application of imitation learning in caregiving robotics, aiming at addressing the increasing demand for automated assistance in caring for the elderly and disabled. While leveraging advancements in deep learning and control algorithms, the study focuses on training neural network policies using offline demonstrations. A key challenge addressed is the “Policy Stopping” problem, which is crucial for enhancing safety in imitation learning-based policies, particularly diffusion policies. Novel solutions proposed include ensemble predictors and adaptations of the normalizing flow-based algorithm for early anomaly detection. Comparative evaluations against anomaly detection methods like VAE and Tran-AD demonstrate superior performance on assistive robotics benchmarks. The paper concludes by discussing further research in integrating safety models into policy training, which is crucial for the reliable deployment of neural network policies in caregiving robotics. Досліджено застосування навчання за імітацією в задачах робототехніки для догляду, спрямоване на вирішення зростаючого попиту на автоматизовану допомогу в обслуговуванні літніх людей і людей з інвалідністю. На підставі досягнень у глибокому навчанні та керуванні дослідження зосереджено на навчанні стратегій, представлених нейронними мережами за допомогою попередньо зібраних демонстрацій. Однією з ключових проблем, яку вирішується, є проблема «зупинки стратегії», що є важливою для підвищення безпеки в стратегіях, заснованих на навчанні імітацією, таких як дифузійні стратегії. Пропонуються рішення проблеми на базі ансамблів прогнозів стану та адаптації алгоритму на основі нормалізаційного потоку для виявлення аномалій на ранніх стадіях виконання. Порівняльний аналіз з методами виявлення аномалій, такими як VAE та Tran-AD, демонструє перевагу в ефективності методів у задачах робототехніки для догляду. Запропоновано подальші напрями досліджень з інтеграції моделей безпеки в навчання нейромережевих стратегій, що є важливим для надійного впровадження нейромережевих рішень у робототехніку для догляду за людьми. The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2024-12-25 Article Article Peer-reviewed Article application/pdf http://journal.iasa.kpi.ua/article/view/322524 10.20535/SRIT.2308-8893.2024.4.07 System research and information technologies; No. 4 (2024); 86-96 Системные исследования и информационные технологии; № 4 (2024); 86-96 Системні дослідження та інформаційні технології; № 4 (2024); 86-96 2308-8893 1681-6048 en http://journal.iasa.kpi.ua/article/view/322524/312904
institution System research and information technologies
baseUrl_str
datestamp_date 2025-02-09T21:55:38Z
collection OJS
language English
topic допоміжна робототехніка
навчання з підкріпленням
дифузійні моделі
навчання імітацією
виявлення аномалій
spellingShingle допоміжна робототехніка
навчання з підкріпленням
дифузійні моделі
навчання імітацією
виявлення аномалій
Tytarenko, Andrii
Виявлення небезпечної поведінки в політиках імітації нейромережі для робототехніки для догляду
topic_facet assistive robotics
reinforcement learning
diffusion models
imitation learning
anomaly detection
допоміжна робототехніка
навчання з підкріпленням
дифузійні моделі
навчання імітацією
виявлення аномалій
format Article
author Tytarenko, Andrii
author_facet Tytarenko, Andrii
author_sort Tytarenko, Andrii
title Виявлення небезпечної поведінки в політиках імітації нейромережі для робототехніки для догляду
title_short Виявлення небезпечної поведінки в політиках імітації нейромережі для робототехніки для догляду
title_full Виявлення небезпечної поведінки в політиках імітації нейромережі для робототехніки для догляду
title_fullStr Виявлення небезпечної поведінки в політиках імітації нейромережі для робототехніки для догляду
title_full_unstemmed Виявлення небезпечної поведінки в політиках імітації нейромережі для робототехніки для догляду
title_sort виявлення небезпечної поведінки в політиках імітації нейромережі для робототехніки для догляду
title_alt Detecting unsafe behavior in neural network imitation policies for caregiving robotics
description This paper explores the application of imitation learning in caregiving robotics, aiming at addressing the increasing demand for automated assistance in caring for the elderly and disabled. While leveraging advancements in deep learning and control algorithms, the study focuses on training neural network policies using offline demonstrations. A key challenge addressed is the “Policy Stopping” problem, which is crucial for enhancing safety in imitation learning-based policies, particularly diffusion policies. Novel solutions proposed include ensemble predictors and adaptations of the normalizing flow-based algorithm for early anomaly detection. Comparative evaluations against anomaly detection methods like VAE and Tran-AD demonstrate superior performance on assistive robotics benchmarks. The paper concludes by discussing further research in integrating safety models into policy training, which is crucial for the reliable deployment of neural network policies in caregiving robotics.
publisher The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute"
publishDate 2024
url http://journal.iasa.kpi.ua/article/view/322524
work_keys_str_mv AT tytarenkoandrii detectingunsafebehaviorinneuralnetworkimitationpoliciesforcaregivingrobotics
AT tytarenkoandrii viâvlennânebezpečnoípovedínkivpolítikahímítacíínejromerežídlârobototehníkidlâdoglâdu
first_indexed 2025-02-10T04:08:37Z
last_indexed 2025-02-10T04:08:37Z
_version_ 1824638475107827712