Виявлення небезпечної поведінки в політиках імітації нейромережі для робототехніки для догляду

This paper explores the application of imitation learning in caregiving robotics, aiming at addressing the increasing demand for automated assistance in caring for the elderly and disabled. While leveraging advancements in deep learning and control algorithms, the study focuses on training neural ne...

Full description

Saved in:
Bibliographic Details
Date:2024
Main Author: Tytarenko, Andrii
Format: Article
Language:English
Published: The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2024
Subjects:
Online Access:http://journal.iasa.kpi.ua/article/view/322524
Tags: Add Tag
No Tags, Be the first to tag this record!
Journal Title:System research and information technologies

Institution

System research and information technologies
_version_ 1856543608567496704
author Tytarenko, Andrii
author_facet Tytarenko, Andrii
author_sort Tytarenko, Andrii
baseUrl_str
collection OJS
datestamp_date 2025-02-09T21:55:38Z
description This paper explores the application of imitation learning in caregiving robotics, aiming at addressing the increasing demand for automated assistance in caring for the elderly and disabled. While leveraging advancements in deep learning and control algorithms, the study focuses on training neural network policies using offline demonstrations. A key challenge addressed is the “Policy Stopping” problem, which is crucial for enhancing safety in imitation learning-based policies, particularly diffusion policies. Novel solutions proposed include ensemble predictors and adaptations of the normalizing flow-based algorithm for early anomaly detection. Comparative evaluations against anomaly detection methods like VAE and Tran-AD demonstrate superior performance on assistive robotics benchmarks. The paper concludes by discussing further research in integrating safety models into policy training, which is crucial for the reliable deployment of neural network policies in caregiving robotics.
first_indexed 2025-07-17T10:28:40Z
format Article
id journaliasakpiua-article-322524
institution System research and information technologies
language English
last_indexed 2025-07-17T10:28:40Z
publishDate 2024
publisher The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute"
record_format ojs
spelling journaliasakpiua-article-3225242025-02-09T21:55:38Z Detecting unsafe behavior in neural network imitation policies for caregiving robotics Виявлення небезпечної поведінки в політиках імітації нейромережі для робототехніки для догляду Tytarenko, Andrii assistive robotics reinforcement learning diffusion models imitation learning anomaly detection допоміжна робототехніка навчання з підкріпленням дифузійні моделі навчання імітацією виявлення аномалій This paper explores the application of imitation learning in caregiving robotics, aiming at addressing the increasing demand for automated assistance in caring for the elderly and disabled. While leveraging advancements in deep learning and control algorithms, the study focuses on training neural network policies using offline demonstrations. A key challenge addressed is the “Policy Stopping” problem, which is crucial for enhancing safety in imitation learning-based policies, particularly diffusion policies. Novel solutions proposed include ensemble predictors and adaptations of the normalizing flow-based algorithm for early anomaly detection. Comparative evaluations against anomaly detection methods like VAE and Tran-AD demonstrate superior performance on assistive robotics benchmarks. The paper concludes by discussing further research in integrating safety models into policy training, which is crucial for the reliable deployment of neural network policies in caregiving robotics. Досліджено застосування навчання за імітацією в задачах робототехніки для догляду, спрямоване на вирішення зростаючого попиту на автоматизовану допомогу в обслуговуванні літніх людей і людей з інвалідністю. На підставі досягнень у глибокому навчанні та керуванні дослідження зосереджено на навчанні стратегій, представлених нейронними мережами за допомогою попередньо зібраних демонстрацій. Однією з ключових проблем, яку вирішується, є проблема «зупинки стратегії», що є важливою для підвищення безпеки в стратегіях, заснованих на навчанні імітацією, таких як дифузійні стратегії. Пропонуються рішення проблеми на базі ансамблів прогнозів стану та адаптації алгоритму на основі нормалізаційного потоку для виявлення аномалій на ранніх стадіях виконання. Порівняльний аналіз з методами виявлення аномалій, такими як VAE та Tran-AD, демонструє перевагу в ефективності методів у задачах робототехніки для догляду. Запропоновано подальші напрями досліджень з інтеграції моделей безпеки в навчання нейромережевих стратегій, що є важливим для надійного впровадження нейромережевих рішень у робототехніку для догляду за людьми. The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2024-12-25 Article Article Peer-reviewed Article application/pdf http://journal.iasa.kpi.ua/article/view/322524 10.20535/SRIT.2308-8893.2024.4.07 System research and information technologies; No. 4 (2024); 86-96 Системные исследования и информационные технологии; № 4 (2024); 86-96 Системні дослідження та інформаційні технології; № 4 (2024); 86-96 2308-8893 1681-6048 en http://journal.iasa.kpi.ua/article/view/322524/312904
spellingShingle допоміжна робототехніка
навчання з підкріпленням
дифузійні моделі
навчання імітацією
виявлення аномалій
Tytarenko, Andrii
Виявлення небезпечної поведінки в політиках імітації нейромережі для робототехніки для догляду
title Виявлення небезпечної поведінки в політиках імітації нейромережі для робототехніки для догляду
title_alt Detecting unsafe behavior in neural network imitation policies for caregiving robotics
title_full Виявлення небезпечної поведінки в політиках імітації нейромережі для робототехніки для догляду
title_fullStr Виявлення небезпечної поведінки в політиках імітації нейромережі для робототехніки для догляду
title_full_unstemmed Виявлення небезпечної поведінки в політиках імітації нейромережі для робототехніки для догляду
title_short Виявлення небезпечної поведінки в політиках імітації нейромережі для робототехніки для догляду
title_sort виявлення небезпечної поведінки в політиках імітації нейромережі для робототехніки для догляду
topic допоміжна робототехніка
навчання з підкріпленням
дифузійні моделі
навчання імітацією
виявлення аномалій
topic_facet assistive robotics
reinforcement learning
diffusion models
imitation learning
anomaly detection
допоміжна робототехніка
навчання з підкріпленням
дифузійні моделі
навчання імітацією
виявлення аномалій
url http://journal.iasa.kpi.ua/article/view/322524
work_keys_str_mv AT tytarenkoandrii detectingunsafebehaviorinneuralnetworkimitationpoliciesforcaregivingrobotics
AT tytarenkoandrii viâvlennânebezpečnoípovedínkivpolítikahímítacíínejromerežídlârobototehníkidlâdoglâdu