Покращення моделей розпізнавання облич за допомогою навчання подібності, розкладу зміни темпу навчання та аугментацій

Розпізнавання облич — одна з основних задач комп’ютерного зору, актуальна в силу її практичної значущості та викликає велику зацікавленість широкого кола науковців. І хоча дослідження у сфері відбувались з початку розвитку комп’ютерного зору, адекватних результатів змогли досягнути лише за допомогою...

Повний опис

Збережено в:
Бібліографічні деталі
Дата:2021
Автори: Litvynchuk , Andrey, Baranovska , Lesya
Формат: Стаття
Мова:Ukrainian
Опубліковано: V.M. Glushkov Institute of Cybernetics of NAS of Ukraine 2021
Теми:
Онлайн доступ:https://jais.net.ua/index.php/files/article/view/173
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Problems of Control and Informatics

Репозитарії

Problems of Control and Informatics
id oai:ojs2.jais.net.ua:article-173
record_format ojs
institution Problems of Control and Informatics
baseUrl_str
datestamp_date 2024-03-14T11:20:14Z
collection OJS
language Ukrainian
topic згорткові нейронні мережі
розпізнавання облич
навчання подібності
розклад зміни темпу навчання
аугментації
spellingShingle згорткові нейронні мережі
розпізнавання облич
навчання подібності
розклад зміни темпу навчання
аугментації
Litvynchuk , Andrey
Baranovska , Lesya
Покращення моделей розпізнавання облич за допомогою навчання подібності, розкладу зміни темпу навчання та аугментацій
topic_facet convolutional neural networks
face recognition
metric learning
learning rate schedulers
augmentations
сверточные нейронные сети
распознавание лиц
обучение подобию
расписание изменения темпа обучения
аугментации
згорткові нейронні мережі
розпізнавання облич
навчання подібності
розклад зміни темпу навчання
аугментації
format Article
author Litvynchuk , Andrey
Baranovska , Lesya
author_facet Litvynchuk , Andrey
Baranovska , Lesya
author_sort Litvynchuk , Andrey
title Покращення моделей розпізнавання облич за допомогою навчання подібності, розкладу зміни темпу навчання та аугментацій
title_short Покращення моделей розпізнавання облич за допомогою навчання подібності, розкладу зміни темпу навчання та аугментацій
title_full Покращення моделей розпізнавання облич за допомогою навчання подібності, розкладу зміни темпу навчання та аугментацій
title_fullStr Покращення моделей розпізнавання облич за допомогою навчання подібності, розкладу зміни темпу навчання та аугментацій
title_full_unstemmed Покращення моделей розпізнавання облич за допомогою навчання подібності, розкладу зміни темпу навчання та аугментацій
title_sort покращення моделей розпізнавання облич за допомогою навчання подібності, розкладу зміни темпу навчання та аугментацій
title_alt Improving face recognition models using metric learning, learning rate schedulers, and augmentations
Улучшение моделей распознавания лиц посредством обучения подобию, расписанию изменения темпа обучения и аугментаций
description Розпізнавання облич — одна з основних задач комп’ютерного зору, актуальна в силу її практичної значущості та викликає велику зацікавленість широкого кола науковців. І хоча дослідження у сфері відбувались з початку розвитку комп’ютерного зору, адекватних результатів змогли досягнути лише за допомогою згорткових нейронних мереж. У даній роботі проведено порівняльний аналіз методів розпізнавання обличчя до згорткових нейронних мереж. Розглянуто метод навчання подібності, аугментації та розклади зміни темпу навчання. Проведено ряд експериментів, виконано порівняльний аналіз розглянутих методів покращення згорткових нейронних мереж, у результаті отримано універсальний алгоритм для навчання моделі розпізнавання облич. У роботі використано SE-ResNet50 як єдину мережу для експериментів. Навчання подібності — це метод, за допомогою якого можливо досягнути достатньої точності. Перенавчання є серйозною проблемою для нейронних мереж, зокрема тому, що мають дуже багато параметрів, а даних зазвичай не настільки багато, щоб гарантувати узагальнюючу можливість моделі. Додаткова розмітка даних може займати багато часу і бути доволі дорогою, тому виник такий підхід, як аугментації. Аугментації штучно збільшують тренувальний набір даних, тому цілком природньо, що метод аугментації у всіх експериментах покращив результати відносно початкового експерименту. Різні степені та більш агресивні форми аугментації у задачі розпізнавання облич у даній роботі приводив до кращих результатів. Як і очікувалось, найкращим розкладом зміни темпу навчання виявився косинусний з розігрівом та оновленнями. Цей розклад має мало параметрів, до того ж зручний у використанні. Загалом, використовуючи різні підходи, отримали точність 93,5 % на досить складному наборі даних, що на 22 % краще за базовий експеримент. У наступних дослідженнях планується розглянути покращення не лише моделі розпізнавання облич, а й детекції. Від якості детекції обличчя безпосередньо залежить точність розпізнавання.
publisher V.M. Glushkov Institute of Cybernetics of NAS of Ukraine
publishDate 2021
url https://jais.net.ua/index.php/files/article/view/173
work_keys_str_mv AT litvynchukandrey pokraŝennâmodelejrozpíznavannâobličzadopomogoûnavčannâpodíbnostírozkladuzmínitempunavčannâtaaugmentacíj
AT baranovskalesya pokraŝennâmodelejrozpíznavannâobličzadopomogoûnavčannâpodíbnostírozkladuzmínitempunavčannâtaaugmentacíj
AT litvynchukandrey improvingfacerecognitionmodelsusingmetriclearninglearningrateschedulersandaugmentations
AT baranovskalesya improvingfacerecognitionmodelsusingmetriclearninglearningrateschedulersandaugmentations
AT litvynchukandrey ulučšeniemodelejraspoznavaniâlicposredstvomobučeniâpodobiûraspisaniûizmeneniâtempaobučeniâiaugmentacij
AT baranovskalesya ulučšeniemodelejraspoznavaniâlicposredstvomobučeniâpodobiûraspisaniûizmeneniâtempaobučeniâiaugmentacij
first_indexed 2025-10-30T02:48:44Z
last_indexed 2025-10-30T02:48:44Z
_version_ 1847373358459518976
spelling oai:ojs2.jais.net.ua:article-1732024-03-14T11:20:14Z Покращення моделей розпізнавання облич за допомогою навчання подібності, розкладу зміни темпу навчання та аугментацій Improving face recognition models using metric learning, learning rate schedulers, and augmentations Улучшение моделей распознавания лиц посредством обучения подобию, расписанию изменения темпа обучения и аугментаций Litvynchuk , Andrey Baranovska , Lesya convolutional neural networks face recognition metric learning learning rate schedulers augmentations сверточные нейронные сети распознавание лиц обучение подобию расписание изменения темпа обучения аугментации згорткові нейронні мережі розпізнавання облич навчання подібності розклад зміни темпу навчання аугментації Розпізнавання облич — одна з основних задач комп’ютерного зору, актуальна в силу її практичної значущості та викликає велику зацікавленість широкого кола науковців. І хоча дослідження у сфері відбувались з початку розвитку комп’ютерного зору, адекватних результатів змогли досягнути лише за допомогою згорткових нейронних мереж. У даній роботі проведено порівняльний аналіз методів розпізнавання обличчя до згорткових нейронних мереж. Розглянуто метод навчання подібності, аугментації та розклади зміни темпу навчання. Проведено ряд експериментів, виконано порівняльний аналіз розглянутих методів покращення згорткових нейронних мереж, у результаті отримано універсальний алгоритм для навчання моделі розпізнавання облич. У роботі використано SE-ResNet50 як єдину мережу для експериментів. Навчання подібності — це метод, за допомогою якого можливо досягнути достатньої точності. Перенавчання є серйозною проблемою для нейронних мереж, зокрема тому, що мають дуже багато параметрів, а даних зазвичай не настільки багато, щоб гарантувати узагальнюючу можливість моделі. Додаткова розмітка даних може займати багато часу і бути доволі дорогою, тому виник такий підхід, як аугментації. Аугментації штучно збільшують тренувальний набір даних, тому цілком природньо, що метод аугментації у всіх експериментах покращив результати відносно початкового експерименту. Різні степені та більш агресивні форми аугментації у задачі розпізнавання облич у даній роботі приводив до кращих результатів. Як і очікувалось, найкращим розкладом зміни темпу навчання виявився косинусний з розігрівом та оновленнями. Цей розклад має мало параметрів, до того ж зручний у використанні. Загалом, використовуючи різні підходи, отримали точність 93,5 % на досить складному наборі даних, що на 22 % краще за базовий експеримент. У наступних дослідженнях планується розглянути покращення не лише моделі розпізнавання облич, а й детекції. Від якості детекції обличчя безпосередньо залежить точність розпізнавання. Face recognition is one of the main tasks of computer vision, which is relevant due to its practical significance and great interest of wide range of scientists. It has many applications, which has led to a huge amount of research in this area. And although research in the field has been going on since the beginning of the computer vision, good results could be achieved only with the help of convolutional neural networks. In this work, a comparative analysis of facial recognition methods before convolutional neural networks was performed. A metric learning approach, augmentations and learning rate schedulers are considered. There were performed bunch of experiments and comparative analysis of the considered methods of improvement of convolutional neural networks. As a result a universal algorithm for training the face recognition model was obtained. In this work, we used SE-ResNet50 as the only neural network for experiments. Metric learning is a method by which it is possible to achieve good accuracy in face recognition. Overfitting is a big problem of neural networks, in particular because they have too many parameters and usually not enough data to guarantee the generalization of the model. Additional data labeling can be time-consuming and expensive, so there is such an approach as augmentation. Augmentations artificially increase the training dataset, so as expected, this method improved the results relative to the original experiment in all experiments. Different degrees and more aggressive forms of augmentation in this work led to better results. As expected, the best learning rate scheduler was cosine scheduler with warm-ups and restarts. This schedule has few parameters, so it is also easy to use. In general, using different approaches, we were able to obtain an accuracy of 93,5 %, which is 22 % better than the baseline experiment. In the following studies, it is planned to consider improving not only the model of facial recognition, but also detection. The accuracy of face detection directly depends on the quality of face recognition. Распознавание лиц — одна из основных задач компьютерного зрения, актуальная в силу ее практической значимости и вызывает большую заинтересованность широкого круга ученых. И хотя исследования в области происходили с начала развития компьютерного зрения, адекватных результатов смогли достичь только с помощью сверточных нейронных сетей. В данной работе проведен сравнительный анализ методов распознавания лица в сверточных нейронных сетях. Рассмотрен метод обучения подобию, аугментации и расписанию изменения темпа обучения. Проведен ряд экспериментов, выполнен сравнительный анализ рассмотренных методов улучшения сверточных нейронных сетей, в результате получен универсальный алгоритм для обучения модели распознавания лиц. В работе использован SE-ResNet50 как единая сеть для экспериментов. Обучение подобию – это метод, с помощью которого можно достичь достаточной точности. Переобучение является серьезной проблемой для нейронных сетей, в частности, потому что имеют очень много параметров, а данных обычно не настолько много, чтобы гарантировать обобщающую возможность модели. Дополнительная разметка данных может занимать много времени и быть достаточно дорогой, поэтому возник такой подход, как аугментация. Аугментации искусственно увеличивают тренировочный набор данных, поэтому вполне естественно, что метод ау-гментации во всех экспериментах улучшил результаты относительно начального эксперимента. Различные и более агрессивные формы аугментации в задаче распознавания лиц в данной работе приводили к лучшим результатам. Как и ожидалось, лучшим расписанием изменения темпа обучения оказался косину-сный с разогревом и обновлениями. Этот расклад имеет мало параметров, к тому же удобен в использовании. В общем, используя различные подходы, получили точность 93,5 % на достаточно сложном наборе данных, что на 22 % лучше базового эксперимента. В последующих исследованиях планируется рассмотреть улучшение не только модели распознавания лиц, но и детекции. От качества де-текции лица напрямую зависит точность распознавания. V.M. Glushkov Institute of Cybernetics of NAS of Ukraine 2021-08-25 Article Article application/pdf https://jais.net.ua/index.php/files/article/view/173 10.34229/1028-0979-2021-6-9 Міжнародний науково-технічний журнал "Проблеми керування та інформатики"; Том 66 № 6 (2021): Міжнародний науково-технічний журнал "Проблеми керування та інформатики"; 93-101 International Scientific Technical Journal "Problems of Control and Informatics; Том 66 № 6 (2021): International Scientific and Technical Journal "PROBLEMS OF CONTROL AND INFORMATICS"; 93-101 International Scientific Technical Journal "Problems of Control and Informatics"; Vol. 66 No. 6 (2021): International Scientific and Technical Journal "PROBLEMS OF CONTROL AND INFORMATICS"; 93-101 2786-6505 2786-6491 10.34229/1028-0979-2021-6 uk https://jais.net.ua/index.php/files/article/view/173/262 Copyright (c) 2021 Andrey Litvynchuk , Lesya Baranovska https://creativecommons.org/licenses/by-nc-nd/4.0