Покращення моделей розпізнавання облич за допомогою згорткових нейронних мереж, навчання подібності та методів оптимізації
Розпізнавання облич — це одна з основних задач комп’ютерного зору. Вона має безліч прикладних застосувань, що призвело до величезної кількості досліджень у цій сфері. І хоча дослідження відбувались з початку розвитку комп’ютерного зору, адекватних результатів змогли досягнути лише за допомогою згорт...
Збережено в:
| Дата: | 2021 |
|---|---|
| Автори: | , |
| Формат: | Стаття |
| Мова: | Ukrainian |
| Опубліковано: |
V.M. Glushkov Institute of Cybernetics of NAS of Ukraine
2021
|
| Теми: | |
| Онлайн доступ: | https://jais.net.ua/index.php/files/article/view/189 |
| Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
| Назва журналу: | Problems of Control and Informatics |
Репозитарії
Problems of Control and Informatics| id |
oai:ojs2.jais.net.ua:article-189 |
|---|---|
| record_format |
ojs |
| institution |
Problems of Control and Informatics |
| baseUrl_str |
|
| datestamp_date |
2024-03-14T11:08:24Z |
| collection |
OJS |
| language |
Ukrainian |
| topic |
методи оптимізації навчання подібності згорткові нейронні мережі розпізнавання облич |
| spellingShingle |
методи оптимізації навчання подібності згорткові нейронні мережі розпізнавання облич Litvynchuk , Andrey Baranovska , Lesya Покращення моделей розпізнавання облич за допомогою згорткових нейронних мереж, навчання подібності та методів оптимізації |
| topic_facet |
методи оптимізації навчання подібності згорткові нейронні мережі розпізнавання облич методы оптимизации обучение подобия распознавание лиц сверточные нейронные сети optimiza-tion methods optimization methods metric learning face recognition convolutional neural networks |
| format |
Article |
| author |
Litvynchuk , Andrey Baranovska , Lesya |
| author_facet |
Litvynchuk , Andrey Baranovska , Lesya |
| author_sort |
Litvynchuk , Andrey |
| title |
Покращення моделей розпізнавання облич за допомогою згорткових нейронних мереж, навчання подібності та методів оптимізації |
| title_short |
Покращення моделей розпізнавання облич за допомогою згорткових нейронних мереж, навчання подібності та методів оптимізації |
| title_full |
Покращення моделей розпізнавання облич за допомогою згорткових нейронних мереж, навчання подібності та методів оптимізації |
| title_fullStr |
Покращення моделей розпізнавання облич за допомогою згорткових нейронних мереж, навчання подібності та методів оптимізації |
| title_full_unstemmed |
Покращення моделей розпізнавання облич за допомогою згорткових нейронних мереж, навчання подібності та методів оптимізації |
| title_sort |
покращення моделей розпізнавання облич за допомогою згорткових нейронних мереж, навчання подібності та методів оптимізації |
| title_alt |
Improving face recognition models using convolutional neural networks, metric learning and optimization method Улучшение моделей распознавания лиц с помощью сверточных нейронных сетей, обучение подобию и методам оптимизации |
| description |
Розпізнавання облич — це одна з основних задач комп’ютерного зору. Вона має безліч прикладних застосувань, що призвело до величезної кількості досліджень у цій сфері. І хоча дослідження відбувались з початку розвитку комп’ютерного зору, адекватних результатів змогли досягнути лише за допомогою згорткових нейронних мереж. У даній роботі проведено порівняльний аналіз методів розпізнавання облич до згорткових нейронних мереж. Розглянуто набір архітектур нейронних мереж, методів навчання подібності та оптимізації. Проведено ряд експериментів, виконано порівняльний аналіз розглянутих методів покращення згорткових нейронних мереж, в результаті отримано універсальний алгоритм для навчання моделі розпізнавання облич. Для порівняння різних підходів розпізнавання облич ми обрали набір даних VGGFace2. Він складається з 3,31 млн зображень 9131 людини. Його створили за допомогою зображень з пошукової системи Google. Спочатку застосовувалися попередньо навчені нейронні мережі для виділення певної кількості найбільш можливих фотографій людини. Після цього зображення перевірялись розмітниками для фінальної ідентифікації. Для валідаційної вибірки відклали 50 зображень 500 людей, загалом 25000 зображень. Практично всі експерименти проводилися ітеративно. Тобто, обравши найкращий підхід у попередньому етапі (наприклад, найкращий оптимізатор), ми використовували вже його і далі перевіряли, наприклад, архітектуру мережі. Як і очікувалось, нейронні мережі з більшою кількістю параметрів та складнішою архітектурою показували кращі результати у наведеній в роботі задачі. Серед розглянутих нами моделей найкращою виявилась Se-ResNet50. Навчання подібності — це метод, за допомогою якого можливо досягнути хорошої точності. Без цього методу задачу вирішити було б неможливо. Для оптимізації нейронних мереж ми розглядали і адаптивні, і прості оптимізатори. Як показано у роботі, для даної задачі найкращим виявився стохастичний градієнтний спуск з моментом, а адаптивні методи показали поганий результат. Загалом, використовуючи різні підходи, ми змогли отримати точність 92 % на досить складному наборі даних, що на 25,5 % краще за базовий експеримент. подальший розвиток даного дослідження можливий завдяки покращенню архітектури нейронної мережі, збору більшої кількості даних та застосуванню кращих методів регуляризації. |
| publisher |
V.M. Glushkov Institute of Cybernetics of NAS of Ukraine |
| publishDate |
2021 |
| url |
https://jais.net.ua/index.php/files/article/view/189 |
| work_keys_str_mv |
AT litvynchukandrey pokraŝennâmodelejrozpíznavannâobličzadopomogoûzgortkovihnejronnihmerežnavčannâpodíbnostítametodívoptimízacíí AT baranovskalesya pokraŝennâmodelejrozpíznavannâobličzadopomogoûzgortkovihnejronnihmerežnavčannâpodíbnostítametodívoptimízacíí AT litvynchukandrey improvingfacerecognitionmodelsusingconvolutionalneuralnetworksmetriclearningandoptimizationmethod AT baranovskalesya improvingfacerecognitionmodelsusingconvolutionalneuralnetworksmetriclearningandoptimizationmethod AT litvynchukandrey ulučšeniemodelejraspoznavaniâlicspomoŝʹûsvertočnyhnejronnyhsetejobučeniepodobiûimetodamoptimizacii AT baranovskalesya ulučšeniemodelejraspoznavaniâlicspomoŝʹûsvertočnyhnejronnyhsetejobučeniepodobiûimetodamoptimizacii |
| first_indexed |
2025-10-30T02:48:46Z |
| last_indexed |
2025-10-30T02:48:46Z |
| _version_ |
1847373360171843584 |
| spelling |
oai:ojs2.jais.net.ua:article-1892024-03-14T11:08:24Z Покращення моделей розпізнавання облич за допомогою згорткових нейронних мереж, навчання подібності та методів оптимізації Improving face recognition models using convolutional neural networks, metric learning and optimization method Улучшение моделей распознавания лиц с помощью сверточных нейронных сетей, обучение подобию и методам оптимизации Litvynchuk , Andrey Baranovska , Lesya методи оптимізації навчання подібності згорткові нейронні мережі розпізнавання облич методы оптимизации обучение подобия распознавание лиц сверточные нейронные сети optimiza-tion methods optimization methods metric learning face recognition convolutional neural networks Розпізнавання облич — це одна з основних задач комп’ютерного зору. Вона має безліч прикладних застосувань, що призвело до величезної кількості досліджень у цій сфері. І хоча дослідження відбувались з початку розвитку комп’ютерного зору, адекватних результатів змогли досягнути лише за допомогою згорткових нейронних мереж. У даній роботі проведено порівняльний аналіз методів розпізнавання облич до згорткових нейронних мереж. Розглянуто набір архітектур нейронних мереж, методів навчання подібності та оптимізації. Проведено ряд експериментів, виконано порівняльний аналіз розглянутих методів покращення згорткових нейронних мереж, в результаті отримано універсальний алгоритм для навчання моделі розпізнавання облич. Для порівняння різних підходів розпізнавання облич ми обрали набір даних VGGFace2. Він складається з 3,31 млн зображень 9131 людини. Його створили за допомогою зображень з пошукової системи Google. Спочатку застосовувалися попередньо навчені нейронні мережі для виділення певної кількості найбільш можливих фотографій людини. Після цього зображення перевірялись розмітниками для фінальної ідентифікації. Для валідаційної вибірки відклали 50 зображень 500 людей, загалом 25000 зображень. Практично всі експерименти проводилися ітеративно. Тобто, обравши найкращий підхід у попередньому етапі (наприклад, найкращий оптимізатор), ми використовували вже його і далі перевіряли, наприклад, архітектуру мережі. Як і очікувалось, нейронні мережі з більшою кількістю параметрів та складнішою архітектурою показували кращі результати у наведеній в роботі задачі. Серед розглянутих нами моделей найкращою виявилась Se-ResNet50. Навчання подібності — це метод, за допомогою якого можливо досягнути хорошої точності. Без цього методу задачу вирішити було б неможливо. Для оптимізації нейронних мереж ми розглядали і адаптивні, і прості оптимізатори. Як показано у роботі, для даної задачі найкращим виявився стохастичний градієнтний спуск з моментом, а адаптивні методи показали поганий результат. Загалом, використовуючи різні підходи, ми змогли отримати точність 92 % на досить складному наборі даних, що на 25,5 % краще за базовий експеримент. подальший розвиток даного дослідження можливий завдяки покращенню архітектури нейронної мережі, збору більшої кількості даних та застосуванню кращих методів регуляризації. Face recognition is one of the main tasks of computer vision. It has many applications, which has led to a huge amount of research in this area. And although research in the field has been going on since the beginning of the computer vision, good results could be achieved only with the help of convolutional neural networks. In this work, a comparative analysis of facial recognition methods before convolutional neural networks was performed. A set of neural network architectures, methods of metric learning and optimization are considered. There were performed bunch of experiments and comparative analysis of the considered methods of improvement of convolutional neural networks. As a result a universal algorithm for training the face recognition model was obtained. To compare different approaches of face recognition, we chose a dataset called VGGFace2. It consists of 3,31 million images of 9131 people. It was created using images from the Google search engine. Initially, pre-trained neural networks were used to select photographs with humans. The images were then checked mannualy. For the validation sample, we set aside 50 images of 500 people, for a total of 25,000 images. Almost all experiments were performed iteratively. For example, we choose the best optimizer and then we use it to search for best arctitecture. As expected, neural networks with more parameters and more sophisticated architecture showed better results in this task. Among the considered models the best was Se-ResNet50. Metric learning is a method by which it is possible to achieve good accuracy in face recognition. Without this method it would be impossible to solve the problem. To optimize neural networks, we considered both adaptive and simple optimizers. It turned out that the stochastic gradient descent with moment is the best for this problem, and adaptive methods showed a rather poor result. In general, using different approaches, we were able to obtain an accuracy of 92 %, which is 25,5 % better than the baseline experiment. We see next ways for the further development of the research subject: improving neural network architecture, collecting more data and applying better regularization techniques. Распознавание лиц – это одна из основных задач компьютерного зрения. Она имеет множество прикладных применений, что привело к множеству исследований в этой сфере. И хотя исследования происходили с начала развития компьютерного зрения, адекватных результатов смогли достичь только с помощью сверточных нейронных сетей. В данной работе проведен сравнительный анализ методов распознавания лиц в сверточных нейронных сетях. Рассмотрен набор архитектур нейронных сетей, методов обучения подобию и оптимизации. Проведен ряд экспериментов, выполнен сравнительный анализ рассмотренных методов улучшения сверточных нейронных сетей, в результате получен универсальный алгоритм для обучения модели распознавания лиц. Для сравнения различных подходов к распознаванию лиц мы выбрали набор данных VGGFace2. Он состоит из 3,31 млн изображений 9131 человека. Его создали с помощью изображений из поисковой системы Google. Первоначально применялись предварительно обученные нейронные сети для выделения определенного количества наиболее возможных фотографий человека. После этого изображения проверялись разметчиками для финальной идентификации. Для валидационной выборки отложили 50 изображений 500 человек, в общей сложности 25000 изображений. Фактически все опыты проводились итеративно. То есть, выбрав лучший подход в предыдущем этапе (например, лучший оптимизатор), мы использовали его и дальше проверяли, например, архитектуру сети. Как и ожидалось, нейронные сети с большим количеством параметров и более сложной архитектурой показывали лучшие результаты в приведенной в работе задаче. Среди рассмотренных нами моделей лучшей оказалась Se-ResNet50. Обучение подобию – это метод, с помощью которого можно достичь хорошей точности. Без этого метода задачу решить было бы невозможно. Для оптимизации нейронных сетей мы рассматривали и адаптивные, и простые оптимизаторы. Как показано в работе, для данной задачки лучшим оказался стохастический градиентный спуск с моментом, а адаптивные способы показали нехороший итог. В общем, используя различные подходы, мы смогли получить точность 92 % на достаточно сложном наборе данных, что на 25,5 % лучше базового эксперимента. дальнейшее развитие данного исследования возможно благодаря улучшению архитектуры нейронной сети, сбору большего количества данных и применению лучших методов регуляризации. V.M. Glushkov Institute of Cybernetics of NAS of Ukraine 2021-08-07 Article Article application/pdf https://jais.net.ua/index.php/files/article/view/189 10.34229/1028-0979-2021-5-11 Міжнародний науково-технічний журнал "Проблеми керування та інформатики"; Том 66 № 5 (2021): Міжнародний науково-технічний журнал "Проблеми керування та інформатики"; 140-158 International Scientific Technical Journal "Problems of Control and Informatics; Том 66 № 5 (2021): International Scientific and Technical Journal "PROBLEMS OF CONTROL AND INFORMATICS"; 140-158 International Scientific Technical Journal "Problems of Control and Informatics"; Vol. 66 No. 5 (2021): International Scientific and Technical Journal "PROBLEMS OF CONTROL AND INFORMATICS"; 140-158 2786-6505 2786-6491 10.34229/1028-0979-2021-5 uk https://jais.net.ua/index.php/files/article/view/189/278 Copyright (c) 2021 Andrey Litvynchuk , Lesya Baranovska https://creativecommons.org/licenses/by-nc-nd/4.0 |