Optimization methods for face recognition algorithmes

The paper examines the main drawbacks of modern face recognition algorithms: low processing speed, high sensitivity to image quality and face positioning. A division into three approaches to face recognition algorithms optimization is proposed: optimization of feature weights, algorithm hyperparamet...

Повний опис

Збережено в:
Бібліографічні деталі
Дата:2025
Автори: Sitkov, I.P., Glybovets, M.M.
Формат: Стаття
Мова:Ukrainian
Опубліковано: PROBLEMS IN PROGRAMMING 2025
Теми:
Онлайн доступ:https://pp.isofts.kiev.ua/index.php/ojs1/article/view/766
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Problems in programming
Завантажити файл: Pdf

Репозитарії

Problems in programming
id pp_isofts_kiev_ua-article-766
record_format ojs
resource_txt_mv ppisoftskievua/7a/48a04ac1d1e198e45116b8a54af7a67a.pdf
spelling pp_isofts_kiev_ua-article-7662025-09-02T15:46:41Z Optimization methods for face recognition algorithmes Методи оптимізації алгоритмів розпізнавання обличчя Sitkov, I.P. Glybovets, M.M. optimization methods; genetic algorithm; convolutional neural networks; face recognition algorithms UDC 004.8 методи оптимізації; генетичний алгоритм; згорткові нейронні мережі; алгоритми розпі знавання обличчя УДК 004.8 The paper examines the main drawbacks of modern face recognition algorithms: low processing speed, high sensitivity to image quality and face positioning. A division into three approaches to face recognition algorithms optimization is proposed: optimization of feature weights, algorithm hyperparameters, and constructing an optimal distributed system architecture. Examples of the application of Particle Swarm Optimization, Cuckoo Search, Simulated Annealing, and genetic algorithms to overcome the mentioned limitations in existing algorithms are provided. The study demonstrates the advantages and disadvantages of these optimization methods and identifies promising directions for further research in face identification methods optimization using genetic algorithms.Prombles in programming 2025; 1: 74-81 У роботі розглянуто основні недоліки сучасних алгоритмів розпізнавання обличчя: низьку швидкість роботи, високу чутливість до якості зображень та розташування обличчя. Запропоновано поділ на три основні підходи до оптимізації алгоритмів розпізнавання обличчя: оптимізація ваги ознак, гіперпараме трів алгоритмів та побудова оптимальної розподіленої системи; наведено приклади застосування алго ритмів Particle Swarm Optimization, Cuckoo Search, методу імітації відпалу, генетичних алгоритмів для усунення згаданих обмежень у наявних алгоритмах. У дослідженні продемонстровано переваги та недо ліки вказаних методів оптимізації, визначено перспективні напрями подальших досліджень у галузі оп тимізації методів ідентифікації обличчя за допомогою генетичних алгоритмів.Prombles in programming 2025; 1: 74-81 PROBLEMS IN PROGRAMMING ПРОБЛЕМЫ ПРОГРАММИРОВАНИЯ ПРОБЛЕМИ ПРОГРАМУВАННЯ 2025-08-27 Article Article application/pdf https://pp.isofts.kiev.ua/index.php/ojs1/article/view/766 10.15407/pp2025.01.074 PROBLEMS IN PROGRAMMING; No 1 (2025); 74-81 ПРОБЛЕМЫ ПРОГРАММИРОВАНИЯ; No 1 (2025); 74-81 ПРОБЛЕМИ ПРОГРАМУВАННЯ; No 1 (2025); 74-81 1727-4907 10.15407/pp2025.01 uk https://pp.isofts.kiev.ua/index.php/ojs1/article/view/766/818 Copyright (c) 2025 PROBLEMS IN PROGRAMMING
institution Problems in programming
baseUrl_str https://pp.isofts.kiev.ua/index.php/ojs1/oai
datestamp_date 2025-09-02T15:46:41Z
collection OJS
language Ukrainian
topic optimization methods
genetic algorithm
convolutional neural networks
face recognition algorithms
UDC 004.8
spellingShingle optimization methods
genetic algorithm
convolutional neural networks
face recognition algorithms
UDC 004.8
Sitkov, I.P.
Glybovets, M.M.
Optimization methods for face recognition algorithmes
topic_facet optimization methods
genetic algorithm
convolutional neural networks
face recognition algorithms
UDC 004.8
методи оптимізації
генетичний алгоритм
згорткові нейронні мережі
алгоритми розпі знавання обличчя
УДК 004.8
format Article
author Sitkov, I.P.
Glybovets, M.M.
author_facet Sitkov, I.P.
Glybovets, M.M.
author_sort Sitkov, I.P.
title Optimization methods for face recognition algorithmes
title_short Optimization methods for face recognition algorithmes
title_full Optimization methods for face recognition algorithmes
title_fullStr Optimization methods for face recognition algorithmes
title_full_unstemmed Optimization methods for face recognition algorithmes
title_sort optimization methods for face recognition algorithmes
title_alt Методи оптимізації алгоритмів розпізнавання обличчя
description The paper examines the main drawbacks of modern face recognition algorithms: low processing speed, high sensitivity to image quality and face positioning. A division into three approaches to face recognition algorithms optimization is proposed: optimization of feature weights, algorithm hyperparameters, and constructing an optimal distributed system architecture. Examples of the application of Particle Swarm Optimization, Cuckoo Search, Simulated Annealing, and genetic algorithms to overcome the mentioned limitations in existing algorithms are provided. The study demonstrates the advantages and disadvantages of these optimization methods and identifies promising directions for further research in face identification methods optimization using genetic algorithms.Prombles in programming 2025; 1: 74-81
publisher PROBLEMS IN PROGRAMMING
publishDate 2025
url https://pp.isofts.kiev.ua/index.php/ojs1/article/view/766
work_keys_str_mv AT sitkovip optimizationmethodsforfacerecognitionalgorithmes
AT glybovetsmm optimizationmethodsforfacerecognitionalgorithmes
AT sitkovip metodioptimízacííalgoritmívrozpíznavannâobliččâ
AT glybovetsmm metodioptimízacííalgoritmívrozpíznavannâobliččâ
first_indexed 2025-07-17T09:37:44Z
last_indexed 2025-09-17T09:21:00Z
_version_ 1850411978017734656
fulltext Штучний інтелект 74 © І.П. Сітьков, М.М. Глибовець, 2025 ISSN 1727-4907. Проблеми програмування. 2025. №1 УДК 004.8 https://doi.org/10.15407/pp2025.01.074 І.П. Сітьков, М.М. Глибовець МЕТОДИ ОПТИМІЗАЦІЇ АЛГОРИТМІВ РОЗПІЗНАВАННЯ ОБЛИЧЧЯ У роботі розглянуто основні недоліки сучасних алгоритмів розпізнавання обличчя: низьку швидкість роботи, високу чутливість до якості зображень та розташування обличчя. Запропоновано поділ на три основні підходи до оптимізації алгоритмів розпізнавання обличчя: оптимізація ваги ознак, гіперпараме- трів алгоритмів та побудова оптимальної розподіленої системи; наведено приклади застосування алго- ритмів Particle Swarm Optimization, Cuckoo Search, методу імітації відпалу, генетичних алгоритмів для усунення згаданих обмежень у наявних алгоритмах. У дослідженні продемонстровано переваги та недо- ліки вказаних методів оптимізації, визначено перспективні напрями подальших досліджень у галузі оп- тимізації методів ідентифікації обличчя за допомогою генетичних алгоритмів. Ключові слова: методи оптимізації, генетичний алгоритм, згорткові нейронні мережі, алгоритми розпі- знавання обличчя. I.P. Sitkov, M.M. Hlybovets OPTIMIZATION METHODS FOR FACE RECOGNITION ALGORITHMS The paper examines the main drawbacks of modern face recognition algorithms: low processing speed, high sensitivity to image quality and face positioning. A division into three approaches to face recognition algorithms optimization is proposed: optimization of feature weights, algorithm hyperparameters, and constructing an optimal distributed system architecture. Examples of the application of Particle Swarm Optimization, Cuckoo Search, Simulated Annealing, and genetic algorithms to overcome the mentioned limitations in existing algorithms are provided. The study demonstrates the advantages and disadvantages of these optimization methods and identifies promising directions for further research in face identification methods optimization using genetic algorithms. Keywords: optimization methods, genetic algorithm, convolutional neural networks, face recognition algorithms. Вступ Розпізнавання людини за зображен- ням обличчя сьогодні є однією з найпоши- реніших форм біометричної ідентифікації, яка застосовується як в системах відеона- гляду та контролю доступу, так і в роботи- зованих системах та у взаємодії людини з компʼютером. Саме тому збільшення по- питу на засоби автоматичної детекції поро- джує потребу в точних та надійних алгори- тмах розпізнавання обличчя (далі – РО). Попри досягнення в галузі компʼютерного зору та широкий спектр застосування мето- дів класифікації зображень, досі існує ни- зка перешкод, які є викликом для сучасних алгоритмів: рівень освітленості обличчя, кут нахилу та повороту, наявність аксесуа- рів на обличчі, вираз обличчя, вікові зміни, доступність обчислювальних ресурсів на кінцевих пристроях, таких як смартфони або пристрої Інтернету речей тощо. Наслід- ком чого є суттєве зниження точності та на- дійності систем. Зважаючи на перелічені проблеми, метою роботи став аналіз методів оптиміза- ції алгоритмів розпізнавання обличчя, дос- лідження основних напрямів їхнього засто- сування та визначення перспектив подаль- шого розвитку. Окрім цього, результати, наведені у статті, дозволяють зрозуміти пе- реваги та недоліки розглянутих методів оп- тимізації. У галузі біометричної ідентифікації на основі обличчя дослідники запропону- вали низку алгоритмів. Однак оскільки ба- гато з них було розроблено для вирішення досить специфічних проблем компʼютер- ного зору та для аналізу використовували набір даних з обмеженого контрольованого Штучний інтелект 75 середовища, застосування таких алгорит- мів в умовах відкритого світу не є надій- ним. Наприклад, алгоритм Weber Local Descriptor вирізняється простотою реаліза- ції та ефективністю на тестувальних даних, демонструючи точність розпізнавання вищу за інші поширені алгоритми (Gabor та SIFT) [1]. Утім, він є чутливим до умов освітлення обличчя, що значно звужує сферу його використання. Удосконалений алгоритм WLCGP, представлений у роботі [2], хоч і виправляє попередній недолік, на- томість суттєво збільшує обчислювальні витрати, через що також не може широко використовуватись. Дослідження на тему застосування алгоритмів РО у реальному середовищі [3] також засвідчує обмеження алгоритмів: зниження точності використання у відкри- тому світі, проблему розпізнавання розфо- кусованих та розмитих зображень, необхід- ність великої кількості тренувальних даних та обчислювальних потужностей для нав- чання моделей. У наведеному в роботі [4] огляді підходів до розпізнавання обличчя та повʼязаних із цим викликів автори фоку- сують увагу на 7 типах перешкод, виклика- них рівнем освітленості, варіативністю пози та виразу обличчя, пластичними опе- раціями, віковими змінами, низькою роз- дільною здатністю та оклюзіями. Також не- тривіальною задачею досі залишається ви- бір репрезентативних ознак зображення. Відповідно до [4], незважаючи на низку до- сліджень у галузі компʼютерного зору, дос- тупні на сьогодні засоби розпізнавання не вирішують жодну з перелічних проблем ефективно через високу різноманітність умов реального світу, які впливають на ви- гляд обличчя на фото або відео. Отже, існує необхідність у дослі- дженні методів оптимізації алгоритмів РО для покращення їхньої стійкості до переш- код та збільшення точності ідентифікації у відкритому середовищі. На основі проаналізованих методів оптимізації у роботі запропоновано поділ на напрями відповідно до мети застосу- вання та детально розглянуто спосіб вико- ристання цих методів для подолання де- яких обмежень алгоритмів РО та підви- щення точності розпізнавання. Насамкі- нець вказані шляхи майбутніх досліджень. Основні напрями оптимізації Оптимізації алгоритмів РО присвя- чено велику кількість досліджень. Проана- лізувавши деякі з них, нам вдалося виокре- мити три основні напрями відповідно до мети застосування: оптимізація ваг ознак, гіперпараметрів алгоритму, побудова опти- мальної архітектури розподіленої системи. Оптимізація ваги ознак Процес розпізнавання обличчя в за- лежності від алгоритму передбачає низку стадій, серед яких детекція рамок обличчя на зображенні, попередня обробка, норма- лізація, узгодження обличчя (зіставлення опорних точок, таких як очі, ніс, рот, з фра- гментами зображення), власне класифіка- ція. Однак одним із найважливіших етапів є екстракція ознак обличчя, правильна ре- алізація якої є передумовою для якісної класифікації. Для цього застосовують як емпіричні методи, які вимагають залу- чення експерта до формування ознак, так і автоматичну побудову ембедингів за допо- могою алгоритмів машинного навчання, методу головних компонент тощо. Про- блема полягає в тому, що деякі з ознак є нестійкими до раніше згаданих впливів се- редовища, або не дозволяють унікально ідентифікувати людину на фото, або не стосуються обличчя, а описують обʼєкти на фоні. Як наслідок недосконале числове представлення зображення призводить до значних похибок у передбаченнях алгори- тмів. Оптимізація ваги ознак полягає у ма- ксимізації впливу репрезентативних ознак та мінімізації значення тих характеристик, які представляють шум або нерелевантну інформацію. Наприклад, відбір може від- буватись шляхом множення значення ознаки на відповідний – більший або мен- ший – коефіцієнт. Основними інструментами оптимі- зації ваги ознак в розглянутих роботах є ме- таевристичні алгоритми Particle Swarm Optimization, метод імітації відпалу, Cuckoo Штучний інтелект 76 Search, застосування яких описано в насту- пних розділах. Particle Swarm Optimization. Particle Swarm Optimization (PSO) [5] – сто- хастичний метаевристичний оптимізацій- ний алгоритм, заснований на популяціях та інспірований колективною поведінкою пта- хів у зграях. Для пошуку оптимального розвʼязку цільової функції ініціалізують популяцію з розвʼязків, представлених трьома векторами у D-вимірному просторі, де D – розмірність пошукового простору: xi – поточна позиція розвʼязку, pi – попередня найкраща позиція та vi – швидкість зміни позиції по кожній з координат. Еволюція ві- дбувається шляхом оцінки якості поточних розвʼязків за допомогою цільової функції та оновлення їхніх позицій відповідно до век- торів швидкості. Останні переобчислю- ються для кожного розвʼязку на основі по- точної позиції, попереднього вектору шви- дкості, власної найкращої позиції, глобаль- ного найкращого розвʼязку та векторів з ви- падковими значеннями (конкретна реаліза- ція залежить від модифікації алгоритму). Умовою зупинки є досягнення встановле- ної максимальної кількості ітерацій або отримання розвʼязку, який відповідає ви- значеним критеріям оптимальності. У роботі [1] Zhang et al. використо- вують PSO для оптимізації значень компе- нсувальних коефіцієнтів (КК) f1, …, f8, що контролюють внесок відповідних 8 ознак у процесі обробки зображення, яке необхідно розпізнати. Ознаки представлені матри- цями однакового із зображенням розміру. Їх обчислюють шляхом застосування попі- ксельних перетворень вхідного зображення (S1, S2, S3, S4 – матриці лівого, правого, вер- хнього та нижнього зміщень), комбіну- вання матриць зміщення (S5 – різницева ма- триця, S6 – матриця злиття), перетворення матриці S6 (S7 – матриця зі зменшеним шу- мом), перетворення матриці S7 (S8 – мат- риця підсилення). Утворене в результаті за- стосування КК зображення Sig (1) розбива- ють на 36 частин та в кожній з них визнача- ють розподіл значень яскравості пікселів. До обʼєднаних розподілів застосовують Principal Component Analysis (PCA) для зменшення розмірності вектора та класифі- кують утворені ембединги за допомогою моделі SVM. 𝑆𝑆𝑆𝑆𝑆𝑆 = 𝐴𝐴 + ∑ 𝑓𝑓𝑖𝑖 ∗ 𝑆𝑆𝑖𝑖8 𝑖𝑖=0 , (1) де А – вхідне зображення. Використання алгоритму оптиміза- ції у цьому випадку є обґрунтованим, оскі- льки виконати повний перебір усіх комбі- націй значень (якщо розглядати проміжок [-10, 10] з кроком 0.01) за прийнятний час не можливо. Однак підбір оптимальних значень для КК є критичним, оскільки вони безпосередньо впливають на вагу ознак зо- браження. Представлені у роботі [1] експери- менти свідчать про ефективність оптиміза- ції. Автори наводять результати тестування власної моделі Image Feature Compenstion (IFC) на трьох датасетах (ORL, YALE, MU_PIE), а також на графіках порівнюють ефективність з іншими алгоритмами. У таб- лиці 1 наведено узагальнене порівняння на основі даних з дослідження [1]. Таблиця 1 Результати застосування IFC до датасетів Датасет Порівняння з результатами LBP, CLBP, IGP, WLCGP, IGFC Узагальненість КК ORL IFC показує найвищу точ- ність на кілько- сті тренуваль- них зразків < 7. Узагальненість висока; вища точність при застосуванні до YALE, на MU_PIE точ- ність не знижу- ється. YALE IFC показує за- галом вищу то- чність. Нижча точність на ORL, висока – на MU_PIE. MU_PIE IFC досягає значно вищої точності. Нижча точність на ORL, висока – на YALE. Результати дослідження демонстру- ють здатність моделі до узагальнення, вищу точність у порівнянні з відомими алгорит- Штучний інтелект 77 мами, а отже, оптимізація за допомогою PSO виявилась ефективною для відбору ре- презентативних ознак. Cuckoo Search Algorithm. Cuckoo Search Algorithm (CSA) [6] – ще один мета- евристичний оптимізаційний алгоритм, ін- спірований природою, а саме паразитич- ною поведінкою зозулі. Алгоритм спира- ється на 3 основні правила: 1. Кожна зозуля вікладає одне яйце за раз у випадково обране гні- здо. 2. Гнізда з яйцями найкращої якості переходять у наступне поко- ління. 3. Кількість гнізд фіксована, і власник гнізда може виявити підки- нуте яйце з імовірністю Pa ∈ [0, 1], після чого може або викинути яйце, або залишити гніздо та побудувати нове. Алгоритм також використовує по- няття польоту Леві – випадкового блукання в просторі рішень – для генерування нових розвʼязків. Процес оптимізації відбувається ітеративно, де на кожному кроці “зозуля” створює розвʼязок та розміщує його у випа- дковому “гнізді”, якщо якість нового розвʼязку вища за якість розвʼязку, що збе- рігався там до цього. Тоді частина (Pa) най- гірших розвʼязків замінюється випадко- вими новими, і цикл повторюється. Зупи- нка алгоритму відбувається після досяг- нення максимальної кількості ітерацій або виконання іншої заданої умови. У роботі [7] метою застосування CSA також є пошук оптимального набору репрезентативних ознак. На відміну від попереднього дослідження [1], Preeti Malhotra et al. для отримання початкового набору ознак використовують Discrete Cosine Transform (DCT) у поєднанні з PCA. Результати експериментів на датасеті ORL демонструють, що з використанням CSA алгоритм досягає більшої точності (Рис. 1) у порівнянні із застосуванням інших мето- дів оптимізації: PSO, GA, DE (Differential Evolution). Автори також відзначають, що зменшення кількості ознак шляхом опти- мізації не призводило до погіршення точ- ності РО. Рис. 1. Порівняння точності розпізнавання між алгоритмами із застосуванням CSA, PSO, GA, DE на датасеті ORL. (I) 40 кла- сів, (II) 30 класів, (III) 20 класів, (IV) 10 класів [7]. Метод імітації відпалу. Метод імі- тації відпалу – один із найпростіших та най- відоміших метаевристичних оптимізацій- них алгоритмів та походить від металургій- ного процесу термообробки сталі. Оптимі- зація цільової функції починається з ініціа- лізації початкової температури та розвʼязку випадковими значеннями з простору рі- шень. На кожному ітерації, поки темпера- тура є вищою за встановлений поріг, фор- мують новий розвʼязок з околу поточного розвʼязку (шляхом невеликого кроку, об- міну позицій тощо) та знаходять різницю між значеннями цільової функції на двох розвʼязках. Якщо новий розвʼязок є кращим (залежно від мети краще мінімізує або мак- симізує функцію), його приймають як пото- чний найкращий розвʼязок. Інакше його мо- жуть прийняти лише з імовірністю 𝑃𝑃 = 𝑒𝑒 −△𝐸𝐸 𝑇𝑇 , де △E – різниця значень, T – поточна температура, яка зменшується зі спаданням температури. Наступним кроком зменшу- ють температуру відповідно до встановле- ної функції (наприклад, Tnew = αT, α ∈ (0, 1)) та повторюють ітерацію. Дослідження на тему застосування методу імітації відпалу для оптимізації компенсувальних коефіцієнітів f1, …, f8 про- демонстровано на прикладі алгоритму Efficient Face Recognition Algorithm (EFRA) в роботі [8]. Для опису 8 ознак обличчя (P1, …, P8) автори ввели поняття верхнього, ни- Штучний інтелект 78 жнього, лівого, правого, верхнього лівого, правого, нижнього лівого, правого градієн- тів, які обчислюються відніманням значень пікселів у сусідніх рядках або стовпцях зо- браження або по діагоналі. Наступні кроки (розбиття зображення на блоки, підрахунок розподілів яскравості пікселів, зменшення розмірності за допомогою PCA та класифі- кація з використанням SVM) аналогічні тим, що наведені у розділі про Particle Swarm Optimization. Обмеження, які намагаються подо- лати дослідники, – низька точність алгори- тмів РО у процесі класифікації зображень, де обличчя частково перекрите іншими обʼєктами (масками, окулярами тощо), та низька швидкість класифікації. Результати експериментів засвід- чили вищу точність запропонованого алго- ритму на датасетах ORL та YALE у порів- нянні з іншими алгоритмами (LBP, CLBP, WLCGP, IGFC). Однак алгоритм поступи- вся у точності LBP на датасеті MU_PIE. За швидкістю розпізнавання алгоритм EFRA виявився гіршим за IGFC, що автори пояс- нюють витратами на обчислення 8 ознак за- мість 4, як в алгоритмі IGFC. Оптимізація архітектури розподіленої системи У сучасному світі все частіше вини- кає потреба проводити РО на кінцевих при- строях (edge devices), які мають досить об- межену потужність та обчислювальну здат- ність (смартфони, камери відеонагляду, си- стеми контролю якості продукції, окуляри віртуальної реальності, розумні біометри- чні замки, дрони, роботи тощо). Оптиміза- ції алгоритмів для ефективної роботи в се- редовищі з обмеженими ресурсами присвя- чено роботи [9], [10]. Іншим підходом до покращення якості ідентифікації на кінце- вих пристроях є побудова оптимальної роз- поділеної системи, яка ефективно викорис- товує можливості всіх учасників взаємодії. Важливу роль у системах сьогодні відігра- ють хмарні платформи, які дозволяють гну- чко використовувати обчислювальні поту- жності у великих обсягах. У дослідженні [11] автори пропону- ють оптимальну архітектуру системи для розпізнавання обличчя у реальному часі, де взаємодіють хмарні сервери та кінцеві при- строї. Основною метою є збільшення шви- дкості РО. Для цього процес розпізнавання розділяють на два етапи: 1) детекція обличчя на зобра- женні; 2) власне розпізнавання об- личчя. Перший етап передбачає визначення обмежувальної рамки навколо обличчя на фреймах відео та розмітку обличчя (детек- цію очей, носа, рота) за допомогою згорт- кової нейронної мережі MTCNN з подаль- шим обтинанням зображення. Цей етап від- бувається безпосередньо на кінцевих при- строях. У випадку успішної детекції оброб- лені фрейми надсилають до сервера. За ра- хунок зменшення розміру зображень про- цес обміну даними та розпізнавання значно прискорюється. Другий етап проходить на строні сервера та включає розпізнавання обличчя за допомогою алгоритма Dlib. Кожне зобра- ження представляють як 128-вимірний ем- бединг, для якого за Евклідовою відстанню знаходять найкращий відповідник серед зо- бражень у базі даних. Оцінку ефективності впровадженої системи автори проводили на основі порів- няння кількості фреймів, які система могла обробити за секунду. Для експериментів використовувались відео різної довжини (50, 40, 10 секунд), роздільної здатності (HD, FHD) та FPS (30, 60, 90). Результати продемонстрували збільшення швидкості обробки відео у 8.5 разів у порівнянні з си- стемою, яка складалася тільки з кінцевого пристрою, та в 1.91 разів у порівнянні з си- стемою, яка включала тільки хмарні сер- вери. Отримані переваги у швидкості сві- дчать про перспективність напряму з розро- бки колаборативних систем. Оптимізація гіперпараметрів алгоритмів Гіперпараметри визначають ефекти- вність алгоритму. Однак широкий домен кожного з них та кількість шуканих змін- Штучний інтелект 79 них унеможливлюють повний перебір варі- антів для отримання оптимальних значень під час вирішення конкретної задачі, що ви- кликано високими обчислювальними ви- тратами. У звʼязку з цим розробники вста- новлюють парметри емпіричним шляхом, спираючись на попередні дослідження та закономірності, що також часто не є ефек- тивним. Для вирішення вказаної проблеми до значень часто застосовують оптиміза- ційні алгоритми. Поруч з уже розглянутими алгорит- мами розпізнавання обличчя для класифі- кації зображень використовують згорткові нейронні мережі (ЗНН), які сьогодні є кла- сичним інструментом компʼютерного зору. Вони демонструють високу точність та узагальненість за умови правильної ар- хітектури, тому оптимізації їхніх гіперпа- раметрів приділяють значну увагу. Зок- рема, для цього використовують генетичні алгоритми. Генетичні алгоритми. Генетичні алгоритми – сімейство метаевристичниих оптимізаційних алгоритмів, які симулюють генетичні процеси над популяціями розвʼязків. Алгоритм починає роботу з іні- ціалізації популяції хромосом – розвʼязків, кожен ген відповідає за шукану змінну або її частину (у випадку бінарного кодування). Після цього на кожній ітерації виконується оцінка пристосованості хромосом за допо- могою функції здоровʼя. Далі відповідно до методу селекції хромосоми відбирають до батьківського пулу. Популяція для наступ- ного покоління формується шляхом засто- сування кросинговеру (обміну хромосом ділянками генів між собою) та мутації (ви- падкової зміни генів) до хромосом у бать- ківському пулі. Еволюційний процес про- довжуються, доки не буде досягнуто умови зупинки або кількість ітерацій не переви- щить максимальну. У роботі [12] автори досліджують ефективність застосування генетичного ал- горитму для оптимізації гіперпараметрів ЗНН на прикладі запропонованої моделі CNN-GA. Вони прагнуть збільшити її точ- ність у розпізнаванні облич з різним кутом повороту. Namrata Karlupia et al. для опти- мізації обрали основні гіперпараметри – кі- лькість та розмір згорткових фільтрів для 2, 3, та 4-шарових ЗНН; функція здоровʼя представлена як 100 - accuracy%. За результатами експериметів най- вищу точність (94.5%) було досягнуто в процесі використання 4-шарової ЗНН з оп- тимізованими параметрами. Автори також демонструють перевагу моделі CNN-GA в точності, наводячи порівняння з іншими ал- горитмами: AlexNet (78%), VGG-16 (85.002%), ResNet50 (86.066%), InceptionV3 (87.11%) та власною моделлю з емпірично підібраними значеннями параметрів (60%). Дослідження Sehla Loussaief et al. [13] також було спрямоване на вивчення впливу оптимізації гіперпараметрів ЗНН за допомогою генетичного алгоритму на ре- зультати класифікації. Модель, отримана ручним підбором значень, виявилася нето- чною (30%), тоді як запропонована 5-ша- рова ЗНН з оптимізованими параметрами досягла показника 98.94%. Окрім вищої точності оптимізованої моделі, автори Yanan Sun et al. за підсум- ками роботи [14] відзначають зменшення кількості тренованих параметрів моделі, що тягне за собою зниження обчислюваль- них витрат на навчання алгоритму та збіль- шення його швидкодії. Висновки У роботі розглянуто основні обме- ження сучасних методів розпізнавання об- личчя, до яких належить низька швидкість обробки, чутливість до якості зображення та розміщення обличчя. За підсумками ана- лізу виокремлено 3 напрями застосування оптимізації: оптимізація ваг ознак зобра- ження, гіперпараметрів алгоритму, побу- дова оптимальної архітектури розподіленої системи. Також наведено метаевристичні оптимізаційні алгоритми PSO, CSA, метод імітації відпалу, генетичні алгоритми, які дозволяють ефективно долати деякі зі зга- даних обмежень, зокрема, низьку точність розпізнавання облич під різним кутом по- вороту або частково перекритих іншими обʼєктами. Вказані алгоритми вирішують проблеми відбору репрезентативних ознак та пошуку оптимальних значень для гіпер- параметрів. Для ілюстрації продуктивності оптимізованих алгоритмів РО ми навели Штучний інтелект 80 результати досліджень, де їх було успішно імплементовано та протестовано. Окрему увагу у роботі приділено важливості орга- нізації оптимальної архітектури систем для розпізнавання обличчя, оскільки від цього залежить їхня швидкодія. Перспективним напрямом сьогодні є дослідження алгоритмів машинного нав- чання, тому подальші зусилля у сфері за- стосування методів оптимізації можуть бути спрямовані на вивчення ефективності використання генетичного алгоритму для оптимізації гіперпараметрів згорткових нейронних мереж, які визначають швид- кість навчання моделі, кількість епох, зсув згорткового фільтра та dropout rate. Резуль- тати стануть корисними для розуміння практичності оптимізації вказаних гіперпа- раметрів та доцільності її використання в подальших розробках. Література 1. Zhang, Y. and Yan, L. (2023) 'Face recognition algorithm based on particle swarm optimization and image feature compensation,' SoftwareX, 22, p. 101305. https://doi.org/10.1016/j.softx.2023.101305. 2. Fang, S. et al. (2017) 'Face recognition using weber local circle gradient pattern method,' Multimedia Tools and Applications, 77(2), pp. 2807–2822. https://doi.org/10.1007/s11042- 017-4412-8. 3. Zafeiriou, S., Zhang, C. and Zhang, Z. (2015) 'A survey on face detection in the wild: Past, present and future,' Computer Vision and Image Understanding, 138, pp. 1–24. https://doi.org/10.1016/j.cviu.2015.03.015. 4. Oloyede, M.O., Hancke, G.P. and Myburgh, H.C. (2020) 'A review on face recognition systems: recent approaches and challenges,' Multimedia Tools and Applications, 79(37– 38), pp. 27891–27922. https://doi.org/10.1007/s11042-020-09261-2. 5. Poli, R., Kennedy, J. and Blackwell, T. (2007) 'Particle swarm optimization,' Swarm Intelligence, 1(1), pp. 33–57. https://doi.org/10.1007/s11721-007-0002-0. 6. Gandomi, A.H., Yang, X.-S. and Alavi, A.H. (2012) 'Erratum to: Cuckoo search algorithm: a metaheuristic approach to solve structural optimization problems,' Engineering With Computers, 29(2), p. 245. https://doi.org/10.1007/s00366-012-0308-4. 7. Malhotra, P. and Kumar, D. (2017) 'An optimized face recognition system using Cuckoo search,' Journal of Intelligent Systems, 28(2), pp. 321–332. https://doi.org/10.1515/jisys-2017-0127. 8. Yan, L., Zhang, Yanhu and Zhang, Yanjun (2023) 'A fast face recognition system based on annealing algorithm to optimize operator parameters,' The Imaging Science Journal, 71(4), pp. 323–330. https://doi.org/10.1080/13682199.2023.21822 61. 9. Huang, J., Shang, Y. and Chen, H. (2019) 'Improved Viola-Jones face detection algorithm based on HoloLens,' EURASIP Journal on Image and Video Processing, 2019(1). https://doi.org/10.1186/s13640-019- 0435-6. 10. Li, W. et al. (2023) 'Face recognition model optimization research based on embedded platform,' IEEE Access, 11, pp. 58634–58643. https://doi.org/10.1109/access.2023.3277495. 11. Oroceo, P.P. et al. (2022) 'Optimizing Face Recognition Inference with a Collaborative Edge–Cloud Network,' Sensors, 22(21), p. 8371. https://doi.org/10.3390/s22218371. 12. Karlupia, N. et al. (2023) 'A genetic algorithm based optimized convolutional neural network for face recognition,' International Journal of Applied Mathematics and Computer Science, 33(1). https://doi.org/10.34768/amcs-2023- 0002. 13. Loussaief, S. and Abdelkrim, A. (2018) 'Convolutional Neural Network Hyper- Parameters Optimization based on Genetic Algorithms,' International Journal of Advanced Computer Science and Applications, 9(10). https://doi.org/10.14569/ijacsa.2018.091031. 14. Sun, Y. et al. (2020) 'Automatically designing CNN architectures using the genetic algorithm for image classification,' IEEE Transactions on Cybernetics, 50(9), pp. 3840–3854. https://doi.org/10.1109/tcyb.2020.2983860. Одержано: 18.07.2024 Внутрішня рецензія отримана: 24.07.2024 Зовнішня рецензія отримана: 25.07.2024 Штучний інтелект 81 Про авторів: Сітьков Ілля Павлович, магістр 2 року навчання спеціальності “Компʼютерні науки” https://orcid.org/0009-0004-6311-1442 Глибовець Микола Миколайович, доктор фізико-математичних наук, професор. https://orcid.org/0009-0005-6942-8026 Місце роботи авторів: Національний університет «Києво-Могилянська академія», 04070, м. Київ, вул. Сковороди, 2. Тел.: (044) 463-69-85 Email: i.sitkov@ukma.edu.ua Email: glib@ukma.edu.ua