Особенности реализации алгоритма AdaBoost для обнаружения объектов на изображениях

В статье рассматриваются особенности реализации алгоритма AdaBoost для решения проблемы построения каскада классификаторов для эффективного обнаружения объектов на изображениях. В качестве элементар- ных классификаторов предлагается использовать прямоугольные логические свойства, что позволяет сд...

Повний опис

Збережено в:
Бібліографічні деталі
Дата:2009
Автор: Мурыгин, К.В.
Формат: Стаття
Мова:Російська
Опубліковано: Інститут проблем штучного інтелекту МОН України та НАН України 2009
Теми:
Онлайн доступ:https://nasplib.isofts.kiev.ua/handle/123456789/8113
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Особенности реализации алгоритма AdaBoost для обнаружения объектов на изображениях / К.В. Мурыгин // Штучний інтелект. — 2009. — № 3. — С. 573-581. — Бібліогр.: 7 назв. — рос.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1859717835519950848
author Мурыгин, К.В.
author_facet Мурыгин, К.В.
citation_txt Особенности реализации алгоритма AdaBoost для обнаружения объектов на изображениях / К.В. Мурыгин // Штучний інтелект. — 2009. — № 3. — С. 573-581. — Бібліогр.: 7 назв. — рос.
collection DSpace DC
description В статье рассматриваются особенности реализации алгоритма AdaBoost для решения проблемы построения каскада классификаторов для эффективного обнаружения объектов на изображениях. В качестве элементар- ных классификаторов предлагается использовать прямоугольные логические свойства, что позволяет сделать независимым результат распознавания от монотонно возрастающих преобразований яркости изображений, не изменяющих их классовую принадлежность. Полученный в результате обучения каскад из 4 классификаторов позволяет решать задачу поиска на изображениях областей лиц в видеопотоке с параметрами 30 кадров размером 640×480 пикселей в секунду. У статті розглядаються особливості реалізації алгоритму AdaBoost для вирішення проблеми побудови каскаду класифікаторів для ефективного виявлення об’єктів на зображеннях. Як елементарні класифікатори пропонується використовувати прямокутні логічні властивості, що дозволяє зробити незалежним результат розпізнавання від монотонно зростаючих перетворень яскравості зображень, що не змінюють їх класову приналежність. Отриманий у результаті навчання каскад з 4 класифікаторів дозволяє вирішувати задачу пошуку на зображеннях областей облич у відеопотоці з параметрами 30 кадрів розміром 640×480 пікселів за секунду. In article features of implementation of AdaBoost algorithm for solution a problem of construction of the classifiers cascade for effective detection of objects on images are considered. As elementary classifiers it is offered to use rectangular logical properties that allow to make independent a result of recognition from monotonously increasing conversions of brightness of the images which don’t change their class association. The cascade received as a result of training process 4 classifiers which allows to solve the search task of face areas in a videostream with parameters of 30 frames of the size 640×480 pixels per second.
first_indexed 2025-12-01T08:33:16Z
format Article
fulltext «Штучний інтелект» 3’2009 573 10М УДК 004.89,004.93 К.В. Мурыгин Институт проблем искусственного интеллекта МОН Украины и НАН Украины г. Донецк, Украина kir@iai.donetsk.ua Особенности реализации алгоритма AdaBoost для обнаружения объектов на изображениях В статье рассматриваются особенности реализации алгоритма AdaBoost для решения проблемы построения каскада классификаторов для эффективного обнаружения объектов на изображениях. В качестве элементар- ных классификаторов предлагается использовать прямоугольные логические свойства, что позволяет сделать независимым результат распознавания от монотонно возрастающих преобразований яркости изображений, не изменяющих их классовую принадлежность. Полученный в результате обучения каскад из 4 классификаторов позволяет решать задачу поиска на изображениях областей лиц в видеопотоке с параметрами 30 кадров размером 640×480 пикселей в секунду. Введение Алгоритм AdaBoost представляет собой эффективное средство обучения классификации. Особенностью используемого в нем подхода является принцип отбора и объединения набора простых и малоэффективных свойств в одно решающее правило, обладающее высокой классифицирующей способностью [1], [2]. Получение такого решающего правила является основной задачей обучения распознаванию образов. Во многих практических задачах получить его или его параметры не так просто, что связано со сложностью расположения объектов в пространстве признаков. С другой сто- роны, практически всегда можно эвристически сформировать целый набор достаточно простых характеристик [2], свойственных объектам распознавания, или предложить эвристическую процедуру для их генерации. Подобная процедура формирования свойств может, например, представлять собой объединение первичных признаков nxx ,...,1 в виде произведения различных их степеней    n 1i ik k ixy , где индекс k определяет соответствующий набор  k n k 1 ,..., . Такой способ формирования, вообще говоря, приводит к бесконечному мно- жеству возможных свойств. Даже если каждое из них будет обладать слабой класси- фицирующей силой, то их совместное использование может дать вполне приемле- мый по качеству результат. Алгоритм обучения AdaBoost строит решающее правило в виде линейной комбинации выходных значений слабых классификаторов, при этом достигается экспоненциальное уменьшение ошибки с увеличением числа свойств на обучающем наборе [3]. Если представить слабый (элементарный) классификатор двух классов 1 и 2 , полученный на основе описанных выше простых свойств, в виде    kk yxh  ,   Rxh k  , Мурыгин К.В. «Искусственный интеллект» 3’2009 574 10М классифицирующее свойство которого проявляется в смене знака на границе классов:         ;x,0 ,x,0 xh 2 1 k    то в результате обучения будет получен классификатор вида       T 1t tt xhaxH  , где T – число специальным образом отобранных простых классификаторов из общего их числа. Такой классификатор с учетом приведенного выше в качестве примера способа формирования простых свойств может представлять собой полином любой степени относительно исходных характеристик распознаваемых объектов (признаков) nxx ,...,1 , что теоретически позволяет получить решающее правило любой слож- ности. При этом сложность определяется не эвристически, а генерируется в процессе обучения в зависимости от сложности межклассовой границы. Процедура обучения по методу AdaBoost заключается в следующем [2]. Пусть заданы обучающие объекты, принадлежащие двум разным классам, в виде    mm yxyx ,...,,, 11  , где Xx i   – вектор признаков, определяющий объект распоз- навания,  1,1 Yy i – число, определяющее его классовую принадлежность, m – объем обучающей выборки. Изначально каждому обучающему объекту задается одинаковый вес   m 1iD1  . После этого начинается циклический процесс обучения, который схематически может быть представлен следующим образом. Для каждого цикла обучения Tt ...,,1 : 1) выбирается лучший элементарный классификатор   RX:xh t  , дающий минимальную ошибку на обучающем наборе с учетом текущих весов объектов tD . В более простом случае используются классификаторы вида    1;1X:xh t  ; 2) выбирается действительное число t > 0; 3) выполняется перевзвешивание обучающего набора согласно следующей зависимости        t ititt 1t Z xhyexpiDiD   , где tZ – нормировочный множитель, такой, что сумма весов всех обучающих объектов должна равняться 1. Таким образом, в ходе обучения формируется набор классификаторов  xh t  и чисел t . Итоговое решающее правило, комбинирующее найденные элементарные классификаторы  xh t  , представляет собой их линейную комбинацию:             T 1t tt xhsignxH  . Приведенный процесс продолжается до достижения необходимой величины ошибки классификации. Как видно из выражения для получения новых весов обучающих объектов  iD 1t , в ходе перевзвешивания веса правильно распознанных на текущем цикле обучения объектов уменьшаются, неправильно – увеличиваются. Таким образом, каждый следующий цикл обучения будет концентрироваться на Особенности реализации алгоритма AdaBoost для обнаружения объектов... «Штучний інтелект» 3’2009 575 10М плохо разделенных предыдущими циклами объектах, постепенно уточняя итоговое решающее правило. В работах [1], [2] показано, что для оптимизации процесса обучения с точки зрения максимизации скорости уменьшения ошибки в зависимости от цикла обуче- ния, значение параметра t , используемого при перевзвешивании обучающего набора, должно выбираться согласно зависимости         t t t e e1 ln 2 1 , где te – ошибка классифи- кации на t -м цикле обучения, полученная с учетом весов обучающих объектов tD . Алгоритм обучения AdaBoost может быть успешно применен для решения задач распознавания изображений, в частности для быстрого поиска на изображении произвольных объектов [4]. Требования к быстродействию алгоритмов классификации при решении последней задачи являются очень жесткими [5]. Для обеспечения требуемого быстродействия в работе [4] предложены два основных принципа. 1. Использовать в качестве элементарных классификаторов  xh t  прямоугольные, просто масштабируемые свойства, определить значения которых можно с достаточно малыми вычислительными затратами по интегральному изображению. 2. Использовать не один классификатор, а целый набор классификаторов, объеди- ненных в каскад, что существенно увеличивает среднюю скорость проведения клас- сификации, так как на следующий этап обработки поступают только области исходного изображения, распознанные предыдущими классификаторами как искомый объект. Предложенные в работе [4] свойства являются ограниченным подмножеством возможных прямоугольных свойств. Ряд свойств, предложенных в [6], требуют дополни- тельных усилий для получения их значений. В частности, для получения средней яркости в повернутых прямоугольных областях необходим предварительный расчет интеграль- ного изображения для повернутого на 45 градусов исходного изображения. Кроме этого, предложенный способ построения классификатора на их основе не решает в полной мере проблему зависимости значения классификатора от условий получения изображения. Данная статья посвящена исследованиям вопроса выбора более эффективного с точки зрения вычислительной сложности набора элементарных классификаторов  xh t  , осно- ванных на использовании прямоугольных свойств [4] более широкого вида, и сравни- тельной оценке их эффективности на примере решения задачи обнаружения лиц на изо- бражении. Использование Хаар-подобных свойств для описания свойств изображений Основными критериями качества признака для решения широкого круга задач, и в особенности задач распознавания зрительных образов, являются его разделительные свойства и сложность его получения, учитывая необходимость быстрого поиска области объекта, что предполагает классификацию большого числа кандидатов при обработке одного изображения [5]. С точки зрения необходимости использования достаточно простых алгоритмов получения признаков, перспективным является использование Хаар-подобных свойств, в отличие от предложенных в [4] и [6], представляющих собой результат сравнения яркостей в двух прямоугольных областях изображения (рис. 1). Мурыгин К.В. «Искусственный интеллект» 3’2009 576 10М а) б) Рисунок 1 – Вид прямоугольных свойств, используемых в качестве признаков при обнаружении объектов: а) – области не пересекаются; б) – области пересекаются Значение признака для данной области изображения или отклик области изображения на данное свойство вычисляется на основе следующего выражения: Ч Ч Б Б N S N SR  (1) в случае непересекающихся областей (рис. 1а), и БЧЧ БЧЧ Б Б NN SS N SR      (2) в случае пересечения областей (рис. 1б). Здесь индексы Ч и Б означают черную и бе- лую области соответственно, а Ч ∩ Б обозначает область пересечения областей черного и белого цвета; S – сумма яркостей пикселей изображения, находящихся под областью; N – число пикселей изображения, находящихся под областью. Таким образом, соот- ветствующие отклики означают разность средних яркостей пикселей реальной области изображения, находящейся под белой частью изображения свойства, и находящихся под его черной частью (рис. 1а, б). Отклик такого свойства не зависит от масштаба изображения и смещения изображения по шкале яркости. Кроме приведенных выше выражений для отклика признака на конкретную область изображения (1) и (2) в качестве значения отклика на свойство можно исполь- зовать и следующие выражения: 1) в случае непересекающихся областей ,ЧБ SSR  (3) В случае пересечения областей  БЧЧБ SSSR  ; (4) 2) в случае непересекающихся областей          . N S N S ,1 ; N S N S ,1 R Ч Ч Б Б Ч Ч Б Б (5) Особенности реализации алгоритма AdaBoost для обнаружения объектов... «Штучний інтелект» 3’2009 577 10М В случае пересечения областей                  . NN SS N S ,1 ; NN SS N S ,1 R БЧЧ БЧЧ Б Б БЧЧ БЧЧ Б Б (6) С точки зрения инвариантности значения свойства относительно возможных яркостных трансформаций изображения использование для получения значения отклика выражений (5) и (6) является наиболее приемлемым. Значения, получаемые на основе этих выражений, являются инвариантными по отношению к любым линейным поэлементным монотонно возрастающим яркостным преобразованиям изображений, которые не изменяют его классовую принадлежность, но могут существенно изменять распределения яркостей в изображении. К таким преобразованиям относятся контрасти- рование и изменение яркости изображения, которые могут автоматически применятся при захвате видеоданных в разнообразных устройствах получения видеоизображений для их корректировки и улучшения качества. Обучение классификации Исследования эффективности предложенных свойств для решения задач обнару- жения объектов на изображениях проводились на задаче обнаружения лиц. Обучение классификации лицо/фон выполнялось на основе метода AdaBoost. Для обучения исполь- зовалась база данных изображений лиц, содержащая 2000 изображений. Каждое изобра- жение было размечено вручную и масштабировано к масштабу 12×12 пикселей. В базе данных содержались изображения лиц людей разных рас, полученные при раз- ном угле и интенсивности освещения, изображения лиц с очками различной формы, бородой и (или) усами, имеющие отклонения от фронтального ракурса съемки до 30 градусов. Для расширения базы данных и учета изменения направления освещения она была дополнена зеркальными отражениями каждого изображения лица. Таким образом, итоговая база изображений лиц содержала 4000 изображений размером 12×12 пикселей. Для формирования базы изображений фона была разработана специальная программа, которая на основе сформированного набора изображений разного раз- мера (около 400 изображений), не содержащих лица, случайным образом формировала 100 000 изображений. При этом случайным образом выбирались как положения области фона на изображения, так и ее масштаб. Предполагая необходимость формирования в конечном итоге каскада классификаторов, в программе была учтена возможность форми- рования набора изображений фона, удовлетворяющих заданному условию, в частности условию прохождения изображения фона через все предыдущие классификаторы. Таким образом, программа позволяет формировать базу изображений фона, трактуемых уже обученными классификаторами как лица. Необходимость подобной программы объясня- ется тем фактом, что после обучения ошибка ложного обнаружения должна быть очень низкой (порядка <10-6), а соответственно число обучающих объектов фона как минимум больше 106, что при использовании алгоритма обучения AdaBoost влечет значительные вычислительные затраты, существенно затрудняющие анализ получаемых результатов. Необходимость достижения такой низкой ошибки ложного обнаружения объясняется значительным числом кандидатов лиц на обрабатываемом изображении, а предполага- емый процесс поиска основывается на классификации всех возможных кандидатов с уче- том выбранного шага по масштабам. Мурыгин К.В. «Искусственный интеллект» 3’2009 578 10М Процесс поиска наиболее эффективного свойства на каждом этапе обучения, предусмотренном используемым алгоритмом обучения, предполагает перебор всех возможных прямоугольных свойств, и выбор из них наилучшего, в смысле мини- мума ошибки, вычисленной по взвешенной обучающей базе данных изображений, соответствующей данному этапу обучения. Так как число вариантов прямоугольных свойств даже для используемого масштаба изображений велико, чтобы осуществить полный перебор (порядка 4×107, то есть для полного перебора необходимо выпол- нить указанное число оценок ошибок классификации по имеющейся базе данных обуча- ющих объектов, а это сама по себе вычислительно сложная задача, учитывая размеры обучающих выборок), поиск наилучших свойств выполнялся в два этапа. На первом этапе выполнялся поиск свойства, дающего наименьшую ошибку из всех отобранных случайным образом. На втором этапе методом последовательных приближений най- денное на первом этапе прямоугольное свойство уточнялось по критерию минимиза- ции ошибки. Такой подход позволил успешно проводить обучение каждого классифи- катора каскада за удовлетворительное время (0,5 – 3 часа). В ходе обучения необходимо учитывать необходимость включения в исследуемый набор свойств и классификаторов, которые с точки зрения классификации взвешенного обучающего набора не имеют смысла, например, классифицируют все изображения как 1 объект. Если таких свойств не будет, то скорость спада ошибки обучения в зависимости от цикла обучения может существенно замедлиться. Это связано с ба- лансом весов объектов одного и другого классов. В ходе обучения этот баланс может существенно смещаться как в одну, так и в другую сторону и ошибка принятия всех объектов 1-го класса за 2-й класс может оказаться наименьшей из всех других иссле- дованных классификаторов на данном этапе. Введение подобных «бесполезных» классификаторов позволяет поддерживать при обучении приемлемый баланс между суммарными весами объектов обоих классов. С точки зрения итогового решающего правила в виде линейной комбинации элементарных классификаторов это означает смещение классифицирующей поверхности, определяемой линейной комбинацией простых классификаторов, относительно начала координат. Для ускорения процесса обработки изображений с целью обнаружения лиц, как отмечалось в [5], количество свойств, используемых на начальных каскадах, должно быть, с одной стороны, минимально возможным, а с другой, обеспечивать допустимый пропуск ложных лиц на следующие, более вычислительно сложные и обеспечивающие более тонкое разделение лиц и фона, этапы обработки. В ходе обучения каскадов классификаторов согласно методу AdaBoost для пря- моугольных свойств, задаваемых выражениями (5) и (6), для первого каскада была получена следующая зависимость ошибки ложного обнаружения от числа исполь- зуемых признаков (рис. 2). Ограничение на ошибку пропуска лиц – не более 1% – принято, так как для ре- шения задачи классификации с заданным качеством (95% правильного обнаружения) планировалось использовать не более 5 классификаторов в каскаде. Как видно из приведенной на рис. 2 зависимости, значения ошибки ложной тревоги достаточно быстро уменьшаются с увеличением числа используемых прямо- угольных свойств. При этом функцию ошибки можно с удовлетворительной точ- ностью в области больших значений числа используемых свойств аппроксимировать экспоненциальной зависимостью. Рассчитанные параметры и вид этой аппроксими- рующей функции приведен на рис. 2. Из графика также видно, что для отсеивания на первом этапе 99% ложных лиц достаточно использовать 47 прямоугольных призна- ков и линейную разделяющую функцию, получаемую на выходе алгоритма обучения. Особенности реализации алгоритма AdaBoost для обнаружения объектов... «Штучний інтелект» 3’2009 579 10М Зависимость ошибки ложной тревоги от числа используемых элементарных признаков y = 0.3424e-0.0852x 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5 1 6 11 16 21 26 31 36 41 46 Эксперименталь ная ошибка ложного обнаружения Экспоненциальн ая аппроксимация Рисунок 2 – Зависимость ошибки ложной тревоги от числа используемых элементарных признаков, при ограничении на ошибку пропуска лица 1% Экспериментальная зависимость К от К1 0 10 20 30 40 50 60 1 6 11 16 21 26 31 36 41 46 К К1 Рисунок 3 – Зависимость среднего числа используемых при прохождении двух каскадов прямоугольных свойств (К) от числа свойств, используемых на промежуточном первом каскаде (К1) Приведенная зависимость позволяет оценить вычислительную сложность алгоритма классификации, состоящего из двух каскадов. Если мы зададимся ограничением ошибки пропуска лиц в 2% и требованием к ошибке ложного обнаружения – 1%, то для среднего числа используемых свойств при прохождении двух каскадов будем иметь зависимость, приведенную на рис. 3. При получении этой зависимости учитыва- лось, что второй классификатор каскада содержит 47 свойств, что гарантированно обеспечивает ошибку ложного обнаружения менее 1%. Анализируя приведенные данные можно заключить, что в данном случае опти- мальным с точки зрения минимизации вычислительной сложности алгоритма при прохождении каскада из двух классификаторов является использование в первом клас- сификаторе 10 прямоугольных признаков. Это, согласно приведенным на рис. 3 дан- ным, позволяет уменьшить вычислительные затраты более чем 2,5 раза по сравнению с использованием только одного второго классификатора. Получение подобных зави- симостей позволяет управлять вычислительной сложностью алгоритма каскадной клас- сификации и настраивать этот параметр исходя из требований к скорости обнаружения лица на изображении. Наряду с исследованием скоростных характеристик алгоритма каскадной классифи- кации были проведены исследования по определению зависимости качества классифика- торов от используемых выражений для определения отклика прямоугольных свойств на изображение. Методом AdaBoost были экспериментально получены зависимости ошибки Мурыгин К.В. «Искусственный интеллект» 3’2009 580 10М классификации от числа используемых свойств в случае использования выражений для отклика изображения на прямоугольное свойство (1, 2) и (5, 6). Сравнительные данные приведены на рис. 4. Исходя из приведенных данных можно говорить о том, что при одном количестве используемых прямоугольных свойств суммарная ошибка классификации лицо/фон при использовании выражений (1, 2) меньше, чем при использовании выражений (5, 6). Используя отклики прямоугольных свойств, получаемые на основе выражений (1, 2), был получен каскад из 4 классификаторов, содержащих соответственно 5, 8, 100, 200 признаков. При этом два первых классификатора использовали квадратическую разделяющую функцию, полученную методом, описанным в [7], а два последних – линейную, полученную методом AdaBoost. Достигнутые после обучения классифи- каторов показатели качества составили 0,04 – вероятность пропуска лиц, и 8×10-6 – вероятность ложного обнаружения. При этом была получена скорость обнаруже- ния – 30 кадров размером 640×480 пикселей в секунду при поиске лиц в диапазоне  3 2 6 ; HH с шагом в 1,1 раза на компьютере Pentium Core2Duo с частотой процессора 2,33 ГГц. Здесь Н – вертикальный размер изображения. Зависимость суммарной ошибки от числа признаков 0.000000 0.050000 0.100000 0.150000 0.200000 0.250000 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 Число признаков С ум м ар на я ош иб ка Признаки, полученные на основе (1) и (2) Признаки, полученные на основе (5) и (6) Рисунок 4 – Зависимость суммарной ошибки от числа используемых признаков для разных способов получения отклика свойства на изображение В результате дополнительного цикла обучения был получен также каскад из 4 классификаторов, использующих выражения для откликов на прямоугольные свой- ства (5, 6). В ходе обучения были достигнуты такие же показатели по качеству обна- ружения, что и при использовании выражений (1, 2) при увеличении вычислительной сложности приблизительно в 2 раза. Выводы Рассмотренный в статье подход к решению задачи обнаружения объектов на изображении на основе использования алгоритма обучения AdaBoost показал удовле- творительные результаты в применении его к задаче классификации лицо/фон. Полу- ченный в результате обучения каскад из 4 классификаторов позволяет использовать его для обнаружения областей лиц в кадрах видеопоследовательности, при этом достигнута скорость обработки 30 кадров в секунду для размеров входных изображений 640×480 пикселей. Приведенная вычислительная производительность алгоритма получена при поиске лиц в диапазоне  3 2 6 ; HH с шагом в 1,1 раза на компьютере Pentium Core2Duo с частотой процессора 2,33 ГГц (здесь Н – вертикальный размер изображения). Достиг- Особенности реализации алгоритма AdaBoost для обнаружения объектов... «Штучний інтелект» 3’2009 581 10М нутые после обучения классификаторов показатели качества составили 0,04 – вероят- ность пропуска лиц, и 8×10-6 – вероятность ложного обнаружения. Основным направ- лением дальнейших исследований является исследование возможностей использования описанного подхода для обнаружения других целевых объектов, в частности деталей лица, для определения степени его инвариантности к свойствам объектов поиска. Кроме этого, рассмотренный метод позволяет модифицировать способ представления классифи- каторов в направлении рассмотрения вершин многомерного куба как дескрипторов распознаваемых классов. Такой способ представления позволит существенно сократить вычислительные затраты при условии древовидного представления положения объектов в вершинах. Литература 1. Schapire R.E. Improved Boosting Algorithms Using Confidence-rated Predictions / R.E. Schapire, Y.Singer // Proceedings of Machine Learning. – 1999. – Р. 297-336. 2. Schapire. Robert E. The boosting approach to machine learning: An overview / Robert.Е. Schapire // In MSRI Workshop on Nonlinear Estimation and Classification. – 2002. 3. Schapire. Robert E. Boosting the margin: A new explanation for the effectiveness of voting methods / Robert E. Schapire. Freund Y. Bartlett P, Lee W.S. // Proc. Of the Fourteenth International Conference on Machine Learning. – 1997. 4. Paul Viola. Robust real-time object detection / Paul Viola and Michael J. Jones. // Proc. of IEEE Workshop on Statistical and Computational Theories of Vision. – 2001. 5. Мурыгин К.В. Обнаружение объектов на изображении на основе каскада классификаторов / К.В. Мурыгин // Искусственный интеллект. – 2007. – № 2. – С. 104-108. 6. Bradski G. Learning-based computer vision with Intel’s open source computer vision library [Электронный ресурс] / G. Bradski, A. Kaehler, V. Pisarevsky // Intel Technology Journal. – Режим доступа : http://develiper.intel.com/technology/itj-/index.htm. 7. Мурыгин К.В. Построение классификаторов на основе разделяющих поверхностей / К.В. Мурыгин // Искусственный интеллект. – 2008. – № 2. – С. 65-69. К.В. Муригін Особливості реалізації алгоритму AdaBoost для виявлення об’єктів на зображеннях У статті розглядаються особливості реалізації алгоритму AdaBoost для вирішення проблеми побудови каскаду класифікаторів для ефективного виявлення об’єктів на зображеннях. Як елементарні класифікатори пропонується використовувати прямокутні логічні властивості, що дозволяє зробити незалежним результат розпізнавання від монотонно зростаючих перетворень яскравості зображень, що не змінюють їх класову приналежність. Отриманий у результаті навчання каскад з 4 класифікаторів дозволяє вирішувати задачу пошуку на зображеннях областей облич у відеопотоці з параметрами 30 кадрів розміром 640×480 пікселів за секунду. K.V. Murygin The Features of Algorithm AdaBoost Implementation for Objects Detection on the Images In article features of implementation of AdaBoost algorithm for solution a problem of construction of the classifiers cascade for effective detection of objects on images are considered. As elementary classifiers it is offered to use rectangular logical properties that allow to make independent a result of recognition from monotonously increasing conversions of brightness of the images which don’t change their class association. The cascade received as a result of training process 4 classifiers which allows to solve the search task of face areas in a videostream with parameters of 30 frames of the size 640×480 pixels per second. Статья поступила в редакцию 11.06.2009.
id nasplib_isofts_kiev_ua-123456789-8113
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 1561-5359
language Russian
last_indexed 2025-12-01T08:33:16Z
publishDate 2009
publisher Інститут проблем штучного інтелекту МОН України та НАН України
record_format dspace
spelling Мурыгин, К.В.
2010-04-30T15:01:18Z
2010-04-30T15:01:18Z
2009
Особенности реализации алгоритма AdaBoost для обнаружения объектов на изображениях / К.В. Мурыгин // Штучний інтелект. — 2009. — № 3. — С. 573-581. — Бібліогр.: 7 назв. — рос.
1561-5359
https://nasplib.isofts.kiev.ua/handle/123456789/8113
004.89,004.93
В статье рассматриваются особенности реализации алгоритма AdaBoost для решения проблемы построения каскада классификаторов для эффективного обнаружения объектов на изображениях. В качестве элементар- ных классификаторов предлагается использовать прямоугольные логические свойства, что позволяет сделать независимым результат распознавания от монотонно возрастающих преобразований яркости изображений, не изменяющих их классовую принадлежность. Полученный в результате обучения каскад из 4 классификаторов позволяет решать задачу поиска на изображениях областей лиц в видеопотоке с параметрами 30 кадров размером 640×480 пикселей в секунду.
У статті розглядаються особливості реалізації алгоритму AdaBoost для вирішення проблеми побудови каскаду класифікаторів для ефективного виявлення об’єктів на зображеннях. Як елементарні класифікатори пропонується використовувати прямокутні логічні властивості, що дозволяє зробити незалежним результат розпізнавання від монотонно зростаючих перетворень яскравості зображень, що не змінюють їх класову приналежність. Отриманий у результаті навчання каскад з 4 класифікаторів дозволяє вирішувати задачу пошуку на зображеннях областей облич у відеопотоці з параметрами 30 кадрів розміром 640×480 пікселів за секунду.
In article features of implementation of AdaBoost algorithm for solution a problem of construction of the classifiers cascade for effective detection of objects on images are considered. As elementary classifiers it is offered to use rectangular logical properties that allow to make independent a result of recognition from monotonously increasing conversions of brightness of the images which don’t change their class association. The cascade received as a result of training process 4 classifiers which allows to solve the search task of face areas in a videostream with parameters of 30 frames of the size 640×480 pixels per second.
ru
Інститут проблем штучного інтелекту МОН України та НАН України
Распознавание образов. Цифровая обработка сигналов
Особенности реализации алгоритма AdaBoost для обнаружения объектов на изображениях
Особливості реалізації алгоритму AdaBoost для виявлення об’єктів на зображеннях
The Features of Algorithm AdaBoost Implementation for Objects Detection on the Images
Article
published earlier
spellingShingle Особенности реализации алгоритма AdaBoost для обнаружения объектов на изображениях
Мурыгин, К.В.
Распознавание образов. Цифровая обработка сигналов
title Особенности реализации алгоритма AdaBoost для обнаружения объектов на изображениях
title_alt Особливості реалізації алгоритму AdaBoost для виявлення об’єктів на зображеннях
The Features of Algorithm AdaBoost Implementation for Objects Detection on the Images
title_full Особенности реализации алгоритма AdaBoost для обнаружения объектов на изображениях
title_fullStr Особенности реализации алгоритма AdaBoost для обнаружения объектов на изображениях
title_full_unstemmed Особенности реализации алгоритма AdaBoost для обнаружения объектов на изображениях
title_short Особенности реализации алгоритма AdaBoost для обнаружения объектов на изображениях
title_sort особенности реализации алгоритма adaboost для обнаружения объектов на изображениях
topic Распознавание образов. Цифровая обработка сигналов
topic_facet Распознавание образов. Цифровая обработка сигналов
url https://nasplib.isofts.kiev.ua/handle/123456789/8113
work_keys_str_mv AT muryginkv osobennostirealizaciialgoritmaadaboostdlâobnaruženiâobʺektovnaizobraženiâh
AT muryginkv osoblivostírealízacííalgoritmuadaboostdlâviâvlennâobêktívnazobražennâh
AT muryginkv thefeaturesofalgorithmadaboostimplementationforobjectsdetectionontheimages