Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования

Разработан метод линейного масштабно-пространственного представления изображения на основе
 интегро-дифференциального уравнения 1-го порядка со сверткой вейвлет-функций в качестве ядра
 интегрального оператора. Розроблено метод лінійного масштабно-просторового представлення зображенн...

Full description

Saved in:
Bibliographic Details
Date:2008
Main Authors: Полякова, М.В., Крылов, В.Н., Гуляева, Н.А.
Format: Article
Language:Russian
Published: Інститут проблем штучного інтелекту МОН України та НАН України 2008
Subjects:
Online Access:https://nasplib.isofts.kiev.ua/handle/123456789/7656
Tags: Add Tag
No Tags, Be the first to tag this record!
Journal Title:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Cite this:Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования / М.В. Полякова, В.Н. Крылов, Н.А. Гуляева // Штучний інтелект. — 2008. — № 4. — С. 776-784. — Бібліогр.: 6 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1860073511407583232
author Полякова, М.В.
Крылов, В.Н.
Гуляева, Н.А.
author_facet Полякова, М.В.
Крылов, В.Н.
Гуляева, Н.А.
citation_txt Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования / М.В. Полякова, В.Н. Крылов, Н.А. Гуляева // Штучний інтелект. — 2008. — № 4. — С. 776-784. — Бібліогр.: 6 назв. — рос.
collection DSpace DC
description Разработан метод линейного масштабно-пространственного представления изображения на основе
 интегро-дифференциального уравнения 1-го порядка со сверткой вейвлет-функций в качестве ядра
 интегрального оператора. Розроблено метод лінійного масштабно-просторового представлення зображення на основі інтегро-
 диференційного рівняння 1-го порядку зі згорткою вейвлет-функцій у якості ядра інтегрального
 оператора. The method of linear scale-space of image is developed on the basis of integro-differential equation of first
 order with a convolution of wavelets as the kernel of integral operator.
first_indexed 2025-12-07T17:11:56Z
format Article
fulltext «Искусственный интеллект» 4’2008 776 9П УДК 681.3.01:519.67 М.В. Полякова, В.Н. Крылов, Н.А. Гуляева Одесский национальный политехнический университет, Украина Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования Разработан метод линейного масштабно-пространственного представления изображения на основе интегро-дифференциального уравнения 1-го порядка со сверткой вейвлет-функций в качестве ядра интегрального оператора. Введение Масштабно-пространственное представление – это множество копий исходного изображения с разными масштабами, которые позволяют охарактеризовать объекты иерархической структуры [1], т.е. объекты, которые содержат подобъекты. При реше- нии прикладных задач используются те копии исходного изображения, которые имеют наибольшую семантическую значимость в зависимости от цели обработки. Масштабно-пространственное представление изображения широко используется при обработке медицинских изображений, изображений аэрофотосъемки, а также при контроле качества изделий в промышленности, когда решаются задачи определения формы объекта, контурной сегментации, определения оптического потока и стереозрения. Такое представление позволяет существенно повысить оперативность обработки и достоверность распознавания объектов на изображениях. Масштабно-пространственное представление изображения может быть линей- ным или нелинейным. Линейное масштабно-пространственное представление строится на основе уравнения диффузии и ставит в соответствие изображению I(x,y) зависящее от масштаба t однопараметрическое семейство изображений I(x,y,t), которое удов- летворяет уравнению ),,,(),,( tyxI t tyxI    (1) с начальным условием I(x,y,0) = I(x,y), где ,2 2 2 2 yx       x, y – пространственные координаты. Предполагается, что масштабный параметр t  0 монотонно возрастает и некоторым образом может быть соотнесен с пространственным масштабом [1]. В [1] показано, что I(x,y,t) может быть получено с помощью свертки с гауссовской функцией G(x,y,t) = t yx e t 4 22 4 1    . В этом случае построение масштабно- пространственного представления сводится к построению последовательности сглажен- ных изображений. Производные изображений I(x,y,t) также удовлетворяют уравне- Линейное масштабно-пространственное представление изображения... «Штучний інтелект» 4’2008 777 9П нию диффузии, а производные гауссовских функций генерируют масштабно-прост- ранственное представление, подчеркивающее контуры объектов на разных масш- табах. Процесс получения масштабно-пространственного представления изображения на основе уравнения (1) называется изотропной диффузией. Изотропная диффузия обеспечивает помехоустойчивость представления путем сглаживания изображения, однако в этом случае размываются контуры, которые часто являются наиболее информативной частью объекта распознавания. Для решения этой проблемы часть информации о контурах вносят в качестве нелинейности в дифференциальное уравнение в частных производных. Тогда внутри однородных областей изображение сглаживается сильнее, чем вдоль границ облас- тей. Полученное в результате решения задачи Коши для нелинейного дифференциаль- ного уравнения в частных производных масштабно-пространственное представление изображения называется нелинейным, а подход, который применяется для его построения – анизотропным диффузионным [2]. Этот подход позволяет повысить качество выделения контуров и улучшить результат сегментации. Уравнение анизо- тропной диффузии имеет вид:   ,),,( IIgdiv t tyxI    где div – дивергенция, yx div       ; – градиент, ;,            yx  Ig  – поро- говая функция для перепадов интенсивности изображения такая, что g(0) = 1, 0)(lim,0)(   xgxg x . Выбор g(x) производится по аналогии с выбором порога для I в дифференциальных методах контурной сегментации изображений [2]. Недостатком анизотропного диффузионного подхода являются большой объем вычислений по сравнению с линейной диффузией и низкая помехоустойчивость из-за использо- вания производных по пространственным координатам. Значительная часть практи- ческих задач характеризуется высоким уровнем помех. Поэтому задача разработки нового подхода к построению масштабно-пространственного представления изобра- жения, позволяющего локализовать контуры и обеспечивающего высокую помехо- устойчивость, является актуальной. В случае иерархической структуры объекта распознавания для получения масштабно-пространственного представления изображения вместо пространствен- ного дифференцирования в данной работе предлагается применять репагулярное вейвлет-преобразование. Это преобразование определено в [3] как свертка строки или столбца изображения с функцией         ,,0 ;,sgn),( a a a x xxxax    где a – фиксированное число, зависящее от а(0,1) – параметра преобразования. Применение репагулярного вейвлет-преобразования для подчеркивания перепадов интенсивности изображения в задаче контурной сегментации изображений позволило достичь более высокой помехоустойчивости методов сегментации по сравнению с применением дифференцирования [3]. Для характеристики помехоустойчивости в работе используется показатель качества масштабно-пространственного представления, оценивающий близость резуль- татов представления для зашумленного и незашумленного изображений, и пока- Полякова М.В., Крылов В.Н., Гуляева Н.А. «Искусственный интеллект» 4’2008 778 9П затель эффективности, учитывающий уменьшение энтропии изображения при сни- жении уровня помех. Так как применение репагулярного вейвлет-преобразования при построении масштабно-пространственного представления обусловлено необходи- мостью сохранения границ объектов при подавлении шума на однородных участках изображения, целью работы является повышение эффективности линейного масштабно-пространственного представления изображения с помощью вейвлет- преобразования. Для достижения поставленной цели решены следующие задачи: – разработан метод линейного масштабно-пространственного представления изображения на основе интегро-дифференциального уравнения 1-го порядка со сверткой вейвлет-функций в качестве ядра интегрального оператора; – экспериментально исследованы качество и эффективность предложенного метода. Построение линейного масштабно-пространственного представления изображения с помощью вейвлет-преобразования Как уже упоминалось, линейное масштабно-пространственное представление строится на основе уравнения диффузии (1). Обозначим m-ю строку изображения I(x,y,t) через u(x,t): u(x,t) = I(x,ym,t). Тогда (1) для m-й строки изображения имеет вид: .),(),( 2 2 x txu t txu      (2) При моделировании изображения, содержащего перепады интенсивности, последние описываются функцией Хевисайда. Поэтому в общем случае функция u(x,t), удовлетворяющая (2), имеет разрывы 1-го рода и может быть представлена как обобщенная функция, зависящая от параметра t. Дифференцирование в (2) выполняется для обобщенной функции [4]. Дифференцирование по пространственной координате можно представить в виде свертки строки изображения с производной дельта-функции [4], тогда (2) имеет вид: )),(*)((*)(),( txuxx t txu     . (3) При использовании вейвлет-преобразования для подчеркивания контуров изображения задача сегментации сводится к задаче определения точек, в которых изменяется регулярность функции значений интенсивности изображения в зависимости от пространственных координат. Для обнаружения изменений регулярности функции целесообразно использовать специальный вид вейвлет-преобразования, характеризу- ющийся не изменением параметра масштаба, а изменением показателя регулярности вейвлет-функции. Этот вид вейвлет-преобразования, которое называется репагулярным (от латинского repagulum – сдерживающая преграда), реализуется как свертка изображения с вейвлет-функциями разной регулярности, локализованными в одной точке. Известно, что подчеркивание перепадов интенсивности изображения с помощью вейвлет-функций разной регулярности ),( ax , где а(0,1), обеспечивает Линейное масштабно-пространственное представление изображения... «Штучний інтелект» 4’2008 779 9П большую по сравнению с операцией дифференцирования помехоустойчивость [3]. Поэтому заменим в (3) )(x на функцию вида ),( ax , где а(0,1) фиксировано, получаем ).,(*),((*),(),( txuaxax t txu    (4) Формула (4) представляет собой обыкновенное интегро-дифференциальное уравнение 1-го порядка со сверткой вейвлет-функций в качестве ядра интегрального оператора [5]. Поставим задачу Коши: найти решение этого уравнения (обобщенную функцию, которая зависит от параметра t), обращающееся при t = 0 в заданную обобщенную функцию f(x). Чтобы раскрыть физический смысл (4), учтем, что первообразная функция ),( ax имеет вид: ),( 1 1),( 1 aCx a ax a     где С(а) – произвольная функция а [4], поэтому выберем С(а) = 0. В этом случае ).,(),( ax x ax     Тогда (4) можно представить как .),(*),(*),(),(              txuax x ax x tx t u  (5) Согласно свойству дифференцирования свертки обобщенных функций, фор- мула (5) принимает вид:            2 2 ),(*),(*),(),( x txuaxax t txu  . (6) В области преобразования Фурье (6) преобразуется к следующему виду: ).,()),((),( 2 2 22 tuat t u         (7) Формула (7) представляет собой в области преобразования Фурье уравнение диффузии в неоднородной среде. Использование такого уравнения предполагает, что сглаживание спектральной плотности изображения можно представить как процесс диффузии в неоднородной среде. Чтобы найти концентрацию вещества в любой точке среды в любой момент времени, недостаточно одного уравнения (7). Необходимо знать еще распределение концентрации вещества в начальный момент времени – начальное условие: ).()0,(  fu  Таким образом получаем в области преобразования Фурье задачу Коши для уравнения диффузии в неоднородной изотропной среде:           ).()0,( ,),()),((),( 2 2 22    fu tua t tu (8) Полякова М.В., Крылов В.Н., Гуляева Н.А. «Искусственный интеллект» 4’2008 780 9П Решение задачи Коши (8), описывающей преобразование спектральной плотности изображения как процесс диффузии в неоднородной среде, получается путем применения преобразования Фурье к решению (4) с начальным условием )()0,( xfxu  . (9) Для нахождения решения обыкновенного интегро-дифференциального уравне- ния 1-го порядка (4) выполняется преобразование Фурье обеих частей этого уравне- ния. Получаем линейное однородное уравнение относительно ),( au  с переменными коэффициентами:   ),(),(),( 2 tua t tu     . (10) Общее решение уравнения (10) имеет вид: taeCtE 2)),(( 0),(   . Выполнив обратное преобразование Фурье по переменной  , получаем   deeCtxE xi ta 2)),(( 0),(     . Фундаментальным решением уравнения (4) называется решение E(x,t), удов- летворяющее начальному условию E(x,0) = )(x . Если обобщенная функция f(x) в (9) финитна, то решение задачи Коши для уравнения (4) с начальным условием (9) запи- сывается в виде: u(x,t) = E(x,t) f(x). (11) Для определения константы С0 воспользуемся начальным условием задачи Коши для уравнения (4): )()0,( xxE  . В области преобразования Фурье по переменной х получаем 1)0,( 0 CE  . Тогда  deetxE xita    2)),((),( , причем полученное решение не ограничивает выбор вейвлета только репагулярной вейвлет-функцией. Докажем, что обобщенная функция u(x,t) = E(x,t) f(x) удовлетворяет уравне- нию (10). Выполнив преобразование Фурье по переменной х, имеем )(),(),(  ftEtu  . (12) Подставляя (12) в уравнение (10), получаем     0),(),(),()()(),(),()(),( 22             tEa t tEfftEaf t tE  . Линейное масштабно-пространственное представление изображения... «Штучний інтелект» 4’2008 781 9П Докажем, что (12) удовлетворяет начальному условию задачи Коши u(x,0) = f(x). В области преобразования Фурье по переменной х это условие принимает вид: )()0,(  fu  . Тогда )()(lim),(lim 2)),(( 00   ffeau ta tt   . Реализация линейного масштабно-пространственного представления изображения с помощью вейвлет-преобразования Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования согласно формуле (11) реализуется в виде свертки каждой строки, а затем каждого столбца матрицы значений интенсивности изображения с фильтром   Ne nt ne 0 , коэффициенты которого представляют собой дискретные значения функции Е(х,t). Для вычисления коэффициентов фильтра   Ne nt ne 0 задается параметр масштабно-пространственного представления а(0,1). Затем определяются значения функции  2, a для последовательности дискретных значений  , например, из интервала  3,3 с шагом 0,25. Для упрощения вычислений в качестве  a, использовалась функция      sgn1 2 cos2,~ 1 aaaia , являющаяся пре- образованием Фурье xxax a sgn),(~   . Результат вычисления интеграла для каждого значения частоты потенцируется, а затем к полученной последовательности значений применяется обратное дискретное преобразование Фурье. Получаем коэффициенты фильтра   Ne nt ne 0 (рис. 1, 2). а) б) Рисунок 1 – Функция, производящая масштабно-пространственное представление в пространственной (а) и частотной (б) области: 1 – гауссовская (t = 1/32), 2 – предложенная (t = 1/4) Полякова М.В., Крылов В.Н., Гуляева Н.А. «Искусственный интеллект» 4’2008 782 9П а) б) Рисунок 2 – Масштабно-пространственное представление изображения: линейное (а) (t = 2, 4, 8, 12, 20), линейное с помощью вейвлет-преобразования (б) (t = 1/24, 1/12, 1/6, 1/4, 1/2) Экспериментальные исследования и выводы Экспериментальные исследования предложенного масштабно-пространственного представления проведены на изображении размером 256  256 пикселей, в центре которого – белый квадрат 64  64 на черном фоне. На это изображение накладывался аддитивный гауссовский шум, для которого отношение сигнал/шум q определялось по формуле 22 /  hq , где h – величина контраста объекта,  – стандартное отклонение шума. Показателем качества масштабно-пространственного представления, применяемого для улучшения изображения, выбрана величина t ПроF , определяемая по формуле [6]:              N i M j эт N i M j этt t Про jiIjiI jiIjiI F 1 1 20 1 1 2 ),(),( ),(,( , где ),( jiI эт – результат масштабно-пространственного представления тестового изображения; ),( jiI t – результат масштабно-пространственного представления зашум- ленного изображения; ),(0 jiI – зашумленное изображение. Для оценки эффективности масштабно-пространственного представления изображения предложено использовать коэффициент уменьшения энтропии, так как снижение уровня помех приводит к уменьшению энтропии изображения [6]: HP HDH  , где Н – энтропия зашумленного изображения; )(log)( 1 2   L i ii xPxPH ; L – количество значений интенсивности изображения; )( ixP – вероятность появления значения интенсивности ix ; HP – энтропия изображения, полученного в результате масштабно- пространственного представления. Линейное масштабно-пространственное представление изображения... «Штучний інтелект» 4’2008 783 9П Получены графики зависимости значения показателей эффективности и качества масштабно-пространственного представления изображения от отношения сигнал/шум по мощности (рис. 3). а) б) Рисунок 3 – Зависимости показателей качества (а) и эффективности (б) от отношения сигнал/шум по мощности для масштабно-пространственного представления: линейного (1), предложенного (2), нелинейного (3) Анализируя полученные результаты, заметим, что предложенное масштабно- пространственное представление изображений, пораженных аддитивным гауссовским шумом, превышает по эффективности линейное и нелинейное масштабно-пространст- венное представление в 1,4 – 2,1 раза при значениях отношения сигнал/шум 100 и менее по мощности. По значениям показателя качества предложенное масштабно-пространственное представление хуже линейного представления до 5 раз при отношении сигнал/шум 20 и менее по мощности. При значениях отношения сигнал/шум 50 и более по мощности предложенное представление превышает по показателю качества линейное масштабно-пространственное представление до 2,3 раза. Сравнение предложенного масштабно-пространственного представления с нелинейным представлением показало, что оба представления сходны по показателю качества. По быстродействию предложенное масштабно-пространственное представление сравнимо с линейным представлением и лучше нелинейного представления в Cn раз, где n – количество итераций при вычислении нелинейного масштабно-пространст- венного представления (в наших экспериментах 30 – 45), С – постоянная, которая приблизительно равна 0,1 (рис. 4). Рисунок 4 – Время вычисления нелинейного масштабно-пространственного представления изображения 256  256 пикселей в зависимости от количества итераций (вычисление предложенного масштабно-пространственного представления заняло 0,5 – 0,6 с) Полякова М.В., Крылов В.Н., Гуляева Н.А. «Искусственный интеллект» 4’2008 784 9П Таким образом предложенное линейное масштабно-пространственное представле- ние целесообразно использовать для улучшения изображений, пораженных аддитивным гауссовским шумом при отношении сигнал/шум 100 и менее по мощности в задачах, где требуется высокое быстродействие и эффективность. Литература 1. Lindeberg T. Scale-Space Theory in Computer Vision. – Boston: Kluwer Academic Publishers, 1994. – 423 p. 2. Perona P., Malik J. Scale-space and edge detection using anisotropic diffusion // IEEE Trans. Pattern Analysis and Machine Intelligence. – 1990. – Vol. 12. – P. 629-639. 3. Полякова М.В., Крылов В.Н. Морфологический метод контурной сегментации изображений на основе репагулярного вейвлет-преобразования // Труды Одес. политех. ун-та. – Одесса, 2006. – Вып. 1 (25). – С. 98-103. 4. Гельфанд И.М., Шилов Г.Е. Обобщенные функции и действия над ними. Вып. 1. – М.: Физматгиз, 1959. – 470 с. 5. Вольтера В. Теория функционалов, интегральных и интегро-дифференциальных уравнений: Пер. с англ. / Под ред. П.И. Кузнецова. – М.: Наука, 1982. – 304 с. 6. Абакумов В.Г., Крылов В.Н., Антощук С.Г. Повышение эффективности обработки образной информации в автоматизированных системах // Электроника и связь: Темат. вып. «Проблемы электроники». – 2005. – Ч. 1. – С. 100-105. М.В. Полякова, В.М. Крилов, Н.А. Гуляєва Лінійне масштабно-просторове представлення зображення за допомогою вейвлет-перетворення Розроблено метод лінійного масштабно-просторового представлення зображення на основі інтегро- диференційного рівняння 1-го порядку зі згорткою вейвлет-функцій у якості ядра інтегрального оператора. M.V. Polyakova, V.N. Krylov, N.A. Gulyayeva Linear Scale-space of Image with Wavelet Transform Help The method of linear scale-space of image is developed on the basis of integro-differential equation of first order with a convolution of wavelets as the kernel of integral operator. Статья поступила в редакцию 29.05.2008.
id nasplib_isofts_kiev_ua-123456789-7656
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 1561-5359
language Russian
last_indexed 2025-12-07T17:11:56Z
publishDate 2008
publisher Інститут проблем штучного інтелекту МОН України та НАН України
record_format dspace
spelling Полякова, М.В.
Крылов, В.Н.
Гуляева, Н.А.
2010-04-06T12:51:27Z
2010-04-06T12:51:27Z
2008
Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования / М.В. Полякова, В.Н. Крылов, Н.А. Гуляева // Штучний інтелект. — 2008. — № 4. — С. 776-784. — Бібліогр.: 6 назв. — рос.
1561-5359
https://nasplib.isofts.kiev.ua/handle/123456789/7656
681.3.01:519.67
Разработан метод линейного масштабно-пространственного представления изображения на основе
 интегро-дифференциального уравнения 1-го порядка со сверткой вейвлет-функций в качестве ядра
 интегрального оператора.
Розроблено метод лінійного масштабно-просторового представлення зображення на основі інтегро-
 диференційного рівняння 1-го порядку зі згорткою вейвлет-функцій у якості ядра інтегрального
 оператора.
The method of linear scale-space of image is developed on the basis of integro-differential equation of first
 order with a convolution of wavelets as the kernel of integral operator.
ru
Інститут проблем штучного інтелекту МОН України та НАН України
Распознавание речи. Интеллектуальные системы для работы с естественными языками и текстами
Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования
Лінійне масштабно-просторове представлення зображення за допомогою вейвлет-перетворення
Linear Scale-space of Image with Wavelet Transform Help
Article
published earlier
spellingShingle Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования
Полякова, М.В.
Крылов, В.Н.
Гуляева, Н.А.
Распознавание речи. Интеллектуальные системы для работы с естественными языками и текстами
title Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования
title_alt Лінійне масштабно-просторове представлення зображення за допомогою вейвлет-перетворення
Linear Scale-space of Image with Wavelet Transform Help
title_full Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования
title_fullStr Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования
title_full_unstemmed Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования
title_short Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования
title_sort линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования
topic Распознавание речи. Интеллектуальные системы для работы с естественными языками и текстами
topic_facet Распознавание речи. Интеллектуальные системы для работы с естественными языками и текстами
url https://nasplib.isofts.kiev.ua/handle/123456789/7656
work_keys_str_mv AT polâkovamv lineinoemasštabnoprostranstvennoepredstavlenieizobraženiâspomoŝʹûveivletpreobrazovaniâ
AT krylovvn lineinoemasštabnoprostranstvennoepredstavlenieizobraženiâspomoŝʹûveivletpreobrazovaniâ
AT gulâevana lineinoemasštabnoprostranstvennoepredstavlenieizobraženiâspomoŝʹûveivletpreobrazovaniâ
AT polâkovamv líníinemasštabnoprostorovepredstavlennâzobražennâzadopomogoûveivletperetvorennâ
AT krylovvn líníinemasštabnoprostorovepredstavlennâzobražennâzadopomogoûveivletperetvorennâ
AT gulâevana líníinemasštabnoprostorovepredstavlennâzobražennâzadopomogoûveivletperetvorennâ
AT polâkovamv linearscalespaceofimagewithwavelettransformhelp
AT krylovvn linearscalespaceofimagewithwavelettransformhelp
AT gulâevana linearscalespaceofimagewithwavelettransformhelp