Информационная оценка изображений в системах технического зрения
В статье рассмотрены вопросы оценки информационной емкости полноградационных и бинарных изображений, используемых в системах технического зрения (СТЗ). Основой СТЗ являются телевизионные средства формирования и анализа изображений. Показано, что для СТЗ полноградационное изображение носит абст...
Збережено в:
| Опубліковано в: : | Штучний інтелект |
|---|---|
| Дата: | 2011 |
| Автор: | |
| Формат: | Стаття |
| Мова: | Російська |
| Опубліковано: |
Інститут проблем штучного інтелекту МОН України та НАН України
2011
|
| Теми: | |
| Онлайн доступ: | https://nasplib.isofts.kiev.ua/handle/123456789/59902 |
| Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Цитувати: | Информационная оценка изображений в системах технического зрения / И.И. Сальников // Штучний інтелект. — 2011. — № 3. — С. 261-270. — Бібліогр.: 3 назв. — рос. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraine| _version_ | 1859649583302311936 |
|---|---|
| author | Сальников, И.И. |
| author_facet | Сальников, И.И. |
| citation_txt | Информационная оценка изображений в системах технического зрения / И.И. Сальников // Штучний інтелект. — 2011. — № 3. — С. 261-270. — Бібліогр.: 3 назв. — рос. |
| collection | DSpace DC |
| container_title | Штучний інтелект |
| description | В статье рассмотрены вопросы оценки информационной емкости полноградационных и бинарных
изображений, используемых в системах технического зрения (СТЗ). Основой СТЗ являются телевизионные
средства формирования и анализа изображений. Показано, что для СТЗ полноградационное изображение
носит абстрактный характер, а источником информативных параметров являются статистически устойчивые
пространственные характеристики этого изображения. Поэтому используются бинарные изображения,
которые характеризуются существенно меньшим информационным потоком при сохранении информации
о пространственных параметрах анализируемых изображений.
|
| first_indexed | 2025-12-07T13:32:06Z |
| format | Article |
| fulltext |
«Штучний інтелект» 3’2011 261
4С
УДК 621.397
И.И. Сальников
Пензенская государственная технологическая академия, г. Пенза, Россия
iis@pgta.ru
Информационная оценка изображений
в системах технического зрения
В статье рассмотрены вопросы оценки информационной емкости полноградационных и бинарных
изображений, используемых в системах технического зрения (СТЗ). Основой СТЗ являются телевизионные
средства формирования и анализа изображений. Показано, что для СТЗ полноградационное изображение
носит абстрактный характер, а источником информативных параметров являются статистически устойчивые
пространственные характеристики этого изображения. Поэтому используются бинарные изображения,
которые характеризуются существенно меньшим информационным потоком при сохранении информации
о пространственных параметрах анализируемых изображений.
Введение
В системном анализе оценить выполняемые преобразования с точки зрения поте-
ри информации всегда представлялось заманчивым, так как изменение количества ин-
формации является наиболее универсальной оценкой преобразований, выполняемых
любой информационной технической системой (ИТС). Однако, анализируя имеющиеся
результаты, следует сделать вывод, что количество информации не стало универсальной
оценкой работы реальных ИТС. При всей привлекательности использование количества
информации в качестве универсального критерия оценки ИТС невозможно из-за су-
ществования барьера субъективизма. То есть при попытке использовать количество ин-
формации в качестве критерия оценки сразу же возникает вопрос – что считать полез-
ной информацией? В ряде работ это учитывается путем введения понятия ценности
информации – как некоторой функции, максимизирующей разность между уровнем потерь
при отсутствии информации и минимальным уровнем потерь при наличии информации в
системе обработки.
Ценность информации – это есть проявление субъективизма, учитывающего
каждый конкретный случай построения системы обработки информации в отдельности.
Получается, что универсального критерия оценки преобразований не может быть.
Использование количества информации в качестве критерия оценки качества пре-
образования возможно, но при условии определения в каждом конкретном случае
понятия ценности информации.
Когда невозможно определить ценность информации следует рассматривать не ко-
личество информации, передаваемое сигналом, а информационную емкость носителя
информации как некоторую потенциальную величину, которой характеризуется и пере-
даваемый сигнал и система его обработки.
В теории информации, самостоятельное развитие которой начато трудами К. Шеннона,
используются методы теории вероятности и математической статистики. Огромным дости-
жением теории информации является тот факт, что определяемое количество информации,
несмотря на разнородное конкретное содержание сигнала (сообщений), можно продуктив-
но измерять единой количественной мерой.
Сальников И.И.
«Искусственный интеллект» 3’2011 262
4С
Изображение как пространственно-временной сигнал (ПВС) ),,( tyxS может нести
в себе самую различную информацию для человека. В качестве художественного образа
изображение получило, пожалуй, наибольшее распространение. Это и живописные кар-
тины, когда каждый изгиб линии на картине художника может трактоваться самым неве-
роятным и бесконечным образом и в целом картина может нести неисчерпаемое коли-
чество информации; это и фотография, открывающая человеку бесконечные вариации
изображений от непознанного внутреннего мира вещества до окружающей человека
бесконечной Вселенной; и современное телевидение, которое возможно уступает живо-
писи и фотографии в изобразительности, но целиком и полностью превосходит их в дина-
мичности передаваемых изображений и почти полным эффектом присутствия. Барьер
субъективизма для данных типов ПВС не позволяет использовать количество инфор-
мации в качестве меры количественной их оценки. Поэтому в дальнейшем мы ограни-
чимся рассмотрением информационной емкости носителей информации для двух ос-
новных случаев: полноградационного и бинарного телевизионных изображений.
Информационная оценка ТВ-изображения
При рассмотрении информационной емкости телевизионной системы потен-
циальное количество информации, которое может быть передано, описывается выраже-
нием
mNITC 2log , (1)
где N – число элементов растра; m – количество уровней квантования яркости,
которое будет зависеть от отношения сигнал/шум.
Для вещательного телевизионного стандарта, если принять размер растра 512 х 512
элементов при частоте передачи полных кадров 25 Гц (или 50 Гц при передаче полу-
кадров для чересстрочной развертки) и допустить, что телевизионный сигнал пред-
ставляется 256 градациями яркости, то есть, кодируется 8-разрядным двоичным кодом, то
тогда потенциальное количество информации, которое может передавать вещательная
ТВ-система, будет равно 2,1106 бит для одного кадра или 52,43 Мбит/с (6,55 Мбайт/с)
для всего информационного потока. Попутно отметим, что для вещательного телевизион-
ного стандарта принята полоса передаваемых частот 6,5 МГц.
Количество информации, передаваемое телевизионным изображением, играет
важную роль при проектировании каналов связи для правильного выбора их параметров.
В общем случае верхняя оценка количества информации, передаваемого телевизионным
изображением, должна соответствовать (1), то есть потенциальной информационной ем-
кости телевизионной системы. Далее необходимо учесть: неравновероятность уровней
квантования яркости изображения и статистическую связь между элементами изображе-
ния. Эти факторы приводят к уменьшению количества информации по сравнению с
потенциальным, и позволяют применять методы сжатия ТВ-изображения с целью со-
кращения информационного потока, используя статистические характеристики ТВ-
изображения. Системы сжатия применяют при передаче ТВ-изображений по каналам
связи с ограниченными характеристиками, а также при архивации и визуализации
изображений в вычислительных системах.
Измерения распределения вероятностей P(S) уровней яркости ТВ-изображения –
статистики первого порядка, показали, что для разных типовых сюжетов это распре-
деление различно. Это означает, что использовать неравномерность распределения яр-
кости для эффективного сжатия в вещательном телевидении нельзя [1].
Информационная оценка изображений в системах технического зрения
«Штучний інтелект» 3’2011 263
4С
Особенностью статистических связей между элементами реальных ТВ-изображе-
ний является возможность моделирования их односвязной цепью Маркова, когда учи-
тывается связь между данным элементом и одним предшествующим. Знание еще одного
или двух элементов, как правило, мало влияет на успешность предсказания данного
элемента. Этим изображение отличается от текстовых сообщений, где условно-вероятност-
ные связи весьма существенно распространяются на соседние буквы. Для такой модели ТВ-
изображения при оценке количества информации достаточно ограничиться статистикой
второго порядка, то есть условными вероятностями для двух соседних элементов. В этом
случае энтропия для одного элемента будет равна
m
j
m
i
jiPjiPH
1 1
22 )|(log)|(
2
1 , (2)
где P(i j) – вероятность появления элемента с i-уровнем при условии появления
элемента с предшествующим j-уровнем.
Возможное сжатие, определяющееся коэффициентом сокращения количества ин-
формации с учетом статистических связей, в среднем оказывается равным примерно
двум. Выясняется, что даже этот незначительный выигрыш в вещательном телевидении
использовать не удается. Множество передаваемых кадров ТВ-изображения образуют
нестационарную последовательность, что привело бы при статистическом кодировании
к необходимости менять «кодовую книгу» от сюжета к сюжету, предварительно опре-
деляя, к какому типу он относится.
Случайные сигналы характеризуются энергетическим спектром, который реально
можно расcчитать, используя алгоритмы БПФ. Характерной особенностью подобных
спектров является резкая неоднородность распределения энергии по пространственным
частотам. Основная часть энергии оказывается сосредоточенной в сравнительно узкой
области нижних пространственных частот, что характеризует статистическую избыточ-
ность изображений. Задача эффективного кодирования состоит в выравнивании загрузки
канала связи. Сигнал, лишенный статистической избыточности, имеет характер «белого
шума» и его спектральная плотность равномерно распределяется по всему диапазону
частот.
Другой особенностью энергетического спектра телевизионного изображения яв-
ляется его анизотропия. Это хорошо известные «пустоты» или минимумы между макси-
мумами, приходящимися на частоты, кратные кадровым и строчным частотам. Этот вид
анизотропии пространственного спектра объясняется растровым характером телеви-
зионного изображения. Другой тип анизотропии характерен для изображений общего
плана пейзажей, панорам, групповых съемок и т.п. и связан с тем, что реальные
объекты находятся в поле земного тяготения и из-за этого преобладают вертикальные и
горизонтальные границы предметов. Это приводит к тому, что изометрические линии
энергетического спектра constG yx ),( в области высоких пространственных частот
существенно отличаются от концентрических окружностей, которые должны были бы
быть в случае изотропного пространственного спектра. Эти линии напоминают ромб,
оси симметрии которого совпадают с осями частотной плоскости, то есть ориенти-
рованы по горизонтали и вертикали.
Подводя итог рассмотрению вопроса о количестве информации, передаваемом теле-
визионным изображением в вещательном телевидении, следует отметить, что количество
информации не может быть больше информационной емкости телевизионной системы.
Конкретное количество информации зависит от сюжета и не может служить количествен-
ной характеристикой информационной системы.
Сальников И.И.
«Искусственный интеллект» 3’2011 264
4С
Информационная оценка бинарного изображения
Бинарные изображения в СТЗ получили широкое распространение, так как при
полном сохранении пространственного расположения изображения объектов сокращается
число градаций яркости видеосигнала до двух, что приводит к существенному упрощению
устройств обработки. Бинаризацию можно отнести к одному из способов сжатия ТВ-
изображения, в результате которого формируется силуэт изображения [2].
Бинарное преобразование представляет собой сравнение многоградационного
изображения S(x,y) с пороговым значением Sп и присвоение текущему элементу изо-
бражения «1», если исходное значение больше или равно пороговому, и присвоение
«0», если меньше порогового:
П
П
1,если ( , )
( , )
0,если ( , )b
S x y S
S x y
S x y S
. (3)
Бинарное преобразование легко реализуется средствами цифровой техники. Важным
моментом здесь является правильный выбор порогового уровня Sп. Бинарное преобразо-
вание для изображающей системы – системы наблюдения, системы ТВ-вещания, в общем
случае бессмысленно, так как изображение изменяется существенно и, естественно, на-
блюдается потеря количества информации.
Другое дело в СТЗ, в которых исходным сигналом является телевизионное изобра-
жение. Если измеряемые параметры заключаются в пространственном положении эле-
ментов изображения, а не в их амплитудном значении яркости, то тогда, заменяя много-
градационное изображение его бинарным аналогом, потенциально количество полезной
информации не изменится. Однако всегда следует помнить о шумах, на фоне которых
выполняется процесс бинаризации, и которые влияют на пространственное положение
элементов изображения.
При переходе к бинарным изображениям с числом градаций m = 2 информационная
емкость телевизионной системы для одного элемента растра становится равной I ТС = 1
бит/элемент, а с учетом N элементов будет описываться выражением (1). Эта величина
является верхней оценкой количества передаваемой бинарным изображением информа-
ции. Реально с учетом статистических связей, как между градациями уровней яркости, так
и между элементами ТВ-изображения, количество информации, передаваемое таким
изображением, уменьшается. Как и в случае полноградационного ТВ-изображения, для
ТВ-систем, работающих с бинарным изображением, следует различать:
– информационную емкость телевизионной системы с двумя градациями яркости,
для которой следует использовать соотношение (1);
– количество информации, содержащееся в бинарном ТВ-изображении, как с
учетом распределения вероятностей двух уровней, так и с учетом статистических
связей между единичными элементами.
Энтропия двухградационного изображения будет зависеть от вероятности P1 по-
явления элемента изображения с единичным уровнем на фоне, уровень которого пред-
ставляется равным 0. Для многих технических приложений вероятность P1 < 1, в этом
случае, используя (2), можно получить приближенное выражение для энтропии:
1 2 1 1 2 1 1 2 1log (1 ) log (1 ) log ( / )H P P P P P e P . (4)
Для P1 = 10-2 получим энтропию изображения порядка 10-1 бит/элемент, что
позволяет говорить о сокращении информационного потока в 10 раз по сравнению с
информационной емкостью бинарного изображения и, по крайней мере, в 80 раз по
сравнению с информационной емкостью полноградационного ТВ-изображения.
Информационная оценка изображений в системах технического зрения
«Штучний інтелект» 3’2011 265
4С
Вышеотмеченная модель полноградационного ТВ-изображения как односвязная цепь
Маркова, когда учитывается связь между данным элементом и одним предшествующим,
вполне подходит и для бинарных изображений. Так как процесс бинаризации является
нелинейным безынерционным процессом (3), то статистическая связь между элементами
будет уменьшаться. А энергетический спектр при нелинейном преобразовании расши-
ряется, так как преобразование безынерционное. В этом случае энтропия для одного
элемента бинарного изображения будет аналогична (4).
Рассмотрим процесс бинаризации полноградационного ТВ-изображения для огра-
ниченного класса измерительных СТЗ, которые используют пространственные характе-
ристики изображений объектов. В подобных СТЗ не важно само изображение, а важно
пространственное положение объекта, важны статистически устойчивые пространствен-
ные характеристики – такие как габаритные границы, координаты центра тяжести изобра-
жения, периметр контура, площадь силуэта и т.д. Особенностью работы таких СТЗ
является необходимость анализа информационного изображения на фоне как аддитивных
шумов, так и в условиях мультипликативных искажений. Кроме того, подобные системы
работают с объектами, перемещающимися в пространстве. Примерами подобных СТЗ
могут служить следящие системы, в которых вид изображения объекта не столь важен и
для человека носит абстрактный характер. Это может быть изображение пламени рабо-
тающего двигателя, пятно лазерного луча, прошедшего атмосферу, объект в турбулент-
ных потоках жидкости, газа и т.п.
При оценке пространственных характеристик в измерительных СТЗ важную
роль играют границы изображения объекта. Оценка пространственного положения
границ объекта по его изображению является сложной задачей и существует целый
ряд подходов к ответу на вопрос – что является границей изображения объекта?
Наиболее простым определением границы изображения объекта можно считать
геометрическое место точек на плоскости с координатами Xг, Yг, для которых значе-
ние функции яркости равно половине динамического диапазона изменения яркости
объекта, то есть
г г max min( , ) 0,5( )S X Y S S . (5)
Определив таким образом границу объекта, мы можем перейти к бинарному изобра-
жению. При этом бинаризация изображения в соответствии с определением (3) выполняется
с порогом П max min0,5( )S S S . При идеальной бинаризации полноградационного изобра-
жения граница объекта должна сохраняться и в этом смысле не должно быть потерь инфор-
мации. В реальных СТЗ действует ряд факторов, определяющих потери информации.
Определим зависимость информационной емкости бинарного изображения от исходного
отношения сигнал/шум. Введем ряд условий, необходимых для дальнейшего рассмотрения.
1. Рассматриваем изображение как растровое, то есть полученное из одномер-
ного временного видеосигнала S(t) путем преобразования временного параметра t в
пространственный xx V t , где Vx – скорость развертки по строке.
2. Введем ограничение сверху по полосе частот спектра видеосигнала, которое
всегда имеет место в реальных СТЗ, максимальной частотой Fm.
3. Учтем влияние аддитивного шума, который будет «размывать» границы,
внося неопределенность в значение координат г г( , )X Y .
4. Критерием выбора порога бинаризации возьмем условие, вытекающее из (5).
Рис. 1, а) иллюстрирует процесс бинаризации видеосигнала полноградационного изобра-
жения S(t) с порогом Sп. В результате по строке x формируется бинарное изображение Sb (x)
с границами г( )X .
Сальников И.И.
«Искусственный интеллект» 3’2011 266
4С
Наличие аддитивного шума «размывает» границы Xг, формируя зону неопределен-
ности Xг. Бинарное изображение Sb(x,y) представляет собой совокупность белых пятен
произвольной формы, границы которых флюктуируют в пределах некоторой зоны (рис. 1, б).
Рисунок 1 – Бинаризация растрового изображения: формирование границы Хг (а);
бинарное изображение с «размытыми» границами (б)
Ограничение спектра частотой Fm, которое имеет место в реальных СТЗ, эквива-
лентно действию фильтра нижних частот с частотой среза Fm. Анализ отклика линейного
фильтра во временной области усложняется тем обстоятельством, что время течет в одну
сторону и для выполнения принципа физической реализуемости линейной системы не-
обходимо вводить некоторую задержку, наличие которой усложняет анализ и не носит
принципиального характера с точки зрения поставленной задачи. Поэтому эту задержку
учитывать не будем. Для идеального (с нулевой ФЧХ) фильтра нижних частот отклик на
некоторое воздействие Sвх(t) описывается интегралом свертки. Если на вход подобного
фильтра нижних частот подается единичный скачок функции яркости, то отклик будет
описываться специальной табличной функцией – интегральным синусом [3]:
вых ( ) [sin 2 ] [2 ] / 0,5
t
m mS t F d Si F t
. (6)
Расстояние между экстремумами, соответствующее интервалу нарастания отклика
равно 2 / 2 1/m m mT F F . При t имеем установившийся процесс Sвых() = 1, так
как Si [] = /2. Изменение функции [2 ]/ 0,5mSi F t в пределах {0;1} происходит на
интервале
0 0,62 / mT F . (7)
По теореме Котельникова отсчеты дискретизации необходимо брать через интервал
mi Ft 2/1 . Для дальнейшего рассмотрения на интервале T0 функцию [2 ]mSi F t
аппроксимируем прямой вых ( ) 0,5AS t k t , где kА – коэффициент преобразования, оп-
ределяющий наклон аппроксимирующей функции:
вых ( ) 1,6 0,5mS t F t , (8)
при этом ошибка аппроксимации для [2 ]mSi F t = 1,2 не превышает 5%.
На рис. 2 показан результат воздействия скачкообразной функции яркости входного
видеосигнала Sвх(t) на реальную СТЗ. В результате ограничения спектра максимальной
частотой Fm наблюдается увеличение времени нарастания Sвых(t). В соответствии с алго-
ритмом (3) формируется бинарное изображение Sb (x) объекта с границей Х г.
Информационная оценка изображений в системах технического зрения
«Штучний інтелект» 3’2011 267
4С
Рисунок 2 – Формирование границы бинарного изображения
Воздействие нормального аддитивного шума на процесс бинаризации эквивалентно
флюктуации порогового уровня с функцией плотности вероятности W(Sп), описываемой
нормальным законом с математическим ожиданием равным Sп,0 – пороговым уровнем
при отсутствии шума, и дисперсией ш2. В результате бинарного преобразования будет
наблюдаться флюктуация координат границы Xг также с нормальным законом W1(Xг), так
как функция нарастания отклика аппроксимируется линейной зависимостью (8).
Математическое ожидание координаты границы равно M{Xг} = Xг, то есть при
отсутствии шума находится из (5). Дисперсия координат границы XГ будет зависеть от
дисперсии шума ш2 и функции преобразования (8). Допустим, что коэффициент пре-
образования временного видеосигнала Sвых(t) в его пространственный аналог Sвых(x) ра-
вен единице, тогда запишем пространственный аналог функции преобразования (8) в
виде: вых г 0( ) 1,6 ( / 2) 0,5mxS x F x X X , где x – текущая координата по строке; Хг,0 –
граница для идеальной изображающей системы; Fm,x = Fm/Vx – максимальная простран-
ственная частота в спектре изображения; X0 /2 – пространственный сдвиг, возни-
кающий из-за необходимости наличия задержки в линейной системе в соответствии с
принципом физической реализуемости и с учетом (6). Далее получим зависимость ко-
ординаты границы от значения сигнала при условии порогового сравнения:
г вых вых , г,0 , , ,
вых , г,0
,
( ) ( 1,6 0,31 1,6 / 0,5)/1,6
1
(0,625 )
m x m x m x m x
m x
m x
X S S F X F F F
S F X
F
(9)
Математическое ожидание будет равно г г вых г ,0 ,{ } ( 0,5) 0, 29 / m xM X X S X F .
Дисперсия координат границ будет зависеть от коэффициента наклона функции линей-
ного преобразования Xг (Sвых):
2 2 2 2 2 2
,г ш , ш0,625 / 0, 4 /х m x х mF V F , (10)
то есть дисперсия зависит от уровня шума ш2 на входе и от частоты Fm, ограничивающей
спектр видеосигнала в СТЗ. С увеличением дисперсии шума ш2 будет возрастать не-
определенность в определении границы бинарного изображения и, как следствие, будет
уменьшаться количество информации о пространственных характеристиках объекта.
Для определения изменения количества информации для процесса бинариза-
ции в условиях нормального аддитивного шума необходимо определить интервал
дискретизации по строке (по оси 0х). Примем интервал дискретизации по 0х, равный
ширине шумовой дорожки Xг, которая зависит от дисперсии функции плотности
вероятности случайной величины, заданной вероятности попадания в данный интервал
Сальников И.И.
«Искусственный интеллект» 3’2011 268
4С
случайной величины и от надежности измерения, с какой мы хотим определить коли-
чество интервалов. Напомним, что для интервала Xг= х,г для нормального закона
вероятность попадания равна 0,68. Воспользуемся неравенством Чебышева, которое
устанавливает для произвольного положительного действительного числа k соотно-
шение между вероятностью отклонения случайной величины от среднего значения и ее
среднеквадратическим значением: 2
ср(| | )DP D D k k , то есть отклонения случай-
ной величины от ее среднего значения, значительно превышающие среднеквадратиче-
ское, маловероятны. Тогда вероятность непревышения случайной величины ее среднего
значения в зависимости от дисперсии примет вид 2
ср(| | ) (1 )DP D D k k . Исполь-
зуя эти соотношения, получим выражение для интервала дискретизации:
2 2
ш ,г ,г 1/ 1х хX k P . (11)
Для вероятности P1 = 0,68 необходимо взять интервал дискретизации равный Х =
=1,76х,г, а для P1 = 0,997 уже Х = 18,2х,г. Интервал дискретизации (11) учитывает
только наличие шума. Так при дисперсии шума х,г 20 интервал также стремится к
нулю. Уменьшение интервала дискретизации приведет только к увеличени количества
отсчетов бинарного изображения и к неоправданной перегрузке системы дискретизации.
С точки зрения правильности передачи сигнала интервал дискретизации по
пространству должен удовлетворять теореме Котельникова, которая учитывает Fm:
mXxmK FVFX /5,02/1 , . (12)
Тогда в общем случае интервал дискретизации бинарного изображения должен
удовлетворять условию
ш КX X X . (13)
Условие (13) – противоречивое. С одной стороны, мы должны уменьшать интервал
дискретизации по сравнению с ХК, тогда условие неискаженной передачи сигналов в
соответствии с теоремой Котельникова будет выполнено. Но с уменьшением интервала
мы можем нарушить условие, определяемое наличием шумов в системе для Хш (11).
Рассмотрим зависимости ХК и Хш от Fm. Если для ХК эта зависимость явная
(12), то в (11) для Хш граничная частота Fm учитывается исключительно благодаря
функции преобразования (9). Кроме этого следует учесть изменение уровня шума при
прохождении линейной системы с ограниченной полосой пропускания.
Для оценки уровня шумов в системе используют модель «белого шума», когда
спектральная плотность мощности шума – удельная мощность шума на единицу полосы
частот, постоянна. То есть ш ш,0( )G G ,[В2.с]. При прохождении «белого шума» через
реальную систему обработки спектр ограничивается полосой ( 0 Fm ), тогда
среднеквадратическое напряжение шумов, определяемое дисперсией шума при усло-
вии, что среднее значение шума равно 0, примет вид
2
ш ш ш ,0{ } mM S G F . (14)
Спектральная плотность мощности шума Gш,0 величина неудобная. Чаще всего
используется безразмерная величина – отношение сигнал/шум, которое определим в
виде
max min ш( ) / { }S S M S . (15)
С учетом ограничения по спектру и равенства единице коэффициента преобра-
зования отношение сигнал/шум на выходе будет равно
ш,0max min( ) / mS S G F , (16)
Информационная оценка изображений в системах технического зрения
«Штучний інтелект» 3’2011 269
4С
то есть с увеличением полосы пропускания системы отношение сигнал/шум ухудшает-
ся. Используя (11), а также условия Smax = 1, Smin = 0, получим соотношение:
ш 1 ш,0 10,625 /( 1 ) 0,625 /( 1 )х m х mX V F P V G F P , (17)
из которого следует, что интервал дискретизации по оси 0x для растрового изобра-
жения в первую очередь зависит от уровня шума Gш,0. Чем больше уровень шума,
тем больший необходимо взять интервал. Обратно пропорциональная зависимость
от Fm объясняется тем, что чем шире полоса пропускания линейной системы, тем
круче будет линейная функция, описывающая отклик на скачкообразное воздействие
(6), и меньше будет дисперсия отклонения координаты границы бинарного изобра-
жения от ее среднего значения (рис. 2). На рис. 3 приведены зависимости ХК (11) и
Хш (17) от максимальной частоты в спектре видеосигнала Fm. При некотором зна-
чении Fm выполняется равенство ХК и Хш: ш,0
,0 ,0 1
0,625
2 (1 )
хх
m m
V GV
F F P
, из которого можно
определить значение частоты Fm,0 и интервала Х0:
1
,0
ш,0
10, 24(1 )
m
P
F
G
; 2
0 ш,0 1 10,78 /(1 ) 0,78 / (1 )mX G P F P . (18)
Из (18) следует, что чем больше отношение сигнал/шум, тем меньший интервал
дискретизации можно взять. И с другой стороны, с уменьшением полосы частот системы
интервал дискретизации по оси 0x следует увеличивать. Выражение (18) характеризует
частный случай равенства ХК = Хш.. Учитывая независимость двух критериев выбора
интервала дискретизации (11) и (17) в общем случае, возьмем их сумму, как наиболее
простую форму объединения этих условий:
шKX X X . (19)
Физический смысл (19) заключается в следующем. При уменьшении уровня шума
интервал Хш 0 и тогда выбор Х обеспечивается ХК, то есть условием (11). Коли-
чество отсчетов бинарного изображения по строке будет определяться общим разме-
ром изображения Х и интервалом дискретизации Х:
1/ /[0,5 0,625 /( 1 )]m
х
XF
m X X P
V
. (20)
При равновероятных отсчетах информационная емкость бинарного изображения
будет равна
2 2 1log log { /[0,5 0,625 / ( 1 )]}m
y y
х
XF
I N m N P
V
, (21)
где Ny – число строк в растровом изображении.
Из (21) следует, что с увеличением уровня шумов ( 0) информационная емкость
уменьшается, а при расширении полосы частот (Fm) СТЗ она увеличивается. Кроме того,
для повышения надежности измерения (P11) мы вынуждены расширять интервал дискре-
тизации, что приводит к уменьшению информационной емкости бинарного изображения.
Заключение
Таким образом, подводя итог рассмотрению вопросов информационной оценки
пространственно-временных сигналов, отметим следующее.
Когда невозможно определить ценность информации, что характерно для СТЗ, ра-
ботающих с ПВС, следует рассматривать информационную емкость носителя инфор-
мации – как некоторую потенциальную величину, которой характеризуется и пере-
даваемый сигнал и система его обработки.
Сальников И.И.
«Искусственный интеллект» 3’2011 270
4С
Показано, что для целого ряда применений СТЗ само по себе полноградационное
изображение носит абстрактный характер, а источником информативных параметров яв-
ляются пространственные статистически устойчивые характеристики этого изображения.
В этом случае можно перейти к анализу бинарных изображений, так как при правильном
выборе порогового уровня количество информации применительно к задачам измери-
тельных СТЗ не изменится.
При оценке пространственных характеристик изображений объектов в измеритель-
ных СТЗ определяющее значение имеют границы объектов. Воздействие аддитивного
шума на видеосигнал в процессе формирования бинарного изображения приводит к
пространственным флюктуациям границы, причем только по строке, то есть по оси x,
так как рассматривается растровое изображение. При оценке характера пространственных
флюктуаций координат границ бинарного изображения учтено влияние ограничения макси-
мальной частоты в спектре видеосигнала при прохождении системы обработки.
Аппроксимация импульсной переходной характеристики линейной зависимостью
позволило получить простые выражения для дисперсии и среднего значения координат
границ при условии, что шум имеет нормальное распределение. Полученное выражение
для информационной емкости бинарного изображения зависит от основных его характе-
ристик – прямо пропорционально числу строк в растровом изображении и в виде лога-
рифмической функции от следующих параметров:
– прямо пропорционально максимальной частоте в спектре видеосигнала, раз-
мера изображения по строке и от отношения сигнал/шум видеосигнала;
– обратно пропорционально скорости развертки видеосигнала по строке и от на-
дежности измерения координаты границы, оцениваемой вероятностью попадания слу-
чайной величины в заданный интервал. Выбранный критерий формирования бинарного
изображения как геометрическое место точек на плоскости с координатами Xг, Yг, для
которых значение функции яркости равно половине динамического диапазона измене-
ния яркости изображения объекта, не является универсальным, так как предполагает ап-
риорное знание динамического диапазона входного видеосигнала.
В реальных СТЗ наряду с действием аддитивных шумов могут иметься мульти-
пликативные низкочастотные помехи в виде изменения уровня освещенности и измене-
ния коэффициента передач тракта преобразования изображения, причем этот тип помех
может действовать не только во времени, но и в пространстве, то есть по полю изобра-
жения. Необходимость учета мультипликативных помех приводит к потребности раз-
работки адаптивных методов формирования порогового уровня.
Литература
1. Цуккерман И.И. Цифровое кодирование телевизионных изображений / Цуккерман И.И. – М. : Радио и
связь, 1981.
2. Сальников И.И. Растровые пространственно-временные сигналы в системах анализа изображений /
Сальников И.И. – М. : Физматлит, 2009. – 248 с.
3. Янке Е. Специальные функции / Янке Е., Эмде Ф., Лёш Ф. – М. : Наука, 1968. – 344 с.
Literatura
1. Cukkerman I.I. Cifrovoe kodirovanie televizionnyh izobrazhenij. M.: Radio i svjaz'. 1981.
2. Sal'nikov I.I. Rastrovye prostranstvenno-vremennye signaly v sistemah analiza izobrazhenij. M.: Fizmatlit. 2009. 248 s.
3. Janke E. Special'nye funkcii. M.: Nauka. 1968. 344 s.
Статья поступила в редакцию 22.06.2011.
|
| id | nasplib_isofts_kiev_ua-123456789-59902 |
| institution | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| issn | 1561-5359 |
| language | Russian |
| last_indexed | 2025-12-07T13:32:06Z |
| publishDate | 2011 |
| publisher | Інститут проблем штучного інтелекту МОН України та НАН України |
| record_format | dspace |
| spelling | Сальников, И.И. 2014-04-10T14:53:22Z 2014-04-10T14:53:22Z 2011 Информационная оценка изображений в системах технического зрения / И.И. Сальников // Штучний інтелект. — 2011. — № 3. — С. 261-270. — Бібліогр.: 3 назв. — рос. 1561-5359 https://nasplib.isofts.kiev.ua/handle/123456789/59902 621.397 В статье рассмотрены вопросы оценки информационной емкости полноградационных и бинарных изображений, используемых в системах технического зрения (СТЗ). Основой СТЗ являются телевизионные средства формирования и анализа изображений. Показано, что для СТЗ полноградационное изображение носит абстрактный характер, а источником информативных параметров являются статистически устойчивые пространственные характеристики этого изображения. Поэтому используются бинарные изображения, которые характеризуются существенно меньшим информационным потоком при сохранении информации о пространственных параметрах анализируемых изображений. ru Інститут проблем штучного інтелекту МОН України та НАН України Штучний інтелект Интеллектуальные интерфейсы и распознавание образов. Системы цифровой обработки изображений Информационная оценка изображений в системах технического зрения Article published earlier |
| spellingShingle | Информационная оценка изображений в системах технического зрения Сальников, И.И. Интеллектуальные интерфейсы и распознавание образов. Системы цифровой обработки изображений |
| title | Информационная оценка изображений в системах технического зрения |
| title_full | Информационная оценка изображений в системах технического зрения |
| title_fullStr | Информационная оценка изображений в системах технического зрения |
| title_full_unstemmed | Информационная оценка изображений в системах технического зрения |
| title_short | Информационная оценка изображений в системах технического зрения |
| title_sort | информационная оценка изображений в системах технического зрения |
| topic | Интеллектуальные интерфейсы и распознавание образов. Системы цифровой обработки изображений |
| topic_facet | Интеллектуальные интерфейсы и распознавание образов. Системы цифровой обработки изображений |
| url | https://nasplib.isofts.kiev.ua/handle/123456789/59902 |
| work_keys_str_mv | AT salʹnikovii informacionnaâocenkaizobraženiivsistemahtehničeskogozreniâ |