Валидация моделей классификации гиперспектральных данных
Розглядається проблема оцiнювання та класифікації стану рослинності. Запропоновано метод опорних векторів для класифікації спектрів відбиття рослин на декілька класів залежно від наявної концентрації хлорофілу. Описано новий підхід до валідації супутникових гіперспектральних даних на основі порівнян...
Збережено в:
| Дата: | 2008 |
|---|---|
| Автори: | , , |
| Формат: | Стаття |
| Мова: | Russian |
| Опубліковано: |
Інститут кібернетики ім. В.М. Глушкова НАН України
2008
|
| Назва видання: | Проблемы управления и информатики |
| Теми: | |
| Онлайн доступ: | https://nasplib.isofts.kiev.ua/handle/123456789/209136 |
| Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Цитувати: | Валидация моделей классификации гиперспектральных данных / О.В. Семенив, Ю.В. Шатохина, В.А. Яценко // Проблемы управления и информатики. — 2008. — № 3. — С. 113-118. — Бібліогр.: 12 назв. — рос. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraine| id |
irk-123456789-209136 |
|---|---|
| record_format |
dspace |
| spelling |
irk-123456789-2091362025-11-16T01:10:41Z Валидация моделей классификации гиперспектральных данных Валідація моделей класифікації гіперспектральних даних Validation of hyperspectral data classification models Семенив, О.В. Шатохина, Ю.В. Яценко, В.А. Методы обработки информации Розглядається проблема оцiнювання та класифікації стану рослинності. Запропоновано метод опорних векторів для класифікації спектрів відбиття рослин на декілька класів залежно від наявної концентрації хлорофілу. Описано новий підхід до валідації супутникових гіперспектральних даних на основі порівняння з результатами класифікації спектральних кривих відбиття, отриманих наземним спектрометром. A problem of the vegetation state estimation and classification is considered. Support Vector Machine for vegetation reflectance spectra classification into several classes depending on chlorophyl concentration is suggested. A new approach for validation of satellite hyperspectral data based on comparing with the results of the reflectance spectra classification is suggested. 2008 Article Валидация моделей классификации гиперспектральных данных / О.В. Семенив, Ю.В. Шатохина, В.А. Яценко // Проблемы управления и информатики. — 2008. — № 3. — С. 113-118. — Бібліогр.: 12 назв. — рос. 0572-2691 https://nasplib.isofts.kiev.ua/handle/123456789/209136 519.6:581.133.1:535.361.2 10.1615/JAutomatInfScien.v40.i5.30 ru Проблемы управления и информатики application/pdf Інститут кібернетики ім. В.М. Глушкова НАН України |
| institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| collection |
DSpace DC |
| language |
Russian |
| topic |
Методы обработки информации Методы обработки информации |
| spellingShingle |
Методы обработки информации Методы обработки информации Семенив, О.В. Шатохина, Ю.В. Яценко, В.А. Валидация моделей классификации гиперспектральных данных Проблемы управления и информатики |
| description |
Розглядається проблема оцiнювання та класифікації стану рослинності. Запропоновано метод опорних векторів для класифікації спектрів відбиття рослин на декілька класів залежно від наявної концентрації хлорофілу. Описано новий підхід до валідації супутникових гіперспектральних даних на основі порівняння з результатами класифікації спектральних кривих відбиття, отриманих наземним спектрометром. |
| format |
Article |
| author |
Семенив, О.В. Шатохина, Ю.В. Яценко, В.А. |
| author_facet |
Семенив, О.В. Шатохина, Ю.В. Яценко, В.А. |
| author_sort |
Семенив, О.В. |
| title |
Валидация моделей классификации гиперспектральных данных |
| title_short |
Валидация моделей классификации гиперспектральных данных |
| title_full |
Валидация моделей классификации гиперспектральных данных |
| title_fullStr |
Валидация моделей классификации гиперспектральных данных |
| title_full_unstemmed |
Валидация моделей классификации гиперспектральных данных |
| title_sort |
валидация моделей классификации гиперспектральных данных |
| publisher |
Інститут кібернетики ім. В.М. Глушкова НАН України |
| publishDate |
2008 |
| topic_facet |
Методы обработки информации |
| url |
https://nasplib.isofts.kiev.ua/handle/123456789/209136 |
| citation_txt |
Валидация моделей классификации гиперспектральных данных / О.В. Семенив, Ю.В. Шатохина, В.А. Яценко // Проблемы управления и информатики. — 2008. — № 3. — С. 113-118. — Бібліогр.: 12 назв. — рос. |
| series |
Проблемы управления и информатики |
| work_keys_str_mv |
AT semenivov validaciâmodelejklassifikaciigiperspektralʹnyhdannyh AT šatohinaûv validaciâmodelejklassifikaciigiperspektralʹnyhdannyh AT âcenkova validaciâmodelejklassifikaciigiperspektralʹnyhdannyh AT semenivov valídacíâmodelejklasifíkacíígíperspektralʹnihdanih AT šatohinaûv valídacíâmodelejklasifíkacíígíperspektralʹnihdanih AT âcenkova valídacíâmodelejklasifíkacíígíperspektralʹnihdanih AT semenivov validationofhyperspectraldataclassificationmodels AT šatohinaûv validationofhyperspectraldataclassificationmodels AT âcenkova validationofhyperspectraldataclassificationmodels |
| first_indexed |
2025-11-16T02:05:57Z |
| last_indexed |
2025-11-17T02:08:47Z |
| _version_ |
1849001590458941440 |
| fulltext |
© О.В. СЕМЕНИВ, Ю.В ШАТОХИНА, В.А. ЯЦЕНКО 2008
Проблемы управления и информатики, 2008, № 3 113
МЕТОДЫ ОБРАБОТКИ ИНФОРМАЦИИ
УДК 519.6:581.133.1:535.361.2
О.В. Семенив, Ю.В. Шатохина, В.А. Яценко
ВАЛИДАЦИЯ МОДЕЛЕЙ КЛАССИФИКАЦИИ
ГИПЕРСПЕКТРАЛЬНЫХ ДАННЫХ
Введение. Известно несколько подходов к оцениванию состояния расти-
тельности по спектральным кривым листьев [1–6]. В частности, предложено и
реализовано два метода (экстремумов производных спектральных кривых и
главных компонентов) для дистанционного оценивания содержания хлоро-
филла в растительности [7]. Исследовано влияние различных факторов окру-
жающей среды на отражающую способность растений; изучена зависимость
формы спектра отражения растений в видимом диапазоне от электронных пе-
реходов в молекулах фотосинтетических пигментов; также исследовано влия-
ние концентрации хлорофилла на формирование спектральной кривой [1–3].
В данной работе описывается новый подход к оцениванию состояния раститель-
ности, который основывается на использовании робастного метода классифи-
кации (метода опорных векторов) спутниковых гиперспектральных данных на
несколько классов в зависимости от содержания в растительности хлорофилла
с учетом процедуры валидации и результатов сравнения со спектральными
кривыми, полученными с помощью наземного спектрометра [4–9].
Постановка задачи. Рассматривается проблема классификации спутни-
ковых гиперспектральных данных растительности x на k классов в зависимо-
сти от уровня концентрации хлорофилла, показателей формы и процедуры ва-
лидации. Как обычно, гиперспектральные снимки представим в виде так назы-
ваемого «гиперспектрального куба» [10]. Развертку гиперкуба в спектральную
кривую будем осуществлять по оси при фиксированном пикселе (X, Y). Тре-
буется построить модель, которая на основе показателей формы спектральной
кривой относит ее к одному из нескольких классов.
Для валидации гиперспектральных данных будем сравнивать их с данны-
ми, получеными наземным способом [7]. Для этого предполагается использо-
вать эталонные посевы с известной концентрацией биохимичесих компонен-
тов. Гиперспектральному изображению поставим в соответствие спектраль-
ную кривую растительности [11]. Валидация модели классификации
проводится с использованием спектральных кривых отражения, снятых назем-
ным оптическим сенсором на эталонных площадках. После проведения клас-
сификации спектральных кривых результаты ее сравниваются с результатами
классификации по спутниковым гиперспектральным данным. Если результаты
отличаются, предлагается провести переобучение алгоритма классификации
спутниковых гиперспектральных данных с учетом данных наземных исследо-
ваний таким образом, чтобы результаты новой классификации согласовыва-
лись с результатами классификации соответствующих спектральных кривых.
114 ISSN 0572-2691
Задачу классификации рассмотрим на примере спектральных кривых, по-
лученных наземным спектрометром. Пусть O — оптический сенсор, который
дистанционно измеряет зависимость коэффициента отражения листков расти-
тельности )(x от длины волны с определенной заданной дискретностью
(1 нм) в оптическом диапазоне длин волн 400–750 нм. График такой зависимо-
сти назовем спектральной кривой.
Форма кривой ),,()( rqpgx в общем случае зависит от типа расте-
ния p, плотности посевов q, а также от отражательных качеств почвы r. Пред-
полагается, что на спектральные данные воздействуют шумы v(t), к которым
относят отражение света от почвы z(t), шумы атмосферы o(t) и внутренние
шумы сенсора m(t).
Пусть проведена серия l измерений спектральных кривых ).(x Каждая
кривая )(x из множества l соответствует листкам растительности типа k с
определенным содержанием некоторого биохимического компонента, напри-
мер хлорофилла. Значения концентрации хлорофилла для кривых из множест-
ва l получены по специальной методике с использованием химического анали-
за. Мы предполагаем, что набор спектральных кривых достаточно репрезента-
тивный, а значения концентрации хлорофилла не повторяются. Множество l
назовем учебным.
Метод решения. Пусть спектральная кривая )(x с областью определе-
ния D — непрерывная, гладкая функция. Множество таких функций образует
линейное бесконечномерное пространство. Чтобы перейти к конечномерному
пространству, выберем конечное множество ,Di ,...,,1 di такое, что по
значениям ),( ix ,...,,1 di можно построить непрерывную линейно-
кусочную функцию ),(ˆ x мало отличающуюся от ).(x Множеству таких
функций )(ˆ x поставим в соответствие конечномерный вектор. Считая нача-
лом каждого вектора начало координат и сопоставляя каждому вектору его
конец, имеем взаимно однозначное соответствие между векторами и точками
d-мерного пространства.
Каждой кривой )(x из множества l поставим в соответствие дискретный
набор чисел, а именно, значения интенсивности отраженного света в опреде-
ленных равномерно распределенных точках спектрального диапазона. Такие
дискретные наборы чисел образуют векторы ,,...,, lid
i Rx в евклидовом
пространстве, где d — размерность вектора, т.е. количество точек, в которых
фиксируется интенсивность отраженного света.
Пусть мы хотим разделить векторы xi на два класса: с высокой и низкой
концентрацией хлорофилла. Векторам с высоким содержанием хлорофилла
присвоим метки 1, а векторам с низким содержанием хлорофилла — метки
1. Множество },{ ii yx , li ,...,1 , }1,1{iy , ,d
i Rx назовем учебным.
Мы хотим построить пару параллельных гиперплоскостей H1 и H2 (поло-
су), которая разделяла бы точки учебной выборки на два класса. Другими сло-
вами, нам нужно, чтобы все точки с положительными метками лежали по одну
сторону такой полосы, все точки с отрицательными метками — по другую
сторону полосы, и чтобы в пространство между двумя гиперплоскостями, т.е.
вовнутрь полосы, ни одна из точек не попадала.
Проблемы управления и информатики, 2008, № 3 115
Пусть имеется некоторая гиперплоскость H0, которая разделяет точки с
метками 1 и 1. Точки x, которые лежат на гиперплоскости, удовлетворяют
уравнению ,0 bxw где w — нормаль к гиперплоскости, w/b — длина
перпендикуляра, проведенного от гиперплоскости к началу координат, и
w — евклидова норма вектора w. С помощью )( dd обозначим наимень-
шее расстояние от разделяющей гиперплоскости к ближайшей положительной
(отрицательной) точке. Ширину разделяющей полосы обозначим . dd
Желательно, чтобы точки не попадали в середину полосы, т.е. нужно, чтобы
все точки учебного множества удовлетворяли условиям
,1 bi wx ,1iy (1)
,1 bi wx ,1iy (2)
которые можно объединить в систему неравенств
,01)( by ii wx ....,,1, lii (3)
Уравнения (1) и (2) задают изменение масштаба для b,w так, чтобы бли-
жайшие к гиперплоскостям H1 и H2 точки находились на расстоянии ./1 w
Рассмотрим точки, для которых в условии (1) выполняется равенство. Суще-
ствование такой точки эквивалентно выбору шкалы для w и b. Эти точки при-
надлежат гиперплоскости H1, которая задается уравнением ,1 bi wx
с нормалью w и длиной перпендикуляра от начала координат ./1 wb Ана-
логично точки, для которых выполняется равенство в условии (2), принадле-
жат гиперплоскости H2, которая задается уравнением ,1 bi wx с норма-
лью w и длиной перпендикуляра от начала координат ./1 wb Отсюда по-
лучаем, что ,/1 w dd а ширина полосы равна ./2 w Понятно, что чем
больше ширина найденной разделяющей полосы, тем лучше будут разделяться
на два класса точки тестовых множеств, тем меньше риск появления ошибки
при тестировании наученного алгоритма и при дальнейшем его использова-
нии. Отметим, что H1 и H2 параллельны (имеют одну и ту же нормаль) и что
ни одна из точек учебного множества не попадает между ними. Таким обра-
зом, можно найти пару гиперплоскостей, которые будут давать максимальную
ширину разделяющей полосы, решая оптимизационную задачу с ограниче-
ниями
2
2
1
min w
w
(4)
при условиях
01)( by ii wx ....,,1, lii (5)
На рисунке дано графическое представление об искомых гиперплоскостях
и полосе между ними в двумерном случае разделения точек на два класса (ги-
перплоскость является прямой).
Те учебные точки, для которых в условии (5) выполняется равенство (т.е.
те, которые лежат на гиперплоскостях H1 и H2), называют опорными вектора-
ми. На рисунке они обведены дополнительными окружностями.
116 ISSN 0572-2691
Начало
координат
Разделяющая
полоса
W
b
W
H1
H2
Для того чтобы избавиться от ограничений, можно воспользоваться из-
вестным методом множителей Лагранжа [8, 9]. Вводя дополнительные множи-
тели Лагранжа ,...,,1, lii для ограничений в виде неравенств (5) и вычитая
их произведение от целевой функции (4), получаем лагранжиан
,)(
2
1
1 1
2
l
i
l
i
iiiiP byL wxw (6)
который мы должны минимизировать относительно w и b при условии,
что .0i
Задача математического программирования приобретает вид
l
i
l
i
iiii
b
by
1 1
2
,
)(
2
1
min wxw
w
(7)
при условии
.0i (8)
Минимум находится из условия равности нулю всех производных от Lp по
всем i . Заданный таким образом набор ограничений обозначим C1.
Поскольку мы имеем задачу опуклого квадратического программирова-
ния, можно решать эквивалентную дуальную задачу [8, 9]
l
i
l
i
iiii by
i 1 1
2
)(
2
1
max wxw (9)
при условии
,0i (10)
т. е. максимизировать Lp при условии, что градиент Lp по w и b обращается в
ноль, и при условии, что .0i Заданный таким образом набор ограничений
обозначим C2. Известно, что максимальное значение Lp при условии C2 явля-
ется одновременно минимальным значением Lp при условии C1 для тех же
значений w, b и [8, 9].
Можно рассматривать задачу в дуальном пространстве — пространстве
множителей Лагранжа [8, 9].
Обращение на ноль градиента Lp по w и b дает нам следующие условия:
,
i
iii y xw (11)
.0
i
ii y (12)
Проблемы управления и информатики, 2008, № 3 117
Подставляя эти ограничения в виде равенств в уравнение (6), получаем
дуальный лагранжиан:
.
2
1
,
i ji
jijijiiD yyL xx (13)
Тогда задача имеет вид
i ji
jijijii yy
i ,2
1
max xx (14)
при условии
,0
i
ii y (15)
.0i (16)
Задача классификации сводится к максимизации LD относительно i при
ограничительных условиях (16) и положительных ,i решение задается в ви-
де (11). Отметим, что каждая точка учебного множества имеет свой множи-
тель Лагранжа i . Те точки, для которых ,0i называются «опорными век-
торами» и принадлежат одной из гиперплоскостей H1, H2. Все остальные точ-
ки учебного множества имеют 0 i и либо принадлежат H1 или H2 (так, что
выполняется равенство в условии (3)), либо лежат за этими гиперплоскостями
(так, что в условии (3) выполняется строгое неравенство). Опорные векторы
являются наиболее важными элементами учебного множества, они задают ре-
шение. Если убрать все остальные точки учебного множества или переместить
их, не пересекая при этом гиперплоскость, и повторить процесс обучения, то
найдем ту же разделяющую гиперплоскость.
С помощью описанного метода проведено обучение и тестирование моде-
ли классификации спектральных данных. В качестве учебных данных исполь-
зовались спектральные кривые отражения листков озимой пшеницы с разным
содержанием хлорофилла, полученные с помощью наземного спектрометра.
Концентрация хлорофилла определялась химическим методом по Арнону [12].
На тестовой выборке получена классификация на три класса с достаточно вы-
сокой точностью.
Заключение. Предложена математическая модель классификации состоя-
ния растительности по гиперспектральным спутниковым данным. Приведено
сравнение с результатами классификации спектральных кривых растительно-
сти, полученных наземным спектрометром. Описан алгоритм классификации,
основанный на методе опорных векторов. На примере содержания хлорофилла
в растительности показана возможность высокоточной классификации спек-
тральных кривых на три класса, что может использоваться для экспресс-
анализа растительности на больших площадях. Для пространственно -
временного совмещения и сравнения спутниковых гиперспектральных данных
с данными наземных измерений предлагается переобучать алгоритм класси-
фикации, решая скорректированную оптимизационную задачу в рамках мето-
да опорных векторов.
118 ISSN 0572-2691
О.В. Семенів, Ю.В. Шатохіна, В.О. Яценко
ВАЛІДАЦІЯ МОДЕЛЕЙ КЛАСИФІКАЦІЇ
ГІПЕРСПЕКТРАЛЬНИХ ДАНИХ
Розглядається проблема оцiнювання та класифікації стану рослинності. Запро-
поновано метод опорних векторів для класифікації спектрів відбиття рослин на
декілька класів залежно від наявної концентрації хлорофілу. Описано новий пі-
дхід до валідації супутникових гіперспектральних даних на основі порівняння з
результатами класифікації спектральних кривих відбиття, отриманих наземним
спектрометром.
O.V. Semeniv, Yu.V. Shatokhina, V.A. Yatsenko
VALIDATION OF HYPERSPECTRAL
DATA CLASSIFICATION MODELS
A problem of the vegetation state estimation and classification is considered. Support
Vector Machine for vegetation reflectance spectra classification into several classes
depending on chlorophyl concentration is suggested. A new approach for validation
of satellite hyperspectral data based on comparing with the results of the reflectance
spectra classification is suggested.
1. Кочубей С.М., Шадчина Т.М., Кобец Н.И. Спектральные свойства растений как основа ме-
тодов дистанционной диагностики. — Киев: Наук. думка, 1990. — 136 c.
2. Yatsenko V., Kochubey S., Donets V., Kazantsev T. Hardware-software complex for chlorophyll
estimation in phytocenoses under field conditions // Proc. of SPIE «Detectors and Associated
Signal Processing II». — Jena 13–14 Sept., 2005. IEEE. — 5964. — P. 1–6.
3. Кочубей С.М. Оценка основных параметров сельскохозяйственных посевов по спектру от-
ражения растительности в оптическом диапазоне // Космічна наука і технологія. —
2003. — 9. — С. 185–190.
4. Yatsenko V.A., Kochubey S.M., Pardalos P.M., Zhan L. Estimation of chlorophyll concentration in
vegetation using global optimization approach // Proc. of SPIE. — 2003. — 5071. — P. 50–59. —
«Technologies, Systems, and Architectures for Transnational Defence II», SPIE Conf.
«AeroSence. Technologies and Systems for Defence and Security». — 2003. — 21–25 Apr.,
Orlando USA).
5. Яценко В.О., Кочубей С.М., Хандрига П.А., Донец В.В., Семенів О.В. Новый метод дистан-
ционного оценивания содержания хлорофилла в растительности и его программно-
аппаратная реализация // Космічна наука і технологія. — 2007. — 13, № 3 — P. 35–45.
6. Yatsenko V., Semeniv O., Shatohina J. Mathematical modeling of reflectance spectra and estima-
tion of biochemical component concentrations in vegetation // Intern. Conf. Dynamical System
Modeling and Stability Investigation. Thesis of Сonf. rep. — 2007. — Kyiv, May 22–25. —
P. 259.
7. Яценко О.В., Кочубей С.М., Хандрига П.О., Донец В.В., Семенів О.В. Програмно-апаратний
комплекс та нові методи дистанційного оцінювання стану рослинності // Сьома укр. конф.
з космічних досліджень. — 2007. — 3–8 вересня. — Євпаторія. — 148 с.
8. Burges C.J.C. A Tutorial on Support Vector Machines for Pattern Recognition // Knowledge Dis-
covery and Data Mining. — 1998. — 2 (2). — P. 121–167.
9. Vapnik V.N. The nature of statistical learning theory. — New York: Springer-Verlag, 1995. —
188 p.
10. Hyperspectral Data Analysis // PCI Geomatics. — Canada. — 2005. www.pcigeomatics.com
11. Giles M. Foody, Ajay Mathur. Toward intelligent training of supervised image classifications: di-
recting training data acquisition for SVM classification // Remote Sensing of Environment. —
2004. — 93. — P. 107–117.
12. Arnon D.I. Copper enzymes in isolated chloroplasts. Polyphenoloxidase in Beta vulgaris // Plant
Physiol. — 1949. — 24. — P. 1–15.
Получено 26.11.2007
|