Валидация моделей классификации гиперспектральных данных

Розглядається проблема оцiнювання та класифікації стану рослинності. Запропоновано метод опорних векторів для класифікації спектрів відбиття рослин на декілька класів залежно від наявної концентрації хлорофілу. Описано новий підхід до валідації супутникових гіперспектральних даних на основі порівнян...

Full description

Saved in:
Bibliographic Details
Published in:Проблемы управления и информатики
Date:2008
Main Authors: Семенив, О.В., Шатохина, Ю.В., Яценко, В.А.
Format: Article
Language:Russian
Published: Інститут кібернетики ім. В.М. Глушкова НАН України 2008
Subjects:
Online Access:https://nasplib.isofts.kiev.ua/handle/123456789/209136
Tags: Add Tag
No Tags, Be the first to tag this record!
Journal Title:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Cite this:Валидация моделей классификации гиперспектральных данных / О.В. Семенив, Ю.В. Шатохина, В.А. Яценко // Проблемы управления и информатики. — 2008. — № 3. — С. 113-118. — Бібліогр.: 12 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1859802897652383744
author Семенив, О.В.
Шатохина, Ю.В.
Яценко, В.А.
author_facet Семенив, О.В.
Шатохина, Ю.В.
Яценко, В.А.
citation_txt Валидация моделей классификации гиперспектральных данных / О.В. Семенив, Ю.В. Шатохина, В.А. Яценко // Проблемы управления и информатики. — 2008. — № 3. — С. 113-118. — Бібліогр.: 12 назв. — рос.
collection DSpace DC
container_title Проблемы управления и информатики
description Розглядається проблема оцiнювання та класифікації стану рослинності. Запропоновано метод опорних векторів для класифікації спектрів відбиття рослин на декілька класів залежно від наявної концентрації хлорофілу. Описано новий підхід до валідації супутникових гіперспектральних даних на основі порівняння з результатами класифікації спектральних кривих відбиття, отриманих наземним спектрометром. A problem of the vegetation state estimation and classification is considered. Support Vector Machine for vegetation reflectance spectra classification into several classes depending on chlorophyl concentration is suggested. A new approach for validation of satellite hyperspectral data based on comparing with the results of the reflectance spectra classification is suggested.
first_indexed 2025-12-07T15:14:19Z
format Article
fulltext © О.В. СЕМЕНИВ, Ю.В ШАТОХИНА, В.А. ЯЦЕНКО 2008 Проблемы управления и информатики, 2008, № 3 113 МЕТОДЫ ОБРАБОТКИ ИНФОРМАЦИИ УДК 519.6:581.133.1:535.361.2 О.В. Семенив, Ю.В. Шатохина, В.А. Яценко ВАЛИДАЦИЯ МОДЕЛЕЙ КЛАССИФИКАЦИИ ГИПЕРСПЕКТРАЛЬНЫХ ДАННЫХ Введение. Известно несколько подходов к оцениванию состояния расти- тельности по спектральным кривым листьев [1–6]. В частности, предложено и реализовано два метода (экстремумов производных спектральных кривых и главных компонентов) для дистанционного оценивания содержания хлоро- филла в растительности [7]. Исследовано влияние различных факторов окру- жающей среды на отражающую способность растений; изучена зависимость формы спектра отражения растений в видимом диапазоне от электронных пе- реходов в молекулах фотосинтетических пигментов; также исследовано влия- ние концентрации хлорофилла на формирование спектральной кривой [1–3]. В данной работе описывается новый подход к оцениванию состояния раститель- ности, который основывается на использовании робастного метода классифи- кации (метода опорных векторов) спутниковых гиперспектральных данных на несколько классов в зависимости от содержания в растительности хлорофилла с учетом процедуры валидации и результатов сравнения со спектральными кривыми, полученными с помощью наземного спектрометра [4–9]. Постановка задачи. Рассматривается проблема классификации спутни- ковых гиперспектральных данных растительности x на k классов в зависимо- сти от уровня концентрации хлорофилла, показателей формы и процедуры ва- лидации. Как обычно, гиперспектральные снимки представим в виде так назы- ваемого «гиперспектрального куба» [10]. Развертку гиперкуба в спектральную кривую будем осуществлять по оси  при фиксированном пикселе (X, Y). Тре- буется построить модель, которая на основе показателей формы спектральной кривой относит ее к одному из нескольких классов. Для валидации гиперспектральных данных будем сравнивать их с данны- ми, получеными наземным способом [7]. Для этого предполагается использо- вать эталонные посевы с известной концентрацией биохимичесих компонен- тов. Гиперспектральному изображению поставим в соответствие спектраль- ную кривую растительности [11]. Валидация модели классификации проводится с использованием спектральных кривых отражения, снятых назем- ным оптическим сенсором на эталонных площадках. После проведения клас- сификации спектральных кривых результаты ее сравниваются с результатами классификации по спутниковым гиперспектральным данным. Если результаты отличаются, предлагается провести переобучение алгоритма классификации спутниковых гиперспектральных данных с учетом данных наземных исследо- ваний таким образом, чтобы результаты новой классификации согласовыва- лись с результатами классификации соответствующих спектральных кривых. 114 ISSN 0572-2691 Задачу классификации рассмотрим на примере спектральных кривых, по- лученных наземным спектрометром. Пусть O — оптический сенсор, который дистанционно измеряет зависимость коэффициента отражения листков расти- тельности )(x от длины волны  с определенной заданной дискретностью (1 нм) в оптическом диапазоне длин волн 400–750 нм. График такой зависимо- сти назовем спектральной кривой. Форма кривой ),,()( rqpgx  в общем случае зависит от типа расте- ния p, плотности посевов q, а также от отражательных качеств почвы r. Пред- полагается, что на спектральные данные воздействуют шумы v(t), к которым относят отражение света от почвы z(t), шумы атмосферы o(t) и внутренние шумы сенсора m(t). Пусть проведена серия l измерений спектральных кривых ).(x Каждая кривая )(x из множества l соответствует листкам растительности типа k с определенным содержанием некоторого биохимического компонента, напри- мер хлорофилла. Значения концентрации хлорофилла для кривых из множест- ва l получены по специальной методике с использованием химического анали- за. Мы предполагаем, что набор спектральных кривых достаточно репрезента- тивный, а значения концентрации хлорофилла не повторяются. Множество l назовем учебным. Метод решения. Пусть спектральная кривая )(x с областью определе- ния D — непрерывная, гладкая функция. Множество таких функций образует линейное бесконечномерное пространство. Чтобы перейти к конечномерному пространству, выберем конечное множество ,Di  ,...,,1 di  такое, что по значениям ),( ix  ,...,,1 di  можно построить непрерывную линейно- кусочную функцию ),(ˆ x мало отличающуюся от ).(x Множеству таких функций )(ˆ x поставим в соответствие конечномерный вектор. Считая нача- лом каждого вектора начало координат и сопоставляя каждому вектору его конец, имеем взаимно однозначное соответствие между векторами и точками d-мерного пространства. Каждой кривой )(x из множества l поставим в соответствие дискретный набор чисел, а именно, значения интенсивности отраженного света в опреде- ленных равномерно распределенных точках спектрального диапазона. Такие дискретные наборы чисел образуют векторы ,,...,, lid i Rx  в евклидовом пространстве, где d — размерность вектора, т.е. количество точек, в которых фиксируется интенсивность отраженного света. Пусть мы хотим разделить векторы xi на два класса: с высокой и низкой концентрацией хлорофилла. Векторам с высоким содержанием хлорофилла присвоим метки 1, а векторам с низким содержанием хлорофилла — метки 1. Множество },{ ii yx , li ,...,1 , }1,1{iy , ,d i Rx  назовем учебным. Мы хотим построить пару параллельных гиперплоскостей H1 и H2 (поло- су), которая разделяла бы точки учебной выборки на два класса. Другими сло- вами, нам нужно, чтобы все точки с положительными метками лежали по одну сторону такой полосы, все точки с отрицательными метками — по другую сторону полосы, и чтобы в пространство между двумя гиперплоскостями, т.е. вовнутрь полосы, ни одна из точек не попадала. Проблемы управления и информатики, 2008, № 3 115 Пусть имеется некоторая гиперплоскость H0, которая разделяет точки с метками 1 и 1. Точки x, которые лежат на гиперплоскости, удовлетворяют уравнению ,0 bxw где w — нормаль к гиперплоскости, w/b — длина перпендикуляра, проведенного от гиперплоскости к началу координат, и w — евклидова норма вектора w. С помощью )(  dd обозначим наимень- шее расстояние от разделяющей гиперплоскости к ближайшей положительной (отрицательной) точке. Ширину разделяющей полосы обозначим .  dd Желательно, чтобы точки не попадали в середину полосы, т.е. нужно, чтобы все точки учебного множества удовлетворяли условиям ,1 bi wx ,1iy (1) ,1 bi wx ,1iy (2) которые можно объединить в систему неравенств ,01)(  by ii wx ....,,1, lii  (3) Уравнения (1) и (2) задают изменение масштаба для b,w так, чтобы бли- жайшие к гиперплоскостям H1 и H2 точки находились на расстоянии ./1 w Рассмотрим точки, для которых в условии (1) выполняется равенство. Суще- ствование такой точки эквивалентно выбору шкалы для w и b. Эти точки при- надлежат гиперплоскости H1, которая задается уравнением ,1 bi wx с нормалью w и длиной перпендикуляра от начала координат ./1 wb Ана- логично точки, для которых выполняется равенство в условии (2), принадле- жат гиперплоскости H2, которая задается уравнением ,1 bi wx с норма- лью w и длиной перпендикуляра от начала координат ./1 wb Отсюда по- лучаем, что ,/1 w  dd а ширина полосы равна ./2 w Понятно, что чем больше ширина найденной разделяющей полосы, тем лучше будут разделяться на два класса точки тестовых множеств, тем меньше риск появления ошибки при тестировании наученного алгоритма и при дальнейшем его использова- нии. Отметим, что H1 и H2 параллельны (имеют одну и ту же нормаль) и что ни одна из точек учебного множества не попадает между ними. Таким обра- зом, можно найти пару гиперплоскостей, которые будут давать максимальную ширину разделяющей полосы, решая оптимизационную задачу с ограниче- ниями 2 2 1 min w w (4) при условиях 01)(  by ii wx ....,,1, lii  (5) На рисунке дано графическое представление об искомых гиперплоскостях и полосе между ними в двумерном случае разделения точек на два класса (ги- перплоскость является прямой). Те учебные точки, для которых в условии (5) выполняется равенство (т.е. те, которые лежат на гиперплоскостях H1 и H2), называют опорными вектора- ми. На рисунке они обведены дополнительными окружностями. 116 ISSN 0572-2691 Начало координат Разделяющая полоса W b W H1 H2 Для того чтобы избавиться от ограничений, можно воспользоваться из- вестным методом множителей Лагранжа [8, 9]. Вводя дополнительные множи- тели Лагранжа ,...,,1, lii  для ограничений в виде неравенств (5) и вычитая их произведение от целевой функции (4), получаем лагранжиан ,)( 2 1 1 1 2      l i l i iiiiP byL wxw (6) который мы должны минимизировать относительно w и b при условии, что .0i Задача математического программирования приобретает вид      l i l i iiii b by 1 1 2 , )( 2 1 min wxw w (7) при условии .0i (8) Минимум находится из условия равности нулю всех производных от Lp по всем i . Заданный таким образом набор ограничений обозначим C1. Поскольку мы имеем задачу опуклого квадратического программирова- ния, можно решать эквивалентную дуальную задачу [8, 9]      l i l i iiii by i 1 1 2 )( 2 1 max wxw (9) при условии ,0i (10) т. е. максимизировать Lp при условии, что градиент Lp по w и b обращается в ноль, и при условии, что .0i Заданный таким образом набор ограничений обозначим C2. Известно, что максимальное значение Lp при условии C2 явля- ется одновременно минимальным значением Lp при условии C1 для тех же значений w, b и  [8, 9]. Можно рассматривать задачу в дуальном пространстве — пространстве множителей Лагранжа [8, 9]. Обращение на ноль градиента Lp по w и b дает нам следующие условия: , i iii y xw (11) .0  i ii y (12) Проблемы управления и информатики, 2008, № 3 117 Подставляя эти ограничения в виде равенств в уравнение (6), получаем дуальный лагранжиан: . 2 1 ,    i ji jijijiiD yyL xx (13) Тогда задача имеет вид     i ji jijijii yy i ,2 1 max xx (14) при условии ,0  i ii y (15) .0i (16) Задача классификации сводится к максимизации LD относительно i при ограничительных условиях (16) и положительных ,i решение задается в ви- де (11). Отметим, что каждая точка учебного множества имеет свой множи- тель Лагранжа i . Те точки, для которых ,0i называются «опорными век- торами» и принадлежат одной из гиперплоскостей H1, H2. Все остальные точ- ки учебного множества имеют 0 i и либо принадлежат H1 или H2 (так, что выполняется равенство в условии (3)), либо лежат за этими гиперплоскостями (так, что в условии (3) выполняется строгое неравенство). Опорные векторы являются наиболее важными элементами учебного множества, они задают ре- шение. Если убрать все остальные точки учебного множества или переместить их, не пересекая при этом гиперплоскость, и повторить процесс обучения, то найдем ту же разделяющую гиперплоскость. С помощью описанного метода проведено обучение и тестирование моде- ли классификации спектральных данных. В качестве учебных данных исполь- зовались спектральные кривые отражения листков озимой пшеницы с разным содержанием хлорофилла, полученные с помощью наземного спектрометра. Концентрация хлорофилла определялась химическим методом по Арнону [12]. На тестовой выборке получена классификация на три класса с достаточно вы- сокой точностью. Заключение. Предложена математическая модель классификации состоя- ния растительности по гиперспектральным спутниковым данным. Приведено сравнение с результатами классификации спектральных кривых растительно- сти, полученных наземным спектрометром. Описан алгоритм классификации, основанный на методе опорных векторов. На примере содержания хлорофилла в растительности показана возможность высокоточной классификации спек- тральных кривых на три класса, что может использоваться для экспресс- анализа растительности на больших площадях. Для пространственно - временного совмещения и сравнения спутниковых гиперспектральных данных с данными наземных измерений предлагается переобучать алгоритм класси- фикации, решая скорректированную оптимизационную задачу в рамках мето- да опорных векторов. 118 ISSN 0572-2691 О.В. Семенів, Ю.В. Шатохіна, В.О. Яценко ВАЛІДАЦІЯ МОДЕЛЕЙ КЛАСИФІКАЦІЇ ГІПЕРСПЕКТРАЛЬНИХ ДАНИХ Розглядається проблема оцiнювання та класифікації стану рослинності. Запро- поновано метод опорних векторів для класифікації спектрів відбиття рослин на декілька класів залежно від наявної концентрації хлорофілу. Описано новий пі- дхід до валідації супутникових гіперспектральних даних на основі порівняння з результатами класифікації спектральних кривих відбиття, отриманих наземним спектрометром. O.V. Semeniv, Yu.V. Shatokhina, V.A. Yatsenko VALIDATION OF HYPERSPECTRAL DATA CLASSIFICATION MODELS A problem of the vegetation state estimation and classification is considered. Support Vector Machine for vegetation reflectance spectra classification into several classes depending on chlorophyl concentration is suggested. A new approach for validation of satellite hyperspectral data based on comparing with the results of the reflectance spectra classification is suggested. 1. Кочубей С.М., Шадчина Т.М., Кобец Н.И. Спектральные свойства растений как основа ме- тодов дистанционной диагностики. — Киев: Наук. думка, 1990. — 136 c. 2. Yatsenko V., Kochubey S., Donets V., Kazantsev T. Hardware-software complex for chlorophyll estimation in phytocenoses under field conditions // Proc. of SPIE «Detectors and Associated Signal Processing II». — Jena 13–14 Sept., 2005. IEEE. — 5964. — P. 1–6. 3. Кочубей С.М. Оценка основных параметров сельскохозяйственных посевов по спектру от- ражения растительности в оптическом диапазоне // Космічна наука і технологія. — 2003. — 9. — С. 185–190. 4. Yatsenko V.A., Kochubey S.M., Pardalos P.M., Zhan L. Estimation of chlorophyll concentration in vegetation using global optimization approach // Proc. of SPIE. — 2003. — 5071. — P. 50–59. — «Technologies, Systems, and Architectures for Transnational Defence II», SPIE Conf. «AeroSence. Technologies and Systems for Defence and Security». — 2003. — 21–25 Apr., Orlando USA). 5. Яценко В.О., Кочубей С.М., Хандрига П.А., Донец В.В., Семенів О.В. Новый метод дистан- ционного оценивания содержания хлорофилла в растительности и его программно- аппаратная реализация // Космічна наука і технологія. — 2007. — 13, № 3 — P. 35–45. 6. Yatsenko V., Semeniv O., Shatohina J. Mathematical modeling of reflectance spectra and estima- tion of biochemical component concentrations in vegetation // Intern. Conf. Dynamical System Modeling and Stability Investigation. Thesis of Сonf. rep. — 2007. — Kyiv, May 22–25. — P. 259. 7. Яценко О.В., Кочубей С.М., Хандрига П.О., Донец В.В., Семенів О.В. Програмно-апаратний комплекс та нові методи дистанційного оцінювання стану рослинності // Сьома укр. конф. з космічних досліджень. — 2007. — 3–8 вересня. — Євпаторія. — 148 с. 8. Burges C.J.C. A Tutorial on Support Vector Machines for Pattern Recognition // Knowledge Dis- covery and Data Mining. — 1998. — 2 (2). — P. 121–167. 9. Vapnik V.N. The nature of statistical learning theory. — New York: Springer-Verlag, 1995. — 188 p. 10. Hyperspectral Data Analysis // PCI Geomatics. — Canada. — 2005. www.pcigeomatics.com 11. Giles M. Foody, Ajay Mathur. Toward intelligent training of supervised image classifications: di- recting training data acquisition for SVM classification // Remote Sensing of Environment. — 2004. — 93. — P. 107–117. 12. Arnon D.I. Copper enzymes in isolated chloroplasts. Polyphenoloxidase in Beta vulgaris // Plant Physiol. — 1949. — 24. — P. 1–15. Получено 26.11.2007
id nasplib_isofts_kiev_ua-123456789-209136
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 0572-2691
language Russian
last_indexed 2025-12-07T15:14:19Z
publishDate 2008
publisher Інститут кібернетики ім. В.М. Глушкова НАН України
record_format dspace
spelling Семенив, О.В.
Шатохина, Ю.В.
Яценко, В.А.
2025-11-15T09:59:59Z
2008
Валидация моделей классификации гиперспектральных данных / О.В. Семенив, Ю.В. Шатохина, В.А. Яценко // Проблемы управления и информатики. — 2008. — № 3. — С. 113-118. — Бібліогр.: 12 назв. — рос.
0572-2691
https://nasplib.isofts.kiev.ua/handle/123456789/209136
519.6:581.133.1:535.361.2
10.1615/JAutomatInfScien.v40.i5.30
Розглядається проблема оцiнювання та класифікації стану рослинності. Запропоновано метод опорних векторів для класифікації спектрів відбиття рослин на декілька класів залежно від наявної концентрації хлорофілу. Описано новий підхід до валідації супутникових гіперспектральних даних на основі порівняння з результатами класифікації спектральних кривих відбиття, отриманих наземним спектрометром.
A problem of the vegetation state estimation and classification is considered. Support Vector Machine for vegetation reflectance spectra classification into several classes depending on chlorophyl concentration is suggested. A new approach for validation of satellite hyperspectral data based on comparing with the results of the reflectance spectra classification is suggested.
ru
Інститут кібернетики ім. В.М. Глушкова НАН України
Проблемы управления и информатики
Методы обработки информации
Валидация моделей классификации гиперспектральных данных
Валідація моделей класифікації гіперспектральних даних
Validation of hyperspectral data classification models
Article
published earlier
spellingShingle Валидация моделей классификации гиперспектральных данных
Семенив, О.В.
Шатохина, Ю.В.
Яценко, В.А.
Методы обработки информации
title Валидация моделей классификации гиперспектральных данных
title_alt Валідація моделей класифікації гіперспектральних даних
Validation of hyperspectral data classification models
title_full Валидация моделей классификации гиперспектральных данных
title_fullStr Валидация моделей классификации гиперспектральных данных
title_full_unstemmed Валидация моделей классификации гиперспектральных данных
title_short Валидация моделей классификации гиперспектральных данных
title_sort валидация моделей классификации гиперспектральных данных
topic Методы обработки информации
topic_facet Методы обработки информации
url https://nasplib.isofts.kiev.ua/handle/123456789/209136
work_keys_str_mv AT semenivov validaciâmodeleiklassifikaciigiperspektralʹnyhdannyh
AT šatohinaûv validaciâmodeleiklassifikaciigiperspektralʹnyhdannyh
AT âcenkova validaciâmodeleiklassifikaciigiperspektralʹnyhdannyh
AT semenivov valídacíâmodeleiklasifíkacíígíperspektralʹnihdanih
AT šatohinaûv valídacíâmodeleiklasifíkacíígíperspektralʹnihdanih
AT âcenkova valídacíâmodeleiklasifíkacíígíperspektralʹnihdanih
AT semenivov validationofhyperspectraldataclassificationmodels
AT šatohinaûv validationofhyperspectraldataclassificationmodels
AT âcenkova validationofhyperspectraldataclassificationmodels