Реконструкция полей температуры поверхности по фрагментарным данным дистанционного зондирования

Предлагается метод заполнения пропусков в данных дистанционного зондирования гидрофизических и биологических характеристик водной поверхности. Метод реконструкции опирается на представление полей поверхностных характеристик в виде суммы некоторого числа эмпирических ортогональных функций, имеющих на...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Datum:2011
1. Verfasser: Васечкина, Е.Ф.
Format: Artikel
Sprache:Russian
Veröffentlicht: Морський гідрофізичний інститут НАН України 2011
Schriftenreihe:Морской гидрофизический журнал
Schlagworte:
Online Zugang:https://nasplib.isofts.kiev.ua/handle/123456789/56690
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:Реконструкция полей температуры поверхности по фрагментарным данным дистанционного зондирования / Е.Ф. Васечкина // Морской гидрофизический журнал. — 2011. — № 3. — С. 48-65. — Бібліогр.: 9 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id nasplib_isofts_kiev_ua-123456789-56690
record_format dspace
spelling nasplib_isofts_kiev_ua-123456789-566902025-02-10T00:05:37Z Реконструкция полей температуры поверхности по фрагментарным данным дистанционного зондирования Васечкина, Е.Ф. Математическое моделирование морских систем Предлагается метод заполнения пропусков в данных дистанционного зондирования гидрофизических и биологических характеристик водной поверхности. Метод реконструкции опирается на представление полей поверхностных характеристик в виде суммы некоторого числа эмпирических ортогональных функций, имеющих наибольший вклад в общую дисперсию поля. По отрывочным данным, полученным в результате обработки спутниковых снимков, для летнего сезона года строятся оценки среднего поля и четырехмерной пространственной ковариационной функции температуры поверхности Черного моря. Коэффициенты разложения вычисляются методом наименьших квадратов либо находятся с помощью генетического алгоритма поиска. Результаты численных экспериментов свидетельствуют о перспективности применения метода в задачах заполнения пропусков в спутниковых данных. Пропонується метод заповнення пропусків у даних дистанційного зондування гідрофізичних і біологічних характеристик водної поверхні. Метод реконструкції ґрунтується на представленні полів поверхневих характеристик у вигляді суми деякого числа емпіричних ортогональних функцій, які дають найбільший внесок в загальну дисперсію поля. За уривчастими даними, отриманими внаслідок обробки супутникових знімків, для літнього сезону року будуються оцінки середнього поля і чотиривимірної просторової коваріаційної функції температури поверхні Чорного моря. Коефіцієнти розкладання обчислюються методом найменших квадратів або знаходяться за допомогою генетичного алгоритму пошуку. Результати чисельних експериментів свідчать про перспективність застосування методу в задачах заповнення пропусків у супутникових даних. The method of gap-filling in remote sensing data on hydrophysical and biological characteristics of water surface is proposed. The method of reconstruction is based on presentation of fields of surface characteristics as a sum of a number of empirical orthogonal functions making the largest contribution to the field general dispersion. Based on fragmentary data resulted from processing of satellite images, estimated are the average field and four-dimensional spatial covariance matrix of the Black Sea surface temperature for a summer season. Decomposition coefficients are calculated by the least-squares method or obtained by the genetic algorithm. The results of numerical experiments testify to perspective application of the method in the tasks of gap-filling in satellite data. 2011 Article Реконструкция полей температуры поверхности по фрагментарным данным дистанционного зондирования / Е.Ф. Васечкина // Морской гидрофизический журнал. — 2011. — № 3. — С. 48-65. — Бібліогр.: 9 назв. — рос. 0233-7584 https://nasplib.isofts.kiev.ua/handle/123456789/56690 551.465.6 ru Морской гидрофизический журнал application/pdf Морський гідрофізичний інститут НАН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Russian
topic Математическое моделирование морских систем
Математическое моделирование морских систем
spellingShingle Математическое моделирование морских систем
Математическое моделирование морских систем
Васечкина, Е.Ф.
Реконструкция полей температуры поверхности по фрагментарным данным дистанционного зондирования
Морской гидрофизический журнал
description Предлагается метод заполнения пропусков в данных дистанционного зондирования гидрофизических и биологических характеристик водной поверхности. Метод реконструкции опирается на представление полей поверхностных характеристик в виде суммы некоторого числа эмпирических ортогональных функций, имеющих наибольший вклад в общую дисперсию поля. По отрывочным данным, полученным в результате обработки спутниковых снимков, для летнего сезона года строятся оценки среднего поля и четырехмерной пространственной ковариационной функции температуры поверхности Черного моря. Коэффициенты разложения вычисляются методом наименьших квадратов либо находятся с помощью генетического алгоритма поиска. Результаты численных экспериментов свидетельствуют о перспективности применения метода в задачах заполнения пропусков в спутниковых данных.
format Article
author Васечкина, Е.Ф.
author_facet Васечкина, Е.Ф.
author_sort Васечкина, Е.Ф.
title Реконструкция полей температуры поверхности по фрагментарным данным дистанционного зондирования
title_short Реконструкция полей температуры поверхности по фрагментарным данным дистанционного зондирования
title_full Реконструкция полей температуры поверхности по фрагментарным данным дистанционного зондирования
title_fullStr Реконструкция полей температуры поверхности по фрагментарным данным дистанционного зондирования
title_full_unstemmed Реконструкция полей температуры поверхности по фрагментарным данным дистанционного зондирования
title_sort реконструкция полей температуры поверхности по фрагментарным данным дистанционного зондирования
publisher Морський гідрофізичний інститут НАН України
publishDate 2011
topic_facet Математическое моделирование морских систем
url https://nasplib.isofts.kiev.ua/handle/123456789/56690
citation_txt Реконструкция полей температуры поверхности по фрагментарным данным дистанционного зондирования / Е.Ф. Васечкина // Морской гидрофизический журнал. — 2011. — № 3. — С. 48-65. — Бібліогр.: 9 назв. — рос.
series Морской гидрофизический журнал
work_keys_str_mv AT vasečkinaef rekonstrukciâpoleitemperaturypoverhnostipofragmentarnymdannymdistancionnogozondirovaniâ
first_indexed 2025-12-02T00:45:19Z
last_indexed 2025-12-02T00:45:19Z
_version_ 1850355296762855424
fulltext ISSN 0233-7584. Мор. гидрофиз. журн., 2011, № 3 48 © Е.Ф. Васечкина, 2011 Математическое моделирование морских систем УДК 551.465.6 Е.Ф. Васечкина Реконструкция полей температуры поверхности по фрагментарным данным дистанционного зондирования Предлагается метод заполнения пропусков в данных дистанционного зондирования гидро- физических и биологических характеристик водной поверхности. Метод реконструкции опи- рается на представление полей поверхностных характеристик в виде суммы некоторого числа эмпирических ортогональных функций, имеющих наибольший вклад в общую дисперсию по- ля. По отрывочным данным, полученным в результате обработки спутниковых снимков, для летнего сезона года строятся оценки среднего поля и четырехмерной пространственной кова- риационной функции температуры поверхности Черного моря. Коэффициенты разложения вычисляются методом наименьших квадратов либо находятся с помощью генетического алго- ритма поиска. Результаты численных экспериментов свидетельствуют о перспективности при- менения метода в задачах заполнения пропусков в спутниковых данных. Ключевые слова: спутниковые данные, пространственная ковариационная функция, эм- пирические ортогональные функции. Использование информации, получаемой со спутников, открывает широ- кие возможности для исследования пространственной динамики полей как физических, так и биологических характеристик поверхностного слоя моря. Однако ценность этой информации значительно снижается вследствие при- сутствия на снимках большого числа пропусков, «белых пятен», в основном обусловленных наличием облачности над морем. Известны различные под- ходы к решению данной проблемы, однако мы остановимся на методе, осно- ванном на разложении полей по базису эмпирических ортогональных функ- ций (ЭОФ). Этот метод хорошо изучен, он используется в гидрофизических исследованиях с 50-х годов прошлого века [1, 2]. Перспективность его при- менения в данной задаче связана с высокой скоростью сходимости рядов разложения по ЭОФ и следовательно – с относительно небольшим числом коэффициентов, которые необходимо будет рассчитывать для восстановле- ния поля. Различным аспектам использования метода восстановления данных с применением системы ЭОФ посвящены работы, выполненные в отделе сис- темного анализа МГИ НАН Украины [3 – 6]. Полученные результаты говорят о перспективности применения такого подхода к обработке спутниковой ин- формации. Конечно, в том случае, когда облаками закрыто практически все море, восстановить утраченную информацию невозможно, однако существу- ет довольно большая часть данных, которая после процедуры восстановления могла бы быть использована в задачах мониторинга или модельных расчетах для задания граничных условий. ISSN 0233-7584. Мор. гидрофиз. журн., 2011, № 3 49 Методика расчетов Пусть произвольная реализация наблюдаемого поля f(x,t) представлена в виде ∑=′ ′+= k kk tatf tftftf ),()(),( ),,()],([),( xx xxx ψ (1) где [f(x,t)] – математическое ожидание f(x,t); kψ – собственные функции ко- вариационной матрицы P(x, y), ∑ ′′= t tftfP ),(),(),( yy xx . (2) Коэффициенты разложения ak(t) рассчитываются с помощью свертки xdtfta k s k )(),()( xx ψ∫ ′= . (3) Пусть нужно восполнить пропуски в функции f(x,t), являющейся реали- зацией некоего процесса или поля. На практике, когда речь идет о полях, по- строенных по спутниковым данным, реализации, в которых f(x,t) известна для каждого x, являются редким исключением. На большинстве снимков присутствуют пропуски, «белые пятна», которые занимают большую пло- щадь. Однако и в этом случае возможно с той или иной ошибкой оценить среднее поле и ковариационную матрицу, используя всю доступную инфор- мацию. При этом суммирование проводится во всех точках, где есть данные (здесь и далее речь идет о дискретных реализациях полей на сетке). Напри- мер, i-я реализация функции fi(xj,t) определена в точках xj (j = 1, …, N) и со- держит пропуски, которые распределены таким образом, что значения функ- ции f известны только в наборе точек K, K < N. Пусть в нашем распоряжении имеется набор из T реализаций, каждая из которых также имеет пропуски. Среднее значение функции можно вычислить, суммируя значения в точках, обеспеченных данными в каждой реализации: ∑ = = jT i ij j j tf T S 1 ),( 1 )( xx , (4) где Tj – число реализаций, имеющих значение функции в точке xj. Оценка ко- вариационной матрицы будет тогда вычисляться по формуле ),(),(),( ,),(),( 1 ),( 1 jijij T i ikij jk kj Stftf tftf T P jk xxx xxxx −=′ ′′= ∑ = (5) где суммирование выполняется только для тех реализаций (числом Tjk), в ко- торых точки xj и xk содержат значения функции. Очевидно, что, поскольку суммирование производится по разному числу пар ( , ) ( , )j kf t f t′ ′x x , ковариа- ISSN 0233-7584. Мор. гидрофиз. журн., 2011, № 3 50 ционная матрица будет неодинаково обеспечена данными. Это необходимо учитывать при практических вычислениях. Ансамбль реализаций, используемый для вычисления среднего и кова- риационной матрицы, должен подбираться таким образом, чтобы выполня- лись хотя бы приблизительно условия однородности и стационарности внеш- них воздействий. При ограниченном числе данных их выборка представляет собой отдельную проблему. Реализации не должны иметь большого смеще- ния относительно среднего поля, этот фактор оказывается весьма значимым и существенно влияет на качество решения всей задачи. Обычно выборка дела- ется в рамках одного сезона года, однако календарный сезон может не совпа- дать с климатическим. Например, в настоящей работе мы использовали вы- борку данных с 15 июня по 15 сентября, считая этот период летним сезоном года. Построенная таким образом оценка ковариационной матрицы использу- ется затем для расчета собственных функций ΨΨΨΨ и собственных чисел D, удовлетворяющих уравнению =PΨ ΨD . Теперь для того чтобы получить полную реализацию без пропусков, нужно оценить коэффициенты разложе- ния (3) для некоторого числа первых функций и произвести свертку по фор- муле (1). Если точек в реализации поля достаточно много, для нахождения коэффициентов можно воспользоваться методом наименьших квадратов, ре- шая систему линейных уравнений ∑=′ j kjijik tatf )()(),( xx ψ , (6) где k = 1, …, K – номера точек с данными; j = 1, …, n – номера первых n ЭОФ. Применение формулы (3) при наличии пропусков невозможно, поскольку пропущенные данные эквивалентны в этом выражении нулевым значени- ям ),( tf x′ . Число обеспеченных данными точек K в реализации должно быть не менее 10 n. Если же данных мало, применение формулы (6) некорректно вследствие недостаточности информации для осреднения. В этом случае, как показала практика, хорошо работает генетический алгоритм [7], который отыскивает набор коэффициентов ak, оптимальным образом удовлетворяющий данным и, кроме того, позволяющий учесть имеющуюся априорную информацию о функции. Подробная информация об этом варианте метода изложена в [4, 5]. Здесь же мы остановимся на нем лишь кратко. В основе генетического алгоритма лежит идея поиска решения задачи путем имитации его «биологической» эволюции. Алгоритм генерирует и поддерживает популяцию потенциальных решений задачи – индивидуумов. Некоторые из этих решений используются для создания новых решений пу- тем применения к ним специальных операторов, имитирующих процессы ре- альной биологической эволюции. Это операторы селекции, скрещивания (кроссовера) и мутации. Решения, обладающие лучшим качеством в смысле соответствия введенным критериям, имеют бóльшие шансы «дать потомков» и пройти селекционный отбор в новое поколение. Новые поколения популя- ции потенциальных решений рассчитываются последовательно до выполне- ISSN 0233-7584. Мор. гидрофиз. журн., 2011, № 3 51 ния алгоритмом некоторого условия, обычно связанного с глубиной найден- ного экстремума функции качества. Для запуска процедуры поиска нужно определить число функций, для которых требуется найти коэффициенты разложения, интервал изменчивости коэффициентов, необходимую точность их вычисления. Эти параметры за- дают длину строки так называемого генотипа потенциального решения зада- чи, за которое мы примем набор коэффициентов разложения. Генотип – это последовательность нулей и единиц, представляющая собой запись искомых коэффициентов в двоичном виде. Генотип разделен на участки, соответст- вующие отдельным коэффициентам. В каждом из участков определенные по- зиции отведены для кодировки знака коэффициента, его целой и дробной частей. Интервал возможной изменчивости коэффициентов определяет коли- чество позиций, выделенных для кодировки целой части числа, а точность вычисления – число позиций, в которых будет записана его дробная часть. Другими управляющими параметрами являются мощность популяции потенциальных решений задачи (индивидуумов), максимальное число гене- раций, вероятность мутации (замены «0» на «1» в некоторой случайным об- разом выбранной позиции генотипа). Исследователь также должен задать вид оператора кроссовера, процедуру отбора лучших решений при переходе по- пуляции к следующей генерации, определить условия выхода из алгоритма (окончание поиска), а также условия, в которых популяция может быть эли- минирована и заменена на новую, состоящую из случайных строк. Все эти предварительные установки определяют эффективность работы генетическо- го алгоритма, т. е. скорость получения конечного решения задачи. Особенно важным является задание вида функции качества получаемых решений. К очевидному требованию близости оценки к имеющимся данным в смысле минимума квадратической ошибки можно добавить некоторые ап- риорные сведения о поле, которое необходимо получить. Например, в нашем случае использовалось требование минимума абсолютной величины лапла- сиана, вычисляемого для центральной части моря, т. е. требование относи- тельной гладкости оценки ),(ˆ tf x : ( ) ( ) 2 11 1 ,1,1,,1,1 ˆ1ˆˆˆˆˆ25,0 1 ∑∑∑ == = −+−+ −+−+++= K k kk L i L j jijijijiji ji ff K fffff LL Q i j , (7) где Q – минимизируемая функция качества потенциальных решений задачи; Li, Lj – размеры выделенной области расчетной сетки; jif , ˆ – значение оценки функции f(x,t) в узле сетки (i, j); kf̂ – значение оценки в k-м узле из множества K, где имеются данные наблюдений. В работе использовалась модификация генетического алгоритма, обла- дающая следующими особенностями: – скрещивание двух индивидуумов популяции производилось путем раз- биения их генотипов на отдельные участки в двух случайно выбранных точ- ках и последующего обмена этими участками (оператор двухточечного крос- совера); ISSN 0233-7584. Мор. гидрофиз. журн., 2011, № 3 52 – индивидуум популяции «переходил» в следующую генерацию в том случае, если его функция качества была лучше, чем у трех случайно выбран- ных из популяции экземпляров; – лучшие два решения проходили в следующую генерацию вне конкурса; – популяция элиминировалась и заменялась на новую, если разница меж- ду средним и минимальным значениями функции качества в текущей попу- ляции становилась меньше 0,1; – в начале работы алгоритма искомые коэффициенты рассчитывались методом наименьших квадратов, после чего это решение кодировалось в строку генотипа и становилось «стартовой точкой» для поиска; – алгоритм заканчивал работу, если лучшее полученное решение не ме- нялось в 40 последовательных генерациях либо число генераций превышало заданный предел; – параметры, использованные в расчетах: максимальное число генераций – 1000; мощность популяции – 200; длина участка генотипа, кодирующего один коэффициент – 15 бит (целая часть – 4 бита, дробная – 10, знак коэффи- циента – 1, точность представления коэффициента – 10-3); вероятность мута- ции отдельного бита в генотипе – 5⋅10-4. После получения оценок коэффициентов разложения ak остается приме- нить формулы (1) для вычисления оценки поля ),(ˆ tf x . Полученная оценка, естественно, уже не имеет пропусков. Возникает вопрос о количестве функ- ций, которые необходимо использовать для вычисления оценки поля. Этот вопрос решается на основе анализа зависимости величин собственных чисел от номера моды, характеризующего вклад соответствующей моды в общую дисперсию поля. В качестве примера рассмотрим график, полученный в дан- ном исследовании (рис. 1). Как правило, на кривой собственных чисел (рис. 1, б) просматривается отчетливая «ступенька», после которой их значе- ния резко падают. Эта «ступенька» приблизительно определяет необходимое число ЭОФ для оптимального восстановления поля. При меньшем количест- ве функций ошибка реконструкции поля заметно выше, при увеличении чис- ла функций сверх необходимого минимума ошибка практически не меняется вплоть до момента использования полного набора ЭОФ, когда она обращает- ся в ноль. Практическое применение этого метода связано с двумя основными про- блемами. Первая заключается в часто выявляемой недостаточности данных для построения ковариационной матрицы, вторая – в сложности ее расчета при большой размерности исследуемого поля. Накопление архивов спутни- ковых снимков снимет первую проблему в самом ближайшем будущем, вто- рая проблема связана с объемом памяти и быстродействием компьютеров, находящихся в пользовании исследователя, на сегодня эта проблема пред- ставляется более существенной. Рассмотрим вариант ее решения на примере задачи заполнения пропусков в данных дистанционного зондирования по- верхности Черного моря [8]. ISSN 0233-7584. Мор. гидрофиз. журн., 2011, № 3 53 Р и с. 1. Распределение дисперсии изменчивости полей температуры поверхности (летний сезон 2007 – 2009 гг.) по собственным функциям ковариационной матрицы (в %): а – суммар- ная дисперсия; б – вклад в общую дисперсию последовательных мод (1 – для западной, 2 – для восточной части Черного моря) Подготовка данных При рассмотрении спутниковых снимков, имеющих пропуски вследствие наличия непрозрачных облаков над морем, выясняется, что на некоторых из них присутствуют искажения в данных на краях «белых пятен», вызываемые недостаточно корректным удалением отсчетов в области, скрытой облаками. Например, можно видеть такие снимки, как на рис. 2, где черные точки по краям «белых пятен» (пропусков) после преобразования в градусы Цельсия или единицы концентрации будут давать искаженные значения характери- стик поверхности. Эти искаженные данные оказывают существенное влияние на результирующую ковариационную функцию, поэтому их необходимо тща- тельно удалять с тех снимков, где они имеются. ISSN 0233-7584. Мор. гидрофиз. журн., 2011, № 3 54 Р и с. 2. Примеры спутниковых изображений, содержащих искажения в данных на границе областей, закрытых облаками: а – фрагмент поля концентрации хлорофилла «а»; б – фрагмент поля температуры поверхности Для фильтрации искажений была предложена следующая процедура. Для каждого из имеющихся полей строилась гистограмма распределения искомой характеристики. На снимках, содержащих ошибочные значения (как слишком высокие, так и слишком низкие), гистограмма имела длинные хвосты как вправо, так и влево, с малыми значениями частот встречаемости (рис. 3). Зна- чения поля, имеющие низкую вероятность, фильтровались. Если амплитуда значений поля превышала заданную пороговую величину (например, макси- мальная и минимальная температура поверхности различалась более чем ISSN 0233-7584. Мор. гидрофиз. журн., 2011, № 3 55 на 5°С), производилась фильтрация и значения, имеющие частоту, меньшую одной сотой от максимальной частоты встречаемости, заменялись пропуска- ми. Р и с. 3. Выборочные распределения вероятности для одного из полей температуры поверхно- сти, построенного по спутниковым данным, до (а) и после (б) применения процедуры фильт- рации искажений После такой обработки амплитуда изменчивости поля заметно сокраща- лась (в примере на рис. 3 с 23 до 6°С, что значительно более реалистично) и распределение приобретало вид, близкий к нормальному. Было установлено, что для полей содержания хлорофилла «а» такую обработку необходимо вы- полнять до пересчета данных в единицы концентрации, поскольку после пе- ресчета гистограмма приобретает вид экспоненциального распределения и удалить ошибочно низкие и высокие значения уже не представляется воз- можным. Таким образом были обработаны данные за летние сезоны 2007 – 2009 гг. по концентрации хлорофилла «а» и температуре поверхности. Полученные ISSN 0233-7584. Мор. гидрофиз. журн., 2011, № 3 56 массивы использовались затем для расчета четырехмерной ковариационной матрицы и ее собственных функций. Поскольку принципиальных различий в этих расчетах нет, все дальнейшие выкладки настоящей работы будут касать- ся только полей температуры поверхности. Вычисление четырехмерной ковариационной матрицы и ее собственных функций Разрешение имеющихся в настоящее время данных MODIS о температу- ре поверхности составляет 1 км [8]. Каждый снимок за вычетом границ со- держит более 300 000 точек, потенциально несущих полезную информацию. Понятно, что расчет четырехмерной пространственной ковариационной функции всего моря при сохранении разрешения 1 км невозможен, поэтому необходимо осреднять исходные поля, понижая размер ковариационной мат- рицы. В настоящем исследовании применялось осреднение исходных спут- никовых полей с разрешением 1 км на сетке 7 × 7 км. Кроме того, вся аквато- рия моря была поделена на два участка (западный и восточный), чтобы еще больше сократить размер получающейся ковариационной матрицы. Граница раздела приходилась на центральную часть моря (34° в. д.). Проблема соеди- нения двух участков поля – западного и восточного – здесь специально не рассматривается, однако из опыта известно, что при корректном расчете ко- вариационных матриц и соответствующих собственных функций она не представляет особых затруднений. Западная часть моря после осреднения была представлена массивом данных 82 × 65, в котором NW узлов приходи- лось на область моря, восточная часть – массивом данных 62 × 76 с NE значи- мыми узлами. Рассмотрим теперь практические аспекты выполнения расчетов. Вначале определялся набор переменных, для которого и вычислялась в дальнейшем ковариационная матрица. Каждая переменная представляла собой последова- тельность значений наблюдаемого поля в некотором узле сетки в области мо- ря f(xk,t) (k = 1 … NW + NE). Для построения оценки ковариационной матрицы формировался ансамбль квазинезависимых реализаций поля, полученных об- работкой спутниковых снимков в различные моменты времени с дискретно- стью не менее одних суток. В расчетах, приведенных ниже, ансамблем счи- тался набор реализаций, полученных в летний период с 15 июня по 15 сен- тября 2007 – 2009 гг. Двумерное поле преобразовывалось в одномерную реа- лизацию путем конкатенации строк массива данных, при этом исключались точки, лежащие за пределами моря. Полученные таким образом строки орга- низовывались в массив F(i, k) (i = 1, …, T; k = 1, …, M), который представлял собой множество квазинезависимых значений переменных f(xk,t) в различные моменты времени. Здесь Т – мощность статистического ансамбля, или объем выборки двумерных реализаций поля; М – число переменных (для западной части М = NW, для восточной М = NE). Данный массив использовался для рас- чета среднего поля и ковариационной матрицы. Вычисленная ковариацион- ная матрица имела размер М × М. Каждая k-я строка такой матрицы пред- ставляла собой пространственную ковариационную функцию для k-го узла ISSN 0233-7584. Мор. гидрофиз. журн., 2011, № 3 57 сетки (k = 1, …, M). С помощью специальной процедуры такая запись могла преобразовываться в обычное представление в виде поля. Р и с. 4. Среднее поле температуры поверхности Черного моря (°C) на сетке с дискретностью 7 км, оцененное по выборке спутниковых снимков за 2007 – 2009 гг., – а и обеспеченность данными каждого узла этого поля – б В процессе вычислений оценивалась обеспеченность данными той или иной статистической характеристики. На рис. 4 показано среднее поле темпе- ратуры поверхности Черного моря в летний период и его обеспеченность данными. Хуже всего обстояло дело с данными на границе море – суша, там число отсчетов не превышало 15 – 20, поэтому приграничные точки были удалены из массивов. Плохо обеспечена данными юго-восточная часть моря, и это сказывается на репрезентативности ковариационной матрицы и в ко- нечном счете – на качестве восстановления информации. Западная часть моря лучше обеспечена данными, и качество реконструкции полей температуры там выше. Очевидно, что количество данных, которым обеспечивается кова- риационная функция для какого-либо узла сетки с координатами xi, yi, будет ISSN 0233-7584. Мор. гидрофиз. журн., 2011, № 3 58 меньше, чем при расчете среднего поля, ведь для того чтобы какая-либо реа- лизация дала вклад в расчет коэффициента взаимной корреляции, нужно на- личие в ней данных для пары узлов (xi, yi и xj, yj), тогда как при расчете сред- него достаточно данных только в точке xi, yi. На рис. 5, а показана ковариационная функция для центральной области моря, где хорошо видна ее существенная анизотропия. Рис. 5, б иллюстриру- ет распределение количества данных, использованных для получения этой функции. Видно, что юго-восточная область обеспечена данными относи- тельно хуже, чем западная, поэтому с уверенностью можно говорить об оценке ковариации только в центральной части моря. Подобные карты можно построить для любого узла сетки западной и восточной частей акватории. Р и с. 5. Ковариационная функция температуры поверхности Черного моря, рассчитанная для центральной области по данным статистического ансамбля за июнь – сентябрь 2007 – 2009 гг., (осреднена по 12 центральным узлам сетки) – а и количество данных, использованных для расчета коэффициентов взаимной корреляции в каждом из узлов сетки, – б Существенная анизотропия поля корреляции видна на рис. 6, где пока- заны профили ковариационной функции в широтном и меридиональном ISSN 0233-7584. Мор. гидрофиз. журн., 2011, № 3 59 направлениях. Широтные профили рассчитаны по данным, представленным на рис. 5, – от центральной области на запад и восток. Меридиональные раз- резы построены по полю ковариационной функции для центральной области западной части моря в направлениях на север и юг. Р и с. 6. Одномерные корреляционные функции температуры поверхности: а – широтный разрез по 43° с. ш. (от центральной области на запад – 1, на восток – 2); б – меридиональный разрез по 31° в. д. (от центральной области на юг – 1, на север – 2) Численные эксперименты по восстановлению полей по фрагментарной информации Следующий этап после вычисления четырехмерной ковариационной матрицы – расчет ее собственных функций, т. е. ЭОФ. Их относительный вклад в общую дисперсию показан на рис. 1. Первая мода описывает 52% общей дисперсии, вторая – 5%, третья – 4%. Более высокие моды вносят экс- поненциально уменьшающийся вклад в общую дисперсию, однако для дос- тижения оптимального результата в расчетах по восстановлению полей не- обходимо использовать в данном случае 150 – 160 функций («ступенька» на ISSN 0233-7584. Мор. гидрофиз. журн., 2011, № 3 60 графике зависимости собственных чисел от номера моды). Меньшая обеспе- ченность данными восточной части акватории отразилась на графике рис. 1, б – «ступенька» кривой собственных чисел для ковариационной матрицы вос- точного массива данных имеет меньший перепад, и остаточная дисперсия выше, чем для западного массива. На практике такие особенности приводят к более низкому качеству восстановления информации. Улучшить качество вы- числений можно путем увеличения количества данных в исходном массиве. Рассмотрим теперь конкретные результаты по заполнению пропусков. Эксперименты выполнялись следующим образом. Для обеспечения условий контролируемой точности реконструкции было отобрано несколько реализа- ций полей, имеющих небольшое количество пропусков, а также обладающих заметными особенностями пространственного распределения температуры. Они были обозначены как контрольные, удалены из массива данных и не учитывались при вычислении ковариационной матрицы. Параллельно отби- рались реализации, имеющие различное число пропусков, – от 10 до 75%. Паттерн «белых пятен», обусловленных пропусками (маска облачности), с одной из этих реализаций накладывался на контрольную реализацию без пропусков, после чего поле подавалось на вход алгоритма реконструкции, описанного выше. Последним этапом реконструкции являлась фильтрация полученных по- лей с помощью дискретного двумерного вейвлет-преобразования. Эта проце- дура удаления шумовой компоненты оказалась необходимой вследствие не- избежных ошибок вычислений, связанных с большим количеством пропусков в исходных полях температуры. Использовался двумерный вейвлет db2 (Daubechies). Восстановленное поле температуры ),(ˆ tf x раскладывалось на аппроксимацию и три детализации – горизонтальную, вертикальную и диаго- нальную (первый уровень разложения). Далее детализации подвергались фильтрации, в результате чего удалялись мелкомасштабные флуктуации. От- фильтрованный шум имел нормальное распределение с нулевым средним. Затем производилось обратное преобразование – реконструкция поля с ис- пользованием аппроксимации и модифицированных детализаций. Поле, полученное на выходе процедуры, сравнивалось затем с исходным полем без пропусков, и вычислялись абсолютная и относительная ошибки. Относительная ошибка рассчитывалась как отношение среднеквадратической ошибки к среднеквадратическому отклонению случайной составляющей по- ля. На рис. 7 показан пример реконструкции поля температуры от 3 августа 2009 г. «Наблюдаемое» поле в данном случае имеет 55% пропусков и соот- ветствует реальной ситуации наблюдения Черного моря со спутника от 14 сентября 2007 г. Относительная ошибка реконструкции составляет 0,22 среднеквадрати- ческого отклонения реального поля для его западной части и 0,28 – для вос- точной. Как видно из рис. 7, метод позволяет восстановить особенности про- странственного распределения температуры, частично или полностью отсут- ствовавшие в «наблюдаемом» поле. Восточную часть моря удалось восстано- вить несколько хуже, чем западную. По всей видимости, это объясняется тем, что ковариационная матрица для восточного массива была оценена с боль- шей погрешностью. Можно надеяться, что при увеличении мощности стати- ISSN 0233-7584. Мор. гидрофиз. журн., 2011, № 3 61 стического ансамбля, используемого для оценки ковариационной функции, ошибки реконструкции удастся уменьшить. Восстановленное поле можно сравнить со средним полем поверхностной температуры для августа 2009 г. (рис. 7, г). Видно, что абсолютные значения среднего поля ниже, а характер пространственного распределения аномалий на рис. 7, а, г существенно различается. Холодное пятно (рис. 7, а, в) в юго- восточной части моря сместилось к северу, теплого пятна в западной части нет, и общий рисунок аномалий температуры заметно сглажен. Ошибка ре- конструкции относительно среднего поля за август 2009 г. составляет 0,24, абсолютная 0,48°С. Очевидно, что заполнение «белых пятен» в наблюдаемом поле среднемесячными значениями приведет к грубым искажениям рисунка пространственного распределения температуры. Р и с. 7. Пример реконструкции поля температуры поверхности (°C) от 3 августа 2009 г.: а – реальное; б – то же поле после наложения маски облачности с 55% пропусков (имитация на- блюдаемого поля); в – восстановленное; г – среднее за август 2009 г. ISSN 0233-7584. Мор. гидрофиз. журн., 2011, № 3 62 Р и с. 7. Окончание Аналогичные эксперименты были проведены со всеми реализациями температуры поверхности, не имеющими пропусков. Маски облачности, ко- торые использовались для имитации наблюдаемых полей, имели 10 – 75% пропусков. Абсолютные ошибки реконструкции поля находились в пределах 0,1 – 0,7°С, относительные – в пределах 0,06 – 0,60 стандартного отклонения аномалий. Погрешность зависела не только от количества пропусков, но и от характера их распределения в пространстве. На большинстве снимков про- пуски были сплошными, т. е. часть акватории моря оказывалась полностью вне зоны наблюдения. В этом случае возникает задача экстраполяции, а не интерполяции. Если пропуски были рассредоточены по всему полю неболь- шими островками, т. е. поле в принципе можно было проинтерполировать, ошибка всегда была невелика. Однако таких снимков оказалось совсем не- много, не более 15% от общего числа обработанных полей. В среднем зави- ISSN 0233-7584. Мор. гидрофиз. журн., 2011, № 3 63 симость относительной ошибки реконструкции от количества пропусков в исходном поле можно аппроксимировать формулой ε = 0,3690В2 + 0,4796В + 0,0768, где В – относительное число пропусков в наблюдаемом поле (рис. 8). Если принять за число степеней свободы количество функций в форму- лах (1), использованных для восстановления конкретного поля, можно оце- нить доверительный интервал с заданной вероятностью. Например, если счи- тать, что средняя ошибка реконструкции при использовании 160 ЭОФ со- ставляет 0,3°C, то истинное поле с вероятностью 95% находится в интервале ( ),(ˆ tf x –0,5°C; ),(ˆ tf x +0,5°C). В работе [9] рассматривалась задача оптимальной интерполяции данных дистанционного зондирования температуры поверхности Черного моря. При- ведена средняя ошибка интерполяции данных наблюдений при переходе от сетки с шагом 10 км на сетку с шагом 1 км, она равна 0,29°С. Средняя ошиб- ка, полученная нами, составляет 0,38°С. Учитывая, что в нашем случае реша- ется задача экстраполяции полей, в которых пропуски занимают до 70% площади, можно признать эту ошибку вполне удовлетворительной. Если же рассматривать только поля, где пропуски занимают не более 50% площади, то средняя ошибка реконструкции сократится до 0,32°С. Зависимость отно- сительной погрешности от количества пропусков в исходных данных пред- ставлена на рис. 8. Р и с. 8. Относительные ошибки реконструкции температуры поверхности (в долях средне- квадратического отклонения случайной составляющей) в зависимости от количества пропус- ков в исходных данных ISSN 0233-7584. Мор. гидрофиз. журн., 2011, № 3 64 Заключение Предлагаемый метод восстановления информации на основе четырех- мерной ковариационной матрицы наблюдаемых значений поля обеспечивает реконструкцию особенностей реального поля на качественном уровне. Что касается количественной оценки, то ошибка метода, как правило, не превы- шает одной трети стандартного отклонения характеристики от ее среднего распределения. При добавлении новых реализаций к ансамблю вид одно- и двумерных сечений ковариационной матрицы качественно не изменяется, т. е. построенная оценка достаточно устойчива. Предлагаемый метод может быть применен для реконструкции не только полей поверхностной темпера- туры, но и других характеристик, получаемых по спутниковым данным. СПИСОК ЛИТЕРАТУРЫ 1. Everson R., Cornillon P., Sirovich L. et al. An empirical eigenfunction analysis of sea surface temperatures in the Western North Atlantic // J. Phys. Oceanogr. – 1997. – 27, № 3. – P. 468 – 479. 2. Репинская Р.П., Бабич Я.Б. Аппроксимация рядами эмпирических ортогональных функций северополушарных полей облачности по спутниковым данным // Исследова- ния Земли из космоса. – 1999. – № 6. – С. 8 – 15. 3. Васечкина Е.Ф., Тимченко И.Е., Ярин В.Д. Восстановление структуры гидрофизических полей по неполной информации // Морской гидрофизический журнал. – 1997. – № 2. – С. 37 – 44. 4. Васечкина Е.Ф., Ярин В.Д. Генетический алгоритм в задаче реконструкции гидрометео- рологических полей // Системы контроля окружающей среды. – Севастополь: ЭКОСИ- Гидрофизика, 2002. – С. 141 – 145. 5. Васечкина Е.Ф., Ярин В.Д. Использование генетического алгоритма в задаче восстанов- ления пропущенных данных // Морской гидрофизический журнал. – 2002. – № 4. – С. 30 – 39. 6. Yarin V.D., Vasechkina Y.F. Missing data recovery by using decomposition into empirical orthogonal functions // Proc. of Intern. Conf. “Scientific and policy challengers towards an ef- fective management of the marine environment”. – Albena, Bulgaria, 2003. – P. 401 – 403. 7. Whitley D. A genetic algorithm tutorial // Tech. Rep. CS-93-103. – Colorado State University, 1993. – 38 p. 8. Морской портал НКАУ – МГИ НАН Украины. – http://dvs.net.ua. 9. Пухтяр Л.Д., Станичный С.В., Тимченко И.Е. Оптимальная интерполяция данных дис- танционного зондирования морской поверхности // Морской гидрофизический жур- нал. – 2009. – № 4. – С. 34 – 50. Морской гидрофизический институт НАН Украины, Материал поступил Севастополь в редакцию 19.01.10 E-mail: cpdi@rambler.ru После доработки 10.03.10 ISSN 0233-7584. Мор. гидрофиз. журн., 2011, № 3 65 АНОТАЦІЯ Пропонується метод заповнення пропусків у даних дистанційного зондування гідрофізичних і біологічних характеристик водної поверхні. Метод реконструкції ґрунтується на представленні полів поверхневих характеристик у вигляді суми деякого числа емпіричних ортогональних функцій, які дають найбільший внесок в загальну дисперсію поля. За уривча- стими даними, отриманими внаслідок обробки супутникових знімків, для літнього сезону року будуються оцінки середнього поля і чотиривимірної просторової коваріаційної функції темпе- ратури поверхні Чорного моря. Коефіцієнти розкладання обчислюються методом найменших квадратів або знаходяться за допомогою генетичного алгоритму пошуку. Результати чисель- них експериментів свідчать про перспективність застосування методу в задачах заповнення пропусків у супутникових даних. Ключові слова: супутникові дані, просторова коваріаційна функція, емпіричні ортого- нальні функції. ABSTRACT The method of gap-filling in remote sensing data on hydrophysical and biological char- acteristics of water surface is proposed. The method of reconstruction is based on presentation of fields of surface characteristics as a sum of a number of empirical orthogonal functions making the largest contribution to the field general dispersion. Based on fragmentary data resulted from process- ing of satellite images, estimated are the average field and four-dimensional spatial covariance matrix of the Black Sea surface temperature for a summer season. Decomposition coefficients are calculated by the least-squares method or obtained by the genetic algorithm. The results of numerical experi- ments testify to perspective application of the method in the tasks of gap-filling in satellite data. Keywords: satellite data, spatial covariance matrix, empirical orthogonal functions.