Актуализация мониторинговых данных на основе классификации

Предложена методика актуализации мониторинговых данных, основанная на нахождении степени доверия к показателям точек наблюдения с применением схем классификации. Разработана соответствующая информационная технология актуализации данных. Проведена апробация на данных гидрологического мониторинга (...

Full description

Saved in:
Bibliographic Details
Date:2009
Main Author: Логинов, О.А.
Format: Article
Language:Russian
Published: Інститут проблем штучного інтелекту МОН України та НАН України 2009
Subjects:
Online Access:https://nasplib.isofts.kiev.ua/handle/123456789/8151
Tags: Add Tag
No Tags, Be the first to tag this record!
Journal Title:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Cite this:Актуализация мониторинговых данных на основе классификации / О.А. Логинов // Штучний інтелект. — 2009. — № 4. — С. 60-65. — Бібліогр.: 5 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1859935040701464576
author Логинов, О.А.
author_facet Логинов, О.А.
citation_txt Актуализация мониторинговых данных на основе классификации / О.А. Логинов // Штучний інтелект. — 2009. — № 4. — С. 60-65. — Бібліогр.: 5 назв. — рос.
collection DSpace DC
description Предложена методика актуализации мониторинговых данных, основанная на нахождении степени доверия к показателям точек наблюдения с применением схем классификации. Разработана соответствующая информационная технология актуализации данных. Проведена апробация на данных гидрологического мониторинга (уровня грунтовых вод в опорных скважинах сети наблюдений) Днепропетровской области, показана целесообразность ее применения. Запропонована методика актуалізації моніторингових даних, основана на знаходженні ступеня довіри до показників точок спостереження із застосуванням схем класифікації. Розроблена відповідна інформаційна технологія актуалізації даних. Проведена апробація на даних гідрологічного моніторингу (рівня ґрунтових вод в опорних свердловинах мережі спостереження) Дніпропетровської області, показана доцільність її застосування. The methodology of monitoring data actualization, based on finding of degree of belief to indexes of observation points with classification scheme application was suggested. Appropriate information technology of data actualization was developed. The approbation on hydrologic monitoring data (level of subterranean waters in reference borehole of observation net) of Dnepropetrovsk region was carried out, the expediency of its application was shown.
first_indexed 2025-12-07T16:09:47Z
format Article
fulltext «Искусственный интеллект» 4’2009 60 2Л УДК 681.3:519.711:004.8 О.А. Логинов Национальный горный университет, г. Днепропетровск, Украина walter_topol@i.ua Актуализация мониторинговых данных на основе классификации Предложена методика актуализации мониторинговых данных, основанная на нахождении степени доверия к показателям точек наблюдения с применением схем классификации. Разработана соответствующая информационная технология актуализации данных. Проведена апробация на данных гидрологического мониторинга (уровня грунтовых вод в опорных скважинах сети наблюдений) Днепропетровской области, показана целесообразность ее применения. Постановка проблемы в общем виде и ее связь с важными научными и практическими задачами В связи с возрастающими объемами статистической информации, накапливаемой в распределенных, разрозненных источниках данных, и постоянно меняющимися требованиями к анализу информации актуальным направлением исследований становит- ся актуализация данных для решения аналитических задач. Актуализация данных – приведение данных в соответствии с состоянием отобража- емых объектов предметной области. Актуализация реализуется посредством операций добавления, исключения и редактирования записей [1]. Актуализация данных позволяет определить наборы данных с низкой степенью доверия, выделять заблаговременно «лож- ные» наборы данных, при прогнозировании снижает вероятность ошибочного результата. Основным требованием аналитика является достоверность используемой информа- ции. Как правило, анализ предметной области показывает изменение структур данных мониторинга, потребность проведения согласования данных, без чего нельзя говорить о достоверности. Помимо этого данные содержат ошибки измерений. При исследовании мониторинговых данных требуется рассматривать не только отдельные показатели, но и динамические ряды, встает проблема обеспечения минимума методологических искаже- ний и неконтролируемых человеком потерь информации в процессе ее обработки. Общепринятой методики актуализации данных не существует, в разных предмет- ных областях используются свои методы. В то же время для мониторинговых данных можно предложить универсальный подход, основанный на классификации. Классифика- ция – отношение соответствия между классом и диапазоном изменения показателя [2], [3]. Существует много схем одномерной классификации, в данной работе предлагает- ся применять такие, как «равные интервалы», «естественная разбивка», «стандартное отклонение» [4]. Цель работы – разработка методики и соответствующей информационной техноло- гии актуализации данных с применением схем классификации, проверка их адекватности на реальных мониторинговых данных Днепропетровской области. Актуализация мониторинговых данных на основе классификации «Штучний інтелект» 4’2009 61 2Л Методика актуализации данных с использованием схем классификации Концептуальная схема разработанной методики актуализации данных и соответ- ствующей информационной технологии приведена на рис. 1. Рисунок 1 – Концептуальная схема методики актуализации данных Рассмотрим основные этапы получения актуализированных данных (на примере гидрологического мониторинга). Этап 1. Отбор исходных данных. Грунтовые воды – подземные воды первого от поверхности земли постоянного водоносного горизонта, не имеющего сверху сплошной кровли водонепроницаемых пород, не обладают напором и подвержены сезонным колебаниям уровня и дебита [5]. Моделирование и прогнозирование уровня грунтовых вод (УГВ) является важной народ- нохозяйственной задачей. Полный набор исходных данных составляет ежемесячный мониторинг по 22 сква- жинам за 31 год наблюдения с 1974 по 2005, всего 8184 значений. Из него отбираются показатели всех скважин за один месяц (март) по всем годам. Анализу подвергается выборка {Zi}, i = 1, 2,…, N, по N = 22 скважинам за M = 31 год наблюдений, всего 982 зна- чения (пример исходных данных – табл. 1). Zi = (Zi,1,…,Zi,M) – наблюдения по i-й скважине. Таблица 1 – Выборка по 22 скважинам на 31 год наблюдений N N_skv x y 1974 1975 . . . j . . . 2004 2005 1 14360 34,4861 34,4861 3,02 3,13 . . . . . . . . . 2,77 1,60 2 14354 34,4906 34,4906 4,22 4,28 . . . . . . . . . 4,14 3,07 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . i . . . . . . . . . . . . . . . . . . Zi,j . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 6337 35,1675 35,1675 1,42 1,54 . . . . . . . . . 1,05 1,05 22 8760 34,8933 34,8933 2,12 2,00 . . . . . . . . . 2,18 2,18 Визуальный анализ графиков Получение элементарных статистик Отбор исходных данных Подсчет степени доверия по каждой схеме Актуализация данных Разведочный анализ данных Разбивка на классы «Естественная разбивка» «Стандартное отклонение» «Равные интервалы» Логинов О.А. «Искусственный интеллект» 4’2009 62 2Л Этап 2. Разведочный анализ данных. Получение элементарных статистик (пример – табл. 2), построение графиков, визуальный анализ графиков (рис. 2) по скважинам. Рисунок 2 – Уровень грунтовых вод, март 1974 – 2005 гг. Таблица 2 – Элементарные статистики ряда Z11 Максимум 0,90 Минимум 0,02 Среднее 0,42 Дисперсия 0,06 Стандартное отклонение 0,24 Этап 3. Разбивка на классы. Производится разбивка выборки {Zi}, i = 1,…,N на классы по трем схемам клас- сификации: «равные интервалы», «естественная разбивка», «стандартное отклонение». 1. «Равные интервалы»: а) вычисляются minZ Z, maxmin ,Z Z – соответственно минимальное и максимальное зна- чения выборки; б) промежуток maxmin[ , ]Z Z делится на k интервалов равной длины; в) элементу ряда присваивается номер класса, соответствующий номеру интер- вала, в который попадает его значение. 2. «Естественная разбивка» (аналог кластеризации): а) ряд представляется в виде гистограммы; б) разбивка на k классов проводится в соответствии с резкими скачками в значе- ниях частот; в один класс попадают элементы ряда, имеющие близкие значения; в) каждому элементу ряда присваивается номер класса. 3. «Стандартное отклонение»: а) вычисляется Z – среднее значение выборки; б) вычисляется s – стандартное отклонение; в) разбиение на интервалы начинается от Z последовательным прибавлением и вычитанием m-й доли (  0 1m ) стандартного отклонения s: [Z 2m×s; Z m×s), [Z + m×s; Z+2m s);[ ; );Z m s Z m s       … Скважина № 15000 0,00 0,10 0,20 0,30 0,40 0,50 0,60 0,70 0,80 0,90 1,00 19 74 19 75 19 76 19 77 19 78 19 79 19 80 19 81 19 82 19 83 19 84 19 85 19 86 19 87 19 88 19 89 19 90 19 91 19 92 19 93 19 94 19 95 19 96 19 97 19 98 19 99 20 00 20 01 20 02 20 03 20 04 20 05 УГВ (м.) Актуализация мониторинговых данных на основе классификации «Штучний інтелект» 4’2009 63 2Л г) каждому элементу выборки, значение которого попало в интервал [ ; ]Z m s Z m s    [ ; ]Z m s Z m s    , присваивается номер класса. Подсчитывается число попаданий в каждый из классов значений отдельно по каж- дому, по каждой скважине. Полученные градации для классификации приведены в табл. 3. Таблица 3 – Градации классификаций Градации Естественная разбивка Равные интервалы Стандартное отклонение I интервал 0,00 - 1,46 0 - 2,12 0,00 - 0,81 II интервал 1,46 - 2,89 2,12 - 4,25 0,81 - 1,97 III интервал 2,89 - 4,50 4,25 - 6,37 1,97 - 3,13 IV интервал 4,50 - 7,39 6,37 - 8,50 3,13 - 4,29 V интервал 7,39 - 10,62 8,50 - 10,62 4,29 - 5,45 VI интервал — — 5,45 - 10,10 Пример полученной классификации «естественная разбивка» приведен в табл. 4. Таблица 4 – Классификация «естественная разбивка» N N_skv x y 1974 1975 . . . 1986 1987 . . . 2004 2005 1 14360 34.4861 48.0364 3,02 3,13 . . . 1,77 2,52 . . . 2,77 1,60 2 14354 34.4906 48.0417 4,22 4,28 . . . 3,28 4,03 . . . 4,14 3,07 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 6337 35.1675 48.4728 1,42 1,54 . . . 0,77 2,29 . . . 1,05 1,05 22 8760 34.8933 48.5228 2,12 2,00 . . . 1,92 2,26 . . . 2,18 2,18 Этап 4. Подсчет степени доверия по каждой схеме. а) определяются частости , 1,..., , 1,...,V i N j Kij   попаданий объектов наблюде- ний в заданные К классов; б) находится число попаданий для самого многочисленного класса в Zi относи- тельно всех попаданий значений скважины по каждой из трех схем разбивки * argmaxV Vi ijj  ; (1) в) находится степень доверия к значениям Zi * ( ) ViZi M   ; (2) г) находится средняя степень доверия по трем схемам классификации. Этап 5. Актуализация данных. Выделяются и признаются не пригодными к дальнейшей работе те показатели скважин, чьи степени доверия ниже заданного порога  . Как видно из табл. 5, выделены три скважины с наименьшей (при заданном пороге  = 0,7) степенью доверия по трем способам разбивки и три скважины по двум способам разбивки («равные интервалы» и «стандартное отклонение»), всего 6 скважин. Схема «естественная разбивка» выделяет только 3 скважины, они также выделены двумя другими способами разбивки, ее можно считать проверочной. Логинов О.А. «Искусственный интеллект» 4’2009 64 2Л Таблица 5 – Результат актуализации данных N N_skv x y Равные интервалы Естественная разбивка Стандартное отклонение Среднее 1 14360 34.4861 48.0364 0,56 0,75 0,63 0,65 2 14354 34.4906 48.0417 0,84 0,78 0,69 0,77 3 14361 34.2859 48.0150 0,47 0,41 0,41 0,43 4 15064 36.0939 48.2426 0,66 0,59 0,38 0,54 5 14358 34.1467 48.1769 0,97 0,97 0,91 0,95 6 12752 36.0244 48.1772 1,00 1,00 0,91 0,97 7 14699 36.0333 48.1833 1,00 0,72 0,84 0,85 8 14698 36.0281 48.185 0,94 0,75 0,94 0,88 9 12926 36.1522 48.0556 0,88 0,97 1,00 0,95 10 15584 36.5644 48.1106 0,97 1,00 1,00 0,99 11 15000 36.0238 48.2632 1,00 1,00 0,91 0,97 12 5946 36.05 48.31 1,00 1,00 0,56 0,85 13 14329 35.9033 48.5492 0,66 0,91 0,53 0,70 14 15221 35.8394 48.5689 0,50 0,84 0,69 0,68 15 6951 35.5057 48.3031 0,94 0,94 0,84 0,91 16 6966 35.92 48.4619 0,94 0,94 0,72 0,86 17 8776 35.0744 48.9269 0,66 0,53 0,66 0,61 18 8777 35.0803 48.9206 0,88 0,88 0,66 0,80 19 14697 35.0997 48.9219 0,94 0,84 0,94 0,91 20 8519 34.5638 49.1131 1,00 0,88 0,69 0,85 21 6337 35.1675 48.4728 0,97 0,91 0,91 0,93 22 8760 34.8933 48.5228 0,69 0,97 0,72 0,79 0,47 0,41 0,38 min 1,00 1,00 1,00 max Граница Днепропетровской области Реки Города региона Степень доверия по трем схемам 0,430000 - 0,700000 0,700001 - 0,789814 0,789815 - 0,887695 0,887696 - 0,990000 Бассейн р. Днепр Днепропетровская область 9 8 7 6 5 4 3 2 1 22 21 20 1918 17 16 15 14 13 12 11 10 Рисунок 3 – Опорные скважины Днепропетровской области и степени доверия к показателям мониторинга Актуализация мониторинговых данных на основе классификации «Штучний інтелект» 4’2009 65 2Л На рис. 3 приведена карта расположения скважин в Днепропетровской области и средние по трем схемам степени доверия к ним. Скважины с низкой степенью доверия при прогнозировании могут привести к не- адекватным результатам. Актуализированные данные дают возможность при дальнейшем прогнозировании снизить процент ошибок. Выводы Разработана и реализована компьютерная информационная технология актуализа- ции данных, основанная на схемах классификации данных. Дальнейшие исследования пространственно распределенных данных мониторинга целесообразно направить на дву- мерный вариант классификации и связать результаты с данными геостатистического анализа. При более детальном исследовании гидрологических данных необходимо при- нять во внимание то, что на территории Днепропетровской области расположено три раз- личных гидрологических бассейна. Литература 1. Электронный словарь URL [Электронный ресурс]. – Режим доступа : http://www.finam.ru/dictionary/wordf0092500014/default.asp?n=1 2. Сарычева Л.В. Компьютерный эколого-социально-экономический мониторинг регионов. Геоинфор- мационное обеспечение : [монография] / Л.В. Сарычева. – Днепропетровск : НГУ, 2003. – 174 с. 3. Сарычева Л.В. Компьютерный эколого-социально-экономический мониторинг регионов. Математи- ческое обеспечение : [монография] / Л.В. Сарычева. – Днепропетровск : НГУ, 2003. – 222 с. 4. Саричева Л.В. Схеми класифікації регіонів за показниками еколого-соціально-економічного моніто- рингу в геоінформаційній системі / Л.В. Саричева, О.В. Качанов // Геоінформатика. – 2002. – № 4. – С. 53-63. 5. Рубан С.А. Гідрогеологічна оцінка і прогнози режиму підземних вод України / С.А. Рубан, М.А. Шинкаревський. – Дніпропетровськ : Укрпівденгеологія, 2005. – 372 с. О.О. Логiнов Актуалізація моніторингових даних на основі класифікації Запропонована методика актуалізації моніторингових даних, основана на знаходженні ступеня довіри до показників точок спостереження із застосуванням схем класифікації. Розроблена відповідна інформаційна технологія актуалізації даних. Проведена апробація на даних гідрологічного моніторингу (рівня ґрунтових вод в опорних свердловинах мережі спостереження) Дніпропетровської області, показана доцільність її застосування. O.A. Loginov Actualization of Monitoring Data on the Basis of Classification The methodology of monitoring data actualization, based on finding of degree of belief to indexes of observation points with classification scheme application was suggested. Appropriate information technology of data actualization was developed. The approbation on hydrologic monitoring data (level of subterranean waters in reference borehole of observation net) of Dnepropetrovsk region was carried out, the expediency of its application was shown. Статья поступила в редакцию 10.07.2009.
id nasplib_isofts_kiev_ua-123456789-8151
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 1561-5359
language Russian
last_indexed 2025-12-07T16:09:47Z
publishDate 2009
publisher Інститут проблем штучного інтелекту МОН України та НАН України
record_format dspace
spelling Логинов, О.А.
2010-05-13T10:23:46Z
2010-05-13T10:23:46Z
2009
Актуализация мониторинговых данных на основе классификации / О.А. Логинов // Штучний інтелект. — 2009. — № 4. — С. 60-65. — Бібліогр.: 5 назв. — рос.
1561-5359
https://nasplib.isofts.kiev.ua/handle/123456789/8151
681.3:519.711:004.8
Предложена методика актуализации мониторинговых данных, основанная на нахождении степени доверия к показателям точек наблюдения с применением схем классификации. Разработана соответствующая информационная технология актуализации данных. Проведена апробация на данных гидрологического мониторинга (уровня грунтовых вод в опорных скважинах сети наблюдений) Днепропетровской области, показана целесообразность ее применения.
Запропонована методика актуалізації моніторингових даних, основана на знаходженні ступеня довіри до показників точок спостереження із застосуванням схем класифікації. Розроблена відповідна інформаційна технологія актуалізації даних. Проведена апробація на даних гідрологічного моніторингу (рівня ґрунтових вод в опорних свердловинах мережі спостереження) Дніпропетровської області, показана доцільність її застосування.
The methodology of monitoring data actualization, based on finding of degree of belief to indexes of observation points with classification scheme application was suggested. Appropriate information technology of data actualization was developed. The approbation on hydrologic monitoring data (level of subterranean waters in reference borehole of observation net) of Dnepropetrovsk region was carried out, the expediency of its application was shown.
ru
Інститут проблем штучного інтелекту МОН України та НАН України
Интеллектуальный анализ данных
Актуализация мониторинговых данных на основе классификации
Актуалізація моніторингових даних на основі класифікації
Actualization of Monitoring Data on the Basis of Classification
Article
published earlier
spellingShingle Актуализация мониторинговых данных на основе классификации
Логинов, О.А.
Интеллектуальный анализ данных
title Актуализация мониторинговых данных на основе классификации
title_alt Актуалізація моніторингових даних на основі класифікації
Actualization of Monitoring Data on the Basis of Classification
title_full Актуализация мониторинговых данных на основе классификации
title_fullStr Актуализация мониторинговых данных на основе классификации
title_full_unstemmed Актуализация мониторинговых данных на основе классификации
title_short Актуализация мониторинговых данных на основе классификации
title_sort актуализация мониторинговых данных на основе классификации
topic Интеллектуальный анализ данных
topic_facet Интеллектуальный анализ данных
url https://nasplib.isofts.kiev.ua/handle/123456789/8151
work_keys_str_mv AT loginovoa aktualizaciâmonitoringovyhdannyhnaosnoveklassifikacii
AT loginovoa aktualízacíâmonítoringovihdanihnaosnovíklasifíkacíí
AT loginovoa actualizationofmonitoringdataonthebasisofclassification