Интеллектуальный анализ показателей эколого-социально-экономического мониторинга регионов
Выделены основные классы задач интеллектуального анализа пространственных данных эколого-социально- экономического мониторинга, предложены методы и алгоритмы их решения. На реальных показателях мониторинга регионов Украины рассмотрены примеры генерирования новых знаний с помощью геоиконического м...
Saved in:
| Date: | 2008 |
|---|---|
| Main Author: | |
| Format: | Article |
| Language: | Russian |
| Published: |
Інститут проблем штучного інтелекту МОН України та НАН України
2008
|
| Subjects: | |
| Online Access: | https://nasplib.isofts.kiev.ua/handle/123456789/7379 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| Journal Title: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Cite this: | Интеллектуальный анализ показателей эколого-социально-экономического мониторинга регионов / Л.В. Сарычева // Штучний інтелект. — 2008. — № 4. — С. 137-148. — Бібліогр.: 16 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| _version_ | 1859973906808438784 |
|---|---|
| author | Сарычева, Л.В. |
| author_facet | Сарычева, Л.В. |
| citation_txt | Интеллектуальный анализ показателей эколого-социально-экономического мониторинга регионов / Л.В. Сарычева // Штучний інтелект. — 2008. — № 4. — С. 137-148. — Бібліогр.: 16 назв. — рос. |
| collection | DSpace DC |
| description | Выделены основные классы задач интеллектуального анализа пространственных данных эколого-социально-
экономического мониторинга, предложены методы и алгоритмы их решения. На реальных показателях
мониторинга регионов Украины рассмотрены примеры генерирования новых знаний с помощью
геоиконического моделирования в геоинформационной системе.
Виділені основні класи завдач інтелектуального аналізу просторових даних еколого-соціально-
економічного моніторингу, запропоновані методи і алгоритми їх розв’язання. На реальних показниках
моніторингу регіонів України розглянуті приклади генерування нових знань за допомогою
геоіконічного моделювання в геоінформаційній системі.
The basic classes of the intelligence analysis tasks of the spatial data of ecology-socio-economic monitoring
are extracted, the methods and algorithms of their solving are offered. The examples of new knowledge
generation using geoiconic simulation in a geoinformation system are surveyed with usage of actual
parameters of Ukraine regions monitoring.
|
| first_indexed | 2025-12-07T16:22:18Z |
| format | Article |
| fulltext |
«Штучний інтелект» 4’2008 137
2С
УДК 681.3:519.711:004.8
�E���<�����K�Z�j�u�q�_�\�Z����
Национальный горный университет, г. Днепропетровск, Украина
Sarychevаl@nmu.org.ua
Интеллектуальный анализ показателей
эколого-социально-экономического
мониторинга регионов
Выделены основные классы задач интеллектуального анализа пространственных данных эколого-социально-
экономического мониторинга, предложены методы и алгоритмы их решения. На реальных показателях
мониторинга регионов Украины рассмотрены примеры генерирования новых знаний с помощью
геоиконического моделирования в геоинформационной системе.
Одной из приоритетных задач мирового сообщества на XXI век Организация
Объединенных Наций провозгласила решение проблемы устойчивого развития (УР).
Для выхода на траекторию УР необходим научно обоснованный подход к прогно-
зированию развития регионов (территориальных единиц – областей, районов и т.д.).
Поэтому возникла проблема количественной оценки уровня УР, мониторинга эколо-
гических, социальных, экономических (ЭСЭ) показателей.
Под эколого-социально-экономическим мониторингом (ЭСЭМ) как частью
системы управления региональным развитием будем понимать специально
организованное целевое систематическое наблюдение и краткосрочное прогнозирование
хода важнейших ЭСЭ-процессов с целью их анализа, идентификации и выявления круга
регулируемых факторов для подготовки и принятия решений.
Интеллектуальный анализ данных (ИАД) – инструмент для извлечения знаний из
первичных данных. Цель применения ИАД к решению задач ЭСЭМ регионов – получе-
ние ранее неизвестных, нетривиальных, доступных для интерпретации ЭСЭ-процессов
знаний, закономерностей в ЭСЭМ-данных, полезных для поддержки принятия реше-
ний. В настоящее время из имеющихся данных мониторинга регионов извлекается не
вся информация. Одной из причин такого положения является недостаточная раз-
работанность методологии и подходов к интерпретации мониторинговых данных.
Большинство авторов выделяет пять типов задач ИАД [1]: 1) классификация
(распознавание с «учителем», ранжирование); 2) кластеризация (определение присущего
исследуемым данным разбиения на однородные группы – кластеры); 3) выявление
ассоциаций; 4) выявление последовательностей; 5) прогнозирование.
ИАД ЭСЭ-мониторинга включает перечисленные пять типов задач. Но сущест-
вуют некоторые дополнения, связанные с тем, что ЭСЭМ-данные имеют конкретную
пространственную привязку и предназначены для раннего обнаружения и предупрежде-
ния негативных тенденций и явлений в ЭСЭ-развитии регионов. Это такие задачи [2]:
1) выделение аномалий (на основе особенностей протекания ЭСЭ-процессов
выявляются регионы, ЭСЭ-развитие которых отличается от общей тенденции, при-
сущей всей совокупности регионов);
2) анализ и оптимизация сети мониторинга (построение модели для описания
пространственного распределения точечных объектов – узлов сети мониторинга и
пространственных отношений между объектами).
Сарычева Л.В.
«Искусственный интеллект» 4’2008 138
2С
Поэтому для извлечения новых знаний из данных мониторинга регионов разраба-
тываются методы интеллектуального анализа пространственных данных (ИАПД), ис-
пользующие ИАД и современные геоинформационные системы и технологии
(ГИС) [3], [4]. ГИС, обеспечивая пространственную привязку информации, не только
облегчают ее восприятие и интерпретацию, но и обеспечивают получение такой
производной информации, которая не может быть извлечена по исходным данным при
использовании других информационных систем [5].
Проведенное исследование методов и средств анализа ЭСЭ-показателей в ГИС
(ArcView, ArcGis, Modflow, Idrisi, Панорама) свидетельствует о том, что ГИС могут
быть использованы для задач анализа зонирования территории по значениям показате-
лей ЭСЭ-мониторинга, синтеза тематических пластов картографической экологической
информации, построения геоиконических моделей ЭСЭ-показателей, определения и
картирования аномальных с точки зрения УР регионов.
Применение методов ИАПД позволяет проводить комплексный анализ разно-
родных данных трех информационных блоков: экологического, экономического,
социального. Это особенно важно, ведь «математика» при моделировании экологи-
ческих процессов отличается от «математики» при моделировании социально-эконо-
мических процессов, а актуальность совместного анализа ЭСЭ-показателей не вызывает
сомнений.
Цель работы – исследование и реализация методов интеллектуального анализа
пространственных ЭСЭМ-данных для поддержки принятия решений по управлению
региональным развитием, генерирование новых знаний с помощью ГИС-анализа и
моделирования.
Постановка задачи
Объектами ИАПД являются �Q регионов территории, которые характеризуются �P
ЭСЭ-показателями (признаками), измеренными в определенные моменты времени, и
географическими координатами. Результаты наблюдений за объектами (в фиксирован-
ный момент времени) представляются матрицей типа «объект-признак» размера �Q�u�P.
Число признаков может быть больше числа объектов: �P�!�Q.
Для ИАПД ЭСЭ-мониторинга регионов требуется: 1) выделить основные классы
задач и описать методы их решения; 2) разработать соответствующие алгоритмы
реализации ИАПД в ГИС.
ИАПД мониторинга ЭСЭ-показателей регионов:
задачи, методы и алгоритмы
Особенности применения методов ИАПД для анализа показателей ЭСЭ-
мониторинга регионов обусловлены характером исходных данных и содержательной
постановкой решаемых задач. Одни и те же методы ИАПД используются для
различных по содержанию задач. Например, кластеризация применяется и для анализа
сети мониторинга, и для районирования территории (по степени загрязнения, по совокуп-
ности показателей тематического сюжета «инвестиционная привлекательность» регионов
и т.п.), и для выделения аномальных регионов. Кластеризация используется как на этапе
разведочного анализа, так и на этапе извлечения знаний из ЭСЭМ-данных, проверки
гипотез о сходстве протекающих в различных регионах ЭСЭ-процессов.
Сравнительная характеристика ИАД и ИАПД представлена в табл. 1.
�B�g�l�_�e�e�_�d�l�m�Z�e�v�g�u�c���Z�g�Z�e�b�a���i�h�d�Z�a�Z�l�_�e�_�c�«��
«Штучний інтелект» 4’2008 139
2C
Таблица 1 – Сравнительная характеристика ИАД и ИАПД
Основные задачи ИАПД мониторинга ЭСЭ-показателей регионов следующие:
анализ и оптимизация сети мониторинга, ГИС-анализ и геоиконическое моделирование
показателей для зонирования территории, обнаружение пространственно-временных
аномалий, геостатистический анализ, прогнозирование ЭСЭ-показателей (рис. 1).
Рисунок 1 – Структурная схема использования методов ИАПД
для поддержки принятия управляющих решений
Характеристики ИАД ИАПД
Обнаружение моделей в
данных
Обнаружение пространственных
особенностей в данных
Разработка гипотез о данных Разработка гипотез, основанных на
«географии» данных �P�_�e�b��
Составление модельных
оценок Оценка пространственных моделей
Статистика Геостатистика
Классификация Ранговые картограммы по одному,
двум и трем атрибутам
Кластеризация Кластеризация
Правила вывода Правила вывода
Методы
Интегрированные методы Геоиконическое моделирование,
интегрированные методы
Графики Карта+Графики
Диаграммы Карта+Диаграммы
�K�j�_�^�k�l�\�Z����
визуализации
результатов Гистограммы Карта+Гистограммы
Сарычева Л.В.
«Искусственный интеллект» 4’2008 140
2С
Геоиконические модели – принципиально новый класс ЭСЭ-моделей, основанный
на иконическом способе отображения ЭСЭ-информации, упорядоченной с помощью
географической карты. В соответствии с тематическим сюжетом по совокупности
изучаемых ЭСЭ-показателей создаются карты. Информация представляется для
дальнейшего анализа в сжатом, синтетическом виде, а карта рассматривается как
аналитическое средство [6].
Геоиконические модели в ГИС обладают важным свойством – это интерактивные
модели, работающие в режиме взаимодействия ЛПР – ЭВМ. Электронное хранение в
ГИС геоиконических моделей позволяет буквaльно зa минуту отобрaзить и
проaнaлизировaть несколько рaзличных ЭСЭ-показателей. В итоге оперaтивность
aнaлизa возрaстaет во много рaз. Для ИАПД ЭСЭ-мониторинга целесообразно
использовать следующие геоиконические модели.
1.���J�Z�g�]�h�\�u�_���d�Z�j�l�h�]�j�Z�f�f�u. Регионы, относящиеся к одному классу, выводятся
на карту однотипно (одним цветом или одинаковой штриховкой).
2.���D�Z�j�l�h�^�b�Z�]�j�Z�f�f�u �±��карты, отражающие распределение какого-либо явления
посредством диаграмм: линейных и столбчатых, площадных или объемных,
локализованных по единицам территориального деления; обычно используется для
показа абсолютных статистических ЭСЭМ-данных.
3.���:�g�Z�e�b�l�b�q�_�k�d�b�_�� �d�Z�j�l�u�� показывающие не обобщенные или малообобщенные
показатели какого-либо явления.
4.���D�h�f�i�e�_�d�k�g�u�_�� �d�Z�j�l�u, показывающие совместно несколько разных взаимо-
связанных явлений (или несколько свойств одного явления), но каждое в своей системе
показателей.
5.���K�b�g�l�_�l�b�q�_�k�d�b�_�� �d�Z�j�l�u – дают интегральное представление явления в единых
синтетических показателях (обычно отражают типологическое районирование террито-
рии по комплексу показателей), создаются на основе интеграции множества частных
показателей или аналитических и комплексных карт. При их создании применяются
методы факторного, кластерного анализа, главных компонент.
6.���=�_�h�b�d�h�g�b�q�_�k�d�b�_�� �f�h� �̂_�e�b�� �j�_�]�b�h�g�Z�e�v�g�h�c�� �]�_�g�_�j�Z�e�b�a�Z�p�b�b. Пространственный аспект
генерализации связан с отображением формы, размера и положения картографических
объектов, атрибутивный аспект генерализации связан с обобщением количественных и
качественных характеристик, агрегированием территориальных единиц при различных
классификациях.
7.���B�g�l�_�]�j�Z�e�v�g�u�_�� �]�_�h�b�d�h�g�b�q�_�k�d�b�_�� �f�h�^�_�e�b�� �j�_�]�b�h�g�Z�e�v�g�h�]�h�� �Z�g�Z�e�b�a�Z����Интегрированию
показателей в ГИС соответствует логическое сложение их картограмм.
8.���>�b�g�Z�f�b�q�_�k�d�b�_�� �]�_�h�b�d�h�g�b�q�_�k�d�b�_�� �f�h�^�_�e�b учитывают фактор времени,
используются для наглядного представления динамики изменения ЭСЭ-показателей.
Для ГИС-анализа используется топологическая модель территории, когда важ-
ны не картометрические характеристики, а аспекты распределения тематических
признаков (соседство, сочлененность, форма, характер распределения кластеров).
Электронные карты в ГИС являются базами данных, обеспечивающими интерактивное
выполнение информационно-поисковых и аналитических процедур путем непосредствен-
ных указаний на объекты карты.
Рассмотрим последовательно основные этапы ИАПД мониторинга регионов.
Для решения задач каждого этапа предложим соответствующие методы и алгоритмы.
I. Анализ и оптимизация сети мониторинга. Основные методы [2]:
1) статистические (для проверки гипотезы о соответствии сети мониторинга
пространственно случайному точечному процессу используются индексы Морисита,
Фишера, Дэвида-Мура, Дугласа, Ллойда);
2) геометрические (вычисляются геометрические характеристики: а) расстояния
между точками – узлами сети мониторинга; б) площади областей влияния точек; в) мера
нерегулярности сети);
3) геостатистические (кригинг и кокригинг);
�B�g�l�_�e�e�_�d�l�m�Z�e�v�g�u�c���Z�g�Z�e�b�a���i�h�d�Z�a�Z�l�_�e�_�c�«��
«Штучний інтелект» 4’2008 141
2C
�J�Z�k�k�l�h�y�g�b�_�����d�f
62
85 79
49
20
5
0
20
40
60
80
1 2 3 4 5 6
�Q�b�k�e�h���i�Z�j��
178
263 260
169
86
25 9
0
50
100
150
200
250
1 2 3 4 5 6 7�J�Z�k�k�l�h�y�g�b�_�����d�f
�Q�b�k�e�h���i�Z�j��
�l �h�q�_�d
4) кластерные (проверка сети на кластерность, декластеризация);
5) фрактальные (определяется фрактальная размерность сети мониторинга, напри-
мер, методами «счета коробок» и «счета песка в коробке»);
6) интерполяционные (характеристики неравномерности сети вычисляются на
основе коэффициентов, использующихся при линейной интерполяции величины, для
которой предназначена анализируемая сеть);
7) теоретико-графовые (сеть мониторинга представляется в триангулированном
виде, вычисляются параметры центральности, связности и формы графа).
Каждый из методов используется для описания определенных характеристик сети
мониторинга. Исследование сети экологического мониторинга целесообразно прово-
дить, используя последовательно: сначала геометрический, статистический и теоретико-
графовый, затем кластерный, геостатистический и интерполяционный, и, наконец,
фрактальный подходы. Для социально-экономического мониторинга регионов интерпо-
ляционный и фрактальный подходы неактуальны. Целесообразно использовать данные
статистических управлений регионов и Госкомстата [7] по административной сети
территориального деления, «привязывая» экологические показатели.
На рис. 2 приведен пример гистограмм расстояний между региональными цент-
рами в Европе, Украине и Днепропетровской области (геометрический метод). Полу-
ченные гистограммы подобны, присутствие кластеров не наблюдается (рост числа пар с
ростом расстояния указывает на наличие кластеров, равномерный рост означает нали-
чие одного кластера, рост скачками — наличие нескольких кластеров).
Европа dmin= 138 км
dmax= 5177 км
Интервалы
1.��138 – 858
2.��858 – 1578
3.��1578 – 2298
4.��2298 – 3018
5.��3018 – 3738
6.��3738 – 4458
7. 4458 – 5177
Украина
dmin= 70 км
dmax= 1573 км
Интервалы
1.��70 – 321
2.��321–571
3.��571 – 821
4.��821 – 1071
5.��1071 – 1321
6. 1321 – 1573
Днепропет-
ровская
область
dmin= 14 км
dmax= 268 км
Интервалы
1.��14 – 64
2.��64 –114
3.��114 – 163
4.��163 – 213
5.��213 – 268
Рисунок 2 – Пример применения геометрического метода анализа сети мониторинга
(гистограммы расстояний между региональными центрами в Европе,
Украине и Днепропетровской области)
�J�Z�k�k�l�h�y�g�b�_�����d�f
63
77
52
30
9
0
20
40
60
80
1 2 3 4 5
�Q�b�k�e�h���i�Z�j��
Сарычева Л.В.
«Искусственный интеллект» 4’2008 142
2С
II. Разведочный анализ ЭСЭ-показателей.
ЭСЭ-показатели имеют разный диапазон изменений (измерены в различных
шкалах, характеризуют разные свойства и т.д.). Непосредственное использование их
в анализе может привести к тому, что классификацию будут определять показатели,
имеющие наибольший разброс значений. Поэтому применяются следующие виды
стандартизации: 1) «Z-шкалы», 2) «разброс от 0 до 1», 3) «максимум – 1», 4) «сред-
нее – 1», 5) «стандартное отклонение – 1», 6) «разброс от –1 до 1», 7) центрирование
и масштабирование на среднее значение и другие [2].
В геоинформационной системе (ГИС) проводится классификация регионов по
одному, двум (например, рождаемость – смертность, объемы экспорта – импорта и др.)
показателям ЭСЭ-мониторинга и строятся ранговые картограммы. При их построении
используются следующие схемы классификации: 1) естественная разбивка, 2) равные
интервалы, 3) квантиль, 4) стандартное отклонение (основные схемы классификации в
ГИС, их достоинства и недостатки, а также соответствующие им алгоритмы приведены в
работах [8], [9]). Они позволяют отобразить, например, 20 % регионов с наилучшими (или
наихудшими) значениями ЭСЭ-показателя (схема квантиль, 5 классов) или регионы со
значением показателей, отличающимися от соответствующего среднего не более, чем на
половину стандартного отклонения.
Для выделения регионов с заданными свойствами ЭСЭ-показателей используется в
ГИС блок статистического анализа свойств отдельного атрибута и блок логических
операций. Например, в рамках тематического сюжета «смертность + рождаемость +
индекс продолжительности жизни (рассчитанный по методике ПРООН)», вычисляются
средние значения показателей.
Они используются для составления логических выражений вида
([H1994]<12)and([P1994]>14.5)and([P1997]>15), позволяющих задавать диапазоны
изменения ЭСЭ-показателей (H1994, P1994, P1997 – названия атрибутов).
Рисунок 3 – Выделение в ГИС регионов, по которым в 1991 – 2000 гг.
показатель «Количество умерших (всего, на 1000 населения)» выше среднего
значения по Украине (цифра – индекс продолжительности жизни, 2000)
�B�g�l�_�e�e�_�d�l�m�Z�e�v�g�u�c���Z�g�Z�e�b�a���i�h�d�Z�a�Z�l�_�e�_�c�«��
«Штучний інтелект» 4’2008 143
2C
C помощью ГИС-анализа выделяются регионы, по которым в 1991 – 2000 гг.
показатель «Количество умерших (всего, на 1000 имеющегося населения)» выше средне-
го значения по Украине (рис. 3). В результате – заслуживающая внимания ЛПР картина:
10 выделенных регионов (Киевская, Черниговская, Сумская, Харьковская, Полтавская,
Кировоградская, Черкасская, Житомирская, Винницкая, Хмельницкая области) образуют
единое «пятно» на карте Украины. Индекс продолжительности жизни для этих регионов
не является худшим (в Донецкой, Днепропетровской, Луганской, Запорожской, Нико-
лаевской, Херсонской областях он хуже). Можно предположить, что такая картина рас-
пределения показателя смертности связана с Чернобыльской трагедией.
Одновременный анализ ранговых картограмм (с сопоставимыми градациями) в
последовательные моменты времени дает представление о динамике процесса
изменения ЭСЭ-показателя.
Например, анализ картограмм заработной платы по регионам Украины за
1995 – 2000 гг. свидетельствует о расслоении общества (регионов). Палитра карты
1995 года пестрит разнообразием цветов, число регионов, окрашенных в разные
цвета (из 5-ти градаций), приблизительно одно и то же. Карты последующих лет
постепенно теряют пестроту, приобретая оттенки двух градаций, а карта 2000 года
окрашена преимущественно в два цвета, соответствующие градациям больших и
малых значений заработной платы, регионов с остальными тремя градациями мало.
При анализе нескольких временных ранговых картограмм одного показателя
проводится сравнительный анализ различных картограмм и поиск пространственных
аналогов, выделяются региональные зоны. Создаются геоиконические модели «ре-
гиональной генерализации» [6], получаемые путем сравнительного анализа различ-
ных картограмм и поиска пространственных аналогов (рис. 4).
Рисунок 4 – Объединение зон при создании геоиконической модели региональной
генерализации
На рис. 5 представлены примеры анализа тематического сюжета «Рождаемость и
смертность населения регионов Украины, 2000». Отчетливо видны тренды, присутству-
ющие в распределении показателей рождаемость (рис. 5а) и смертность (рис. 5б).
Каждая вертикальная линия на этих графиках представляет местоположение региона
и значение соответствующего показателя (начало координат – на юго-западе). При
проектировании на перпендикулярные плоскости видны диаграммы рассеяния и
линии регрессии. Рождаемость уменьшается, а смертность населения возрастает в
направлении с запада на восток. Оба эти показателя увеличиваются в направлении с
юга на север.
Сарычева Л.В.
«Искусственный интеллект» 4’2008 144
2С
Рисунок 5 – Фрагменты пространственного анализа показателей рождаемости (а)
и смертности (б) населения регионов Украины, 2000
Мониторинг временных изменений одного ЭСЭ-показателя отображается (на
картограмме показателя за последний наблюдаемый год) с помощью картодиаграм-
мы – для каждого региона строятся диаграммы значений показателя за этот год и
несколько предыдущих.
Пары показателей анализируются с помощью диаграмм рассеяния. Далее применя-
ются методы: главных компонент, корреляционный, факторный, дисперсионный анализ
показателей [10]. Выбираются показатели для дальнейшего анализа.
III. С помощью многомерного регрессионного анализа и метода группового
учета аргументов (МГУА) [11], [12] находятся модели зависимостей между
исследуемыми показателями. Применение алгоритмов МГУА обусловлено тем,
что задачи моделирования поставлены в условиях структурной неопределенности по
количеству и составу входных переменных в моделях.
Если результаты моделирования неудовлетворительны, то проводится кластериза-
ция регионов по исследуемому набору показателей и строятся многомерные модели для
каждого кластера отдельно. Визуализация результатов кластеризации и регрессионного
анализа проводится в ГИС в виде одной карты «ранговая картограмма классов + карто-
диаграмма со значениями ошибок, коэффициента детерминации, выходов регрес-
сионной модели».
IV. Обнаружение пространственной автокорреляции (подобие значений
показателей в соседних регионах) с помощью построения диаграммы рассеяния
(на вертикальной оси – значения показателей данного региона, а на горизонталь-
ной – средние значения соответствующих показателей в смежных регионах).
Геостатистический анализ (построение пространственных вариограмм показателей в
ГИС и пространственно-временных вариограмм) [13]. Обнаружение автокорреляции
в регрессионных «остатках»��
Анализируя типичные облака вариограмм ЭСЭ-показателей и соответствующие
модели вариограмм, примеры которых показаны на рис. 6, заметим, что пары точек (точ-
ки имеют координаты центров регионов), расположенные близко друг к другу (точки в
начале оси ОХ), имеют сходные значения (низкие значения на оси ОУ). Наблюдается
также постепенное уменьшение пространственной автокорреляции (соответственно, уве-
личение дисперсии) до некоторого расстояния (радиуса влияния), за пределами которого
автокорреляция равна нулю. Радиус влияния используется для определения области
влияния – совокупности регионов-соседей данного региона.
V. Кластеризация��регионов по совокупности ЭСЭ-показателей (или по
«остаткам» лучших регрессионных моделей) с применением алгоритма GEOTIME [14]
для пространственно-временных данных. Для оценки качества кластеризации
используются внешние критерии МГУА [15]. Просмотр результатов в ГИС, создание
синтетических карт [6].
а б
�B�g�l�_�e�e�_�d�l�m�Z�e�v�g�u�c���Z�g�Z�e�b�a���i�h�d�Z�a�Z�l�_�e�_�c�«��
«Штучний інтелект» 4’2008 145
2C
Рисунок 6 – Моделирование вариограммы показателя «Валова додана вартість на
душу населення України, 1997 – 2000» (экспоненциальная модель)
Важным в задачах ранжирования, распознавания и в кластерном анализе является
выбор меры сходства (между объектами, между объектом и кластером, между кла-
стерами, между кластеризациями, между признаками объектов), от которого решающим
образом зависит окончательный вариант разбиения объектов на классы при заданном
алгоритме разбиения. В каждой конкретной задаче этот выбор производится с учетом
главных целей исследования. Основные меры сходства представлены в работе [15].
Рисунок 7 – Кластеризация регионов Украины по совокупности показателей,
влияющих на формирование небезопасных геологических явлений, 2003 г.
Пример использования (для районирования территории Украины) кластеризации
регионов по совокупности 9-ти показателей, влияющих на формирование небезопасных
геологических явлений (производство промышленной продукции на душу населения,
грн.; объем забора воды с поверхностных источников, млн куб. м; объем забора воды
с подземных источников, млн куб. м; объем сброса оборотных вод, млн куб. м; лесис-
�H�^�_�k�v�d�Z
�D�b�€�\�k�v�d�Z
�K�m�f�k�v�d�Z
�O�Z�j�d�•�\�k�v�d�Z
�Q�_�j�g�•�]�•�\�k�v�d�Z
�>�h�g�_�p�v�d�Z
�E�m�]�Z�g�k�v�d�Z�<�•�g�g�b�p�v�d�Z
�I�h�e�l�Z�\�k�v�d�Z
�A�Z�i�h�j�•�a�v�d�Z
�E�v�\�•�\�k�v�d�Z
�@�b�l�h�f�b�j�k�v�d�Z
�O�_�j�k�h�g�k�v�d�Z
�Q�_�j�d�Z�k�v�d�Z
�<�h�e�b�g�k�v�d�Z
�J�•�\�g�_�g�k�v�d�Z
�>�g�•�i�j�h�i�_�l�j�h�\�k�v�d�Z
�F�b�d�h�e�Z�€�\�k�v�d�Z
�D�•�j�h�\�h�]�j�Z�^�k�v�d�Z
�O�f�_�e�v�g�b�p�v�d�Z�L�_�j�g�h�i�•�e�v�k�v�d�Z
�A�Z�d�Z�j�i�Z�l�k�v�d�Z
�:�\�l�h�g�h�f�g�Z���j�_�k�i�m�[�e�•�d�Z���D�j�b�f
�1�\�Z�g�h���N�j�Z�g�d�•�\�k�v�d�Z
�Q�_�j�g�•�\�_�p�v�d�Z
�D�b�€�\
�K�_�\�Z�k�l�h�i�h�e�v
Сарычева Л.В.
«Искусственный интеллект» 4’2008 146
2С
тость региона, %; площадь сдвигов, кв. км; площадь распространения пород, склонных
к проседанию, кв. км; площадь, пораженная овражной эрозией, кв. км; площадь рас-
пространения карстовых явлений, кв. км, 2003 г.) приведен на рис. 7.
Выделяются шесть территориальных зон: 1) Донецкая + Луганская, 2) Днепро-
петровская + Запорожская, 3) АР Крым, 4) Закарпатская + Ивано-Франковская + Черно-
вицкая, 5) Киевская + Полтавская + Харьковская + Кировоградская + Винницкая +
+ Николаевская + Одесская + Херсонская, 6) остальные 9 областей.
VI. Ранжирование регионов по степени близости к заданному одному региону
или заданной совокупности регионов. Задание эталонных классов и распознавание «с
учителем». При распознавании «с учителем» в ГИС выполняются два типа процедур:
оценивание сходства между географическими объектами слоя и набором эталонных
объектов при заданном множестве атрибутивных свойств (с выбором оптимального
подмножества); распознавание пространственно координированных объектов в слое
по выборке эталонных объектов нескольких классов при заданном множестве
атрибутивных свойств (с выбором оптимального подмножества).
VII. Обнаружение пространственно-временных аномалий.
Строгого математического определения аномалии регионального развития и
границы области устойчивости для ЭСЭ-показателей не существует, хотя для некоторых
показателей известны диапазоны изменения значений. Аномалиям временных тенденций
развития соответствует значительный постоянный рост или спад ЭСЭ-показателей
региона-аномалии, а многомерным аномалиям в рамках выбранного тематического
сюжета соответствуют полярные «хвосты» распределений. Подразумевается, что ано-
малии могут быть как положительные, так и отрицательные.
Методы и алгоритмы выделения аномалий регионального развития охватывают
подходы: а) на основе применения кластерного анализа, б) поляризации, в) анализа
регрессионных остатков, г) адаптивности и разнообразия, д) мер сходства между
объектом и классом [2]. Выделяются аномалии тенденций временного развития и
аномалии в рамках заданного тематического сюжета.
В случае короткого временного интервала вычисляются скорости и ускорения
ЭСЭ-показателей, а затем проводится трехмерная (показатель + скорость + ускоре-
ние) классификация в ГИС. На одной геоиконической модели можно отразить теку-
щее значение, скорость и ускорение ЭСЭ-показателя и оперативно провести их
анализ (например, выявить регионы с низким уровнем финансового благополучия,
которое к тому же еще и снижается, причем наиболее быстрыми темпами). В резуль-
тате получается интегральная характеристика, учитывающая не только величину
самого показателя, но и его динамические характеристики – первую и вторую произ-
водные по времени.
Для анализа длинных временных рядов наряду с традиционными используется
метод, основанный на выделении «периферийных» регионов. При обнаружении
пространственных аномалий анализируется синтетическая карта «экстремумы» [6].
VIII. Прогнозирование. Для прогнозирования значений ЭСЭ-показателей исполь-
зуется алгоритм структурной идентификации [16], основанный на МГУА, с выбором
набора показателей.
МГУА позволяет получать модели с наилучшими прогнозирующими свойст-
вами, так как направлен на выбор моделей, уменьшающих ошибку прогнозирования:
в простейшем случае выборка делится на две части, на одной из которых генери-
руется множество моделей, а на второй вычисляется ошибка каждой модели и
выбирается та, которая лучше работает «в режиме прогнозирования».
�B�g�l�_�e�e�_�d�l�m�Z�e�v�g�u�c���Z�g�Z�e�b�a���i�h�d�Z�a�Z�l�_�e�_�c�«��
«Штучний інтелект» 4’2008 147
2C
Для прогнозирования показателей, имеющих пространственную привязку, пред-
ставляется целесообразным учитывать тот факт, что географически близко располо-
женные объекты являются более похожими друг на друга, чем расположенные на
большом расстоянии (для объектов с экологическими показателями это очевидно). Этот
факт можно учитывать двумя способами: 1) на этапе генерации структур непосредствен-
ным введением в модель в качестве переменных географических координат; 2) на этапе
задания критерия и выбора оптимальной модели.
В процессе ИАПД ЭСЭ-мониторинга конечный выбор технологической цепочки
применяемых методов зависит от конкретных данных мониторинга, целевых установок
и опыта исследователя. Но при этом исследователь может воспользоваться приведенной
последовательностью (I – VIII) этапов и предложенными методами, отражая промежу-
точные результаты в ГИС для пространственного анализа.
Процедуры извлечения из ЭСЭМ-данных новых знаний на основе ГИС-
анализа, ИАД и геоиконического моделирования следующие.
1.��Региональная генерализация границ на основе ранговых картограмм, регио-
нальная генерализация границ на основе оверлея полигонов.
2.��Выявление закономерностей территориального распределения многомерных
аномалий.
3.��Комплексный анализ ЭСЭ-развития регионов на базе синтеза и агрегирования в
ГИС результатов статистической отчетности.
4.��Обнаружение пространственных взаимосвязей между разнородными
ЭСЭ-показателями с помощью сравнительного анализа ранговых картограмм.
5.��Сопоставление региональных многомерных регрессионных моделей зависи-
мостей между ЭСЭ-показателями и результатов геоиконического моделирования
остатков регрессионных моделей, нахождение объяснения остаткам и уточнение
модели.
6.��Выявление тенденций динамики изменений региональных ЭСЭ-показа-
телей и т.д.
Выводы
Классифицированы задачи интеллектуального анализа ЭСЭМ-данных. Дана
сравнительная характеристика ИАД и ИАПД по целям, методам и способам визуа-
лизации результатов.
Изложены особенности применения ГИС для задач ЭСЭМ, методы и средства ГИС-
анализа пространственно распределенной ЭСЭ-информации. Классифицированы гео-
иконические модели для ИАПД ЭСЭ-показателей. Рассмотрены основные этапы ИАПД
мониторинга регионов. На реальных данных показано, что применение ИАПД и
ГИС-технологий позволяет уточнять первичные ЭСЭМ-данные и получать новую
информацию, которая обычно не учитывается официальной статистикой.
Предложены процедуры извлечения из ЭСЭМ-данных новых знаний на основе
ГИС-анализа, ИАД и геоиконического моделирования.
Эффективность ГИС-анализа при решении задач устойчивого развития может
быть повышена за счет новейших аналитических, графических и анимационных
возможностей ГИС будущих поколений. Требуется привлечение новых методов
многомерного анализа пространственных данных, поддержка интерактивного управ-
ления картографикой и обеспечение подсветки анализируемых объектов во всех
открытых окнах: картографических, графических и табличных.
Сарычева Л.В.
«Искусственный интеллект» 4’2008 148
2С
В идеале – полученная из разных источников ЭСЭ-информация в реальном
масштабе времени в компьютерной сети в интерактивном режиме синтезируется,
преобразуется в «разумное изображение», гипергеоиконическую модель, которая
наглядно отображает свойства изучаемых многомерных данных ЭСЭ-мониторинга
для задач регулирования УР.
Литература
1.�� Дюк В., Самойленко А. Data Mining: Учебный курс. – СПб.: Питер, 2001. – 368 с.
2.�� Сарычева Л.В. Компьютерный эколого-социально-экономический мониторинг регионов. Математи-
ческое обеспечение: Монография. – Днепропетровск: НГУ, 2003. – 222 с.
3.�� ДеМерс, Майкл Н. Географические Информационные Системы. Основы: Пер. с англ. – М.:
Дата+, 1999. – 490 с.
4.�� Worrall L. The role of GIS-based spatial analysis in strategic management in local government //
Comput., Environ, and Urban Syst. – 1994. – 18, № 5. – P. 323-332.
5.�� ГИС-технологии в управлении территориальным развитием // [Электронный ресурс]. – Режим
доступа: http://www.ecomm.kiev.ua/gis/index.htm
6.�� Сарычева Л.В. Компьютерный эколого-социально-экономический мониторинг регионов. Гео-
информационное обеспечение: Монография. – Днепропетровск: НГУ, 2003. – 174 с.
7.�� Державний комітет статистики України // [Електронний ресурс]. – Режим доступа: http://www.ukrstat.gov.ua
8.�� Энди Митчелл. Руководство по ГИС анализу. – Часть 1: Пространственные модели и взаимосвязи:
Пер. с англ.– Киев: ЗАО ЕСОММ Со., Стилос, 2000. – 198 с.
9.�� Саричева Л.В., Качанов О.В. Схеми класифікації регіонів за показниками еколого-соціально-
економічного моніторингу в геоінформаційній системі. Геоінформатика. – 2002. – № 4. – С. 53-63.
10.��Айвазян С.А., Енюков, И.С, Мешалкин Л.Д. Прикладная статистика. Исследование зависимостей. –
М.: Финансы и статистика, 1985. – 488 с.
11.��Ивахненко А.Г., Юрачковский Ю.П. Моделирование сложных систем по экспериментальным
данным. – М.: Радио и связь, 1987. – 120 с.
12.��Sarycheva L.V. Using GMDH in Ecological and Socio-economical Monitoring Problems // Systems
Analysis and Modelling Simulation. – 2003. – Vol. 43, № 10. – P. 1409-1414.
13.�� Geostatistical Software Tool // [Электронный ресурс]. – Режим доступа: http://www.vl-maltsev.narod.ru
/gst/gst.html
14.��Сарычева Л.В. Пространственно-временной подход в задачах кластеризации // Штучний інтелект. –
2006. – № 3. – С. 646-653.
15.��Сарычева Л.В. Объективный кластерный анализ данных на основе МГУА // Проблемы управ-
ления и информатики. – 2008. – № 2. – С. 86-104.
16.��Сарычева Л.В. Прогнозирование в задачах эколого-социально-экономического-мониторинга
регионов // Моделювання та інформатизація соціально-економічного розвитку України: Зб. наук.
пр.– К.: ДНДІІМЕ, 2003. – № 3. – С. 147-165.
�E���<�����K�Z�j�b�q�_�\�Z
Інтелектуальний аналіз показників еколого-соціально-економічного моніторингу регіонів
Виділені основні класи завдач інтелектуального аналізу просторових даних еколого-соціально-
економічного моніторингу, запропоновані методи і алгоритми їх розв’язання. На реальних показниках
моніторингу регіонів України розглянуті приклади генерування нових знань за допомогою
геоіконічного моделювання в геоінформаційній системі.
�/�����6�D�U�\�F�K�H�Y�D����
The Intelligence Analysis of Parameters Ecological-Socio-Economic Monitoring of the Regions
The basic classes of the intelligence analysis tasks of the spatial data of ecology-socio-economic monitoring
are extracted, the methods and algorithms of their solving are offered. The examples of new knowledge
generation using geoiconic simulation in a geoinformation system are surveyed with usage of actual
parameters of Ukraine regions monitoring.
�K�l�Z�l�v�y���i�h�k�l�m�i�b�e�Z���\���j�_�^�Z�d�p�b�x��������������������������
|
| id | nasplib_isofts_kiev_ua-123456789-7379 |
| institution | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| issn | 1561-5359 |
| language | Russian |
| last_indexed | 2025-12-07T16:22:18Z |
| publishDate | 2008 |
| publisher | Інститут проблем штучного інтелекту МОН України та НАН України |
| record_format | dspace |
| spelling | Сарычева, Л.В. 2010-03-29T13:04:42Z 2010-03-29T13:04:42Z 2008 Интеллектуальный анализ показателей эколого-социально-экономического мониторинга регионов / Л.В. Сарычева // Штучний інтелект. — 2008. — № 4. — С. 137-148. — Бібліогр.: 16 назв. — рос. 1561-5359 https://nasplib.isofts.kiev.ua/handle/123456789/7379 681.3:519.711:004.8 Выделены основные классы задач интеллектуального анализа пространственных данных эколого-социально- экономического мониторинга, предложены методы и алгоритмы их решения. На реальных показателях мониторинга регионов Украины рассмотрены примеры генерирования новых знаний с помощью геоиконического моделирования в геоинформационной системе. Виділені основні класи завдач інтелектуального аналізу просторових даних еколого-соціально- економічного моніторингу, запропоновані методи і алгоритми їх розв’язання. На реальних показниках моніторингу регіонів України розглянуті приклади генерування нових знань за допомогою геоіконічного моделювання в геоінформаційній системі. The basic classes of the intelligence analysis tasks of the spatial data of ecology-socio-economic monitoring are extracted, the methods and algorithms of their solving are offered. The examples of new knowledge generation using geoiconic simulation in a geoinformation system are surveyed with usage of actual parameters of Ukraine regions monitoring. ru Інститут проблем штучного інтелекту МОН України та НАН України Прикладные интеллектуальные системы Интеллектуальный анализ показателей эколого-социально-экономического мониторинга регионов Інтелектуальний аналіз показників еколого-соціально-економічного моніторингу регіонів The Intelligence Analysis of Parameters Ecological-Socio-Economic Monitoring of the Regions Article published earlier |
| spellingShingle | Интеллектуальный анализ показателей эколого-социально-экономического мониторинга регионов Сарычева, Л.В. Прикладные интеллектуальные системы |
| title | Интеллектуальный анализ показателей эколого-социально-экономического мониторинга регионов |
| title_alt | Інтелектуальний аналіз показників еколого-соціально-економічного моніторингу регіонів The Intelligence Analysis of Parameters Ecological-Socio-Economic Monitoring of the Regions |
| title_full | Интеллектуальный анализ показателей эколого-социально-экономического мониторинга регионов |
| title_fullStr | Интеллектуальный анализ показателей эколого-социально-экономического мониторинга регионов |
| title_full_unstemmed | Интеллектуальный анализ показателей эколого-социально-экономического мониторинга регионов |
| title_short | Интеллектуальный анализ показателей эколого-социально-экономического мониторинга регионов |
| title_sort | интеллектуальный анализ показателей эколого-социально-экономического мониторинга регионов |
| topic | Прикладные интеллектуальные системы |
| topic_facet | Прикладные интеллектуальные системы |
| url | https://nasplib.isofts.kiev.ua/handle/123456789/7379 |
| work_keys_str_mv | AT saryčevalv intellektualʹnyianalizpokazateleiékologosocialʹnoékonomičeskogomonitoringaregionov AT saryčevalv íntelektualʹniianalízpokaznikívekologosocíalʹnoekonomíčnogomonítoringuregíonív AT saryčevalv theintelligenceanalysisofparametersecologicalsocioeconomicmonitoringoftheregions |