Применение методов интеллектуального анализа данных при оценке развития Украины

Показана возможность применения методов интеллектуального анализа данных (ИАД), отличающихся высоким уровнем понимания информации, для изучения социально-экономического развития стран мира. В качестве исходной информации использована для анализа база данных Программы развития ООН. Построена модель р...

Повний опис

Збережено в:
Бібліографічні деталі
Опубліковано в: :Геотехнічна механіка
Дата:2013
Автори: Аверин, Г.В., Звягинцева, А.В.
Формат: Стаття
Мова:Російська
Опубліковано: Інститут геотехнічної механіки імені М.С. Полякова НАН України 2013
Онлайн доступ:https://nasplib.isofts.kiev.ua/handle/123456789/87405
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Применение методов интеллектуального анализа данных при оценке развития Украины / Г.В. Аверин, А.В. Звягинцева // Геотехническая механика: Межвед. сб. науч. тр. — Днепропетровск: ИГТМ НАНУ, 2013. — Вип. 112. — С. 242-255. — Бібліогр.: 2 назв. — рос.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1859587272940191744
author Аверин, Г.В.
Звягинцева, А.В.
author_facet Аверин, Г.В.
Звягинцева, А.В.
citation_txt Применение методов интеллектуального анализа данных при оценке развития Украины / Г.В. Аверин, А.В. Звягинцева // Геотехническая механика: Межвед. сб. науч. тр. — Днепропетровск: ИГТМ НАНУ, 2013. — Вип. 112. — С. 242-255. — Бібліогр.: 2 назв. — рос.
collection DSpace DC
container_title Геотехнічна механіка
description Показана возможность применения методов интеллектуального анализа данных (ИАД), отличающихся высоким уровнем понимания информации, для изучения социально-экономического развития стран мира. В качестве исходной информации использована для анализа база данных Программы развития ООН. Построена модель развития стран мира на основе применения метода многомерного шкалирования по атрибутивным индикаторам системы и алгоритмов ИАД для вычисления статистической вероятности распределения наблюдаемых в совокупности показателей развития стран. Предложен метод определения энтропии и потенциала развития объектов. Проведены вычислительные эксперименты и определены ранги развития стран мира, а также ранги темпов развития. Выполнена оценка развития Украины по сравнению с основными странами мира. Полученные результаты могут быть использованы при стратегическом прогнозировании и планировании развития страны. Показана можливість застосування методів інтелектуального аналізу даних (ІАД), які відрізняються високим рівнем розуміння інформації, для вивчення соціально-економічного розвитку країн світу. В якості вихідної інформації використана для аналізу база даних Програми розвитку ООН. Побудована модель розвитку країн світу на основі застосування методу багатовимірного шкалювання за атрибутивними індикаторами системи та алгоритмів ІАД для обчислення статистичної ймовірності розподілу спостережуваних в сукупності показників розвитку країн. Запропоновано метод визначення ентропії та потенціалу розвитку об'єктів. Проведено обчислювальні експерименти і визначено ранги розвитку країн світу, а також ранги темпів розвитку. Виконана оцінка розвитку України в порівнянні з основними країнами світу. Отримані результати можуть бути використані при стратегічному прогнозуванні та плануванні розвитку України. The possibility of applying data mining techniques (DM) is shown that differs by a high level of understanding of information for the study of the socio-economic development of countries. As the initial information the database of the United Nations Development Program was used for the analyzes. A model of countries' development was built using the method of multidimensional scaling on attribute indicators of the system and application of DM algorithms to calculate the statistical probability distribution of observed in the set of indicators of countries' development. A method for determining the entropy and potential of the development of objects was proposed. Computational experiments were carried out and countries' development ranks were determined as well as the ranks of the pace of development. The evaluation of the development of Ukraine was carried out in comparison with the major countries of the world. The results obtained can be used for strategic planning and forecasting of the development of Ukraine.
first_indexed 2025-11-27T11:19:50Z
format Article
fulltext ISSN 1607-4556 (Print), ISSN 2309-6004 (Online) Геотехнічна механіка. 2013. №112 ______________________________________________________________________________________________  242 methane concentration in the outgoing air stream flowing from the coal face. Level and dynamics of the methane concentration adequately characterize the fact of implementetion of and duration of the outburst prevention measures, and application of appropriate sensors automates monitoring of their implementation. The experimental results support a conclusion that gas content in the coal seam is one of the informative indicators of effectiveness of the outburst prevention measure implementation. Keywords: coal seam, outburst, gas emission, working, methaneconcentration. Cтатья поступила в редакцию 20.08.2013 Рекомендовано к публикации д-ром техн. наук Т.В. Бунько УДК 303.732.4:332.1 Г.В. Аверин, д-р техн. наук, профессор, А.В. Звягинцева, канд. техн. наук, доцент (ГВУЗ «ДонНТУ») ПРИМЕНЕНИЕ МЕТОДОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ ПРИ ОЦЕНКЕ РАЗВИТИЯ УКРАИНЫ Г.В. Аверін, д-р техн. наук, професор, Г.В. Звягінцева, канд. техн. наук, доцент (ДВНЗ «ДонНТУ») ЗАСТОСУВАННЯ МЕТОДІВ ИНТЕЛЕКТУАЛЬНОГО АНАЛІЗУ ДАНИХ ПРИ ОЦІНЦІ РОЗВИТКУ УКРАЇНИ G.V. Averin, D. Sc. (Tech.), Professor, A.V. Zviyagintseva, Ph.D. (Tech.), Associate Professor (Donetsk National Technical University) APPLICATION OF DATA MINING TECHNIQUES FOR THE ASSESSMENT OF UKRAINE DEVELOPMENT Аннотация. Показана возможность применения методов интеллектуального анализа данных (ИАД), отличающихся высоким уровнем понимания информации, для изучения со- циально-экономического развития стран мира. В качестве исходной информации использо- вана для анализа база данных Программы развития ООН. Построена модель развития стран мира на основе применения метода многомерного шкалирования по атрибутивным индика- торам системы и алгоритмов ИАД для вычисления статистической вероятности распределе- ния наблюдаемых в совокупности показателей развития стран. Предложен метод определе- ния энтропии и потенциала развития объектов. Проведены вычислительные эксперименты и определены ранги развития стран мира, а также ранги темпов развития. Выполнена оценка развития Украины по сравнению с основными странами мира. Полученные результаты могут быть использованы при стратегическом прогнозировании и планировании развития страны. Ключевые слова: интеллектуальный анализ данных, модели развития стран, стратегиче- ская оценка, ранги стран мира, темпы развития Украины. © Г.В. Аверин, А.В. Звягинцева, 2013 ISSN 1607-4556 (Print), ISSN 2309-6004 (Online) Геотехнічна механіка. 2013. №112 ________________________________________________________________________________________________  243 В настоящее время поиск закономерностей развития стран связывают с гло- балистикой, прогностикой и другими междисциплинарными научными направ- лениями, изучающими развитие общества. Глобалистика выявляет сущность, тенденции и причины процессов глобализации, а также анализирует последст- вия глобальных процессов для человека и биосферы. Прогностика представля- ется как наука для предсказания будущего. Практическим результатом данных областей знаний являются научные методы стратегического прогнозирования и планирования. Сегодня во многих странах растет понимание того, что страте- гическое планирование и национальная безопасность неразрывно связаны меж- ду собой, и эти составляющие государственной политики должны быть направ- лены на достижение долгосрочных целей, которые определяли бы место страны в бурно меняющемся мире XXI века. Однако реализация такой политики не мыслима без эффективной системы стратегического прогнозирования. Теоре- тические работы прогностики в области политических, экономических и эколо- гических наук, а также в области глобальных исследований (Global studies) часто сводятся к гипотезам и обобщениям, оторванным от реальной статистической базы и систематического изучения фактов. В области теоретических исследований существует несколько проблем, ко- торые не позволяют многочисленным научным обобщениям превратиться в общепринятые теории. Во-первых, не редко изначально формулируются проти- воречивые и явно непознаваемые теоретические концепции. «Прогнозировать будущее можно только из будущего» – данная идея, которая претендует на но- вую парадигму прогнозирования и особую методологию познания [1], вряд ли может быть подтверждена или опровергнута на данном этапе науки и практики. Во-вторых, очень часто теоретические гипотезы высказываются на основе «озарений» и поверхностного обобщения данных, при этом современные мето- ды анализа информации не используются, а результаты не проверяются на мас- сивах информации. Все это приводит к «валу» частных и противоречивых мо- делей или, вообще, к множеству различных качественных описаний общест- венных процессов и явлений, которые не могут быть обобщены. В-третьих, уже почти пятнадцать лет существуют обширные и общедоступные базы данных о развитии стран и регионов мира, и только в последние годы наметился явный интерес исследователей к данной информации. Как следствие, научных прогнозов развития мира, при составлении которых задействованы коллективы исследователей, не так уж и много. Среди них сле- дует выделить модель Форрестера, модель Месаровича-Пестеля, прогноз PricewaterhouseCoopers «Мир в 2050 году», долгосрочную модель развития энергетики и состояния окружающей среды ЕС-VLEEM, прогноз Дж. Ф. Коутса «2025: Сценарии развития США и мирового сообщества под воздействием нау- ки и технологий», прогнозы глобальных климатических и экологических изме- нений и т.д. Время обычно показывает низкую достоверность таких прогнозов, ISSN 1607-4556 (Print), ISSN 2309-6004 (Online) Геотехнічна механіка. 2013. №112 ______________________________________________________________________________________________  244 однако они имеют большое значение для развития методологии прогнозирова- ния в области изучения глобальных процессов. Следует признать, что в настоящее время не существует фундаментальной теории, которая характеризовала бы социально-экономическое развитие и эко- логические изменения стран и регионов, а тем более мира в целом. Современ- ная наука должна дать лицам, принимающим решения, понимание закономер- ностей развития общества и предложить новую парадигму прогностики. Мето- дология фундаментальной теории может быть сформулирована только на осно- ве использования объективного подхода, проведения междисциплинарных ис- следований и установления количественных закономерностей. Решение данной задачи возможно с помощью методов интеллектуального анализа данных (ИАД) – области науки, которая бурно развивается. Сегодня анализ данных социально-экономического развития стран и регио- нов мира не мыслим без использования методов ИАД. В этой области при изу- чении процессов и объектов исследователь оперирует массивами данных, кото- рые содержат сотни статистических показателей. Современная карта мира включает около 200 стран, многие из которых имеют административное деле- ние на десятки регионов, республик, областей, округов, районов, штатов, про- винций, земель и т.д. В свою очередь, ретроспективная глубина данных может составлять десятки лет по каждому объекту с разбивкой на кварталы и даже ме- сяцы. Известно, что процесс обобщения результатов наблюдений является пер- вым этапом в построении любой теории. Современные инструменты для анали- за, статистической обработки и визуализации подобных массивов информации имеются пока только в ИАД. В этой области могут лежать ответы на многие ак- туальные вопросы о путях развития мирового сообщества и его будущего. Постановка задачи. Цель статьи – показать возможности применения ме- тодов ИАД для изучения социально-экономического развития стран мира. Это одна из актуальных задач прогностики в области глобальных исследований. В качестве исходной информации использована для анализа база данных Программы развития ООН (http://hdr.undp.org/en/data). База данных Програм- мы развития ООН (ПРООН) включает статистические таблицы данных почти по 100 странам в период 1975 – 1980 годов и по 187 странам в период 2011 – 2013 годов. База данных содержит около 100 индикаторов, по которым опреде- ляются несколько индексов, характеризующих различные аспекты человече- ского развития, в том числе и индекс человеческого развития (ИЧР). На Web- сайте организации предоставлены инструменты визуализации и работы с дан- ными для чаще всего используемых индикаторов (около 50). Пользователь мо- жет создавать свои таблицы и конвертировать их в Excel формат. База данных уже несколько лет находится в открытом доступе. Информация ПРООН не является абсолютно полной. Например, данные по детской смертности в возрасте до 5 лет приведены для 1970, 1980, 1990, 2000, 2005, 2007–2009 годов. Данные для удельного потребления энергии странами представ- лены только для 1980 и 2003 годов. Однако большинство показателей стран ме- http://hdr.undp.org/en/data� ISSN 1607-4556 (Print), ISSN 2309-6004 (Online) Геотехнічна механіка. 2013. №112 ________________________________________________________________________________________________  245 няется достаточно медленно. К примеру, детская смертность в Украине с 1970 по 2010 годы изменилась с 34 до 13 смертей на 1 тысячу живорожденных (в целом по миру в среднем она снизилась с 146 до 75 смертей). В свою очередь, младен- ческая смертность в Украине с 1970 по 2010 год снизилась с 22 до 11 смертей на одну тысячу живорожденных, а потребление энергии в целом по миру с 1980 по 2003 год в среднем возросло с 1573 до 2490 кВтч на душу населения. Анализ показывает, что за 30 – 40 лет для большинства показателей стран мира наблю- даются изменения значений в среднем не более, чем в 1,5 – 2,5 раза. С 2000 го- да информация по основным индикаторам развития является достаточно пол- ной, позволяющей применить методы интеллектуального анализа данных. Построение модели системы. В качестве атрибутов системы выберем при- нятые при расчете ИЧР показатели: ожидаемую продолжительность жизни ( )1ρ , уровень грамотности населения ( )2ρ , коэффициент охвата населения средним и высшим образованием ( )3ρ , ВВП страны в пересчете по ППС ( )4ρ , а также дополнительно долю городского населения ( )5ρ . Первые четыре показа- теля входят в методику ПРООН как атрибутивные переменные. Для анализа данных используем метод многомерного шкалирования по ин- дикаторам системы. Процесс шкалирования предполагает построение шкал аб- солютного индекса развития системы и эмпирических индексов развития: n n n aaT ξξξ ρρρ ρρρ ⋅⋅⋅⋅= ⋅⋅⋅ ⋅⋅⋅ ⋅= ... ... ... 21 2010 21 , * * 0 * j j j j bbt ξ ρ ρ ⋅=⋅= . (1) Здесь T – абсолютный индекс развития системы; jt – эмпирические индексы развития; a , b – постоянные шкалирования; kρ – геометрическая вероятность распределения некоторого индикатора, принятого в качестве атрибутивной пере- менной; * jρ – геометрическая вероятность распределения индикатора, который не является атрибутивной переменной и отражает тенденции развития для некоторо- го компонента развития системы ( mj ≤ ); 0kρ , * 0jρ – геометрические вероятности распределения индикаторов, которые соответствуют некоторому опорному со- стоянию; m – число переменных, отражающих различные компоненты развития. Для одномерной случайной величины геометрическая вероятность нахо- дится согласно уравнения: minmax min II IIk k − − =ρ ; 10 ≤≤ kρ , (2) где kI – некоторый индикатор; maxI , minI – соответственно максимальное и минимальное значение данного индикатора в изучаемой группе стран (в данном ISSN 1607-4556 (Print), ISSN 2309-6004 (Online) Геотехнічна механіка. 2013. №112 ______________________________________________________________________________________________  246 классе объектов, наблюдаемых в опыте) за некоторый период, например, 2004 год или за некоторый диапазон времени, например, 1980 – 2010 гг. Построим шкалы атрибутивных переменных. С этой целью база данных ин- дикаторов нормируется путем выбора опорного состояния (базового объекта с заданными в выбранный момент времени индикаторами). Учитывая специфику данной статьи в качестве опорного состояния системы приняты индикаторы развития Украины в 2004 году. Параметры опорного состояния в дальнейшем будем обозначать дополнительным индексом «0». В результате имеем безраз- мерные переменные вида 0kkk ρρξ = , где 0kρ – геометрические вероятности распределения индикаторов, которые соответствуют опорному состоянию. Цель построения абсолютного индекса – создать моделирующую среду (по- строить поле величины), которая даст возможность разработать аналитическую модель системы. В результате данного подхода строится среда моделирования в виде про- странства координат Ω , где координатные оси соответствуют шкалам атрибу- тивных переменных nξξξ ,...,, 21 для изучаемой базы данных. На практике мы обычно имеем ограниченное количество статистических точек, отражающих данные наблюдений о параметрах развития стран мира. Статистическая база данных опытных точек { }niM ξξξ ,...,, 21 отражает в пространстве Ω некоторую область nΩ , которая определена наблюдаемыми значениями атрибутивных пе- ременных. Область nΩ будем рассматривать как общее пространство наблю- даемых состояний системы. Каждой точке { }nM ξξξ ,...,, 21 данного пространст- ва поставим в соответствие значение абсолютного индекса T , ( )jT , которое на- ходится согласно уравнения (1) для величины T . В свою очередь, каждой опытной точке { }niM ξξξ ,...,, 21 также может быть поставлен в соответствие оп- ределенный набор значений абсолютных T , ( )jT и эмпирических jt индексов развития. Таким образом, nΩ – многомерное пространство точек M , в свою очередь, )(MTT = , )(MTT jj = – непрерывное скалярное поле абсолютного индекса системы, которое мы будем называть, по аналогии с термодинамикой, полем идеальных состояний (объектов) системы. На первом этапе анализа дан- ных задача сводится к изучению возможности построения регрессионных зави- симостей для описания скалярного поля величины T , исходя из связи для каж- дого компонента системы эмпирического и абсолютного индексов, т.е. ( ) jjj Tt =ϕ . Таким образом, может быть построен набор эталонных шкал абсо- лютного индекса системы ( ) jjj Tt =ϕ , которые характеризуют множества раз- личных состояний системы. Построение системы из m уравнений вида ( ) jjj Tt =ϕ указывает на наличие значимых связей в изучаемой базе данных. Для построения общей теории развития данного класса систем сделаем предположение, что в пространстве состояний nΩ процессы развития стран мира описываются многомерными непрерывными кривыми, соединяющими ISSN 1607-4556 (Print), ISSN 2309-6004 (Online) Геотехнічна механіка. 2013. №112 ________________________________________________________________________________________________  247 между собой различные состояния. Однако, процессы развития определенной страны, которые могут осуществляться между наблюдаемым состоянием M и любым другим возможным состоянием в области nΩ , будут отличаться между собой по интенсивности взаимодействия объекта с глобальным социально- экономическим, биосферным, информационным и другим окружением, т.е. с глобальной окружающей средой. Для того, чтобы иметь возможность характе- ризовать взаимодействие системы с окружающей средой для каждого компо- нента системы введем некоторую переменную величину jW , непосредственно связанную с опытными данными. Данная величина характеризует реальные процессы развития стран мира в пространстве многомерных переменных nΩ и определяет интенсивность взаимодействия системы с окружающей средой. Бу- дем называть величину jW статистическим индексом развития системы по вы- бранному компоненту системы. Другими словами, мы принимаем гипотезу о существовании множества общих мер для различных форм материального дви- жения и взаимодействия социальных систем, которыми являются страны мира. Далее для упрощения индекс j при определении величин T и W будем опус- кать, имея в виду, что все сказанное выше справедливо как для системы в це- лом, так и для каждого ее компонента. Для обоснования величины W сделаем предположение, что она связана со статистическими вероятностями наблюдае- мых состояний системы. Будем также предполагать, что функция )(MWW = имеет непрерывные ча- стные производные по всем переменным. Из теории известно, что при справед- ливости указанных выше условий изменение статистического индекса dW в окрестности любой точки M при условии осуществления некоторого процесса l может быть представлено в виде: nndWdWdWdW ξξξ +++= ...2211 , (3) где nξξξ ,...,, 21 – атрибутивные переменные системы; nWWW ,...,, 21 – функции этих переменных, причем kk WW ξ∂∂= . Будем считать, что в окрестности любой точки M при бесконечно малом из- менении состояния социальной системы в произвольном процессе l существует линейная связь между индексами W и T , которую можно представить в виде отношения элементарного приращения индекса W к соответствующему прира- щению индекса T в процессе l : lll dTdWc = . (4) Величина lc определяется на основе опыта и зависит как от положения точки ( )nM ξξξ ,..,, 21 , так и от направления процесса развития системы в пространстве состояний nΩ . ISSN 1607-4556 (Print), ISSN 2309-6004 (Online) Геотехнічна механіка. 2013. №112 ______________________________________________________________________________________________  248 Согласно уравнений (3) и (4) в окрестности точки M имеем следующие со- отношения: n n n dTcdTcdTcdW ξ ξ ξ ξ ξ ξ ∂ ∂ ++ ∂ ∂ + ∂ ∂ = ...2 2 21 1 1 . (5) Если учесть уравнение (1), то из зависимости (5) при условии существова- ния аналитической зависимости для абсолютного индекса T получим: T dWds = ; n n n dcdcdcds ξ ξ ξ ξ ξ ξ +++= ... 2 2 2 1 1 1 , (6) где величину s согласно (6) определим как энтропию системы. Для установления связей модели с показателями развития стран выберем различные индикаторы, отражающие состояние основных компонентов систе- мы, а именно: удельное потребление энергии; младенческую и детскую смерт- ность; фертильность; случаи заболевания туберкулезом и ВИЧ; количество вра- чей на 1 тыс. человек; количество пользователей сети Интернет и абонентов со- товых сетей на 1 тыс. человек и т.д. Для построения системы измерения индекса T установим корреляционные связи между абсолютным индексом системы, зависящим от ее атрибутивных пе- ременных, и всеми эмпирическими индексами развития jt , отражающими раз- личные аспекты развития системы. Среди полученных уравнений выберем одну или несколько наиболее значащих зависимостей и построим шкалу (шкалы) из- мерений. Общий подход несколько подобен построению шкал температур в тер- модинамике. Результаты анализа данных приведены в таблице 1. Таблица 1 – Зависимости различных индикаторов от абсолютного индекса развития стран мира в 2004 году Индикаторы Регрессионное уравнение Вида jtT = Атрибутивные переменные Коэф. кор- реляции Удельное потребление энергии, et 178,1514,1 etT ⋅= 542 ,, ρρρ 0,92 Младенческая смертность, smlt , ( )smltT ,233,0exp400,1 ⋅−⋅= 41,ρρ 0,91 Абоненты сотовых телефонов, mobt 208,1846,0 mobtT ⋅= 54 ,ρρ 0,90 Количество врачей, doсt 714,1279,3 doctT ⋅= 54321 ,,,, ρρρρρ 0,91 Пользователи Интернет, intt 140,1 int750,0 tT ⋅= 541 ,, ρρρ 0,89 Следующим шагом разрабатывается система оценки значений статистиче- ского индекса W , что позволяет совместно с уравнением (4) найти коэффици- ISSN 1607-4556 (Print), ISSN 2309-6004 (Online) Геотехнічна механіка. 2013. №112 ________________________________________________________________________________________________  249 енты kc для каждого компонента в процессе ее развития, исходя из среднеста- тистических тенденций. Для этого оценку значений индекса W будем прово- дить путем определения вероятности состояния системы в пространстве nΩ на основании статистических данных. Определим статистическую вероятность со- стояния системы w исходя из относительных частот событий, которые связаны с распределениями атрибутивных переменных в массиве опытных данных, ко- гда атрибутивные переменные наблюдаются в совокупности одновременно. Алгоритмы определения вероятности в этом случае предложены в работе [2]. В окрестности любой точки M свяжем статистический индекс системы W теоретической линейной зависимостью со статистической вероятностью w : 0wwW ⋅=α , (7) где 0w – вероятность состояния системы для условий принятого опорного со- стояния; α – некоторый коэффициент пропорциональности, который можно принять равным единице. Для построения системы оценки статистического ин- декса W установим связи индекса с энтропией системы, которая согласно (6) может быть представлена в виде: ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ ⋅++⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ ⋅+⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ ⋅= 020 2 2 10 1 1 ln...lnln n n ncсcs ρ ρ ρ ρ ρ ρ . (8) Здесь принято, что 00 =s для условий опорного состояния. Таким образом, обработка данных о развитии стран мира ведется путем оп- ределения значения энтропии s по атрибутивным переменным согласно урав- нение (8) и установления значений величин kc по известным данным статисти- ческой вероятности w , для событий наблюдаемых в совокупности значений ат- рибутивных переменных. Согласование теоретической модели с опытными данными сводится к построению регрессионного уравнения вида: ( )Ws Ψ= , (9) где также принято, что 00 =s для опорного состояния. Данное уравнение является аналогом уравнения Больцмана в физике Wks ln⋅= применительно к изучаемой задаче, при этом вид функции Ψ опре- деляется исходя из особенностей изучаемой системы. Следующим этапом для каждой страны следует определить функции состоя- ния системы (потенциал P и энтропию s ), которые выступают в качестве обоб- щенных переменных. Функции состояния определяют многомерные криволи- нейные координаты поля величины W , при этом каждая страна в пространстве своего развития в процессе nΩ будет занимать некоторое положение относи- ISSN 1607-4556 (Print), ISSN 2309-6004 (Online) Геотехнічна механіка. 2013. №112 ______________________________________________________________________________________________  250 тельно этих координат. Это позволяет объективно определить ранг страны в ие- рархическом множестве других стран по различным компонентам системы. Эн- тропия будет определять направление развития страны относительно опорного состояния, потенциал – принадлежность точки некоторой поверхности уровня, ортогональной линиям энтропии, при условии определенной вероятности со- стояния системы (постоянной энтропии). При известных абсолютном индексе T и энтропии системы s определяется уравнение для всего массива опытных данных – аналог уравнения сохранения энергии [2]: knkk n k k ddudsT ξξξξξα ⋅⋅⋅⋅⋅⋅+=⋅ +− − = ∑ ...... 111 1 1 , (10) где коэффициенты kα находятся путем регрессионного анализа, а dTcdu n= . В свою очередь, согласно [2] потенциал страны относительно опорного со- стояния будет равен: n n ccc P 1...11 2 2 2 2 1 2 1 − ++ − + − = ξξξ , (11) где принято, что величина P равна нулю для опорного состояния. Потенциал является наиболее удобной величиной для обобщенного определения ранга страны при ее развитии в пространстве nΩ . После построения общей модели развития системы определяется статус Ук- раины, который комплексно характеризует ее состояние среди стран мира. Про- водится также сравнение положения страны относительно некоторых индика- тивных объектов, в качестве которых взяты страны, имеющие определенный интерес при проведении оценки. На заключительном этапе анализа определяют- ся рейтинги для каждой страны (ранг развития страны), проводится визуализа- ция актуальных данных, делаются выводы и разрабатываются предложения для оптимизации процесса развития. Изложение результатов оценки. Покажем общую процедуру построения системы измерения человеческого развития на примере, когда в качестве инди- катора эмпирической шкалы принимают удельное потребление энергии стра- нами мира. С этой целью на основе опытных данных для стран мира определим вероятность многомерного распределения, когда совместно наблюдаются зна- чения атрибутивных переменных 542 ,, ρρρ (табл. 1). После этого свяжем зна- чение установленной вероятности совместных событий со значениями атрибу- тивных переменных 542 ,, ρρρ , отнесенных, в свою очередь, к величинам ,, 4020 ρρ 50ρ , которые соответствуют опорному состоянию. Это позволит нам согласно (8) определить функцию энтропии системы и величины kc на множестве опыт- ных данных, характерных для стран мира. В связи с тем, что многомерная не- линейная функция вероятности описывается приближенной зависимостью, то в ISSN 1607-4556 (Print), ISSN 2309-6004 (Online) Геотехнічна механіка. 2013. №112 ________________________________________________________________________________________________  251 совокупности будет наблюдаться определенный разброс опытных точек (рис. 1). Рисунок 1 – Зависимость статистического индекса ( )W от энтропии системы ( )s для распре- деления совместно наблюдаемых значений атрибутивных величин ( )542 ,, ρρρ для 177 стран мира Зная значения абсолютного индекса T и величин kc , легко определить эн- тропию системы s и уравнение вида (10). Для этого находится регрессионная зависимость между переменными. Результаты обработки данных приведены на рис. 2, а соответствующее уравнение в дифференциальной форме имеет вид: 452254 1834,12938,1 ξξξξξξ dddudsT ⋅⋅⋅−⋅⋅⋅+=⋅ , (13) где ds , du , 2ξd , 4ξd – приращения величин относительно опорного состояния. Коэффициент корреляции для уравнения (13) составляет 0,985, средняя относи- тельная ошибка – 11%. Рисунок 2 – Обработка данных для уравнения (10) относительно опорного состояния: ..2938,1 254 −⋅⋅⋅= ξξξ dSum 4521834,1.. ξξξ d⋅⋅⋅− На основе полученных данных определены энтропия и потенциал для каж- дой страны мира, исходя из оценки событий, связанных с удельным потребле- нием энергии. Результаты ранжирования стран мира для данного случая приве- ISSN 1607-4556 (Print), ISSN 2309-6004 (Online) Геотехнічна механіка. 2013. №112 ______________________________________________________________________________________________  252 дены в таблице 2. Аналогичным образом, для примера, проведено ранжирова- ние стран по факту событий, связанных с уровнем младенческой смертности и количеством абонентов сотовых телефонов, при этом была установлена очень высокая устойчивость измерений по всем трем эмпирическим шкалам. Результаты анализа развития стран по различным индикаторам указывают на то, что, несмотря на различия в потенциалах развития, наблюдается высокая устойчивость рангов стран, которые практически очень мало отличаются от значений приведенных в таблице 2 для оценок по различным шкалам. Полу- ченные результаты позволяют предложить объективный метод оценки развития стран мира и построить систему прогнозирования их параметров и индикато- ров. В целом суть метода основывается на гипотезе существования абсолютно- го индекса ( )nTT ξξξ ,..., 21= и связи скалярного поля этого индекса с опытными данными по распределению статистической вероятности состояния системы. При справедливости этой гипотезы в пространстве наблюдаемых состояний сис- темы nΩ можно построить криволинейные координаты, которые определяют некоторое поле направлений, отражающее среднестатистические тенденции в развитии системы. Все это позволяет предложить методику оценки человече- ского развития как альтернативу известной методики ПРООН. Особенностью методики является использование объективного подхода и отсутствие необхо- димости построения экспертных шкал для оценки. Результаты дают также воз- можность разработать методы, позволяющие получить ответы на ряд актуаль- ных вопросов. Например, может ли Украина за десять лет попасть в тридцать наиболее развитых стран мира? Какой выбрать эффективный путь развития страны? По каким компонентам страна имеет наиболее низкие (высокие) темпы развития, и как эти темпы сопоставимы с темпами развития отдельных стран? При условии индикативной оценки развития стран по факту потребления энергии на вопрос о возможности войти Украине в число 30 наиболее развитых стран мира можно ответить отрицательно. Несмотря на наличие в стране атомной энергетики (4 станции), более 25 те- пловых электростанций и 10 гидроэлектростанций уровень развития Украины в 2004 году по удельному показателю потребления энергии был невысокий – всего 85 ранг. Кроме того, в 2004 – 2008 годах 108 стран имели более высокие темпы развития. Ранг Украины при оценке развития по данному показателю даже ниже, нежели ранг человеческого развития (77 ранг) по методике ПРООН. В 2004 – 2008 годах самые высокие темпы развития имели Катар, ОАЭ, Кувейт, Норвегия и Сингапур, в свою очередь, самые низкие темпы – Исландия, Ирлан- дия, Кипр, Тонга и ЮАР. За этот период Украина по темпам развития занимала 109 место и существенно отставала от России и Белоруссии, а также от боль- шинства стран бывшего СССР. ISSN 1607-4556 (Print), ISSN 2309-6004 (Online) Геотехнічна механіка. 2013. №112 ________________________________________________________________________________________________  253 Таблица 2 – Значения энтропии ( )s и потенциала ( )P и рейтинги стран мира при построении шкалы оценки по факту потребления энергии Значения в 2004 году Ранги стран согласно предло- женной методики Страны мира s P уровень развития (2004 г.) темпы развития (2004– 2008 гг.) Ранги стран по ИЧР согласно методике ПРООН (2004 г.) Норвегия 0,1280 1382,7 4 5 1 Исландия 0,2681 1008,3 5 153 2 Швеция 0,1905 795,1 16 15 5 Канада 0,1521 896,6 10 14 6 Япония -0,0067 778,3 18 21 7 США 0,1606 1475,9 2 13 8 Франция 0,1156 781,3 17 24 16 Италия 0,0038 718,8 20 148 17 Англия 0,2406 870,3 13 30 18 Германия 0,1004 725,7 19 16 21 Греция -0,1566 428,4 27 22 24 Словения -0,2247 375,7 28 25 27 Чехия 0,0785 316,9 34 44 30 Венгрия -0,0128 226,9 39 145 35 Польша -0,0666 118,3 48 29 37 Эстония 0,0381 159,6 44 49 40 Литва 0,0030 121,7 47 61 41 Словакия -0,1281 161,3 43 19 42 Латвия 0,0174 87,84 54 68 45 Болгария 0,0077 22,24 65 50 54 Румыния -0,2276 28,00 63 43 60 Россия 0,0700 52,60 59 31 65 Македония -0,0547 2,511 82 55 66 Беларусь 0,0536 7,08 79 34 67 Бразилия -0,0364 24,31 64 56 69 Украина 0,0000 0,00 85 109 77 Казахстан -0,1346 12,85 74 54 79 Армения -0,0494 -21,28 112 77 80 Китай -0,6252 -6,06 91 71 81 Турция -0,2427 17,35 70 35 92 Грузия -0,2176 -28,75 119 74 97 Азербайджан -0,2443 -21,17 110 48 99 Кыргызстан -0,5896 -32,27 137 100 110 Египет -1,0223 -21,09 109 70 111 Узбекистан -0,5589 -32,44 139 86 113 Молдова -0,3566 -32,65 145 83 114 Индия -1,7407 -27,89 117 99 126 Пакистан -2,0035 -31,71 132 94 134 Кения -1,7646 -34,10 160 102 152 Нигерия -1,0868 -33,84 156 93 159 Эфиопия -3,4512 -34,55 176 116 170 ISSN 1607-4556 (Print), ISSN 2309-6004 (Online) Геотехнічна механіка. 2013. №112 ______________________________________________________________________________________________  254 В целом трудоемкость оценки развития стран определяется не методической сложностью метода, а необходимостью построения множества зависимостей для индикаторов, входящих в базу данных о развитии стран мира. Если база данных ПРООН содержит несколько десятков индикаторов, требующих анали- за, то база данных Всемирного банка – это уже более тысячи индикаторов. На фоне 186 стран, данные о которых уже есть для 2010 года, видна явная необхо- димость автоматизации процесса вычислений и поиска закономерностей в ба- зах данных. Это возможно только при создании IT-систем для анализа данных в области Global studies. Таким образом, международные базы данных индикаторов в комплексе с методами интеллектуального анализа данных позволяют установить законо- мерности развития стран мира. Все это говорит о возможности создания общей математической теории оценки развития стран по логике построения аналогич- ной той, которая применяется сегодня в термодинамике. ________________________________ СПИСОК ЛИТЕРАТУРЫ 1. Прогнозирование будущего. Новая парадигма. / Под ред. Г.Г. Фетисова и В.М. Бондаренко. - М.: Экономика, 2008. – 283 с. 2. Аверин, Г.В. Фундаментальные модели в общей теории систем: закон перехода количествен- ных изменений в качественные // Збірник наук. праць ДонНТУ: Системний аналіз та інформаційні технології в науках про природу та суспільство. - Донецьк: ДонНТУ, №1(2) – 2(3), 2012. − С. 6 − 52. _______________________________ REFERENCES 1. Prognozirovaniye budushchego. Novaya paradigma [Forecasting of the future. New Paradigm] (2008), G.G. Fetisov and V.М. Bondarenko. Eds., Economica, Мoscow, Russiya. 2. Averin, G.V. (2012), «Fundamental models in common theory of systems: the law of quantity to qual- ity transition», Zbirnik naukovirh prac DNTU: Sistemniy analyz ta informatsiyni tekhnologii v naukakh pro prirodu ta suspilstvo, no. 1(2) – 2(3), − pp. 6 − 52. ______________________________ Об авторах Аверин Геннадий Викторович, доктор технических наук, профессор, заведующий кафедры ком- пьютерных систем мониторинга Государственного высшего учебного заведения «Донецкий нацио- нальный технический университет» (ГВУЗ «ДонНТУ»), Донецк, Украина, averin@donntu.edu.ua Звягинцева Анна Викторовна, кандидат технических наук, доцент, доцент кафедры компьютер- ных систем мониторинга Государственного высшего учебного заведения «Донецкий национальный технический университет» (ГВУЗ «ДонНТУ»), Донецк, Украина, anna_zv@ukr.net About the authors Averin Gennadiy Viktorovich, Dr.Sc., professor, head of the computer systems for monitoring depart- ment of Donetsk National Technical University, Donetsk, Ukraine, averin@donntu.edu.ua Zviagintseva Anna Victorovna, PhD, associate professor with the department of computer systems for monitoring of Donetsk National Technical University, Donetsk, Ukraine, anna_zv@ukr.net ______________________________ http://www.labirint.ru/pubhouse/1474/� mailto:averin@donntu.edu.ua� mailto:anna_zv@ukr.net� ISSN 1607-4556 (Print), ISSN 2309-6004 (Online) Геотехнічна механіка. 2013. №112 ________________________________________________________________________________________________  255 Анотація. Показана можливість застосування методів інтелектуального аналізу даних (ІАД), які відрізняються високим рівнем розуміння інформації, для вивчення соціально- економічного розвитку країн світу. В якості вихідної інформації використана для аналізу ба- за даних Програми розвитку ООН. Побудована модель розвитку країн світу на основі засто- сування методу багатовимірного шкалювання за атрибутивними індикаторами системи та алгоритмів ІАД для обчислення статистичної ймовірності розподілу спостережуваних в су- купності показників розвитку країн. Запропоновано метод визначення ентропії та потенціалу розвитку об'єктів. Проведено обчислювальні експерименти і визначено ранги розвитку країн світу, а також ранги темпів розвитку. Виконана оцінка розвитку України в порівнянні з осно- вними країнами світу. Отримані результати можуть бути використані при стратегічному про- гнозуванні та плануванні розвитку України. Ключові слова: інтелектуальний аналіз даних, моделі розвитку країн, стратегічна оцін- ка, ранги країн світу, темпи розвитку України. Abstract. The possibility of applying data mining techniques (DM) is shown that differs by a high level of understanding of information for the study of the socio-economic development of countries. As the initial information the database of the United Nations Development Program was used for the analyzes. A model of countries' development was built using the method of multidimensional scaling on attribute indicators of the system and application of DM algorithms to calculate the statistical probability distribution of observed in the set of indicators of countries' development. A method for determining the entropy and potential of the development of objects was proposed. Computational experiments were carried out and countries' development ranks were determined as well as the ranks of the pace of development. The evaluation of the development of Ukraine was carried out in comparison with the major countries of the world. The results obtained can be used for strategic planning and forecasting of the development of Ukraine. Keywords: data mining, country development models, strategic assessment, countries' ranks, Ukraine development pace. Статья поступила в редакцию 25.02. 2013 Рекомендовано к публикации д-ром техн. наук Т.В. Бунько
id nasplib_isofts_kiev_ua-123456789-87405
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 1607-4556
language Russian
last_indexed 2025-11-27T11:19:50Z
publishDate 2013
publisher Інститут геотехнічної механіки імені М.С. Полякова НАН України
record_format dspace
spelling Аверин, Г.В.
Звягинцева, А.В.
2015-10-17T19:12:58Z
2015-10-17T19:12:58Z
2013
Применение методов интеллектуального анализа данных при оценке развития Украины / Г.В. Аверин, А.В. Звягинцева // Геотехническая механика: Межвед. сб. науч. тр. — Днепропетровск: ИГТМ НАНУ, 2013. — Вип. 112. — С. 242-255. — Бібліогр.: 2 назв. — рос.
1607-4556
https://nasplib.isofts.kiev.ua/handle/123456789/87405
303.732.4:332.1
Показана возможность применения методов интеллектуального анализа данных (ИАД), отличающихся высоким уровнем понимания информации, для изучения социально-экономического развития стран мира. В качестве исходной информации использована для анализа база данных Программы развития ООН. Построена модель развития стран мира на основе применения метода многомерного шкалирования по атрибутивным индикаторам системы и алгоритмов ИАД для вычисления статистической вероятности распределения наблюдаемых в совокупности показателей развития стран. Предложен метод определения энтропии и потенциала развития объектов. Проведены вычислительные эксперименты и определены ранги развития стран мира, а также ранги темпов развития. Выполнена оценка развития Украины по сравнению с основными странами мира. Полученные результаты могут быть использованы при стратегическом прогнозировании и планировании развития страны.
Показана можливість застосування методів інтелектуального аналізу даних (ІАД), які відрізняються високим рівнем розуміння інформації, для вивчення соціально-економічного розвитку країн світу. В якості вихідної інформації використана для аналізу база даних Програми розвитку ООН. Побудована модель розвитку країн світу на основі застосування методу багатовимірного шкалювання за атрибутивними індикаторами системи та алгоритмів ІАД для обчислення статистичної ймовірності розподілу спостережуваних в сукупності показників розвитку країн. Запропоновано метод визначення ентропії та потенціалу розвитку об'єктів. Проведено обчислювальні експерименти і визначено ранги розвитку країн світу, а також ранги темпів розвитку. Виконана оцінка розвитку України в порівнянні з основними країнами світу. Отримані результати можуть бути використані при стратегічному прогнозуванні та плануванні розвитку України.
The possibility of applying data mining techniques (DM) is shown that differs by a high level of understanding of information for the study of the socio-economic development of countries. As the initial information the database of the United Nations Development Program was used for the analyzes. A model of countries' development was built using the method of multidimensional scaling on attribute indicators of the system and application of DM algorithms to calculate the statistical probability distribution of observed in the set of indicators of countries' development. A method for determining the entropy and potential of the development of objects was proposed. Computational experiments were carried out and countries' development ranks were determined as well as the ranks of the pace of development. The evaluation of the development of Ukraine was carried out in comparison with the major countries of the world. The results obtained can be used for strategic planning and forecasting of the development of Ukraine.
ru
Інститут геотехнічної механіки імені М.С. Полякова НАН України
Геотехнічна механіка
Применение методов интеллектуального анализа данных при оценке развития Украины
Застосування методів интелектуального аналізу даних при оцінці розвитку України
Application of methods of intellectual data analysis at estimation of development Ukraine
Article
published earlier
spellingShingle Применение методов интеллектуального анализа данных при оценке развития Украины
Аверин, Г.В.
Звягинцева, А.В.
title Применение методов интеллектуального анализа данных при оценке развития Украины
title_alt Застосування методів интелектуального аналізу даних при оцінці розвитку України
Application of methods of intellectual data analysis at estimation of development Ukraine
title_full Применение методов интеллектуального анализа данных при оценке развития Украины
title_fullStr Применение методов интеллектуального анализа данных при оценке развития Украины
title_full_unstemmed Применение методов интеллектуального анализа данных при оценке развития Украины
title_short Применение методов интеллектуального анализа данных при оценке развития Украины
title_sort применение методов интеллектуального анализа данных при оценке развития украины
url https://nasplib.isofts.kiev.ua/handle/123456789/87405
work_keys_str_mv AT averingv primeneniemetodovintellektualʹnogoanalizadannyhpriocenkerazvitiâukrainy
AT zvâgincevaav primeneniemetodovintellektualʹnogoanalizadannyhpriocenkerazvitiâukrainy
AT averingv zastosuvannâmetodívintelektualʹnogoanalízudanihpriocíncírozvitkuukraíni
AT zvâgincevaav zastosuvannâmetodívintelektualʹnogoanalízudanihpriocíncírozvitkuukraíni
AT averingv applicationofmethodsofintellectualdataanalysisatestimationofdevelopmentukraine
AT zvâgincevaav applicationofmethodsofintellectualdataanalysisatestimationofdevelopmentukraine