Прогнозирование эпидемиологических показателей гриппа на основе запросов поисковой системы

В работе рассмотрена возможность повышения эффективности прогнозирования медико-биологических процессов за счет использования данных поисковых запросов. Для моделирования использован релаксационный алгоритм метода группового учета аргументов. Получены модели прогноза эпидемиологических показателей г...

Full description

Saved in:
Bibliographic Details
Published in:Індуктивне моделювання складних систем
Date:2016
Main Authors: Настенко, Е.А., Носовец, Е.К., Белошицкая, О.К., Павлов, А.В., Соколов, А.Д.
Format: Article
Language:Russian
Published: Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України 2016
Online Access:https://nasplib.isofts.kiev.ua/handle/123456789/125057
Tags: Add Tag
No Tags, Be the first to tag this record!
Journal Title:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Cite this:Прогнозирование эпидемиологических показателей гриппа на основе запросов поисковой системы / Е.А. Настенко, Е.К. Носовец, О.К. Белошицкая, А.В. Павлов, А.Д. Соколов, А.В. Павлов // Індуктивне моделювання складних систем: Зб. наук. пр. — К.: МННЦ ІТС НАН та МОН України, 2016. — Вип. 8. — С. 160-166. — Бібліогр.: 7 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id nasplib_isofts_kiev_ua-123456789-125057
record_format dspace
spelling Настенко, Е.А.
Носовец, Е.К.
Белошицкая, О.К.
Павлов, А.В.
Соколов, А.Д.
Павлов, А.В.
2017-10-13T19:57:25Z
2017-10-13T19:57:25Z
2016
Прогнозирование эпидемиологических показателей гриппа на основе запросов поисковой системы / Е.А. Настенко, Е.К. Носовец, О.К. Белошицкая, А.В. Павлов, А.Д. Соколов, А.В. Павлов // Індуктивне моделювання складних систем: Зб. наук. пр. — К.: МННЦ ІТС НАН та МОН України, 2016. — Вип. 8. — С. 160-166. — Бібліогр.: 7 назв. — рос.
XXXX-0044
https://nasplib.isofts.kiev.ua/handle/123456789/125057
681.513.8
В работе рассмотрена возможность повышения эффективности прогнозирования медико-биологических процессов за счет использования данных поисковых запросов. Для моделирования использован релаксационный алгоритм метода группового учета аргументов. Получены модели прогноза эпидемиологических показателей гриппа на основе фактического обращения пациентов в лечебное учреждение и с дополнением данных запросов поисковой системы Yandex. Во втором случае модель показала существенное улучшение прогнозирующих свойств.
В роботі розглянуто можливість підвищення ефективності прогнозування медико-біологічних процесів за рахунок використання даних пошукових запитів. Для моделювання використаний релаксаційний алгоритм методу групового урахування аргументів. Отримано моделі прогнозу епідеміологічних показників грипу на основі фактичного звернення пацієнтів до лікувального закладу і з доповненням даних запитів пошукової системи Yandex. У другому випадку модель показала істотне поліпшення властивостей прогнозування.
The paper considers the possibility of increasing the forecasting medical and biological processes effectiveness through the use of search query data. For modeling used relaxation algorithm of group method of data handling. Get model forecast influenza epidemiological indicators on the basis of the actual treatment of patients in the hospital and with the addition of data the Yandex search engine queries. In the second case, the model showed a significant improvement in predictive properties.
ru
Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України
Індуктивне моделювання складних систем
Прогнозирование эпидемиологических показателей гриппа на основе запросов поисковой системы
Article
published earlier
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
title Прогнозирование эпидемиологических показателей гриппа на основе запросов поисковой системы
spellingShingle Прогнозирование эпидемиологических показателей гриппа на основе запросов поисковой системы
Настенко, Е.А.
Носовец, Е.К.
Белошицкая, О.К.
Павлов, А.В.
Соколов, А.Д.
Павлов, А.В.
title_short Прогнозирование эпидемиологических показателей гриппа на основе запросов поисковой системы
title_full Прогнозирование эпидемиологических показателей гриппа на основе запросов поисковой системы
title_fullStr Прогнозирование эпидемиологических показателей гриппа на основе запросов поисковой системы
title_full_unstemmed Прогнозирование эпидемиологических показателей гриппа на основе запросов поисковой системы
title_sort прогнозирование эпидемиологических показателей гриппа на основе запросов поисковой системы
author Настенко, Е.А.
Носовец, Е.К.
Белошицкая, О.К.
Павлов, А.В.
Соколов, А.Д.
Павлов, А.В.
author_facet Настенко, Е.А.
Носовец, Е.К.
Белошицкая, О.К.
Павлов, А.В.
Соколов, А.Д.
Павлов, А.В.
publishDate 2016
language Russian
container_title Індуктивне моделювання складних систем
publisher Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України
format Article
description В работе рассмотрена возможность повышения эффективности прогнозирования медико-биологических процессов за счет использования данных поисковых запросов. Для моделирования использован релаксационный алгоритм метода группового учета аргументов. Получены модели прогноза эпидемиологических показателей гриппа на основе фактического обращения пациентов в лечебное учреждение и с дополнением данных запросов поисковой системы Yandex. Во втором случае модель показала существенное улучшение прогнозирующих свойств. В роботі розглянуто можливість підвищення ефективності прогнозування медико-біологічних процесів за рахунок використання даних пошукових запитів. Для моделювання використаний релаксаційний алгоритм методу групового урахування аргументів. Отримано моделі прогнозу епідеміологічних показників грипу на основі фактичного звернення пацієнтів до лікувального закладу і з доповненням даних запитів пошукової системи Yandex. У другому випадку модель показала істотне поліпшення властивостей прогнозування. The paper considers the possibility of increasing the forecasting medical and biological processes effectiveness through the use of search query data. For modeling used relaxation algorithm of group method of data handling. Get model forecast influenza epidemiological indicators on the basis of the actual treatment of patients in the hospital and with the addition of data the Yandex search engine queries. In the second case, the model showed a significant improvement in predictive properties.
issn XXXX-0044
url https://nasplib.isofts.kiev.ua/handle/123456789/125057
citation_txt Прогнозирование эпидемиологических показателей гриппа на основе запросов поисковой системы / Е.А. Настенко, Е.К. Носовец, О.К. Белошицкая, А.В. Павлов, А.Д. Соколов, А.В. Павлов // Індуктивне моделювання складних систем: Зб. наук. пр. — К.: МННЦ ІТС НАН та МОН України, 2016. — Вип. 8. — С. 160-166. — Бібліогр.: 7 назв. — рос.
work_keys_str_mv AT nastenkoea prognozirovanieépidemiologičeskihpokazateleigrippanaosnovezaprosovpoiskovoisistemy
AT nosovecek prognozirovanieépidemiologičeskihpokazateleigrippanaosnovezaprosovpoiskovoisistemy
AT belošickaâok prognozirovanieépidemiologičeskihpokazateleigrippanaosnovezaprosovpoiskovoisistemy
AT pavlovav prognozirovanieépidemiologičeskihpokazateleigrippanaosnovezaprosovpoiskovoisistemy
AT sokolovad prognozirovanieépidemiologičeskihpokazateleigrippanaosnovezaprosovpoiskovoisistemy
AT pavlovav prognozirovanieépidemiologičeskihpokazateleigrippanaosnovezaprosovpoiskovoisistemy
first_indexed 2025-11-26T04:55:04Z
last_indexed 2025-11-26T04:55:04Z
_version_ 1850609723879981056
fulltext Настенко Е.А. Носовец Е.К. Белошицкая О.К. Павлов Ан.В. Соколов А.Д. Павлов Ал.В. . Індуктивне моделювання складних систем, випуск 8, 2016 160 УДК 681.513.8 ПРОГНОЗИРОВАНИЕ ЭПИДЕМИОЛОГИЧЕСКИХ ПОКАЗАТЕЛЕЙ ГРИППА НА ОСНОВЕ ЗАПРОСОВ ПОИСКОВОЙ СИСТЕМЫ Е.А. Настенко 1 , Е.К. Носовец 1 , О.К. Белошицкая 1 , Ан.В. Павлов 2 , А.Д. Соколов 1 , Ал.В. Павлов 1 1 Национальный технический университет Украины Киевский политенический институт им. Игоря. Сикорского 2 Международный научно-учебный центр информационных технологий и систем НАНУ и МОНУ nastenko@inbox.ru,e.nosovets@ya.ru,ksenia,bil@ukr.net,andriypavlove@gmail.com, sokolov.alexey1994@gmail.com,cheshirelk@gmail.com В роботі розглянуто можливість підвищення ефективності прогнозування медико- біологічних процесів за рахунок використання даних пошукових запитів. Для моделювання використаний релаксаційний алгоритм методу групового урахування аргументів. Отримано моделі прогнозу епідеміологічних показників грипу на основі фактичного звернення пацієн- тів до лікувального закладу і з доповненням даних запитів пошукової системи Yandex. У другому випадку модель показала істотне поліпшення властивостей прогнозування. Ключові слова: прогнозування, пошукові запити, ресурс Yandex, грип, епідеміологічні показники, релаксаційний алгоритм, метод групового урахування аргументів (МГУА). The paper considers the possibility of increasing the forecasting medical and biological processes effectiveness through the use of search query data. For modeling used relaxation algorithm of group method of data handling. Get model forecast influenza epidemiological indicators on the basis of the actual treatment of patients in the hospital and with the addition of data the Yandex search engine queries. In the second case, the model showed a significant improvement in predictive properties. Keywords: forecast, search queries, resource Yandex, flu, epidemiological indicators, relaxation algorithm. group method of data handling GMDH. В работе рассмотрена возможность повышения эффективности прогнозирования меди- ко-биологических процессов за счет использования данных поисковых запросов. Для моде- лирования использован релаксационный алгоритм метода группового учета аргументов. Получены модели прогноза эпидемиологических показателей гриппа на основе фактиче- ского обращения пациентов в лечебное учреждение и с дополнением данных запросов по- исковой системы Yandex. Во втором случае модель показала существенное улучшение про- гнозирующих свойств. Ключевые слова: прогнозирование, поисковые запросы, ресурс Yandex, грипп, эпидемиологические показатели, релаксационный алгоритм, метод группового учета аргументов (МГУА) Введение Статистические данные сформированные по пользовательским запросам поисковых систем характеризуют одну из форм реакции интернет сообщества на происходящие в реальности процессы, события, явления. Представляет оп- mailto:e.nosovets@ya.ru Прогнозирование эпидемиологических показателей гриппа на основе запросов поисковой системы Індуктивне моделювання складних систем, випуск 8, 2016 161 ределенный интерес исследовать, в какой степени указанные данные могут способствовать повышению эффективности прогнозирующих систем для пред- сказания экономических, социологических, медицинских показателей, которые достоверно характеризуют процессы в экономических, социальных, биологиче- ских объектах. Ряд современных исследований показали возможность открытия поисковыми системами доступа к информационным ресурсам, предоставляю- щим возможность построить более точные прогнозирующие модели, а в неко- торых случаях появляется возможность дополнительного многостороннего анализа для определения новых свойств и структурных связей событий, про- цессов и явлений. В 2009 году опубликованы работы по прогнозу показателей микро- и мак- ро- состояний экономики по динамике запросов в Интернете [1]. Исследователи применили для прогнозирования данные поисковых сервисов предполагая на- личие существенной корреляции между текущим уровнем деловой активности и динамикой соответствующих запросов пользователей поисковиков. Результа- ты моделирования подтвердили предположение авторов на примере прогнозов динамики продаж автомобилей Ford, Chevrolet и Toyota на рынке США и тури- стического потока в Гонконге. Полученные результаты моделирования с вклю- чением переменных, учитывающих колебания запросов в Google превосходили по критериям оценки качества прогноза во всех вариантах примененных выбо- рочных данных. Впоследствии эффективность применения данных поисковых запросов для мониторинга и прогнозирования деловой активности была под- тверждена в десятках опубликованных работ. В качестве примера приведем ра- боту Столбова [2]. Он исследовал применения сервисов Google для оценки те- кущего финансового состояния рынков и показал, что при удачном формирова- нии выборки дескрипторов есть возможность получать более точный результат прогноза чем при применении только опросных методов. Также интересна ра- бота [3], где примененные дескрипторы позволяют определить структурные особенности экономической преступности. Наглядным примером связи дина- мики праздничной активности населения и соответствующего поискового за- проса является отражение приготовления украинцев к Новому Году (скачки перед январем 2015 и 2016 гг.) в динамике запросов слова "салат". Настенко Е.А. Носовец Е.К. Белошицкая О.К. Павлов Ан.В. Соколов А.Д. Павлов Ал.В. . Індуктивне моделювання складних систем, випуск 8, 2016 162 Таким образом есть все основания предполагать полезность применения данных поисковых запросов для повышения точности прогнозирующих моде- лей и в других областях. Ниже рассмотрено применение статистики поисковых запросов для прогнозирования обращения населения в лечебные заведения по поводу заболевания остро-респираторной вирусной инфекцией и гриппом. Постановка задачи Целью настоящей работы является исследование информативности дан- ных поисковых запросов с точки зрения повышения точности прогнозов дина- мических процессов. Рассматривается один из наиболее часто встречающихся в природе заболеваний человека эпидемиологический процесс - процесс заболе- вания (суммарный) остро-респираторной вирусной инфекцией и гриппом, на- блюдаемый в некотором ограниченном регионе. В данном конкретном случае мы не выделяем для прогнозирования определенный штамм гриппа, а пользу- емся значением зарегистрированного суммарного обрашения в поликлинику в одном из районов города Киева по поводу ОРВИ и гриппа. График значений средних за месяц соответствующего ряда приведен на рис.1. Рис.1. График обращений в поликлинику по поводу гриппа и ОРВИ Значения на графике отображают числа первичных обращений населения в поликлинику на протяжении 18 месяцев в 2014-2015 гг. Требуется построить прогнозирующую модель с наилучшими показателя- ми на экзаменационном подмножестве. В качестве такого подмножества выде- лены 2 последние точки выборки - значение ряда в августе и сентябре 2015г. Потребителем нашего прогноза может быть администрация соответст- вующего лечебного заведения, использующего его для планирования графика работы участковых и дежурных терапевтов и опережающей закупки лечебных препаратов в стационар. Прогнозирование эпидемиологических показателей гриппа на основе запросов поисковой системы Індуктивне моделювання складних систем, випуск 8, 2016 163 Кроме того в работе необходимо получить ответ о возможности улучше- ния прогнозирующих свойств модели за счет дополнительных переменных - статистики реализации поисковых запросов на интересующую нас тему. Дан- ные моделирования должны быть использованы для аргументации эффектив- ности применения статистики запросов поисковых систем для прогнозирования динамических процессов. Основная часть. Расчет модели прогноза по значениям исходного ряда. Ввиду доста- точно малого количества значений имеющегося ряда в качестве инструмента создания прогнозирующей модели выберем алгоритмы метода группового уче- та аргументов МГУА. Аргументация целесообразности и преимущества приме- нения данного подхода при малых объемах выборки обоснованы в многочис- ленных работах [4,5]. Модели прогноза ниже рассчитаны программной реали- зацией алгоритма РИА - релаксационного итерационного алгоритма МГУА [7]. В качестве аргументов используем значения ряда с четырьмя запаздываниями. Ниже приведены модели, графики исходного ряда, прогноза, и среднее абсо- лютное отклонение MAD на рабочей выборке и на экзамене, нормированные на коридор вариации всей выборки - Mean Relative Derivation; n i n i ii рабраб yy n yy nMR раб 1I 1 2 ˆ /100D n i n i ii экзэкз yy n yy nMR экз 1I 1 2 ˆ /100D , Здесь n , рабn , экзn - количество точек всей выборки, рабочей выборки и эк- замена соответственно, iy , i ŷ y - значения исходного ряда, модели и среднее ряда соответственно. Модель 1, полученная РИА МГУА на четырех запаздываниях: ))2(*)1(/()(* *0038897.2))3()1(/()2(*0021234.3)3(/))((*0005672.7 )2(/)2(*0033444.2))1(/()(*0015875.323596.177)1( 3/13/4 23/2 tytyty EtytytyEtytyE tytyEtytyEty Настенко Е.А. Носовец Е.К. Белошицкая О.К. Павлов Ан.В. Соколов А.Д. Павлов Ал.В. . Індуктивне моделювання складних систем, випуск 8, 2016 164 Рис.2 Графики исходного ряда и модели 1 РИА на рабочих точках и экзамене. МRDраб РИА1 =7,51% МRDэкз РИА1 =23,93% Расчет модели прогноза с привлечением статистики запросов поиско- вой системы Яндекс. Данный материал служит цели привлечь внимание специалистов к источ- нику информации, использование которого способно повысить эффективность прогнозирующих систем. В нашем случае воспользуемся возможностями инструмента Yandex Wordstat позволяющего получить доступ к статистике запросов по ключевым словам. Для удобства представления данных предложен программный продукт для обработки запросов, куда импортируется статистика ресурса Yandex. В сервисе программы выбор региона Украины, где учтены поисковые за- просы, выбор разбиения по месяцам или неделям, рассчитываются характери- стики связи рядов. Ниже представлены графики рядов статистики запросов по ключевым словам "таблетки от гриппа", "грипп", "ОРВИ", полученные для месячного пе- риода усредненния данных по городу Киеву за время с апреля 2014г. по август 2015г. Прогнозирование эпидемиологических показателей гриппа на основе запросов поисковой системы Індуктивне моделювання складних систем, випуск 8, 2016 165 Рис.3 График запросов "таблетки от гриппа" Рис.4 Графики запросов "грипп" и "ОРВИ" Далее при моделировании будут использованы статистики именно данных запросов так как их корреляция с исходным рядом оказалась наиболее высо- кой. Обозначения, принятые в модели: 2x - переменная статистики запроса "грипп", 3x - переменная статистики запроса "ОРВИ" 4x - переменная статисти- ки запроса "таблетки от гриппа". Модель2, полученная РИА МГУА на четырех запаздываниях: )(*0067566.1))1(*)(/( /)2(*0005572.1))()1(*)2(/(0092297.7)2(/)2(* *)(*0015879.4)1(/)3(*)(*0008912.249466.32)1( 33/1 4 3233 3/1 3 3/13/1 4 tyEtytx txEtytxtxEtxty txEtytytxEty Рис.5 Графики исходного ряда и модели2 РИА на рабочих точках и экзамене. МRDраб РИА1 = 2,94% МRDэкз РИА1 =8,02% Настенко Е.А. Носовец Е.К. Белошицкая О.К. Павлов Ан.В. Соколов А.Д. Павлов Ал.В. . Індуктивне моделювання складних систем, випуск 8, 2016 166 Выводы Получены модели прогноза обращения населения в лечебное учреждение по поводу заболеваний ОРВИ и гриппа с хорошим качеством на экзаменацион- ной выборке. Показано существенное улучшение прогнозирующих свойств мо- дели при учете статистики запросов поискового ресурса. Литература 1.Choi, H., Varian, H.: Predicting the Present with Google Trends. // Working paper, Google Inc., 2009 2. Столбов, М.И.: Статистика поиска в Google как индикатор финансовой конъюнктуры // Журнал "Вопросы экономики" 2011, №11 3. Болдырева А. Построение прогнозных моделей экономической конъюнктуры и преступлений экономической направленности по интенсивно- сти запросов в поисковой системе Интернет. // Выпускная квалификационная работа, Москва, 2015 4. Ивахненко А, Степашко В. Помехоустойчивость моделирования. // Ки- ев: Наук. думка. 1985 5. Степашко В. Индуктивное моделирование в исторической перспективе. // Труды 4-й межд. конф. по индуктивному моделированию (ICIM-2013), НА- НУ, Чешский технический университет, Киев, 2013, сс.31-37 6. Интернет-ресурс https://www.gmdhshell.com/ 7. Павлов.В.А. Синтез нечутливих до зсуву нелінійних моделей [Текст] / В.А. Павлов, О.В. Павлов // Комп’ютерні системи та мережі.[Зб. наук. праць] - Л.: Видавництво Національного університету "Львівська політехніка"/ Вісник Національній університет "Львівська політехніка", 2009. - №658. - С. 111-115.