Автоматическое построение числовых прогнозов
Рассмотрены возможности автоматического получения прогнозов с использованием пакета статистического прогнозирования PREDICTOR. Описаны и обоснованы интеллектуальные средства пакета, в частности средства интегральной оценки, позволяющей оценивать и ранжировать полученные прогнозы. Приведены примеры п...
Saved in:
Date: | 2010 |
---|---|
Main Authors: | , , , |
Format: | Article |
Language: | Russian |
Published: |
Інститут кібернетики ім. В.М. Глушкова НАН України
2010
|
Series: | Компьютерная математика |
Subjects: | |
Online Access: | http://dspace.nbuv.gov.ua/handle/123456789/84586 |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Journal Title: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
Cite this: | Автоматическое построение числовых прогнозов / С.И. Лавренюк, О.Л. Перевозчикова, В.Г. Тульчинский, А.В. Харченко // Компьютерная математика: сб. науч. тр. — 2010. — № 2. — С. 52-61. — Бібліогр.: 8 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraineid |
irk-123456789-84586 |
---|---|
record_format |
dspace |
spelling |
irk-123456789-845862015-07-11T03:01:50Z Автоматическое построение числовых прогнозов Лавренюк, С.И. Перевозчикова, О.Л. Тульчинский, В.Г. Харченко, А.В. Инструментальные средства информационных технологий Рассмотрены возможности автоматического получения прогнозов с использованием пакета статистического прогнозирования PREDICTOR. Описаны и обоснованы интеллектуальные средства пакета, в частности средства интегральной оценки, позволяющей оценивать и ранжировать полученные прогнозы. Приведены примеры построения прогнозов на основе реальных временных рядов. Розглянуто можливості автоматичної побудови прогнозів з використанням пакета статистичного прогнозування PREDICTOR, описані та обгрунтовані інтелектуальні засоби пакета, якими володіє цей продукт, насамперед засоби інтегральної оцінки, що дозволяє ранжувати отримані прогнози. Наведені приклади побудови прогнозів на основі реальних числових рядів. The abilities of automatical forecasting with the use of statistical forecasting package PREDICTOR are examined. Intelligent tools of the package, first of all, the integrated estimating method that enables the resulted forecast ranging, are described and proved. The examples of forecast based on the real-time series are proposed. 2010 Article Автоматическое построение числовых прогнозов / С.И. Лавренюк, О.Л. Перевозчикова, В.Г. Тульчинский, А.В. Харченко // Компьютерная математика: сб. науч. тр. — 2010. — № 2. — С. 52-61. — Бібліогр.: 8 назв. — рос. ХХХХ-0003 http://dspace.nbuv.gov.ua/handle/123456789/84586 004 ru Компьютерная математика Інститут кібернетики ім. В.М. Глушкова НАН України |
institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
collection |
DSpace DC |
language |
Russian |
topic |
Инструментальные средства информационных технологий Инструментальные средства информационных технологий |
spellingShingle |
Инструментальные средства информационных технологий Инструментальные средства информационных технологий Лавренюк, С.И. Перевозчикова, О.Л. Тульчинский, В.Г. Харченко, А.В. Автоматическое построение числовых прогнозов Компьютерная математика |
description |
Рассмотрены возможности автоматического получения прогнозов с использованием пакета статистического прогнозирования PREDICTOR. Описаны и обоснованы интеллектуальные средства пакета, в частности средства интегральной оценки, позволяющей оценивать и ранжировать полученные прогнозы. Приведены примеры построения прогнозов на основе реальных временных рядов. |
format |
Article |
author |
Лавренюк, С.И. Перевозчикова, О.Л. Тульчинский, В.Г. Харченко, А.В. |
author_facet |
Лавренюк, С.И. Перевозчикова, О.Л. Тульчинский, В.Г. Харченко, А.В. |
author_sort |
Лавренюк, С.И. |
title |
Автоматическое построение числовых прогнозов |
title_short |
Автоматическое построение числовых прогнозов |
title_full |
Автоматическое построение числовых прогнозов |
title_fullStr |
Автоматическое построение числовых прогнозов |
title_full_unstemmed |
Автоматическое построение числовых прогнозов |
title_sort |
автоматическое построение числовых прогнозов |
publisher |
Інститут кібернетики ім. В.М. Глушкова НАН України |
publishDate |
2010 |
topic_facet |
Инструментальные средства информационных технологий |
url |
http://dspace.nbuv.gov.ua/handle/123456789/84586 |
citation_txt |
Автоматическое построение числовых прогнозов / С.И. Лавренюк, О.Л. Перевозчикова, В.Г. Тульчинский, А.В. Харченко // Компьютерная математика: сб. науч. тр. — 2010. — № 2. — С. 52-61. — Бібліогр.: 8 назв. — рос. |
series |
Компьютерная математика |
work_keys_str_mv |
AT lavrenûksi avtomatičeskoepostroeniečislovyhprognozov AT perevozčikovaol avtomatičeskoepostroeniečislovyhprognozov AT tulʹčinskijvg avtomatičeskoepostroeniečislovyhprognozov AT harčenkoav avtomatičeskoepostroeniečislovyhprognozov |
first_indexed |
2025-07-06T11:39:18Z |
last_indexed |
2025-07-06T11:39:18Z |
_version_ |
1836897491667124224 |
fulltext |
52 Компьютерная математика. 2010, № 2
Èíñòðóìåíòàëüíûå
ñðåäñòâà
èíôîðìàöèîííûõ
òåõíîëîãèé
Рассмотрены возможности ав-
томатического получения про-
гнозов с использованием пакета
статистического прогнозирова-
ния PREDICTOR. Описаны и
обоснованы интеллектуальные
средства пакета, в частности
средства интегральной оценки,
позволяющей оценивать и ран-
жировать полученные прогнозы.
Приведены примеры построения
прогнозов на основе реальных
временных рядов.
___________________
© С.И. Лавренюк, О.Л. Перевоз-
чикова, В.Г. Тульчинский,
А.В. Харченко, 2010
ÓÄÊ 004
Ñ.È. ЛÀÂÐÅÍÞÊ, Î.Ë. ÏÅÐÅÂÎÇ×ÈÊÎÂÀ,
Â.Ã. ÒÓËÜ×ÈÍÑÊÈÉ, À.Â. ÕÀÐ×ÅÍÊÎ
ÀÂÒÎÌÀÒÈ×ÅÑÊÎÅ ÏÎÑÒÐÎÅÍÈÅ
×ÈÑËÎÂÛÕ ÏÐÎÃÍÎÇÎÂ
Вступление. В условиях рыночной экономи-
ки предприятия нуждаются в построении
прогнозов различных показателей для по-
строения планов своей деятельности (бизнес-
планирование) [1]. Даже учитывая неста-
бильный характер экономики в Украине, ак-
туальность такой проблемы не ослабевает
[2]: для прогнозирования развития ситуации
можно построить несколько прогнозов по
различным сценариям и спланировать разви-
тие предприятия для каждого из них [3–7].
На рынке программных продуктов пред-
ставлено несколько пакетов статистического
прогнозирования [8]. Каждый из этих паке-
тов имеет свои преимущества и недостатки,
но поскольку методы прогнозирования чи-
словых рядов разработаны в 1960–70-х годах,
перечень реализованных методов часто сов-
падает. Даже пользователю с основательной
математической подготовкой среди предло-
женных средств зачастую трудно отыскать
наиболее адекватное решение его задач. При
выборе инструмента прогнозирования следу-
ет учесть математическую подготовку поль-
зователя, время, затраченное на подбор оп-
тимальной модели, затраты на изучение ин-
терфейса нового программного продукта.
Режимы работы пакета PREDICTOR
PREDICTOR представляет собой развитую
систему интерактивного прогнозирования,
встраиваемую в MS-Excel, имеющую для
пользователя 4 режима сложности обработки.
1. Для новичков режим Мастер позволя-
ет быстро получить прогноз путем пошаго-
вых операций установления сезонности, вы-
бора метода (модели), визуального контроля
АВТОМАТИЧЕСКОЕ ПОСТРОЕНИЕ ЧИСЛОВЫХ ПРОГНОЗОВ
Компьютерная математика. 2010, № 2 53
качества работы модели и записи результата в виде ряда чисел. При этом опти-
мальные величины всех необходимых параметров PREDICTOR подбирает авто-
матически, так что пользователь имеет возможность и не знать их назначения.
2. Для квалифицированных пользователей диалоговая среда итеративного
прогнозирования представляет собой иногда намного более длительный про-
цесс, нежели экспресс-прогнозирование, однако его преимущество состоит в
том, что пользователь может "конструировать" прогноз путем тонкой коррекции
параметров после их автоматического подбора системой, сравнения альтерна-
тивных вариантов прогноза одного и того же ряда (визуального и количествен-
ного, используя статистические показатели) и сохранения полученной таким
образом эмпирической модели прогнозирования одних данных для использова-
ния ее с другими данными, описывающими процессы сходной природы.
3. В режиме функций электронной таблицы предполагается, что парамет-
ры прогнозной модели уже определены и необходимо обеспечить, чтобы ре-
зультаты прогнозирования сами являлись исходными данными для последую-
щих вычислений в электронной таблице; при этом необходимо, чтобы при изме-
нении исходных данных, которые не являются результатом каких-либо вычис-
лений, происходил автоматический пересчет всех зависимых от них звеньев,
в частности результатов прогноза. Вот почему модели на этом уровне организо-
ваны в виде функций MS-Excel. PREDICTOR располагает 25 методами прогно-
зирования, среди которых: простые и линейные скользящие средние; сглажива-
ние: простое, адаптивное, линейное по Холту, линейное по Брауну, квадратич-
ное по Брауну, аддитивное сезонное по Винтерзу, сезонное по Холту –
Винтерзу, сезонное по Брауну – Харриссону; регрессия: авторегрессия,
S-кривые, кривая Гомпертца, логистическая кривая, популярные и определяемые
пользователем тренды; методология Бокса – Дженкинса [5], ARARMA, ARIMA-
модели с сезонностью в AR и MA, обобщенная адаптивная фильтрация (GAF);
множественная регрессия; интерполяционные аппроксимационные нейронные
сети [6, 7].
4. Быстрое получение прогноза дает пакетное прогнозирование, в процессе
которого пользователю необходимо указать только источник данных, длину
прогноза, общие параметры, характеризующие временной ряд, и выбрать мето-
ды для тестирования из предложенного списка. Более квалифицированный
пользователь может настроить весовые коэффициенты статистических оценок,
по которым ведется отбор оптимального метода. Оптимальные параметры, ме-
тод десезонирования пакет подбирает автоматически, тестируя при этом полу-
ченную модель, а в конце работы предлагает список из 4 оптимальных методов,
прогнозы построенные с их применением, т. е. дает возможность автоматически
получить результат с минимальным числом шагов.
Поддержано динамическое прогнозирование по мере поступления новых
данных, управление сценариями и повторное использование сценариев. Система
поставляется с подробной документацией и множеством примеров. Пакет
PREDICTOR интегрирован в MS EXCEL и изначально задуман как средство,
объединяющее простоту и наглядность электронных таблиц, мощные возможно-
сти методов численного прогнозирования.
С.И. ЛАВРЕНЮК, О.Л. ПЕРЕВОЗЧИКОВА, В.Г. ТУЛЬЧИНСКИЙ, А.В. ХАРЧЕНКО
54 Компьютерная математика. 2010, № 2
В первую очередь пакет ориентирован на пользователей, которые имеют
минимальные познания в области численного прогнозирования и хотят быстро
получить результат на конкретном числовом ряду данных (например, менедже-
ры). Для такой категории людей наиболее информативными есть визуальные
методы отображения данных (графики, диаграммы, использование различных
цветов для подсветки лучших и худших характеристик из общего списка для
того или иного метода). При разработке и реализации данных режимов исполь-
зовались основные принципы построения стандартных мастеров пакета Micro-
soft Office и программы MS Excel в частности.
Полная последовательность шагов для построения прогноза с помощью
PREDICTOR
Шаг 1. Ввод данных.
Шаг 2. Выбор сезонности данных.
Шаг 3. Выбор длины прогнозного горизонта.
Шаг 4. Выбор методов прогнозирования.
Шаг 5. Подбор параметров метода.
Шаг 6. Подбор метода сезонной декомпозиции.
Шаг 7. Тестирование выбранного метода.
Шаг 8. Прогнозирование выбранным методом и вставка результата в элек-
тронную таблицу.
При работе в режиме Мастер пользователь должен пройти все шаги 1–8 са-
мостоятельно и на каждом шаге он может как принять предложенные пакетом
параметры, так и откорректировать их. В режиме Эксперт пользователь может
выполнить тот же пошаговый процесс получения прогноза, но используя кнопки
на панели управления процессом прогнозирования. В то же время можно менять
порядок выполнения шагов произвольно. Те модели методов прогнозирования,
которые дают приемлемые результаты (на данный момент являются лучшими)
можно запомнить для повторного использования. Такую возможность пользова-
тель получает по кнопке История. В соответствующем диалоговом окне следует
отметить список необходимых моделей методов и сохранить результат в виде
отдельного файла. Информацию из этого файла можно использовать в дальней-
шей работе, пополнять и обновлять в случае необходимости. Если же пользова-
тель начинает новый сеанс работы с пакетом, то работу можно продолжить с
учетом предыдущих изысканий, воспользовавшись для вызова пакета третьей
кнопкой на панели инструментов Predictor с именем Продолжить, по которой
после выбора данных необходимо будет выбрать файл, в котором сохранены
лучшие модели методов (*.mem). Доступ к нужным моделям методов можно
получить по той же кнопке История.
Пакетный режим предлагает пользователю пошагово пройти часть процесса
построения прогноза – от выбора данных до выбора методов прогнозирования,
остальные шаги пакет преодолевает автоматически. На каждом шаге, как и
в режиме Мастер, предлагается помощь (кнопка Помощь), выход из пакета
(Отменить), переход на следующий шаг (Дальше) и возврат на предыдущий
(Назад) – традиционный набор кнопок окна мастера.
АВТОМАТИЧЕСКОЕ ПОСТРОЕНИЕ ЧИСЛОВЫХ ПРОГНОЗОВ
Компьютерная математика. 2010, № 2 55
Автоматическое построение прогнозов в пакетном режиме
Рассмотрим подробнее сеанс работы в пакетным режиме. Данные должны
быть заранее внесены в рабочую таблицу MS Excel. После этого их необходимо
маркировать, и на панели инструментов PREDICTOR выбрать кнопку Пакетный
режим.
Шаг 1. Открывается диалоговое окно с адресом маркированной области.
Необходимо подтвердить выбор данных или скорректировать эту область по
своему усмотрению.
Шаг 2. Выбор сезонности данных. Необходимо просто указать, какой пери-
од имеют данные: представлены ли они по месяцам, кварталам, годам или неде-
лям. При этом соответствующее числовое значение выбирается автоматически.
Есть возможность ввести просто число, если период выбранного ряда данных
не входит в вышеуказанный перечень.
Шаг 3. Длина прогноза. Выбирается число шагов, на которые строится про-
гноз. Это же количество последних точек в режиме тестирования (шаг 7) не ис-
пользуется как исходные данные, а остается для тестирования модели (на них
строится предварительный прогноз). От выбранной длины прогноза будущий
выбор метода прогнозирования не зависит, но следует учесть, что это число мо-
жет превысить длину доверительного интервала выбранного метода.
Шаг 4. Выбор метода прогнозирования. Предлагается общий список, в кото-
ром маркированы методы, пригодные для прогнозирования выбранного ряда
(отбор ведется пакетом автоматически по заданным на предыдущих шагах па-
раметрам и встроенным функциям анализа выбранного ряда), а пользователь
имеет возможность скорректировать данный список (как расширить, так и со-
кратить его). Весь дальнейший процесс тестирования и отбора наиболее подхо-
дящих методов производится автоматически.
Автоматизация подбора оптимального метода возможна за счет встраивания
в пакет средств интеллектуальной поддержки работы пользователя. Одним из
таких средств является интегральная оценка – авторская разработка создателей
пакета (Харченко А.В.).
Задача, решаемая посредством оценок качества. Мотивация инте-
гральной оценки ИО ( )Q Q* E,A,I= . Свойства ( )Q Q* E,A,I= как крите-
рий активного обучения
Оценки качества (ОК) моделей служат для решения задачи адекватности
модели тому временному ряду, для которого построена прогнозная модель.
Пусть Q – максимизируемая в процессе настройки модели ˆ ( , )i iy F= αx , α –
вектор параметров модели, на обучающем подмножестве D оценка качества,
EQ – ее минимизируемый вариант. Традиционно используемые ОК – это меры
ошибки, например среднеквадратическая ошибка
ˆ[ ]СКО i iE E y y= − , (1)
где iy – значение неизвестной функции, iŷ – оценка значения неизвестной
функции.
С.И. ЛАВРЕНЮК, О.Л. ПЕРЕВОЗЧИКОВА, В.Г. ТУЛЬЧИНСКИЙ, А.В. ХАРЧЕНКО
56 Компьютерная математика. 2010, № 2
В пакет Predictor встроены 15 распространенных ОК модели. Однако для
получения рядовым пользователем компактной информации о пригодности того
или иного метода прогнозирования для получения числового прогноза все еще
остается проблематичной. Встает вопрос создания интегрированной обобщен-
ной оценки, которая смогла бы учесть максимальное число параметров, по кото-
рым можно было бы оценить адекватность модели.
Глобальное и локальное обучение прогнозных моделей
Рассмотрим более общий случай – локальную стабильность параметров по-
рождающего процесса, когда совместное распределение вероятностей значений
неизвестной функции и независимых переменных в различных подмножествах
ряда:
)|,()|,( ji ttyPttyP === xx , но )|,()|,( kj ttyPttyP === xx ,
kji << . (2)
В этом случае ОК, аналогичные(1), – глобальные могут использоваться разве
что для оценки средней производительности (качества) модели.
Сформулируем принцип ограниченной предыстории, мотивирующий необ-
ходимость локальной ОК: множество примеров 1{ , } n
i i iS y == x ограниченную
предысторию, когда на временном ряде 1{ } n
i it = существует m таких непересе-
кающихся подмножеств 1{ } m
j jS S == , что справедливо (2).
Таким образом, основной задачей построения прогнозной модели временно-
го ряда, в котором допускается наличие локальных зависимостей, становится не
настройка параметров модели на всей доступной предыстории n
iiiy 1},{ =x , а их
настройка с поиском границы локальных зависимостей. Для решения этой зада-
чи кроме точности настройки модели ),ˆ,(* nyyEE ii= , для которой
EQ
DD ,,
minargmaxarg
αα
= , предлагается учитывать дополнительно другие факторы
качества модели:
1) качество ряда остатков ),ˆ,(* nyyAA ii= ; значение функционала макси-
мально, когда ряд остатков представляет собой процесс белого шума:
0][E =ie ,
2E[ ] constie = , 0],[E =si ee для i s≠ , (3)
где ie − i -й остаток, iii yye −= ˆ , и AQ
DD
minargmaxarg
,
=
α
; заметим, что свой-
ства этого фактора были исследованы в [5];
2) сложность модели
* ˆ( , , , )i iI I y y n= α ,
АВТОМАТИЧЕСКОЕ ПОСТРОЕНИЕ ЧИСЛОВЫХ ПРОГНОЗОВ
Компьютерная математика. 2010, № 2 57
где )(* ⋅I – функционал, взвешивающий сложность модели и какой-либо аспект
качества ряда остатков, например, точность или дисперсия ( 2
ŷσ ), причем
,
arg max arg min
D
Q I
αα
= .
Таким образом, качество прогнозной модели представляет собой функционал
),,(* IAEQQ = . (4)
Поскольку для поиска границы смежных локальных зависимостей∗ необхо-
димо варьировать не только α (параметров модели), но и управлять ее обучаю-
щим множеством D , то для последнего, вообще говоря, могут существовать
различные стратегии. Такие стратегии управления обучающим множеством мо-
делей исследуются в рамках так называемого активного обучения.
Сформулируем задачу активного руководимого обучения. Пусть имеется
множество обучающих примеров m
iii yD 1)},{( == x , где Xi ∈x и Yyi ∈ . Тре-
буется обучение некоторой модели, выполняющей отображение YX → . При
активном обучении субъект обучения (агент) формирует D , т. е. итеративно
выполняет алгоритм:
1) выбрать новый x~ ( DX ∉∈ xx ~,~ );
2) оценить соответствующий y~ ( DyYy ∉∈ ~,~ );
3) принять решение о внесении )~,~( yx в D .
Задачей руководимого активного обучения является установление критерия
добавления )~,~( yx в D .
В активном обучении, значительную часть стратегий которого составляют
эвристики, особая роль принадлежит активному обучению на основании стати-
стически обоснованного критерия Кона – Гарамани – Джордана [7], согласно
которому при отсутствии смещенности ( 0])[E)];,([E( 2 =− yDF αx ) миними-
зация ошибки обучения достигается путем минимизации дисперсии обучения:
)(minargminarg 2
ˆ xy
D
КГД
D
E σ= ,
где ∫ −= xxxx dPyDyEКГД )(]))();([(E 2 – мера точности, 2
ˆ ( )yσ =x
2E[( ( , ) E[ ( , )]) ]F F= α − αx x – дисперсия значений оценок неизвестной функ-
ции )(xy , восстанавливаемой на обучающем множестве D .
Покажем, что интегральную оценку качества в виде (4) можно использовать
в качестве критерия активного обучения в смысле Кона – Гарамани – Джордана
(КГД-обучения):
)(minarg),,(minarg 2
ˆ
*
,
xy
D
E
D
IAEQ σ
α
= .
Справедлива следующая теорема.
∗ Увеличение таким образом качества прогнозной модели путем не включения в модель ряда моделей
всех локальных зависимостей, кроме хронологически последней.
С.И. ЛАВРЕНЮК, О.Л. ПЕРЕВОЗЧИКОВА, В.Г. ТУЛЬЧИНСКИЙ, А.В. ХАРЧЕНКО
58 Компьютерная математика. 2010, № 2
Теорема. При 2(E[ ( , ; )] E[ ]) 0F D yα − =x критерий ( , , )EQ E A I∗
, в котором
КГДE E= и зафиксированном A эквивалентен критерию arg min КГД
D
E =
2
ˆarg min ( )y
D
= σ x .
Доказательство. Поскольку
2 2 2E[( ( , ; ) ( )) ] E[( ( ) E[ ]) ] (E[ ( , ; )] E[ ])F D y y y F D yα α− = − + − +x x x x
2E[( ( , ; ) E[ ( , ; )]) ]F D F Dα α+ −x x
(согласно [7], то первое слагаемое представляет собой шум, не зависящий от ,D
а второе слагаемое, согласно условию теоремы, равно нулю. Для двух примеров
1 1( , )yxɶ ɶ и 2 2( , )yxɶ ɶ , из
1 2
2 2
ˆ ˆy yσ < σ следует 1 1 2 2( , ) ( , )КГД КГДE y E y<x xɶ ɶ ɶ ɶ и
1 2
2 2
ˆ ˆ( ) ( )y yE Eσ < σ , а так как * 2
ˆ( , )yI I= σ α , то
1 2
2 2
ˆ ˆ( ) ( )y yI Iσ < σ , следовательно,
1 2
2 2
ˆ ˆ( ) ( )E y E yQ Q∗ ∗σ < σ при
1 2
2 2
ˆ ˆ( ) ( )y yA Aσ = σ .
Следствие. Критерий ),,( IAEQE
∗
, мера точности в котором вычисляется
как КГДEE = , сильнее критерия )(minargminarg 2
ˆ xy
D
КГД
D
E σ= при настройке
несмещенных моделей.
Таким образом, для активного КГД-обучения прогнозных моделей, кроме
стратегии минимизации 2
ˆ ( )yσ x , возможна альтернативная стратегия, учиты-
вающая качество ряда остатков, например, минимизирующая их автокоррелля-
цию. Таким образом введение интегральной оценки существенно упрощает от-
бор оптимальной модели для численного прогнозирования, а именно включение
ее как составляющей части пакета дает возможность автоматизации процесса
оценивания предложенных моделей, значит, и отбора оптимальной. Пакет
PREDICTOR обеспечивает такую возможность автоматического получения
прогнозов с подбором лучшего метода, максимально точной настройкой его
параметров и отбора лучшей модели по интегральным критериям.
Пример прогнозирования цен на продукты питания. Рассмотрим про-
стоту работы пакета на примере прогнозирования цен на подсолнечное масло
(данные за 2000–2001 годы).
В режиме Пакетное прогнозирование необходимо выбрать область данных
(рис. 1), после чего будет задано пару уточняющих вопросов о сезонности и
длине необходимого прогноза:
РИС. 1. Выбор области данных
АВТОМАТИЧЕСКОЕ ПОСТРОЕНИЕ ЧИСЛОВЫХ ПРОГНОЗОВ
Компьютерная математика. 2010, № 2 59
Система проводит тестирование, выбирает 4 лучших метода, выполняет
прогнозирование выбранными методами и вставку результата в электронную
таблицу (рис. 2).
0.00
20000.00
40000.00
60000.00
80000.00
100000.00
120000.00
1 4 7 10 13 16 19 22 25
Подсолнечное масло
ARIMA 1 0 0
ARIMA-AR 1 0 0 1
ARARMA 1 0 1
Winters 0.80 0 0.30
РИС. 2. Результат прогноза
Результат прогнозирования по выбранным 4 лучшим методам приведен
в табл. 1.
ТАБЛИЦА 1. Результат работы PREDICTOR
Подсолнечное
масло
ARIMA 1 0 0 ARIMA-AR 1
0 0 1
ARARMA 1
0 1
Winters 0.80 0 0.30
64537.00 64537.00 64537.00 64537.00 64537.00
… … … … …
94597.00 64901.14 58390.10 62280.78 60353.23
90153.49 94912.95 83383.21 101565.13
85918.71 87433.50 69623.76 87603.45
81882.84 84396.26 65125.23 99101.00
По каждому методу можно настроить множество параметров статистики, по
которой можно сравнить выбранные методы. Пример статистики приведен
в табл. 2.
ТАБЛИЦА 2. Отображение параметров статистики
ARIMA 1 0 0 ARIMA-AR 1
0 0 1
ARARMA 1 0
1
Winters 0.80 0
0.30
DW 2.036310059 1.990477097 1.916739173 1.977068769
R2 0.166439353 0.179470748 0.313953139 0.026398051
AIC 0.484013495 0.48363533 0.481339243 0.491740601
BIC 488.3696031 487.9914375 490.0514581 504.8089244
HQ 484.3260335 483.9478678 481.9643189 492.6782155
С.И. ЛАВРЕНЮК, О.Л. ПЕРЕВОЗЧИКОВА, В.Г. ТУЛЬЧИНСКИЙ, А.В. ХАРЧЕНКО
60 Компьютерная математика. 2010, № 2
При необходимости можно моделировать ситуацию, изменяя параметры
полученной модели (рис. 3).
РИС. 3. Изменение параметров модели
Иногда данные состоят из нескольких связанных рядов. Например, прогно-
зируя уровень цен на подсолнечное масло в качестве дополнительных рядов,
выбирем цены на другие товары первой необходимости: маргарин, мыло хозяй-
ственное и туалетное. Пакет автоматически подбирает 4 лучших метода, исполь-
зуя для тестирования методы, работающие с множественными рядами.
В примере пользователь, работая в привычной среде Excel своей предметной
области, просто и эффективно использует мощный инструмент прогнозирования
данных, по ходу вычислений приобретая навыки прогнозирования данных.
Особенности использования пакета PREDICTOR
Пакет предполагает автоматическую инсталляцию; необходимо только ука-
зать версию Excel, с которой будет взаимодействовать пакет, и выбрать конфи-
гурацию установки (руководство пользователя, примеры и Мастер). Файлы,
необходимые для дальнейшей работы (рабочие книги –*.xls , библиотечные
файлы –*.dll, файлы справочной системы – *.hlp и т. д.), будут скопированы в
стандартные подкаталоги EXCEL и WINDOWS. Все необходимые настройки
также будут проведены автоматически – создается и включается панель инстру-
ментов PREDICTOR с набором кнопок для различных способов запуска пакета,
создается и включается в работу дополнение (надстройка, Add-Ins).
Заключение. Среди разнообразных методов прогнозирования предпочтение
отдается программным продуктам, способным легко строить прогноз и выби-
рать наилучшие модели для начальных данных. Так, в [8] приведен анализ паке-
тов, облегчающих разработки прогнозов по 12 группам критериев. Кроме срав-
нительного анализа, табл. 2 и 3 из [8] свидетельствуют, что практически каждый
программный продукт может записать результат в таблицы Excel и из них им-
портировать данные для работы. Но ведь экспорт / импорт данных зачастую свя-
зан с побочными проблемами нестыковки форматов данных.
Отличительной чертой пакета Predictor является удобство пользовательско-
го интерфейса, когда построение прогноза перерастает в процесс моделирова-
ния с подсказками компьютера о подходящих методов прогнозирования, с авто-
матическим сравнением моделей и выбором оптимальной модели прогноза.
Подготовку и преобразование входных данных автоматически выполняют ути-
литы пакета.
Начаты работы по переводу пакета PREDICTOR на вычислительные класте-
ры СКИТ-3 и Инпарком, на которых параллельно можно будет одновременно
считать все (или несколько) моделей и обрабатывать сотни файлов данных, со-
держащих сотни тысяч наблюдений, что увеличит производительность пакета.
В связи с тем, что методы прогнозирования связаны с обработкой матричных
данных (особенно AR), то такие методы достаточно просто распараллелить.
АВТОМАТИЧЕСКОЕ ПОСТРОЕНИЕ ЧИСЛОВЫХ ПРОГНОЗОВ
Компьютерная математика. 2010, № 2 61
С.І. Лавренюк, О.Л. Перевозчикова, В.Г. Тульчинський, А.В. Харченко
АВТОМАТИЧНА ПОБУДОВА ЧИСЛОВИХ ПРОГНОЗІВ
Розглянуто можливості автоматичної побудови прогнозів з використанням пакета статистич-
ного прогнозування PREDICTOR, описані та обгрунтовані інтелектуальні засоби пакета, яки-
ми володіє цей продукт, насамперед засоби інтегральної оцінки, що дозволяє ранжувати
отримані прогнози. Наведені приклади побудови прогнозів на основі реальних числових
рядів.
S.I. Lavreniuk, O.L. Perevozhikova, V.G. Tulchinsky, A.V. Kharchrenko
ON AUTOMATICAL GENERATION OF NUMERIC FORECASTS
The abilities of automatical forecasting with the use of statistical forecasting package PREDICTOR
are examined. Intelligent tools of the package, first of all, the integrated estimating method that en-
ables the resulted forecast ranging, are described and proved. The examples of forecast based on the
real-time series are proposed.
1. Савицкая Г.В. Теория анализа хозяйственной деятельности: Учебник. ИНФРА-М. – 2007.
– 288 c.
2. «Проект Закону про державне прогнозування та стратегічне планування в Україні»,
від 16.03.2010 № 6198 // http://gska2.rada.gov.ua
3. Холден К., Пiл Д.А., Томпсон Дж.Л. Економiчне прогнозування: вступ. – К.: Iнформтех-
нiка-ЕМЦ, 1996. – 216 с.
4. Интеллектуальные пакеты статистического прогнозирования / О.Л Перевозчикова,
И.Н. Пшoнковская, Т.К. Терзян, В.Г. Тульчинский и др. // Упр. системы и машины. –
1997. – № 6. – C. 56–67.
5. Box G. E. P., Jenkins G. M. Time Series Analysis Forecasting and Control. – San Francisco:
Holden-Day, Inc., 1970. – 112 р.
6. Cohn D.A., Ghahramani Z., Jordan M.I. Active Learning with Statistical Models // J. of Artifi-
cial Intelligence Research. – 1996. – N 4. – P. 129–145.
7. Geman S., Bienenstoak E., Doursat R. Neural networks and the bias/variance dilemma // Neural
Computation. – 1992. – N 4. – P. 1–58.
8. http://www.nickart.spb.ru/clause/text_07.php
Получено 08.04.2010
Îá àâòîðàõ:
Лавренюк Сергей Иванович,
младший научный сотрудник Института кибернетики имени В.М. Глушкова НАН Украины,
Перевозчикова Ольга Леонидовна,
доктор физико-математических наук, профессор, член-корреспондент НАН Украины,
зав. отделом Института кибернетики имени В.М. Глушкова НАН Украины,
Тульчинский Вадим Григорьевич,
кандидат физико-математических наук, старший научный сотрудник,
зав. лабораторией Института кибернетики имени В.М. Глушкова НАН Украины,
Харченко Андрей Вячеславович,
кандидат физико-математических наук,
научный сотрудник Института кибернетики имени В.М. Глушкова НАН Украины.
|