Применение прогнозирующих алгоритмов МГУА для решения маркетинговых задач
Робота присвячена комплексному розв’язанню складних задач прогнозування під час аналізу маркетингових даних параметричними та непараметричними індуктивними алгоритмами. Описано модифікації алгоритму комплексування аналогів i комбінаторного багаторядного алгоритму МГУА. Наведено результати прогнозува...
Gespeichert in:
| Datum: | 2008 |
|---|---|
| 1. Verfasser: | |
| Format: | Artikel |
| Sprache: | Russian |
| Veröffentlicht: |
Інститут кібернетики ім. В.М. Глушкова НАН України
2008
|
| Schriftenreihe: | Проблемы управления и информатики |
| Schlagworte: | |
| Online Zugang: | https://nasplib.isofts.kiev.ua/handle/123456789/209128 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Zitieren: | Применение прогнозирующих алгоритмов МГУА для решения маркетинговых задач / Г.А. Ивахненко // Проблемы управления и информатики. — 2008. — № 2. — С. 140-152. — Бібліогр.: 9 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| id |
irk-123456789-209128 |
|---|---|
| record_format |
dspace |
| spelling |
irk-123456789-2091282025-11-15T01:18:41Z Применение прогнозирующих алгоритмов МГУА для решения маркетинговых задач Застосування прогнозуючих алгоритмів МГУА для розв’язання маркетингових задач Application of forecasting GMDH algorithms for marketing problems solution Ивахненко, Г.А. Решение прикладных задач моделирования с применением алгоритмов МГУА Робота присвячена комплексному розв’язанню складних задач прогнозування під час аналізу маркетингових даних параметричними та непараметричними індуктивними алгоритмами. Описано модифікації алгоритму комплексування аналогів i комбінаторного багаторядного алгоритму МГУА. Наведено результати прогнозування за допомогою програмної системи для Excel. Запропоновано шляхи вдосконалення алгоритмів МГУА. The article is devoted to solution of complex forecasting problems for marketing data analysis by parametric and nonparametric inductive algorithms. Modifications of the analog complexing and combinatorial multilayered GMDH algorithms are described. The results of forecasting by software system for Excel are considered. The ways to improve GMDH algorithms are proposed. 2008 Article Применение прогнозирующих алгоритмов МГУА для решения маркетинговых задач / Г.А. Ивахненко // Проблемы управления и информатики. — 2008. — № 2. — С. 140-152. — Бібліогр.: 9 назв. — рос. 0572-2691 https://nasplib.isofts.kiev.ua/handle/123456789/209128 621.513 10.1615/JAutomatInfScien.v40.i3.70 ru Проблемы управления и информатики application/pdf Інститут кібернетики ім. В.М. Глушкова НАН України |
| institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| collection |
DSpace DC |
| language |
Russian |
| topic |
Решение прикладных задач моделирования с применением алгоритмов МГУА Решение прикладных задач моделирования с применением алгоритмов МГУА |
| spellingShingle |
Решение прикладных задач моделирования с применением алгоритмов МГУА Решение прикладных задач моделирования с применением алгоритмов МГУА Ивахненко, Г.А. Применение прогнозирующих алгоритмов МГУА для решения маркетинговых задач Проблемы управления и информатики |
| description |
Робота присвячена комплексному розв’язанню складних задач прогнозування під час аналізу маркетингових даних параметричними та непараметричними індуктивними алгоритмами. Описано модифікації алгоритму комплексування аналогів i комбінаторного багаторядного алгоритму МГУА. Наведено результати прогнозування за допомогою програмної системи для Excel. Запропоновано шляхи вдосконалення алгоритмів МГУА. |
| format |
Article |
| author |
Ивахненко, Г.А. |
| author_facet |
Ивахненко, Г.А. |
| author_sort |
Ивахненко, Г.А. |
| title |
Применение прогнозирующих алгоритмов МГУА для решения маркетинговых задач |
| title_short |
Применение прогнозирующих алгоритмов МГУА для решения маркетинговых задач |
| title_full |
Применение прогнозирующих алгоритмов МГУА для решения маркетинговых задач |
| title_fullStr |
Применение прогнозирующих алгоритмов МГУА для решения маркетинговых задач |
| title_full_unstemmed |
Применение прогнозирующих алгоритмов МГУА для решения маркетинговых задач |
| title_sort |
применение прогнозирующих алгоритмов мгуа для решения маркетинговых задач |
| publisher |
Інститут кібернетики ім. В.М. Глушкова НАН України |
| publishDate |
2008 |
| topic_facet |
Решение прикладных задач моделирования с применением алгоритмов МГУА |
| url |
https://nasplib.isofts.kiev.ua/handle/123456789/209128 |
| citation_txt |
Применение прогнозирующих алгоритмов МГУА для решения маркетинговых задач / Г.А. Ивахненко // Проблемы управления и информатики. — 2008. — № 2. — С. 140-152. — Бібліогр.: 9 назв. — рос. |
| series |
Проблемы управления и информатики |
| work_keys_str_mv |
AT ivahnenkoga primenenieprognoziruûŝihalgoritmovmguadlârešeniâmarketingovyhzadač AT ivahnenkoga zastosuvannâprognozuûčihalgoritmívmguadlârozvâzannâmarketingovihzadač AT ivahnenkoga applicationofforecastinggmdhalgorithmsformarketingproblemssolution |
| first_indexed |
2025-11-15T02:07:36Z |
| last_indexed |
2025-11-16T02:04:54Z |
| _version_ |
1848910748347006976 |
| fulltext |
© Г.А. ИВАХНЕНКО, 2008
140 ISSN 0572-2691
УДК 621.513
Г.А. Ивахненко
ПРИМЕНЕНИЕ ПРОГНОЗИРУЮЩИХ
АЛГОРИТМОВ МГУА ДЛЯ РЕШЕНИЯ
МАРКЕТИНГОВЫХ ЗАДАЧ
Введение
В статье рассматриваются особенности применения индуктивных алго-
ритмов для анализа сложных маркетинговых систем с учетом внешних возму-
щающих факторов. Цель работы — исследование вопросов применения индук-
тивных алгоритмов для комплексного анализа таких систем. Публикация со-
держит описание модификаций двух алгоритмов метода группового учета
аргументов (МГУА): комбинаторного и комплексирования аналогов. Кроме то-
го, описаны примеры их применения в прикладной программной системе для
комплексного анализа баз данных. Использование индуктивного подхода для
анализа маркетинговых проблем позволяет существенно разнообразить круг
решаемых проблем, упростить процесс принятия решений и увеличить период
прогнозирования.
В рамках МГУА разработано много взаимосвязанных индуктивных алгорит-
мов для анализа данных (data mining), прогнозирования и распознавания образов.
Они позволяют находить оптимальные модели с помощью перебора постепенно
усложняющихся математических соотношений и выбора наилучшего решения по
минимуму внешнего критерия. Особенность МГУА заключается в том, что он од-
новременно минимизирует ошибку модели и находит оптимальную структуру
модели.
Переборные алгоритмы дают возможность применять метод для решения
проблем искусственного интеллекта, поскольку автоматически находят зако-
номерности, действующие в системе, и позволяют уменьшить влияние пользо-
вателя на результаты моделирования.
Следует отметить, что одной из проблем в параметрических алгоритмах
МГУА является не большой объем перебора моделей, а смещение оценок коэф-
фициентов регрессионных моделей. На практике даже при незначительном шуме
или большом количестве исходных переменных регрессионный анализ находит
переусложненные модели. За годы разработки теории МГУА исследован ряд
существенных улучшений, помогающих модифицировать процесс нахождения
моделей оптимальной сложности. Кроме параметрических алгоритмов, исследо-
ваны непараметрические методы, также позволяющие обойти эту проблему.
Из всего спектра различных видов алгоритмов МГУА (табл. 1) в данном ис-
следовании использовано четыре алгоритма — COMBI для имитации возмож-
ных изменений на рынке и выявления взаимозависимостей переменных, MIA
для нахождения критических точек изменения спроса в зависимости от цены,
OCC для предварительного разделения брендов и продуктов на кластеры и AC
для долгосрочного прогнозирования по коротких рядам данных. Алгоритмы HA
и ARIMAD тоже могут использоваться для решения задач долгосрочного прог-
нозирования.
Проблемы управления и информатики, 2008, № 2 141
Таблица 1
Переменные
Алгоритмы МГУА
Параметрические Непараметрические
Непрерывные
Комбинаторный (COMBI) Объективная компьютерная
кластеризация (OCC) Многорядный итерационный
(MIA, CML, GN)
Объективный системный анализ (OSA)
Комплексирование аналогов (АС)
Индукция размытых правил (FRI)
Гармонический (HA)
Двухуровневый (ARIMAD)
Мультипликативно-аддитивный (MAA)
Комбинации с нейросетями (ANN)
и генетическими алгоритмами (GA)
Дискретные/
бинарные Гармонической редискретизации (HRA)
«Парных вероятностей» на основе
многорядной теории статистиче-
ских решений (PPA)
Комбинаторно-многорядный алгоритм МГУА
По матрице X наблюдений входных переменных размерности ,MN × где
N — число наблюдений, М — число входных переменных, и по вектору Y наблю-
дений выходной переменной размерности N оценивается зависимость
,)...,,( 1 ξ+= MxxPy (1)
где )...,,( 1 MxxP — многочлен от входных переменных ,...,,1 Mxx а ξ — неиз-
вестная помеха.
Комбинаторный алгоритм является базовым в МГУА [1] и построен на пол-
ном переборе всех 12 −M возможных моделей, содержащих M...,,1 аргументов,
и отборе подмножества Ω лучших моделей по минимуму одного из внешних
квадратичных критериев. На первом ряду в качестве начальных приближений к
описанию (1) перебираются все M моделей с одним аргументом вида
,iii xaz ⋅= ,...,,1 Mi = (2)
где ai — коэффициенты, подлежащие оцениванию, на втором ряду — модели с двумя
аргументами, и так далее, до одной полиномиальной модели с M аргументами:
.
1
∑
=
=
M
i
ii xay (3)
На каждом ряду перебора подмножество Ω обновляется лучшими моделя-
ми. После окончания перебора из этого подмножества определятся оптималь-
ная модель по минимуму вспомогательного квадратичного критерия. За при-
емлемое время счета можно выполнить перебор моделей примерно до 33<M
переменных.
В многорядном алгоритме МГУА [2] на всех итерациях в качестве прибли-
жений к зависимости (1) могут выбираться функции вида
,lkjijj zzbzaz ⋅⋅+⋅= (4)
называемые частными описаниями, где ,ii xz = kk xz = ,ll xz = при
Mlki ...,,1,, = и lki zzz ,, — описания, полученные на предыдущем ряду итера-
ции в случае, если .,, Mlki >
142 ISSN 0572-2691
Для каждой из таких функций вычисляется значение некоторого квадратич-
ного критерия, характеризующего качество полученного описания. В отличие от
комбинаторного алгоритма, rF лучших в смысле этого критерия описаний запо-
минаются на каждом ряду усложнения структуры модели для следующего ряда
селекции. Здесь rF — некоторое натуральное число, называемое свободой выбо-
ра и задаваемое извне.
В данном алгоритме предусмотрено использование одного из трех квадра-
тичных критериев качества моделей: несмещенности, корреляционного и регу-
лярности. Применение внешнего критерия регулярности )AR(s предполагает
разделение множества наблюдений на два непересекающихся множества, называ-
емые обучающим множеством или множеством A, и тестовым множеством, обо-
значаемым B. Критерий регулярности имеет вид
,)()AR( 22
ABBBB XyAyys Θ−=−=
(5)
т.е. равен сумме квадратов разностей, рассчитанных на множестве B, между из-
вестными y и модельными значениями y выходной величины, при условии, что
оценки коэффициентов регрессионной модели AΘ
получены на множестве A.
В ходе проверки различных модификаций комбинаторного алгоритма МГУА
найдено, что существующий комбинаторно-селекционный алгоритм [1], разрабо-
танный В.С. Степашко, наиболее полно покрывает область регрессии и универса-
лен, поскольку может реализовать как полный перебор (метод «всех регрессий»)
при свободе выбора r
Mr CF = , так и метод последовательной регрессии при .1=rF
Основная его особенность заключается в том, что для селекции на каждом
ряду перебора отбирается rF лучших описаний и к каждому из них по одной до-
бавляются другие переменные на следующем ряду селекции.
В данной работе использована модификация этого алгоритма. Назовем ос-
новные отличия.
1. Для реализации функций как комбинаторного, так и многорядных алго-
ритмов МГУА в модификации добавлена возможность применения частных опи-
саний zj как аргументов для последующих рядов селекции. Соответственно могут
быть введены ограничения на сложность получаемых моделей, число слагаемых,
добавлена также процедура раскодировки структуры окончательной оптимальной
модели по способу геделевской нумерации [2].
2. Свобода выбора rF не определяется автоматически по условию улучше-
ния минимального значения внешнего критерия и не ограничивается сверху и
снизу, а задается как постоянный параметр, что упрощает работу алгоритма.
3. Добавлена возможность перебора от более сложных моделей к более про-
стым при комбинаторном счете. Это помогает исследовать на практике взаимо-
связи между переменными в сложных моделях.
4. Используется предварительный отсев «выбросов» выходной переменной.
Такие наблюдения переносятся в тестовую подвыборку данных B или удаляются.
Это улучшает оценку коэффициентов по МНК. Кроме того, обнуляются коэффи-
циенты, для которых оценки пренебрежимо малы.
5. Введена протекция по знаку коэффициентов и по структуре модели. Такие
ограничения позволяют находить модели с необходимыми знаками и переменны-
ми для интерпретации и исследования взаимосвязей.
Проблемы управления и информатики, 2008, № 2 143
6. Используется несколько основных и дополнительных критериев селекции
моделей (например, выбор прогнозирующей модели по ошибке на экзаменацион-
ной подвыборке данных C).
Таким образом, разработанный алгоритм достаточно универсален для анали-
за и допускает реализацию различных параметрических алгоритмов МГУА.
В теории МГУА исследовано несколько важных усовершенствований для
улучшения селекции моделей:
1) ортогональное оценивание коэффициентов для уменьшения смещения
оценок регрессионных моделей [3];
2) устойчивые M-оценки параметров регрессионной модели по Хьюберу
[4, 5] для помехоустойчивости моделей. Они позволяют уменьшить главный не-
достаток МНК — чувствительность к выбросам;
3) гребневая регрессия для регуляризации плохо обусловленных матриц, она
позволяет находить оценки коэффициентов, например, при мультиколлинеарно-
сти входных переменных [2, 5];
4) геделевская нумерация переменных для развертывания структур выбран-
ных моделей в многорядном алгоритме [2];
5) «метод окаймления» матриц XX T для рекуррентного оценивания коэф-
фициентов модели, расчета критериев и уменьшения времени счета [1].
Исследование и применение этих методов важно для развития теории МГУА,
так как основной причиной недостоверности моделей чаще всего бывает смеще-
ние оценок их коэффициентов. Именно из-за переусложненности оптимальной
модели трудно получить точный прогноз или открыть закон по выборке данных.
Первые три усовершенствования помогают решить эту важную проблему. При-
менение некоторых из них существенно повысило устойчивость алгоритма и ско-
рость вычислений.
Структура комбинаторно-многорядного алгоритма МГУА содержит три вло-
женных цикла перебора моделей и один цикл выбора лучшей модели из множе-
ства найденных.
Алгоритм состоит из трех следующих этапов.
I. Ввод и предварительное преобразование исходных данных.
1. Ввод и проверка параметров.
2. Ввод данных из сsv-, xls- или txt-файлов. Вывод данных в файл отчета и на
экран.
3. Создание выборки с запаздываниями при режиме прогнозирования.
4. Нормирование исходных данных.
5. Деление выборки случайным образом или с предварительным ранжирова-
нием по дисперсии.
II. Генерирование частных моделей различной сложности.
6. Начало I цикла селекции — по множеству выходных переменных Y.
7. Оценка и перенос выбросов из подвыборки A в подвыборку B.
8. Расчет матрицы нормальных уравнений XX T для всей подвыборки А.
9. Начало II цикла селекции — по сложности модели.
10. Инициализация множества переменных в первоначальной модели.
11. Начало III цикла генерации моделей при заданной их сложности.
12. Протекция переменным — проверка их наличия в новом множестве пере-
менных.
13. Формирование матрицы XX T из полной матрицы.
14. Расчет оценок коэффициентов модели (использование улучшающих ме-
тодов).
144 ISSN 0572-2691
15. Протекция по знаку коэффициентов модели.
16. Расчет основного критерия селекции моделей.
17. Сохранение в массиве Ω лучших структур моделей, коэффициентов и
значений внешнего критерия.
18. Генерация новой структуры частной модели для одной из rF отобранных
моделей.
19. Конец III цикла.
20. Обнуление коэффициентов с пренебрежимо малыми значениями и удале-
ние повторяющихся структур в массиве Ω лучших моделей.
21. При необходимости вывод ранжированного ряда лучших переменных (по
нескольким лучшим моделям).
22. Выбор rF лучших моделей текущего ряда.
23. При необходимости прерывание селекции по неубыванию квадратичного
критерия.
24. Конец II цикла селекции по сложности модели.
III. Выбор оптимальной модели.
25. Начало цикла отбора моделей.
26. Для каждой отобранной модели перерасчет оценок коэффициентов на
полной выборке из обучающей и проверочной подвыборок, расчет среднеквадра-
тичной ошибки на экзаменационной подвыборке С.
27. Расчет значения вспомогательного критерия селекции, критериев адек-
ватности модели.
28. Разнормирование рядов. Запись в файл результатов.
29. Конец цикла отбора по неубыванию вспомогательного критерия.
30. Конец I цикла по Y.
31. Запись времени счета.
32. Конец алгоритма.
Использование многорядной версии этого алгоритма показало, что для боль-
шого количества переменных и свободе выбора 10>rF найденные модели чаще
всего совпадают с результатами полного перебора при значительно меньшем вре-
мени счета. Например, если полный перебор моделей при числе входных пере-
менных 30=M занимает 3 ч 27 мин 50 с, то такую же линейную модель много-
рядный алгоритм находит за 0,84 с при 15=rF и 10 рядах счета. Расчет 58 рядов
для другой выходной переменной при 59=M занимает 13,7 с. Расчеты проводи-
лись в фоновом режиме (с загрузкой процессора 50%) на обычном PC с процессо-
ром Intel Core 2 CPU T7200 2GHz. Исследовалось построение зависимости объема
продаж продукта от показателей его распространения и рекламных переменных.
Кроме того, в рамках исследования рассмотрены непараметрические алго-
ритмы комплексирования аналогов, кластеризации и «парных вероятностей», поз-
воляющие решать те же проблемы интерполяции без применения регрессионных
методов.
Алгоритм комплексирования аналогов (AC)
Алгоритм предназначен для кластеризации и решения задачи пошагового
прогноза многомерных случайных процессов с помощью комплексирования
(взвешенного суммирования) фрагментов-аналогов, взятых из предыстории про-
цесса. Основные параметры алгоритма оптимизируются перебором дискретного
числа возможных вариантов по критерию регулярности ).AR(s
Согласно [6] разнообразие системы управления или модели должно быть не
меньшим, чем разнообразие самого объекта. Закон адекватности, изложенный
Проблемы управления и информатики, 2008, № 2 145
C. Биром [7], устанавливает, что для оптимального управления объекты должны
быть компенсированы соответствующими черными ящиками системы управле-
ния. Равная нечеткость модели и объекта достигается автоматически в случае, ес-
ли сам объект используется для прогноза.
Главные предположения при этом следующие:
• объект исследования описывается многомерным процессом;
• многомерный процесс достаточно представителен, т.е. основные систем-
ные переменные включены в выборку данных и она содержит достаточно много
наблюдений;
• возможно частичное повторение прошлого поведения системы в будущем.
Паттерны ,iFA следующие за аналогами iA во времени, называются их про-
гнозами (рис. 1). При жестком комплексировании F прогнозов по аналогам про-
гноз FA0 определяется по весам комплексирования аналогов :iλ
,
1
0 ∑
=
λ=
F
i
iFiF AA (6)
,
1
00 /∑
=
=λ
F
i
iii ll ,1
1
=λ∑
=
F
i
i (7)
где il0 — евклидово расстояние между исходным паттерном 0A и аналогами .iA
Рис. 1
146 ISSN 0572-2691
При мягком комплексировании прогнозов по аналогам коэффициенты веса
iλ сначала определяются по указанным выше формулам, а затем адаптируются с
помощью перебора небольшого числа дискретных значений по критерию )AR(s
или по МНК.
Общая задача оптимизации характеристик алгоритма комплексирования анало-
гов должна решаться в четырехмерном пространстве перебора. Требуется найти оп-
тимальные по критерию ошибки )AR(s значения следующих четырех параметров:
• множество учитываемых переменных X;
• количество комплексируемых прогнозов F;
• длина аналогов k;
• значения весовых коэффициентов iλ для комплексирования прогнозов.
Однако на практике установлено, что взаимные связи указанных характери-
стик позволяют заменить четырехмерный перебор двумя одномерными (по X и
по iλ ) и одним двумерным (по F и k), описанными ниже.
1. Поиск оптимального множества переменных. Вначале выполняется одно-
мерный перебор множеств входных переменных X при фиксированных F, k и .iλ
Он служит наиболее сильным (но не обязательным) средством оптимизации алго-
ритма комплексирования прогнозов. Оптимальное множество X находится по ми-
нимуму точностного критерия )AR(s одним из параметрических алгоритмов, ис-
пользующих полный или усеченный перебор переменных.
2. Оптимизация количества и длины паттернов. Двумерный перебор по ко-
личеству аналогов F и их длине k — обязательный шаг оптимизации. При необхо-
димости упрощения вычислений он тоже может быть сокращен до одномерного
перебора по F при фиксированной длине k. Матрица евклидовых расстояний
между аналогами должна быть пересчитана перед перебором для каждого значе-
ния k.
Согласно [8] каждый паттерн дополнительно может быть предварительно
нормирован или из него может быть выделен тренд. Но такое преобразование
может ухудшить результаты прогнозирования. Предварительная кластеризация
паттернов и поиск аналогов только внутри ближайшего к паттерну 0A кластера
улучшает результаты долгосрочного прогнозирования.
3. Оценивание весовых коэффициентов. В ходе исследования было проверено
несколько способов определения значений λ i. Веса могут быть найдены как при
«жестком», так и «мягком» способе комплексирования. Результаты по последне-
му способу оказались наиболее точными. Доопределение весовых коэффициентов
с помощью МНК можно выполнить разными способами [9].
При прогнозировании коротких временных рядов маркетинговых данных ос-
новной проблемой была различная длина рядов исходных данных. Для возможно-
сти построения прогнозирующих паттернов, когда при комплексировании не-
сколько аналогов уже не содержат исходных данных, использовалась процедура
коррекции весов комплексирования для последних точек прогноза.
4. Комплексирование (объединение) прогнозов. Каждый отобранный аналог
iA имеет свое продолжение во времени iFA , и по ним строится прогноз .0FA Та-
ким способом мы получаем F прогнозов, необходимых для комлексирования.
Описано несколько способов объединения прогнозов [8, 9]. В алгоритме неиз-
вестный прогноз FA0 находится согласно (6).
Алгоритм комплексирования аналогов МГУА рекомендуется, когда количе-
ство входных переменных больше количества наблюдений, и для данных с боль-
шой дисперсией шума (например, биржевых рядов).
Следующее преимущество алгоритма над параметрическими методами за-
ключается в возможности нахождения долгосрочных прогнозов. Если, кроме того,
Проблемы управления и информатики, 2008, № 2 147
принять предположение, что найденный набор аналогов определяет прогноз по
всей длине исходных временных рядов, то будущие значения коротких рядов мо-
гут быть найдены не только на один шаг вперед (как при применении регрессион-
ных моделей), а и на всю длину известных аналогов. Это свойство использовалось
для построения прогноза продажи продуктов для очень коротких рядов для не-
больших партий выпускаемых товаров. Его описание приводится далее.
Программная система моделирования DaVinci
Разработанная система имеет открытую гибкую структуру. Она позволяет
выполнять необходимые сложные вычисления как внутри программы Excel, так и
путем вызова внешних модулей МГУА. Обеспечивается передача параметров для
модулей, написанных на других языках программирования, их вызов и возврат
расчетов в Excel, обработка результатов и создание отчетов (рис. 2). Так как про-
грамма Excel практически известна всем пользователям, это дает возможность
строить многофункциональные системы, легко учитывающие запросы заказчиков.
С помощью языка VBA пользователь обновляет данные из Интернета и динами-
чески создает презентации, сообщения и документы непосредственно из Excel
нажатием кнопки.
Рис. 2
Цель создания такой программы — автоматизация всего цикла разработки
новых продуктов от момента разработки концепции бренда до отслеживания про-
даж. Применение различных алгоритмов МГУА существенно сократило период
выполнения проектов, принятия решений, расширило круг решаемых проблем
для заказчиков и улучшило точность результатов. Использование автоматическо-
го импорта данных и вывода результатов позволило сократить ошибки при им-
порте баз данных и практически моментально создавать отчеты и презентации в
стандартной форме.
Система предназначена для решения следующих задач
1. Анализ текущего состояния продукта. Создание файлов отчетов, которые
содержат все необходимые для презентации графики стандартной формы, диа-
граммы распределения и таблицы текущих изменений состояния продукта.
2. Кластеризация (сегментация). Применяется алгоритм OCC для разделения
продуктов, переменных, атрибутов и покупателей на кластеры. Долгосрочный
прогноз для нового продукта можно рассчитать с помощью его ассоциации с
имеющимся кластером продуктов.
148 ISSN 0572-2691
3. Построение деревьев решающих правил (decision trees). Этот простой алго-
ритм определяет причины попадания объекта в кластер и правила для перевода
его в другой кластер.
4. Прогнозирование. Применяются три алгоритма: комбинаторно-многоряд-
ный, комплексирования аналогов и экспоненциального сглаживания — для по-
строения интерполяционных и экстраполяционных моделей.
5. Имитация. Используя полученные модели, пользователь имеет возмож-
ность проигрывать различные сценарии в Excel. Проводится анализ взаимосвязей
переменных и влияния внешних воздействий (маркетинговых кампаний).
Решение прикладных задач анализа маркетинговых данных
Современный анализ маркетинговых данных базируется в основном на при-
менении регрессионных моделей. Созданы развитые системы для проигрывания
различных сценариев развития рынка товаров по таким моделям. Обработка об-
ширных иерархических баз данных требует применения новых современных ме-
тодов для автоматического выявления взаимосвязей и анализа влияния внешних
воздействий на развитие рынка.
Индуктивные методы также могут быть эффективным средством для выявле-
ния взаимозависимостей и закономерностей продаж товаров в дополнение к су-
ществующим методам. В частности, с их помощью решаются следующие задачи.
• Анализ эластичности и порогов цен. Параметрические алгоритмы МГУА
применяются в «marketing mix» методе для анализа зависимости дохода от не-
больших колебаний цен и обнаружения порогов цен, после которых меняется ха-
рактер продаж.
• Изучение влияния цен и рекламы на объем продаж. Анализ «каннибализа-
ции» брендов.
• Прогнозирование запусков новых продуктов по очень коротким времен-
ным рядам.
• Долгосрочное и краткосрочное прогнозирование. Имитация.
• Анализ зависимости продаж на основе комплексного анализа демографи-
ческой, территориальной и маркетинговой баз данных.
• Прогнозирование влияния погодных условий на продажи продукта на
уровне страны и регионов.
• Оптимизация расписания и покрытия телеканалами маркетинговых кампа-
ний для максимизации продаж.
• Новые подходы для просчета сценариев любых изменений стратегии про-
даж (включая размещение и размер места на полке) и рекламы брендов одной ка-
тегории.
• Сегментация (кластеризация) покупателей, магазинов, характеристик и
продуктов.
• Анализ на основе опросов покупателей демографических особенностей по-
купателей, характеристик продуктов, магазинов и путей покупателей в каждом
магазине.
• Определение наиболее востребованных характеристик продуктов для со-
здания новых брендов товаров.
Следует отметить, что решение этих задач основано на комплексном приме-
нении как параметрических и непараметрических алгоритмов МГУА, так и общих
методов анализа данных (data mining).
Результаты экспериментальных исследований
1. Пример долгосрочного прогноза запуска нового товара. В рамках исследо-
вания задачи прогнозирования запусков нескольких категорий товаров выполнен
комплексный анализ с помощью программной системы DaVinci. Для анализа был
Проблемы управления и информатики, 2008, № 2 149
выполнен импорт из базы данных выборки, которая содержала 186 шампуней и
кондиционеров, и временне ряды данных для общей категории этих продуктов.
Каждый продукт описывался множеством из 14 переменных, содержащих распре-
деление, объемы и рекламные показатели. Выходной переменной был объем про-
даж. Требовалось провести экспресс-анализ запуска нового кондиционера по трем
точкам еженедельных измерений по алгоритму АС.
По комбинаторно-многорядному алгоритму найдено оптимальное подмноже-
ство переменных для категории данного продукта. Так как длина паттерна k могла
быть равной только трем наблюдениям, то двумерный перебор был ограничен
выбором количества паттернов F. Было найдено, что при F = 2 значение критерия
)AR(s минимально.
Все множество продуктов разбито по алгоритму OCC на три кластера. По
минимуму евклидового расстояния для текущего продукта был найден ближай-
ший второй кластер и два ближайших аналога из этого кластера. Затем выполнено
комплексирование значений выходной величины этих двух продуктов для нахож-
дения прогноза (рис. 3). Известные значения для текущего продукта не использо-
вались. Ошибка прогноза составила %.10,8MAPE =
Рис. 3
Использование перебора всех входных переменных по методу деревьев ре-
шающих правил показало, что процент распространения и базовый объем продаж
больше всего влияют на разделение продуктов (рис. 4). Продукт в последний мо-
мент наблюдения имел 82 % распространения. При увеличении процента распро-
странения продукта на 6 % возможен перевод продукта из второго в первый кла-
стер продуктов.
88 % < % распространения продукта ≤ 100 %
∨ ∨
Нет Да Кластер 1
∨
92229,7 < Базовый объем продаж ≤ 135239,4
∨ ∨
Нет Да Кластер 2
∨
Кластер 3
Рис. 4
150 ISSN 0572-2691
Все расчеты выполнены автоматически внутри программной системы DaVinci.
В будущем при прогнозировании по AC планируется также учитывать изменения
внешних воздействий рекламных кампаний на величину будущих продаж.
2. Пример краткосрочного прогнозирования объема продаж. Комбинаторно-
многорядный алгоритм использовался для прогноза объема продаж продукта. Из
исходного множества, содержащего 14 входных аргументов, по минимуму крите-
рия AR(s) алгоритмом была отобрана прогнозирующая модель, содержащая во-
семь переменных:
.906,0%,61,3MAPE
;3,28729933,80,8878,9673
9,36220,2208271,15264133.13,542802
2
)1()1(13)1(9)1(8
)1(7)1(5)1(4)1(3
==
−+++
+++++−=
−−−−
−−−−
R
yxxx
xxxxy
tttt
tttt
Здесь x3 — продажи в долларах, x4 — продажи в единицах, x5 — средненедельное
количество товаров в магазине, x7 — % продаж в долларах, x8 — % уменьшения
цен (средневзвешенный), x9 — % увеличения объема, x13 — индекс продаж, y —
объем продаж.
Построенная модель использовалась для исследования взаимозависимостей
переменных и для прогноза объема продаж на один месяц вперед. Файл отчета
содержит зависимость значений критерия AR от сложности модели s (рис. 5),
проверку согласия значений расчетной и реальной выходной переменной (рис. 6)
и график значений выходной переменной и прогноза (рис. 7).
1 2 3 4 5 6 7 8 9 10 11 12 13 14
0
5000
10000
15000
20000
25000
30000
AR
s
Внешние значения критерия
Рис. 5
График сравнения вычисленного выхода и реального
y = 1,00x
R2 = 0,90
70000
80000
90000
100000
110000
120000
130000
140000
70000 80000 90000 100000 110000 120000 130000 140000
Рис. 6
Проблемы управления и информатики, 2008, № 2 151
0
20000
40000
60000
80000
Ф
ев
ра
ль
, 2
6,
2
00
6
М
ар
т,
2
6,
2
00
6
А
пр
ел
ь,
2
3,
2
00
6
М
ай
, 2
1,
2
00
6
И
ю
нь
, 1
8,
2
00
6
И
ю
ль
, 1
6,
2
00
6
А
вг
ус
т,
1
3,
2
00
6
С
ен
тя
бр
ь,
1
0,
2
00
6
О
кт
ья
бр
ь,
8
, 2
00
6
Н
оя
бр
ь,
5
, 2
00
6
Д
ек
аб
рь
, 3
, 2
00
6
Д
ек
аб
рь
, 3
1,
2
00
6
Я
нв
ар
ь,
2
8,
2
00
7
Ф
ев
ра
ль
,
25
, 2
00
7
М
ар
т,
2
5,
2
00
7
А
пр
ел
ь,
2
5,
2
00
7
Прогноз Выходная переменная
100000
120000
140000
160000
Я
нв
ар
ь,
2
9,
2
00
6
Рис. 7
В процессе прогнозирования система создала полный отчет, содержащий ис-
ходные значения, ряды ошибок, остатков, значений критериев и структуры моде-
лей. Отдельный лист отчета позволяет проигрывать различные сценарии будуще-
го развития продаж, интерпретировать и исследовать эластичность переменных.
Импорт данных, счет и составление отчета занимает около минуты для обоих
примеров.
Заключение
В статье описаны теоретические и практические результаты прогнозирования
сложных систем с учетом внешних воздействий на выходную переменную, струк-
тура и модификации комбинаторного алгоритма МГУА и алгоритма комплекси-
рования аналогов. Перечислены несколько существенных улучшений процесса
селекции моделей, которые целесообразно применять в алгоритмах МГУА. Рас-
смотрена структура программной системы для комплексного анализа маркетинго-
вых данных. Показано, что комплексное применение индуктивных параметриче-
ских и непараметрических алгоритмов, а также методов анализа данных (data
mining) позволяет выполнять всесторонний анализ объектов, изучать взаимозави-
симости переменных и проигрывать сценарии будущего развития процессов.
Г.О. Івахненко
ЗАСТОСУВАННЯ ПРОГНОЗУЮЧИХ
АЛГОРИТМІВ МГУА ДЛЯ РОЗВ’ЯЗАННЯ
МАРКЕТИНГОВИХ ЗАДАЧ
Робота присвячена комплексному розв’язанню складних задач прогнозування
під час аналізу маркетингових даних параметричними та непараметричними
індуктивними алгоритмами. Описано модифікації алгоритму комплексування
аналогів i комбінаторного багаторядного алгоритму МГУА. Наведено ре-
зультати прогнозування за допомогою програмної системи для Excel. За-
пропоновано шляхи вдосконалення алгоритмів МГУА.
152 ISSN 0572-2691
G.A. Ivakhnenko
APPLICATION OF FORECASTING
GMDH ALGORITHMS FOR MARKETING
PROBLEMS SOLUTION
The article is devoted to solution of complex forecasting problems for marketing data
analysis by parametric and nonparametric inductive algorithms. Modifications of the
analog complexing and combinatorial multilayered GMDH algorithms are described.
The results of forecasting by software system for Excel are considered. The ways to
improve GMDH algorithms are proposed.
1. Ивахненко А.Г., Степашко В.С. Помехоустойчивость моделирования. — Киев : Наук. дум-
ка, 1985. — 216 с. — http://articles.gmdh.net.
2. Ивахненко А.Г., Юрачковский Ю.П. Моделирование сложных систем по эксперименталь-
ным данным. — М. : Радио и связь, 1987. — 120 с.
3. Туманов Н.А. Алгоритмы МГУА со взаимно ортогональными частными описаниями // Ав-
томатика. — 1978. — № 3. — С. 85–88.
4. Хьюбер П. Робастность в статистике. — М. : Мир, 1987. — 304 с.
5. Вучков И., Бояджиева Л., Солаков Е. Прикладной линейный регрессионный анализ. — М. :
Финансы и статистика, 1987. — 240 с.
6. Ashby D. An introduction to cybernetics. — New York : J. Wiley, 1958. — 428 p.
7. Beer S. Cybernetics and management. — London : English Univ. Press, 1959. — 280 с.
8. Mueller J.-A., Lemke F. Self-оrganizing data mining. Extracting knowledge from data. — Traf-
ford Publ., Canada, 2003. — http://knowledgeminer.com.
9. Ивахненко А.Г., Богаченко Н.Н., Ли Тянь Mин. Безмодельное прогнозирование случайных
процессов при помощи комплексирования прогнозов по аналогам // Проблемы управления
и информатики. — 1997. — № 4. — С. 111–188.
Получено 28.12.2007
http://knowledgeminer.com/
Введение
Комбинаторно-многорядный алгоритм МГУА
Алгоритм комплексирования аналогов (AC)
Программная система моделирования DaVinci
Решение прикладных задач анализа маркетинговых данных
Результаты экспериментальных исследований
Заключение
|