Модель автокорреляционной функции временного ряда с сильной зависимостью

Запропоновано модель автокореляційної функції часового ряду, що задовольняє умові сильної залежності, побудова якої базується на розв’язку оптимізаційної задачі, що дозволяє покращити оцінку параметра Херста. Модель може бути адаптована в залежності від кінцевої мети використання оцінки. Запропонова...

Повний опис

Збережено в:

Бібліографічні деталі
Дата:	2015
Автори:	Панкратова, Н.Д., Зражевская, Н.Г.
Формат:	Стаття
Мова:	Russian
Опубліковано:	Інститут кібернетики ім. В.М. Глушкова НАН України 2015
Назва видання:	Проблемы управления и информатики
Теми:	Методы обработки информации
Онлайн доступ:	https://nasplib.isofts.kiev.ua/handle/123456789/208036
Теги:	Додати тег Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:	Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:	Модель автокорреляционной функции временного ряда с сильной зависимостью / Н.Д. Панкратова, Н.Г. Зражевская // Проблемы управления и информатики. — 2015. — № 5. — С. 102-112. — Бібліогр.: 8 назв. — рос.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine

id	irk-123456789-208036
record_format	dspace
spelling	irk-123456789-2080362025-10-19T00:10:35Z Модель автокорреляционной функции временного ряда с сильной зависимостью Модель автокореляційної функції часового ряду з сильною залежністю Model of autocorrelative function of time series with strong dependence Панкратова, Н.Д. Зражевская, Н.Г. Методы обработки информации Запропоновано модель автокореляційної функції часового ряду, що задовольняє умові сильної залежності, побудова якої базується на розв’язку оптимізаційної задачі, що дозволяє покращити оцінку параметра Херста. Модель може бути адаптована в залежності від кінцевої мети використання оцінки. Запропонована модель протестована на штучно згенерованих даних з відомими характеристиками і застосована до визначення параметра Херста часового ряду доходів індексу РТС. Розробка нової моделі пов'язана з тим, що в практичних застосуваннях за наявності нестаціонарності загальноприйняті оцінки параметра Херста можуть мати великий розкид значень. The model, based on the optimization problem solving to improve the Hurst parameter estimation for time series with long-range dependence is proposed. The model can be adapted depending on the ultimate goal of the estimation. The proposed model was tested on artificially generated data with known characteristics and applied to the determination of the Hurst parameter of the time series of RTS incomes. Development of the new model is actual because of the fact that traditional Hurst parameter estimations [2] may have a long range of values in practical applications due to nonstationary effects. 2015 Article Модель автокорреляционной функции временного ряда с сильной зависимостью / Н.Д. Панкратова, Н.Г. Зражевская // Проблемы управления и информатики. — 2015. — № 5. — С. 102-112. — Бібліогр.: 8 назв. — рос. 0572-2691 https://nasplib.isofts.kiev.ua/handle/123456789/208036 519.6:519.81 10.1615/JAutomatInfScien.v47.i10.10 ru Проблемы управления и информатики application/pdf Інститут кібернетики ім. В.М. Глушкова НАН України
institution	Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection	DSpace DC
language	Russian
topic	Методы обработки информации Методы обработки информации
spellingShingle	Методы обработки информации Методы обработки информации Панкратова, Н.Д. Зражевская, Н.Г. Модель автокорреляционной функции временного ряда с сильной зависимостью Проблемы управления и информатики
description	Запропоновано модель автокореляційної функції часового ряду, що задовольняє умові сильної залежності, побудова якої базується на розв’язку оптимізаційної задачі, що дозволяє покращити оцінку параметра Херста. Модель може бути адаптована в залежності від кінцевої мети використання оцінки. Запропонована модель протестована на штучно згенерованих даних з відомими характеристиками і застосована до визначення параметра Херста часового ряду доходів індексу РТС. Розробка нової моделі пов'язана з тим, що в практичних застосуваннях за наявності нестаціонарності загальноприйняті оцінки параметра Херста можуть мати великий розкид значень.
format	Article
author	Панкратова, Н.Д. Зражевская, Н.Г.
author_facet	Панкратова, Н.Д. Зражевская, Н.Г.
author_sort	Панкратова, Н.Д.
title	Модель автокорреляционной функции временного ряда с сильной зависимостью
title_short	Модель автокорреляционной функции временного ряда с сильной зависимостью
title_full	Модель автокорреляционной функции временного ряда с сильной зависимостью
title_fullStr	Модель автокорреляционной функции временного ряда с сильной зависимостью
title_full_unstemmed	Модель автокорреляционной функции временного ряда с сильной зависимостью
title_sort	модель автокорреляционной функции временного ряда с сильной зависимостью
publisher	Інститут кібернетики ім. В.М. Глушкова НАН України
publishDate	2015
topic_facet	Методы обработки информации
url	https://nasplib.isofts.kiev.ua/handle/123456789/208036
citation_txt	Модель автокорреляционной функции временного ряда с сильной зависимостью / Н.Д. Панкратова, Н.Г. Зражевская // Проблемы управления и информатики. — 2015. — № 5. — С. 102-112. — Бібліогр.: 8 назв. — рос.
series	Проблемы управления и информатики
work_keys_str_mv	AT pankratovand modelʹavtokorrelâcionnojfunkciivremennogorâdassilʹnojzavisimostʹû AT zraževskaâng modelʹavtokorrelâcionnojfunkciivremennogorâdassilʹnojzavisimostʹû AT pankratovand modelʹavtokorelâcíjnoífunkcííčasovogorâduzsilʹnoûzaležnístû AT zraževskaâng modelʹavtokorelâcíjnoífunkcííčasovogorâduzsilʹnoûzaležnístû AT pankratovand modelofautocorrelativefunctionoftimeserieswithstrongdependence AT zraževskaâng modelofautocorrelativefunctionoftimeserieswithstrongdependence
first_indexed	2025-10-19T01:08:43Z
last_indexed	2025-10-20T01:11:04Z
_version_	1846461244149596160
fulltext	© Н.Д. ПАНКРАТОВА, Н.Г. ЗРАЖЕВСКАЯ, 2015 102 ISSN 0572-2691 МЕТОДЫ ОБРАБОТКИ ИНФОРМАЦИИ УДК 519.6:519.81 Н.Д. Панкратова, Н.Г. Зражевская МОДЕЛЬ АВТОКОРРЕЛЯЦИОННОЙ ФУНКЦИИ ВРЕМЕННОГО РЯДА С СИЛЬНОЙ ЗАВИСИМОСТЬЮ Введение Модели временных рядов с сильной зависимостью имеют широкий круг применения: в финансовой математике, области телекоммуникаций, гидрогеоло- гии и др. Наличие сильной зависимости может быть описано с помощью парамет- ра Херста (H) [1]. За последние годы разработана фундаментальная теоретическая база для определения этого важного параметра, а также предложено и исследова- но достаточное количество практических алгоритмов [2]. Большинство из них ос- новывается на оценке или автокорреляционной функции, или спектральной плот- ности, или выборочной дисперсии методами математической статистики и применением к ним аппарата регрессионного анализа. В работе [3] приведены оценки параметра Херста, построенные на основе перио- дограммных оценок для спектральной плотности. Проведен их анализ на робаст- ность. Результаты применены как к искусственно смоделированным временным рядам, так и к данным по объемам сетевого трафика. Используя оценку параметра Херста на основе дисперсионной модели, проведены исследования по определению сильной зависимости для разных нестационарных процессов, в частности, когда процесс содержит медленный тренд или скачки среднего [4]. Один из классических подходов к оценке параметра Херста основывается на эмпирическом законе Херста. Соответствующее направление в анализе сильноза- висимых временных рядов называется R /S-анализом, общие положения которого описаны, например, в работах [2, 5, 6]. В то же время при реализации существующих моделей для реальных времен- ных рядов при оценке параметра H часто возникают существенные затруднения. Оценки используемого параметра могут сильно отличаться в зависимости от мо- дели. Таким образом, проблема выбора модели для исследования временного ряда на наличие сильной зависимости остается актуальной. В данной статье рассмотрено восемь наиболее часто используемых методов оценивания параметра Херста [2] и предложена оптимизационная процедура, ко- торая может существенно улучшить оценку параметра Херста для сильно зависи- мых волатильных временных рядов. В работе в целях отработки техники анализа построен и проанализирован искусственно сгенерированный, согласно модели FIGARCH, временной ряд с известными характеристиками. Затем предложенная процедура применена для получения оценок характеристик реального временного ряда индекса РТС — официального индикатора Российской фондовой биржи РТС («Российская Торговая Система») за 2014 г. Международный научно-технический журнал «Проблемы управления и информатики», 2015, № 5 103 Некоторые сведения о временных рядах с сильной зависимостью и проблемы, связанные с их исследованием Пусть ...},2,1,0,{ tX t — временной ряд, стационарный в широком смысле. В литературе приведено несколько альтернативных определений сильной зависи- мости [1, 5]. Рассмотрим два из них. Определение 1. Временной ряд ...},2,1,0,{ tX t с автокорреляционной функцией (АКФ) ),,(Corr)( ktt XXk  },0{Nk подчиняется сильной зави- симости (долгосрочной зависимости или зависимости с дальним радиусом), если существуют константы 10  и 0rc такие, что .1)(/)(lim    kck r k (1) Таким образом, автокорреляционная функция такого ряда медленно спадает, и это соответственно приводит к расхождению ряда .)(  k k В противном случае говорят, что процесс подчиняется слабой зависимости. От корреляционной функции )(k с помощью преобразования Фурье можно перейти к спектральной плотности        ik k ekf )( 2 1 )( 1 и сформулировать оп- ределение сильной зависимости в следующем виде. Определение 2. Временной ряд ...},2,1,0,{ tX t подчиняется сильной зави- симости, если существуют параметр 10  и константа 0fc такие, что .1)(/)(lim 0    fcf (2) В работе [5] доказана эквивалентность определений 1 и 2 ((1) и (2)), а также указывается явный вид связи констант rc и ,fc  и . В частности, показано, что H22 и .12  H Из ограничений на параметры  и  следует, что параметр Херста для рядов с сильной зависимостью удовлетворяет неравенству .12/1  H Исходя из приведенных определений, понятие сильной зависимости можно рассматривать в двух аспектах. Сильнозависимые ряды имеют достаточно высо- кую корреляцию между своими значениями в моменты времени 0t и Tt 0 для достаточно больших .T Значит, для их исследования нужно рассматривать автокорреляционные функции с большим временным лагом, что накладывает существенные ограничения на выборки данных. Кроме того, в пространстве параметров Фурье для этих рядов характерны значительные частотные коле- бания в окрестности нуля, что приводит к появлению больших погрешностей при вычислениях. Поэтому, несмотря на достаточно полное теоретическое исследование сильнозависимых рядов, практический их анализ часто вызывает определенные трудности. Исходная информация (реальные и сгенерированные данные), на которой выполняется апробация моделей Для генерации временных рядов существует достаточно большое количество моделей. В данной работе используется модель FIGARCH, которая широко при- меняется при необходимости моделирования долгосрочной зависимости в гетеро- скедастических рядах. 104 ISSN 0572-2691 Модель FIGARCH (p, d, q) в общем виде запишем следующим образом [7, 8]. Временной ряд ,tt uX  где ,constu подчиняется указанной модели, если ,))(1()1()1))(()(1( 21 tt d vLLLLL   где 2 t — условная диспер- сия процесса ,t 22 tttv  — независимые, одинаково распределенные слу- чайные величины (н.о.р.с.в.), L — оператор сдвига ,1 ttL ,)( 1 i i p i LL    ,)( 1 i i q i LL    j j d L jd dj L )( )1()( )( )1( 1        — оператор дробной разницы )((  — гамма-функция). Необходимое условие стационарности модели: ,0 .1 11    i q i i p i Достаточное условие сильной зависимости: )2/1,0(d (пара- метр Херста связан с :d ).2/1 dH  Для генерации данных рассматривалась модель FIGARCH (1; 0,42; 1) с пара- метрами .1,0;1,0;1,0 11  Реальные данные В качестве реальных данных выбраны доходы на дневной основе индекса РТС. Индекс РТС — общепризнанный показатель состояния российского фондового рынка, который рассчитывается в режиме реального времени в течение всей тор- говой сессии биржи РТС при каждом изменении цен акций, которые включены в список для его расчета. Значение индекса РТС определяется как отношение суммарной рыночной ка- питализации акций, включенных в список для расчета индекса, к суммарной ры- ночной капитализации на начальную дату, умноженное на значение индекса на начальную дату и на корректирующий коэффициент. Изменение стоимости акций каждой компании влияет на величину индекса РТС. При этом чем больше доля компании в индексе, тем сильнее ее влияние. В базу индекса РТС входит 50 наи- более капитализированных и ликвидных акций. Среди крупнейших представлены: Газпром (15,00 % в индексе), Лукойл (15,00 %), Сбербанк России (13,59 %), Рос- нефть (9,03 %). Индекс РТС используется для отслеживания общего состояния рынка акций страны, вехи его развития и перспективы движения в будущем. Кроме того, ин- декс составляется таким образом, чтобы максимально адекватно отразить струк- туру экономики государства. Поэтому вполне логично, что в индексе РТС боль- шая часть приходится на добывающие и нефтегазовые компании. Заметим, что в дальнейшем реальные данные для краткости обозначаются как «индекс РТС», хотя в действительности используются данные квадратов доходов индекса РТС. Оценивание параметра Херста как меры сильной зависимости в наиболее часто применяемых методах Метод выборочной дисперсии агрегированного ряда. Рассмотрим ряд },,{ )( tX m t полученный из },{ ΤtX t  путем усреднения по блокам длины :m ),( 1 )( 1)1( )( iX m kX km mki m   где 1k индексирует блок. Переход к ряду },{ )( ΤtX m t  называется агрегацией по шкале времени с параметром .m Для агре- Международный научно-технический журнал «Проблемы управления и информатики», 2015, № 5 105 гированных временных рядов },{ )( ΤtX m t  с сильной зависимостью для достаточно больших m имеет место формула . )(var ~)(var )( m X X m Параметр 2 1  H можно отыскать, если построить агрегированный процесс на различных уровнях агрега- ции m и вычислить дисперсию каждого уровня. Итак, для заданного m разбиваем выборку NXXX ...,,, .21 на m N блоков размерности ,m вычисляем )()( kX m для mNk /...,,2,1 и выборочную диспер- сию .))(( / 1 ))(( / 1 var 2 )( / 1 2)( / 1 )(            kX mN kX mN X m mN k m mN k m Повторяем проце- дуру для различных значений .m Строим график зависимости ))((varlog )(mX от ),(log m выбирая значения m }1,{ imi так, чтобы const.1  i i m m Для найденных значений строим линейную регрессию. Наклон регрессивной линии на графике будет определять .22  H Метод дифференцирования дисперсии. Для того чтобы отличать ста- ционарные ряды с сильной зависимостью от рядов со слабой зависимостью, но со смещенным средним или с наличием слабо выраженного линейного тренда, в работе [4] предложена модификация рассмотренного выше метода — метода дифференцирования дисперсии. В этом методе вместо выборочной дисперсии используется ее разностная производная .varvar )()( 1 ii mm XX  Указанный метод часто используется в комбинации с базовым методом. Если построенный график выборочных дисперсий имеет экспоненциальную форму, то возникает подозрение в нестационарности ряда. В этом случае строят график для разностных произ- водных выборочной дисперсии. Если ряд стационарный, то оба метода дают подобные результаты для всех ,H от 2/1 до 1. В случае нестационарности ряда и для ,H близких к 2/1 , метод дифференцирования дисперсии будет давать лучший результат. В случае нестационарности и ,H близких к 1, количественно определить параметр Херста невозможно, но можно подтвердить наличие сильной зависимости. Метод абсолютных значений агрегированных рядов. В этом методе вме- сто выборочных дисперсий )(var mX вычисляются суммы абсолютных значений агрегированных рядов, а именно, .)( / 1 )( )( / 1 kX mN mS m mN k    Если ряд имеет сильную зависимость с параметром ,H то графиком линейной регрессионной за- висимости )(log mS от )(log m будет прямая линия с наклоном .1H Рассмотренные выше методы популярны, поскольку позволяют получить достаточно точные оценки при небольших объемах вычислений. Метод Хигуччи. Данный метод используется для последовательности час- тичных сумм временного ряда ,)( 1    n i iXnY вычисляется статистика ,)()( 1 )( ]/)[( 1 1 1 3 mkmiYkmiY m IN m N mL miN ki m i              где квадратные скобки обозначают целую часть числа. График )(log mL от mlog — прямая линия с наклоном .2 H 106 ISSN 0572-2691 Метод остатков регрессии. Он включает следующие шаги: 1) разбивается выборка длины N на блоки длины ,m которые попарно не пересекаются; 2) на каждом блоке находятся частичные суммы ,)( 1    n i ik XnY ;...,,2,1 mk  3) используя метод наименьших квадратов (МНК), строится по )(nYk линей- ная регрессия и находится выборочная дисперсия остатков; 4) описанная процедура повторяется на каждом блоке; 5) находится среднее полученных дисперсий ).(2 m 6) поскольку для больших m ,~)( 2Hmm то на графике зависимости )(log m от mlog прямая будет иметь наклон .2H SR/ -метод или метод нормированного размаха. Это один из первых и наиболее известных методов. Обозначим выборочную дисперсию как ).(2 nS Функция размаха )(nR определяется следующим образом: ,)()(min)()(max)( 00               nY n t tYnY n t tYnR ntnt где .)( 1    n i iXnY Для рядов с сильной зависимостью ,~))(/)(( HCnnSnRE n , где C — положительная постоянная, не зависящая от .n Для определения параметра Херста выборка длины N разбивается на непе- ресекающиеся блоки длины .K Вычисляем для каждого n ),,(/),( nkSnkR ii ,1 K iN ki ...,,2,1i .Nnki  Значение H определяем в соответствии с ли- нейной регрессией, построенной на точках )log)),,(/),(((log nnkSnkR ii для дос- таточно больших .n Основная проблема этого метода — выбор .n Если выбрать n недостаточно большим, будут доминировать краткосрочные корреляции, вы- бор слишком большого n ограничивается размером выборки. Метод периодограмм. Данный метод использует оценку спектральной плот- ности вида , 2 1 )( 2 1      N j ij jeX N I где  — частота. Поскольку периодограм- ма )(I является оценкой спектральной плотности, то по определению 2 для сильно- зависимых рядов на графике ))((log I от log наклон прямой будет .21 H Значе- ния периодограммы рассчитываются для последовательности ,/2 Nkk  где ,...,,1 jk  а целое число j выбирается меньшим, чем . 2 1 N Модифицированный метод периодограмм. Учитывается, что большинство частот на графике расположены в правой части и, таким образом, существенно влияют на регрессионную прямую. В модифицированном методе ось частот разбита на одинаковые (в логарифмическом исчислении) блоки и находятся средние значения периодограмм внутри блоков. Значения для низких частот не учитываются. Международный научно-технический журнал «Проблемы управления и информатики», 2015, № 5 107 Построение моделей АКФ сильнозависимых временных рядов с использованием оценок параметра Херста Нахождение параметра Херста в контексте сильной зависимости временных рядов может преследовать разные цели. Для построения модели временного ряда (например, FARIMA, FIGARCH [7, 8]) существенное значение имеет точность в пределах лага модели (в этом есть некоторые противоречия, поскольку теорети- ческое определение сильной зависимости требует бесконечной выборки и пара- метр H определяется первым членом асимптотического разложения АКФ). Если цель исследования — прогнозирование значений временного ряда, то существен- ными являются значения АКФ при больших сдвигах, в то время как модели АКФ, основывающиеся на параметре Херста, учитывают все значения эмпирической АКФ интегральным образом без приоритезации данных. В настоящей работе сравниваются результаты, полученные с использованием трех различных моделей АКФ на основании регрессионной модели, которая сле- дует из определения сильной зависимости (асимптотическое соотношение (1)): ,)12()( 2 22** 1 * k HkHHk   k — н.о.р.с.в., ,0 Nkk  (3) где в качестве H берется полученная оценка. Модели различаются способом оценивания .H Линейная регрессия не включает первые 0k значений автокорре- ляции, поскольку (1) задает асимптотические свойства. Оценки для коэффициен- тов 21,  могут быть найдены по МНК. Сравнение осуществляется на искусст- венно сгенерированных и реальных данных. Рассмотрим построение первой модели в виде линейной регрессии АКФ в двойном логарифмическом масштабе: .log)(log 21 kkbbk  Параметры модели 21, bb оцениваются по МНК. Эта модель не учитывает априорной инфор- мации о наличии сильной зависимости временного ряда. По полученной оценке 2b  можно определить оценку параметра Херста: .22 corr2  Hb  Значения АКФ и регрессионных прямых в двойном логарифмическом масштабе представлены на рис. 1 для искусственно сгенерированных данных и на рис. 2 — для реальных данных. Из рисунков видно, что такая модель не может быть достаточно адек- ватной для реальных данных, хотя для искусственно сгенерированных данных (т.е. с контролируемыми свойствами) она достаточно достоверна. Оценка пара- метра Херста этой модели обозначена .corrH  Значения АКФ, полученные по первой модели автокорреляционной функции, представлены на рис. 3 и 4. Data corrH – 2,5 lo g A C F – 1,5 – 0,5 – 1 – 2 – 3 0 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 log k Рис. 1 108 ISSN 0572-2691 Data corrH – 2,5 lo g A C F – 1,5 – 0,5 – 1 – 2 – 3 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 log k – 3,5 – 4 – 4,5 Рис. 2 Data corrH A C F 0,4 0 10 20 30 40 50 60 k 0,1 0,2 0,3 0,8 0,5 0,6 0,7 0,9 0 meanH optimH Рис. 3 Data corrH A C F 0,4 0 10 20 30 40 50 60 k 0,1 0,2 0,3 0,5 0,6 0,7 0 meanH optimH 50 60 Рис. 4 При построении второй модели учитывается наличие сильной зависимости временного ряда. Эта дополнительная априорная информация позволяет исполь- зовать специализированные методы оценивания параметров модели. В данном случае задача моделирования сводится к оцениванию параметра Херста, который определяет модель временного ряда с сильной зависимостью. Как указывалось ранее, известен ряд методов оценивания параметра Херста, которые имеют свои особенности и могут быть более или менее эффективны в зависимости от допол- нительных особенностей временных рядов. При построении этой модели для оце- нивания параметра Херста использовались описанные ранее методы (табл. 1). Из табл. 1 видно, что значения параметра ,H полученные методом Хигуччи, моди- фицированным методом периодограмм и методом дифференцирования дисперсии, Международный научно-технический журнал «Проблемы управления и информатики», 2015, № 5 109 имеют большой разброс значений %)25( ) для реальных данных (кроме того, параметр Херста не может превышать 1) и не могут использоваться для агрегации. Среднее по пяти остальным значениям 8692,0mean H  используется в (3) для по- строения модели АКФ. Соответствующие графики изображены на рис. 3 и 4. Как видно, построенная модель АКФ более адекватна, чем та, которая построена без учета сильной зависимости ).( corrH  Это следует из табл. 2, в которой приведе- ны ошибки моделирования: ),ˆ(1 1 / ii N i yyNME    ,ˆ1 1 / ii N i yyNMAE    ,)ˆ(1 2 1 / ii N i yNMSE    %100ˆ/11 1 /    ii N i yyNMAPE (средняя ошибка (МЕ), средняя абсолютная ошибка (МАЕ), среднеквадратическая ошибка (MSE), сред- няя абсолютная процентная ошибка (MAPE), iy — фактические значения авто- корреляции, iŷ — значения автокорреляции модели). Таблица 1 Методы оценивания Оценка H Относительная ошибка H СД РТС СД РТС Абсолютных значений агреги- рованного ряда 0,8700 0,9285 2,3505 4,1750 Выборочной дисперсии агреги- рованного ряда 0,8053 0,8714 5,2633 2,2337 Модифицированный метод пе- риодограмм 0,8711 1,0989 2,4807 23,2915 Дифференцирования дисперсии 0,8179 0,6768 3,7759 24,0613 Хигуччи 0,9994 1,0085 13,1455 17,5730 Остатков регрессии 0,8600 0,8849 1,1819 0,7173 Периодограмм 0,8692 0,8222 2,2574 7,7483 R / S 0,7586 0,8391 10,7536 5,8562 Таблица 2 Модель ME MAE MSE MAPE (%) С.Д. РТС С.Д. РТС С.Д. РТС С.Д. РТС Модель 1 – 0,02 0,0276 0,023 0,033 0,0007 0,0014 29,06 116,27 Модель 2 – 0,01 – 0,016 0,017 0,028 0,0004 0,0010 20,59 90,06 Модель 3 – 9e– 4 – 0,008 0,014 0,021 0,0003 0,0008 16,68 49,64 Предложенная в данной работе модифицированная модель АКФ более гибкая и в то же время более наглядная. Действительно, гибкость второй модели АКФ с учетом наличия сильной зависимости обеспечивается выбором метода построения параметра Херста в силу его применимости и эффективности для конкретно взя- тых данных. В то же время анализ исходных данных в целях выбора метода за- частую более трудоемок, чем само построение модели. Кроме того, указанные ме- тоды (в стандартной формулировке) не предполагают приоритезацию данных в исходной выборке, что ограничивает их специализацию в зависимости от цели построения модели. Эти недостатки устраняются в третьей модели. Эта модель основывается на первых двух и ее качество, в силу построения, гарантировано не хуже качества первых двух моделей. Ее суть состоит в следующем. В соот- ветствии со второй моделью определяется агрегированное значение оценки 110 ISSN 0572-2691 параметра Херста и среднеквадратическое значение ошибки этой модели по исходной выборке. Затем на исходной выборке определяются две подвыборки. Способ разбив- ки может определяться целью моделирования и также является свойством третьей модели. На одной подвыборке строится регрессионная модель, соответствующая первой модели, с использованием МНК. На второй подвыборке определяются ошибки такой регрессионной модели, которые ограничиваются среднеквадрати- ческой ошибкой модели, построенной в соответствии со второй моделью. Такой подход удобно реализовать в виде оптимизационной процедуры. Модель АКФ, построенная с помощью оптимизационной процедуры Пусть даны N kky 1}{  — исходные значения автокорреляции, по которым с применением второй модели определена агрегированная оценка параметра Херста и средняя дисперсия ошибки этой модели .2 Определяются на полной выборке две подвыборки: 1 1}{ k kky  и .}{ 2 1 1 k kkky  На второй подвыборке строим регресси- онную модель (3). Для этого достаточно минимизировать ,)ˆ( 2 1 2 1 kk k kk yy   где ,ˆky ,,1 21 kkk  — значения модели, определяемые по (3). На первой подвыборке определяем квадратичные ошибки значений модели по отношению к фактиче- ским значениям ,,1,)ˆ( 1 2 kkyy kk  и ограничиваем их средней дисперсией ошибки .2 Очевидно, что такая задача минимизации квадратичного функционала с квадратичным ограничением выпуклая. Однако в силу того, что 2 — сред- няя (а не максимальная) дисперсия, задача может не иметь допустимых реше- ний. Для формулировки задачи с оптимальным решением достаточно ввести в правую часть ограничения релаксационный параметр ,0q добавление ко- торого в целевую функцию обеспечит минимальное отклонение оптимальной модели от модели, построенной в соответствии со второй моделью. Основной функционал и релаксационный параметр в целевой функции следует взвесить с коэффициентом штрафа  ).10(  Варьирование  позволяет получить желаемый баланс между соответствием модели исходным данным (на второй подвыборке) и соответствием модели условию сильной зависимости (на пер- вой подвыборке). Таким образом, формулировка оптимизационной задачи имеет вид: min,)( 1 )1( 2 112 2 1      kk k kk yy kk q  ,...,,2,1,)( 1 22 kkqyy kk   .0q Случай 0 соответствует первой модели на ,}{ 2 1 1 k kkky  1 — второй модели на .}{ 1 1 k kky  Следовательно, третья модель содержит первые две модели как частные случаи и не менее адекватна, но более гибкая. Третья модель построена на сгенерированных и реальных данных. Результаты решения оптимизационной задачи при различных значениях  представлены Международный научно-технический журнал «Проблемы управления и информатики», 2015, № 5 111 в табл. 3 (СД — значения для сгенерированных данных, РТС — значения для индекса РТС). В расчетах принято .55,40 21  kk Как видим из табл. 3, результаты решения оптимизационной задачи на сгенерированных данных существенно зависят от , что позволяет регулировать баланс между точностью модели на желае- мом временном интервале и подчинением условиям сильной зависимости. В то же время реальные данные удовлетворяют условию сильной зависимости только с неко- торой точностью, и, как следствие, результат решения оптимизационной задачи не за- висит от . Следовательно, построенная для реальных данных модель соответствует некоторому идеальному временному ряду с сильной зависимостью, у которого АКФ близка к АКФ реального временного ряда на второй подвыборке. Таблица 3  Целевая функция q 2 H СД РТС СД РТС СД РТС СД РТС 0,1 0,0673 0,8094 0,0672 0,8645 0,0679 0,3140 0,8416 0,6770 0,2 0,0674 0,7544 0,0672 0,8645 0,0679 0,3140 0,8416 0,6770 0,3 0,0674 0,6993 0,0672 0,8645 0,0679 0,3140 0,8416 0,6770 0,4 0,0675 0,6443 0,0672 0,8645 0,0679 0,3140 0,8416 0,6770 0,5 0,0676 0,5893 0,0672 0,8645 0,0679 0,3140 0,8416 0,6770 0,6 0,0661 0,5342 0,0855 0,8645 0,0532 0,3140 0,8561 0,6770 0,7 0,0613 0,4792 0,1049 0,8645 0,0427 0,3140 0,8701 0,6770 0,8 0,0539 0,4241 0,1230 0,8645 0,0366 0,3140 0,8823 0,6770 0,9 0,0442 0,3691 0,1399 0,8645 0,0336 0,3140 0,8930 0,6770 Графики модели АКФ ( 5,0 ) изображены на рис. 3 и 4 (кривые ).ˆ optimH Очевидно, они более приемлемы с точки зрения приближения фактических данных на второй подвыборке. Особенно это проявляется для реальных данных (см. рис. 4). Третья модель существенно лучше соответствует средним значениям фактической АКФ для больших сдвигов. Таким образом, для сравнения предлагается три модели АКФ. Первая учиты- вает минимум информации и наименее достоверна. Во втором случае агрегиру- ются модели, построенные по пяти наиболее распространенным методам оценки характеристик сильной зависимости. Третья модель, которая введена в данной ра- боте, использует вторую модель, улучшая ее посредством использования проце- дуры прогноза и коррекции, предоставляет достаточное количество параметров для адаптации модели к использованию в различных задачах. Заключение Настоящая работа посвящена построению модели, основанной на усовер- шенствованном методе оценивания параметров сильной зависимости временных рядов. Проведен обзор известных методов оценивания параметра Херста. В соот- ветствии с полученными результатами моделирования (см. табл. 2), пять стан- дартных методов определения параметра Херста демонстрируют хорошие и отно- сительно однородные результаты для искусственно сгенерированных данных, но имеют большой разброс для реальных данных. Основная причина в том, что сильная зависимость является формальным свойством, и ни один реальный процесс не удовлетворяет ей в полной мере. Кроме того, на характеристики сильной зави- симости влияют другие неучтенные свойства, например нестационарность. Пред- ложена новая модель, основанная на решении оптимизационной задачи для уточ- нения (или корректировки) оценки параметра Херста. Уточненная оценка основа- на на агрегации результатов нескольких стандартных моделей и определяется как результат применения метода прогноза и коррекции. Модель может быть адап- тирована в зависимости от конечной цели оценивания, она верифицирована на сгене- 112 ISSN 0572-2691 рированных по модели FIGARCH данных и применена к построению оценки пара- метра Херста для реальных данных индекса РТС. Показано, что для реальных данных предложенная модель является более адекватной для цели прогнозирова- ния реального временного ряда, поскольку она наилучшим образом описывает сильную зависимость в асимптотическом смысле. Результаты работы могут использоваться для построения адаптивных робастных оценок при прогнозиро- вании гетероскедастических временных рядов. Н.Д. Панкратова, Н.Г. Зражевська МОДЕЛЬ АВТОКОРЕЛЯЦІЙНОЇ ФУНКЦІЇ ЧАСОВОГО РЯДУ З СИЛЬНОЮ ЗАЛЕЖНІСТЮ Запропоновано модель автокореляційної функції часового ряду, що задоволь- няє умові сильної залежності, побудова якої базується на розв’язку оптиміза- ційної задачі, що дозволяє покращити оцінку параметра Херста. Модель може бути адаптована в залежності від кінцевої мети використання оцінки. Запропо- нована модель протестована на штучно згенерованих даних з відомими харак- теристиками і застосована до визначення параметра Херста часового ряду до- ходів індексу РТС. Розробка нової моделі пов'язана з тим, що в практичних за- стосуваннях за наявності нестаціонарності загальноприйняті оцінки параметра Херста можуть мати великий розкид значень. N.D. Pankratova, N.G. Zrazhevska MODEL OF AUTOCORRELATIVE FUNCTION OF TIME SERIES WITH STRONG DEPENDENCE The model, based on the optimization problem solving to improve the Hurst pa- rameter estimation for time series with long-range dependence is proposed. The model can be adapted depending on the ultimate goal of the estimation. The proposed model was tested on artificially generated data with known characteristics and applied to the determination of the Hurst parameter of the time series of RTS incomes. Development of the new model is actual because of the fact that traditional Hurst parameter estimations [2] may have a long range of values in practical appli- cations due to nonstationary effects. 1. Palma W. Long-memory time series: Theory and methods. — New Jersey : John Wiley & Sons, 2007. — 304 p. 2. Taqqu M.S., Teverovsky V., Willinger W. Estimators for long-range dependence: An empirical study // Fractals. — 1995. — P. 785–798. 3. Teverovsky V., Taqqu M.S. Semi-parametric graphical estimation techniques for long-memory da- ta // Lecture Notes in Statistics. — 1996. — 115. — P. 420–432. 4. Teverovsky V., Taqqu M.S. Testing for long-range dependence in the presence of shifting mean or a slowly declining trend, using a variance-type estimator // Time Series Analysis. — 1997. — 18, N 3. — P. 279–304. 5. Beran J. Statistics for long-memory processes. — New York : Chapman and Hall, 1994. — 315 p. 6. Clegg R.G. A practical guide to measuring the Hurst parameter // International Journal of Simula- tion: Systems, Science & Technology. — 2006. — N 2. — P. 3–14. 7. Baillie, R.T., Bollerslev, T., Mikkelsen, H.O. Fractionally integrated generalized autoregressive conditional heteroskedasticity // Journal of Econometrics. — 1996. — N 74. — P. 3–30 8. Бідюк П.І. Системний підхід до прогнозування на основі моделей часових рядів // Системні дослідження та інформаційні технології. — 2003. — № 3. — С. 88–110. Получено 20.05.2015

Модель автокорреляционной функции временного ряда с сильной зависимостью

Репозитарії

Схожі ресурси