Моделювання і прогнозування гетероскедастичних процесів
Розглядається методика побудови математичних моделей гетероскедастичних процесів і її застосування до опису динаміки часових рядів. Запропоновано спрощений тест на гетероскедастичність та алгоритм врахування імпульсних складових ряду, які суттєво перевищують його середнє значення. Побудовано функції...
Збережено в:
| Опубліковано в: : | Системні дослідження та інформаційні технології |
|---|---|
| Дата: | 2004 |
| Автор: | |
| Формат: | Стаття |
| Мова: | Ukrainian |
| Опубліковано: |
Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України
2004
|
| Теми: | |
| Онлайн доступ: | https://nasplib.isofts.kiev.ua/handle/123456789/50334 |
| Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Цитувати: | Моделювання і прогнозування гетероскедастичних процесів / П.І. Бідюк // Систем. дослідж. та інформ. технології. — 2004. — № 1. — С. 115-134. — Бібліогр.: 9 назв. — укр. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraine| id |
nasplib_isofts_kiev_ua-123456789-50334 |
|---|---|
| record_format |
dspace |
| spelling |
Бідюк, П.І. 2013-10-10T20:26:51Z 2013-10-10T20:26:51Z 2004 Моделювання і прогнозування гетероскедастичних процесів / П.І. Бідюк // Систем. дослідж. та інформ. технології. — 2004. — № 1. — С. 115-134. — Бібліогр.: 9 назв. — укр. 1681–6048 https://nasplib.isofts.kiev.ua/handle/123456789/50334 62-50 Розглядається методика побудови математичних моделей гетероскедастичних процесів і її застосування до опису динаміки часових рядів. Запропоновано спрощений тест на гетероскедастичність та алгоритм врахування імпульсних складових ряду, які суттєво перевищують його середнє значення. Побудовано функції прогнозу дисперсії як міри ризику на основі розв’язку рівнянь. Наведено приклади прогнозування реальних рядів. Рассматривается методика построения математических моделей гетероскедастических процессов и ее применение к описанию динамики временных рядов. Предложен упрощенный тест на гетероскедастичность и алгоритм учета импульсных составляющих ряда, которые существенно превышают его среднее значение. Построены функции прогнозирования дисперсии как меры риска на основе решений уравнений. Приведены примеры прогнозирования реальных процессов. A methodology of constructing mathematical models for heteroscedastic processes and its application in describing dynamics of time series are considered. A simplified test for heteroscedasticity is proposed and algorithm for model improvement thanks to taking into consideration the spikes substantially greater than the mean value of a series. The variance forecasting functions are constructed as a measure of risk on the basis of the equations solutions. Some examples of forecasting real time series are given. uk Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України Системні дослідження та інформаційні технології Математичні методи, моделі, проблеми і технології дослідження складних систем Моделювання і прогнозування гетероскедастичних процесів Моделирование и прогнозирование гетероскедастических процессов Modeling and forecasting for heteroscedastic processes Article published earlier |
| institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| collection |
DSpace DC |
| title |
Моделювання і прогнозування гетероскедастичних процесів |
| spellingShingle |
Моделювання і прогнозування гетероскедастичних процесів Бідюк, П.І. Математичні методи, моделі, проблеми і технології дослідження складних систем |
| title_short |
Моделювання і прогнозування гетероскедастичних процесів |
| title_full |
Моделювання і прогнозування гетероскедастичних процесів |
| title_fullStr |
Моделювання і прогнозування гетероскедастичних процесів |
| title_full_unstemmed |
Моделювання і прогнозування гетероскедастичних процесів |
| title_sort |
моделювання і прогнозування гетероскедастичних процесів |
| author |
Бідюк, П.І. |
| author_facet |
Бідюк, П.І. |
| topic |
Математичні методи, моделі, проблеми і технології дослідження складних систем |
| topic_facet |
Математичні методи, моделі, проблеми і технології дослідження складних систем |
| publishDate |
2004 |
| language |
Ukrainian |
| container_title |
Системні дослідження та інформаційні технології |
| publisher |
Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України |
| format |
Article |
| title_alt |
Моделирование и прогнозирование гетероскедастических процессов Modeling and forecasting for heteroscedastic processes |
| description |
Розглядається методика побудови математичних моделей гетероскедастичних процесів і її застосування до опису динаміки часових рядів. Запропоновано спрощений тест на гетероскедастичність та алгоритм врахування імпульсних складових ряду, які суттєво перевищують його середнє значення. Побудовано функції прогнозу дисперсії як міри ризику на основі розв’язку рівнянь. Наведено приклади прогнозування реальних рядів.
Рассматривается методика построения математических моделей гетероскедастических процессов и ее применение к описанию динамики временных рядов. Предложен упрощенный тест на гетероскедастичность и алгоритм учета импульсных составляющих ряда, которые существенно превышают его среднее значение. Построены функции прогнозирования дисперсии как меры риска на основе решений уравнений. Приведены примеры прогнозирования реальных процессов.
A methodology of constructing mathematical models for heteroscedastic processes and its application in describing dynamics of time series are considered. A simplified test for heteroscedasticity is proposed and algorithm for model improvement thanks to taking into consideration the spikes substantially greater than the mean value of a series. The variance forecasting functions are constructed as a measure of risk on the basis of the equations solutions. Some examples of forecasting real time series are given.
|
| issn |
1681–6048 |
| url |
https://nasplib.isofts.kiev.ua/handle/123456789/50334 |
| citation_txt |
Моделювання і прогнозування гетероскедастичних процесів / П.І. Бідюк // Систем. дослідж. та інформ. технології. — 2004. — № 1. — С. 115-134. — Бібліогр.: 9 назв. — укр. |
| work_keys_str_mv |
AT bídûkpí modelûvannâíprognozuvannâgeteroskedastičnihprocesív AT bídûkpí modelirovanieiprognozirovaniegeteroskedastičeskihprocessov AT bídûkpí modelingandforecastingforheteroscedasticprocesses |
| first_indexed |
2025-11-25T22:31:28Z |
| last_indexed |
2025-11-25T22:31:28Z |
| _version_ |
1850565248920059904 |
| fulltext |
© П.І. Бідюк, 2004
Системні дослідження та інформаційні технології, 2004, № 1 115
TIДC
МАТЕМАТИЧНІ МЕТОДИ, МОДЕЛІ, ПРОБЛЕМИ
І ТЕХНОЛОГІЇ ДОСЛІДЖЕННЯ СКЛАДНИХ
СИСТЕМ
УДК 62-50
МОДЕЛЮВАННЯ І ПРОГНОЗУВАННЯ
ГЕТЕРОСКЕДАСТИЧНИХ ПРОЦЕСІВ
П.І. БІДЮК
Розглядається методика побудови математичних моделей гетероскедастичних
процесів і її застосування до опису динаміки часових рядів. Запропоновано
спрощений тест на гетероскедастичність та алгоритм врахування імпульсних
складових ряду, які суттєво перевищують його середнє значення. Побудовано
функції прогнозу дисперсії як міри ризику на основі розв’язку рівнянь. Наве-
дено приклади прогнозування реальних рядів.
ВСТУП
Гетероскедастичні процеси, тобто процеси із змінною в часі дисперсією, —
поширений клас фінансово-економічних процесів, особливо в нестійкій пе-
рехідній економіці. За визначенням такі процеси належать до класу слабо
нестаціонарних процесів, а тому опис їх динаміки має деякі особливості у
порівнянні із стаціонарними. Одним із популярних підходів до моделювання
нестаціонарних процесів є метод групового врахування аргументів [1], який
був успішно застосований до побудови моделей низки технічних, екологіч-
них та економічних процесів. Частково питання побудови моделей нестаці-
онарних процесів розглянуто в роботах [2 – 7], однак моделювання гетеро-
скедастичних процесів потребує докладного розгляду.
Метою даної роботи є розробка спрощеного тесту на гетероскедастич-
ність, універсальної методики моделювання гетероскедастичних процесів, а
також побудова моделей деяких реальних фінансово-економічних процесів
та функцій прогнозування на їх основі.
1. ТЕСТУВАННЯ НА НАЯВНІСТЬ ГЕТЕРОСКЕДАСТИЧНОСТІ
При моделюванні гетероскедастичних процесів спочатку виконують переві-
рку на наявність гетероскедастичності. В літературі наведено кілька тестів
на гетероскедастичність [6, 8, 9], які принципово не відрізняються один від
одного, але потребують додаткових і не завжди виправданих обчислень.
Найбільш зручним є такий.
П.І. Бідюк
ISSN 1681–6048 System Research & Information Technologies, 2004, № 1 116
Спрощений тест на гетероскедастичність складається з кроків:
1) оцінити авторегресію )()1()( 00 kkyaaky ε+−+= або більш високого по-
рядку, наприклад, другого чи третього; 2) побудувати ряд ,)}({ 2 kε скорис-
тавшись залишками від оцінювання попередньої моделі; 3) оцінити регресію
[ ])4(1,0)3(2,0)2(3,0)1(4,0)( 10
2 −+−+−+−+= kkkkak εεεεαε ; 4) якщо
коефіцієнт 1α відмінний від нуля в статистичному смислі, тобто є значи-
мим, то отримана модель для )(2 kε описує гетероскедастичний процес.
Оскільки в цій моделі оцінюються тільки коефіцієнти 1α і 0a , а всі ін-
ші відомі (0,4; 0,3; 0,2; 0,1), то для визначення відмінності від нуля коефіці-
єнта 1α можна застосувати теорію перевірки гіпотез, тобто t -статистику
для цього коефіцієнта.
Привабливість даного тесту полягає в простих обчисленнях і можливо-
сті застосування тієї ж теорії перевірки гіпотез, що використовується при
аналізі лінійних моделей.
Сформулюємо постановку задачі оцінювання та прогнозування для ав-
торегресійних умовно гетероскедастичних моделей АРКС ),( qp на основі
максимізації функції правдоподібності.
Дана послідовність значень часового ряду )}(...,),2(),1({ Nyyy . Для кла-
су лінійних та псевдолінійних моделей АР )( p та АРУГ
∑
=
+−+=
p
i
i kikyaaky
1
10 )()()( ε ,
)()](...)2()1([)( 2
2
1
2
12
2
1110
2
1 kmkkkk m εεβεβεβααε +−++−+−+= ,
де −)(1 kε послідовність випадкових величин із змінною дисперсією;
−)(2 kε послідовність випадкових величин, яким властиве
0)]([ 2 =kE ε ,
⎪⎩
⎪
⎨
⎧
≠
==
.,0
,,)]()([
2
22 jk
jkjkE σεε
Необхідно знайти:
1) оцінку вектора параметрів T
paaa ]...[ 101 =θ , мінімізуючи критерій
∑
=
−=
N
k
kykyJ
1
2)](ˆ)([ , де ∑
=
+−+=
p
i
i kikyaaky
1
10 )()(ˆˆ)(ˆ ε ;
2) оцінки вектора T
m ]...[ 1102 ββααθ = із умови максимізації функції
правдоподібності ( ) ( )∏
=
−−
=
N
k
mkkmyymy yyfyfL
kk
2
2)1(212 );();(log)(
11
θθθ ;
3) оцінку прогнозу дисперсії на основі оціненої моделі
...,2,1)],([)(ˆ 22 ==+ skEksk k εε ,використовуючи всю наявну інформа-
цію на момент часу k , із умови min)](ˆ),(ˆ[ 22
1 →++= skskEJ εε .
Моделювання і прогнозування гетероскедастичних процесів
Системні дослідження та інформаційні технології, 2004, № 1 117
2. МЕТОДИКА ПОБУДОВИ МОДЕЛЕЙ ГЕТЕРОСКЕДАСТИЧНИХ
ПРОЦЕСІВ
Для прикладу розглянемо спочатку узагальнену авторегресійну модель ге-
тероскедастичного процесу (УАРУГ). При використанні такої моделі умов-
на дисперсія процесу описується за допомогою моделі авторегресії з ковз-
ним середнім (АРКС). Нехай похибки моделі
)()()( khkvk =ε , (1)
де )(kv — процес білого шуму з одиничною (для простоти) дисперсією 12 =vσ ;
∑ ∑
= =
−+−+=
q
i
p
i
ii ikhikakh
1 1
2
0 )()()( βεα , (2)
де )(xh — умовна дисперсія.
Оскільки процес { )(kv } визначено в даному випадку як білий шум, то
умовне і безумовне середнє процесу будуть дорівнювати нулю.
Математичне сподівання для )(kε
0})()({)]([ == khkvEkE ε .
Важливим моментом є те, що умовна дисперсія процесу )}({ kε залежна
від часу )()]([ 2
1 khkEk =− ε , оскільки 1)]([ 2
1 =− kvEk . Для того щоб ця умовна
дисперсія була скінченною, необхідно щоб корені характеристичного рів-
няння, записаного для (2), знаходились всередині кола одиничного радіуса.
Таким чином, основною відмінною властивістю моделі УАРУГ є те, що
умовна дисперсія збурень, які діють на процес )}({ ky , — це процес авторег-
ресії з ковзним середнім.
Припустимо, що )}({ ky — процес авторегресії з ковзним середнім. При
побудові моделі процесу в даному випадку можливі варіанти:
1) якщо вдається побудувати адекватну модель АРКС, то похибки мо-
делі будуть мати властивості білого шуму;
2) якщо не вдається побудувати таку модель, то, використовуючи ав-
токореляційну функцію для квадратів залишків, необхідно побудувати мо-
дель УАРУГ, яка дозволить виконати аналіз поведінки дисперсії процесу
(корелограма процесу )}({ 2 kε дасть можливість визначити присутність ге-
тероскедастичності).
Оскільки )()]([1 khkEk =− ε , то рівняння (2) можна записати у вигляді
∑ ∑
= =
− −+−+=
q
i
p
i
iik ikhikakE
1 1
2
0
2
1 )()()]([ βεαε . (3)
За своєю структурою це рівняння подібне до рівняння АРКС ),( pq
для послідовності )}({ 2 kε . Таким чином, методику побудови моделі гетеро-
скедастичного процесу можна узагальнити.
П.І. Бідюк
ISSN 1681–6048 System Research & Information Technologies, 2004, № 1 118
Крок 1. При необхідності зробити попередню обробку експеримента-
льних даних (нормування, логарифмування, заповнення пропусків даних) і
застосувати до них тести на гетероскедастичність. Якщо процес містить
тренд, то перед побудовою моделі необхідно його видалити. Досить часто
візуальний аналіз даних дозволяє отримати суттєву інформацію щодо при-
сутності гетероскедастичності. Разом із візуальним аналізом необхідно роз-
глядати параметри описової статистики, які полегшують визначення струк-
тури моделі.
Крок 2. Користуючись АКФ та ЧАКФ для експериментальних даних,
побудувати модель АР )( p або АРКС ),( pq для процесу )}({ ky та обчисли-
ти ряд з квадратів залишків )}({ 2 kε , де )()( kek =ε . Обчислити вибіркову
дисперсію 2
εσ збурення )(kε : ∑
=−
=
N
k
k
N 1
22 )(
1
1 εσε , де N — число залишків
після побудови моделі АР чи АРКС.
Крок 3. Обчислити і побудувати графік вибіркової автокореляційної
функції для квадратів залишків
∑
∑
=
+=
−
−−−
= N
k
N
sk
k
skk
s
1
22
1
2222
])([
])([])([
)(
ε
εε
σε
σεσε
ρ . (4)
Якщо існують такі значення )(sρ , які відрізняються від нуля із статис-
тичної точки зору, то це свідчить про присутність процесу АРУГ або
УАРУГ. Для того щоб переконатись у присутності гетероскедастичності,
використовують Q -статистику Люнга-Бокса, яка обчислюється за виразом
[7]: ∑
=
−+=
n
i
iNiNNQ
1
)/()()2( ρ , де 4/Nn = (емпіричне значення). Якщо
значення )(2 kε некорельовані, то Q -статистика повинна мати розподіл 2χ
з n ступенями свободи.
Крок 4. Побудувати модель УАРУГ (або іншу модифікацію)
∑ ∑
= =
−+−+=
q
i
p
i
ii ikhikakh
1 1
2
0 )()()( βεα , (5)
використовуючи ряд значень )(2 kε . Якщо в цій моделі хоча б один із кое-
фіцієнтів qii ...,,1, ∈α є значимим, то процес дійсно гетероскедастичний.
Оскільки модель (5) описує залишки моделі з деяким наближенням, то в за-
гальному випадку доцільно продовжити процес уточнення моделей, що
описують вихідний процес в цілому. Тобто, можна уточнити як початкову
модель АР(p) чи АРКС ),( qp , а також модель типу (2). Це робиться на на-
ступному кроці.
Крок 5. Скористатись моделлю (5), для того щоб отримати дійсні зна-
чення залишків, які описуються цією моделлю, тобто згенерувати ряд
Моделювання і прогнозування гетероскедастичних процесів
Системні дослідження та інформаційні технології, 2004, № 1 119
)}({ 1 kε . Згенерувати ще один ряд )}({ 1 ky , де )()()( 11 kkyky ε−= . За допо-
могою отриманого ряду побудувати уточнену модель процесу типу АР )( p
чи АРКС ),( qp . При необхідності процес уточнення моделей може бути
продовжений.
3. АЛГОРИТМ ВРАХУВАННЯ В МОДЕЛІ АРУГ ІМПУЛЬСНИХ
АДИТИВНИХ СКЛАДОВИХ ЧАСОВОГО РЯДУ
Моделі АРУГ дозволяють врахувати ефекти, присутні в часових рядах, які
не можуть бути описані математично за допомогою інших підходів до моде-
лювання. Так, узагальнена модель АРУГ використовується для опису даних,
що мають надлишковий куртозис. Стандартну модель УАРУГ можна вико-
ристати також для опису похибок моделювання, які мають t -розподіл (мо-
дель УАРУГ- t ). Однак ще існують інші проблеми у досягненні високого
ступеня адекватності моделей такого типу, наприклад, випадки, коли ряд
містить адитивні складові (імпульси), що суттєво перевищують поточне се-
реднє значення, а також ближні сусідні значення. Така проблема існує при
побудові моделей для цін акцій на біржах, а також при моделюванні доходів
від цінних паперів. Тому ми пропонуємо підхід до побудови моделей
УАРУГ, які враховують вказаний ефект, що дозволяє суттєво підвищити
адекватність моделі.
Розглянемо часовий ряд Nkky ...,,2,1)},({ = , який може бути описаний
з деяким ступенем адекватності моделлю АРКС ),( qp , тобто
∑ ∑
= =
−+−=
p
i
q
j
ji jkbikyaky
1 0
)()()( ε , (6)
де −)(kε випадкова послідовність типу білого шуму з нульовим середнім та
дисперсією 2
εσ . В моделі (6) відсутня константа 0a , оскільки припускаєть-
ся, що вона будується на основі вимірів yky µ−)( , де yµ — середнє зна-
чення ряду. Припустимо також, що рівняння (6) має збіжний розв’язок, тоб-
то корені його характеристичного рівняння знаходяться в колі одиничного
радіуса. Рівняння (6) можна записати також із застосуванням оператора зсу-
ву L як
)()...1()()...1( 2
21
2
21 kLbLbLbkyLaLaLa q
q
p
p ε++++=−−−− ,
де L — оператор затримки в часі; )1()( −= kykLy .
Нехай модель, яка враховує значні адитивні імпульсні складові часово-
го ряду, має вигляд
),()()( lkukykz β+= , (7)
де
⎩
⎨
⎧
≠
=
=
.,0
,,1
),(
lk
lk
lku
П.І. Бідюк
ISSN 1681–6048 System Research & Information Technologies, 2004, № 1 120
Тобто реальні спостереження описуються рівнянням (7), а не (6). Розгляне-
мо приклад, коли часовий ряд містить одну адитивну складову (значний ім-
пульс), який суттєво перевищує поточне середнє значення.
При оцінюванні моделі АРКС ),( qp на основі такого ряду залишки мо-
делі опишемо так:
)()()(
)(
)()( kyLDky
LB
LAk ==ε , (8)
де ...)1()(/)()( 2
21 −−−== LdLdLBLALD . Значення порядку авторегресії p
та ковзного середнього q визначимо в процесі побудови моделі (6). Якщо
ряд містить значний імпульс, то рівняння (8) приймає вигляд
),()()()(ˆ lkuLDkk βεε += , (9)
і його можна розглядати як модель регресії для )(ˆ kε
)()()(ˆ kkk εωβε += , (10)
де
⎩
⎨
⎧
=
<
=
,,1
,,0
)(
lk
lk
kω і ....,2,1,),()( =>−=+ jlkjDjkω
Тепер вплив суттєвого імпульсного значення на модель в момент lk =
запишемо як
∑
∑
=
== N
lk
N
lk
k
kk
l
)(
)()(
)(
2ω
ωε
β . (11)
Функцію )(lβ представляють у вигляді, зручному для тестування її
значимості. Для цього необхідно визначити оцінку дисперсії залишків,
отриманих при побудові моделі (6). При цьому бажано, щоб оцінка )(lβ не
була суттєво зміщеною внаслідок присутності імпульсів у вихідному ряді
значень. Оцінка дисперсії залишків може бути отримана різними способами.
Один з них полягає в тому, що дисперсія обчислюється для залишків моделі,
з яких видаляється спостереження (імпульс) при lk = . Якщо позначити цю
дисперсію 2ˆ eσ , то стандартний статистичний параметр (статистика) має ви-
гляд
2/1
2 )(
/)(
⎥
⎥
⎦
⎤
⎢
⎢
⎣
⎡
=
∑
=
N
lk
e
k
l
ω
σβ
τ . (12)
Вплив імпульсного значення ряду вважається значним, якщо ,ˆ c>τ де
c — деяке порогове значення. Оскільки в асимптотиці τ̂ має нормальний
Моделювання і прогнозування гетероскедастичних процесів
Системні дослідження та інформаційні технології, 2004, № 1 121
розподіл, то порогове значення c можна визначити з таблиць для
t -розподілу. На основі емпіричних досліджень пропонується використову-
вати для цього величину 4=c . Якщо ,ˆ c>τ можна скоригувати спостере-
ження )(kz в момент lk = , і таким чином перейти до ряду )(ky (без імпу-
льсного значення), використовуючи β̂ , отриману за допомогою (11), тобто
),(ˆ)()( lkukzky β−= .
Розглянутий підхід до врахування імпульсних значень часового ряду
даних поширюється на випадок наявності множини імпульсів, тобто проце-
дура повторюється для кожного імпульсу доти, поки τ̂ -статистика не стане
незначимою. На останньому кроці параметри моделі оцінюють заново для
всіх спостережень.
Розглянемо застосування запропонованої вище методики до побудови
моделей гетероскедастичних процесів. Нехай )(kp — ціна акцій на біржі
або індекс біржових цін. Сформуємо ряд з логарифмів перших різниць як
)]1(log[)]([log)( −−= kpkpkd
і запишемо можливу структуру узагальненої авторегресійної умовно гетеро-
скедастичної моделі у вигляді
)()()( 2/1 khkkd η= , (13)
)1()1()( 1
2
10 −+−+= khkdkh γαα , (14)
де −)(2/1 kh стандартне відхилення для умовної дисперсії, обчисленої на
основі ряду даних. Якщо зробити припущення, що )(kη — некорельована
нормально розподілена послідовність, то рівняння (13), (14) представляють
собою модель УАРУГ. Але якщо )(kη має умовний t -розподіл, то модель
(13), (14) називають УАРУГ- t . Для покращання опису ряду з імпульсними
значеннями скористаємось стандартною моделлю УАРУГ, але будемо кори-
гувати її із врахуванням присутності імпульсних значень в ряді )(kη .
Рівняння (14) описує умовну мінливість величин )(kd , а тому ним мо-
жна скористатись для прогнозування мінливості цін, доходів і т.п. Предста-
вимо модель УАРУГ у вигляді
)1()()1()()( 1
2
110
2 −−+−++= kxkxkdkd γγαα , (15)
де )()()( 2 khkdkx −≡ . Рівняння (15) — це модель типу АРКС(1,1) для
)(2 kd . Зазначимо, що ряд )(kx можна розглядати як гетерогенний ряд за-
лишків. Тепер алгоритм побудови моделі із врахуванням присутності імпу-
льсних значень можна представити у вигляді таких кроків:
Крок 1. Обчислити оцінки параметрів рівнянь (13), (14) методом мак-
симальної правдоподібності. В результаті отримаємо оцінки 110 ˆ,ˆ,ˆ γαα , а
також оцінки рядів )(),( kkh η . Це дозволить знайти ряд )(ˆ)()(ˆ 2 khkdkx −= ,
П.І. Бідюк
ISSN 1681–6048 System Research & Information Technologies, 2004, № 1 122
який використовується на наступному кроці при визначенні присутності ім-
пульсних значень.
Крок 2. З рівняння (8) випливає, що )ˆ1/())ˆˆ(1()(ˆ
111 LLLD γγα −+−= .
Тепер для ∀ lk = необхідно оцінити рівняння регресії (10), використовуючи
оцінки залишків )(ˆ kz , та обчислити )(ˆ lzβ . Незважаючи на те, що ряд )(kx
гетерогенний, необхідно обчислити безумовну дисперсію для )(ˆ kx без вра-
хування імпульсних значень ряду. Тобто дисперсія похибки моделі обчис-
люється при нульовому значенні спостереження та lk = . Для того щоб вра-
хувати зміну в часі дисперсії величини )(ˆ kx , її необхідно обчислити для
вибраного рухомого вікна, а не для вибірки в цілому. Статистики τ̂ , які ви-
значаються виразом (12), обчислюються для )(ˆ kx і порівнюються із значен-
ням 4=c .
Крок 3. Спостереження )(ˆ kx при lk = та найбільшому значенні стати-
стики τ , яке повинне перевищувати 4=c , замінюється на )(ˆ* kx (так, як це
показано в рівнянні (7)) з використанням вагового коефіцієнта )(ˆ lβ (вираз
(11)).
Крок 4. За допомогою ряду )(ˆ* kx та )(ˆ kh побудувати ряд )(2* kd , тоб-
то обчислити його за виразом )(ˆ)(ˆ)( *2* khkxkd += для моменту часу lk = .
Скорегувати ряд даних відносно імпульсних значень
⎪⎩
⎪
⎨
⎧
=
≠
=
.,])([])([sign
,),(
)(
1/22*
*
lkkdkd
lkkd
kd (16)
Наведений вираз показує, що )]([sign)]([sign 2 kdkd = при lk = . З цього
випливає: для членів ряду, які корегуються у відповідності до присутності
імпульсного значення, знак не змінюється.
Крок 5. Після обчислення значень ряду )(* kd перейти на крок 1 і по-
вторювати всю наведену процедуру доти, доки 4ˆ >τ , тобто доки не будуть
оброблені всі члени ряду, які мають суттєві імпульсні значення. Після обро-
бки даних отримаємо остаточні значення оцінок *
0α̂ , *
1
*
1 ˆ,ˆ γα і ряди даних
)(ˆ),( ** khkd . За допомогою цих оцінок параметрів та рядів обчислюється
прогноз на один крок, тобто )1(ˆ* +Nh у відповідності до рівняння (14).
Якщо )(kd в рівнянні (13) представляє собою корельований процес, то
перед використанням запропонованого п’ятикрокового алгоритму необхідно
відфільтрувати детерміновану динаміку процесу за допомогою моделі АР
або АРКС. В результаті отримаємо залишки моделі )(kε так само, як це бу-
ло раніше при побудові моделі АРУГ. Після цього отримані залишки посту-
пають на вхід алгоритму. Однак необхідно пам’ятати, що коефіцієнт корек-
ції β в рівнянні (7) необхідно застосовувати до початкових даних )(kd , а
не до залишків )(kε , оскільки структура моделі АРКС може бути іншою
Моделювання і прогнозування гетероскедастичних процесів
Системні дослідження та інформаційні технології, 2004, № 1 123
після застосування корекції внаслідок присутності суттєвих імпульсних зна-
чень.
Приклад 3.1. Розглянемо побудову моделі УАРУГ для ряду )(kd та
моделі УАРУГ для скоригованого відносно імпульсних значень ряду )(* kd .
Для прикладу візьмемо дані, які характеризують щотижневий прибуток ро-
сійської біржі сільгосппродуктів за 1996 – 1999 рр. Процедура обробки ста-
тистичних даних містить оцінювання параметрів математичних моделей на
основі щотижневих чотирирічних даних, які використовуються для обчис-
лення оцінки однокрокового прогнозу для дисперсії )(kh . Потім з вибірки
даних видаляється перше значення (за перший тиждень всього періоду) і
одне значення додається в кінці вибірки (наступний тиждень). Знову оці-
нюються параметри моделей і обчислюється однокроковий прогноз. Таким
чином запропонований метод корегування впливу імпульсних значень за-
стосовується послідовно до всіх значень вибірки.
На основі даного часового ряду оцінено моделі АР )( p , потім
УАРУГ )1,1( і модель для прибутку, що має таку структуру:
)()2()1()( 21 kkdakdakd εµ +−+−+= ,
)(),()()( 2/1 kkhkk ηηε = ∼ )1,0(N ,
)1()1()( 1
2
10 −+−+= khkkh γεαα .
Результати оцінювання наведено в табл. 1. Параметри моделей оцінено
методом максимальної правдоподібності. Діагностичні статистичні параме-
три 21, QQ , наведені в двох останніх стовпчиках табл. 1, свідчать про те, що
моделі мають достатню ступінь адекватності. Параметри )10(1Q і )10(2Q —
це статистики Люнга-Бокса, які обчислені для визначення ступеня кореляції
залишків моделі. Критичне значення для Q -статистики визначається за до-
помогою таблиць для розподілу 2χ . На наступному кроці до оцінених мо-
делей застосовується метод корекції моделі із врахуванням присутності сут-
тєвих імпульсних значень ряду.
Т а б л и ц я 1 . Результати оцінювання моделей АР(р) та АРУГ(1,1)
Параметри моделі Діагностика Вибірка
даних, рік µ̂ 1â 2â 0α 1α 1γ )10(1Q )10(2Q
1996–1999 0,0034
(1,97)
0,0017
(2,05)
0,179
(2,73)
0,0002
(2,18)
0,274
(4,61)
0,468
(4,97) 5,48 5,17
1997–2000 0,0015
(2,36)
0,0011
(1,99)
0,196
(2,57)
0,0003
(3,19)
0,385
(3,27)
0,652
(4,09) 6,85 7,33
В табл. 2 наведено результати оцінювання тих же моделей, але вже із
врахуванням корекції внаслідок присутності суттєвих імпульсних значень,
тобто модель побудована для )(* kd .
П.І. Бідюк
ISSN 1681–6048 System Research & Information Technologies, 2004, № 1 124
Т а б л и ц я 2 . Результати оцінювання моделей АР(р) та АРУГ(1,1) після
корекції
Параметри моделі Діагностика Вибірка
даних,рік µ̂ 1â 2â 0α 1α 1γ )10(1Q )10(2Q
1996–1999 0,0043
(2,45)
0,0021
(2,39)
0,353
(3,19)
0,0002
(2,18)
0,118
(4,02)
0,694
(5,37) 5,41 4,76
1997–2000 0,0012
(2,44)
0,0009
(1,78)
0,105
(2,69)
0,0002
(3,19)
0,157
(3,06)
0,774
(4,51) 7,49 5,28
У порівнянні з табл. 1 оцінки параметрів 1α і 1γ змінились суттєво.
Наприклад, для періоду даних 1996 – 1999 рр. значення 1α зменшилося від
0,274 до 0,118, а 1γ збільшилося від 0,468 до 0,694. Однак сума коефіцієнтів
11 γα + суттєво не змінилася, що свідчить про те, що загалом динаміка зміни
доходів є робастною по відношенню до імпульсних значень. На основі
отриманих даних моделювання можна зробити висновок, що застосування
корекції даних приводить до більш стійких оцінок параметрів.
Приклад 3.2. Аналіз і моделювання утворення цін на продукцію виро-
бничої фірми (рис. 1).
Нехай )(kq – прибуток фірми (дебітора) в момент часу k ; )(kpe —
очікувана ціна продукції фірми в момент k , отримана на основі інформації
в момент часу )1( −k (тобто )]([)( 1 kpEkp k
e
−= ); )(kh — очікувана диспер-
сія ціни на продукцію фірми в момент k на основі інформації в момент часу
)1( −k ; )1( −kpp – затрати на виробництво одиниці продукції в момент
)1( −k ; )1( −kp — об’єм виробництва продукції в момент часу )1( −k ;
)(1 kε — випадкові збурення прибутку фірми.
Для опису прибутку вибрана структура моделі
+−+++= )1()()()( 2210 kppakhakpaakq e
)()4()1( 154 kkqakpa ε+−+−+ . (17)
Дані вимірюються щоквартально. Для обчислення )(kpe і )(kh буду-
ються окремі моделі: )1( −kpp — затрати на виробництво одиниці продукції
Виробнича
фірма
Очікувана ціна
на продукцію
Витрати на
виробництво
Вихідна продукція
Прибуток фірми
)(kε
Рис. 1. Вхідні та вихідні змінні виробничої фірми
Моделювання і прогнозування гетероскедастичних процесів
Системні дослідження та інформаційні технології, 2004, № 1 125
за попередній квартал; )4( −kq — береться з запізненням 4, щоб врахувати
той же квартал попереднього року. Що цікавого в цій моделі? Це — вплив
умовної дисперсії ціни продукції на прибуток фірми. Змінна )(kpe —
оцінюється на основі ціни в попередньому кварталі.
Якщо ціна змінюється достатньо швидко, то виробник, уникаючи ризи-
ку, намагається знизити об’єм виробництва. Для прогнозу рівня ціни на
продукцію використано модель четвертого порядку
( ) )()(1 20
4
4
3
3
2
21 kkpLLLL εβββββ +=−−−− . (18)
( ) )(632,1)(138,0130,0129,0511,01 2
432 kkpLLLL ε+=−−−− . (19)
Тепер беруть )()( kpkpe = для того, щоб підставити у (17). Передбача-
ється, що динаміка ціни — гетероскедастичний процес:
)1(591,0)1(162,0353,1)( 2
2 −+−+= khkkh ε . (20)
Значення, обчислені в (19) і (20) підставляються у (17) для оцінки рівня
цін на продукцію. Коефіцієнти в (19) і (20) відносяться до прибутку фірми у
виробництві бройлерів. Рівняння для прибутку:
+−++= )1(325,4)(521,0)(767,2)( kppkhkpkq
)()4(603,0)1(887,1 kkqkp ε+−+−+ .
Приклад 3.3. Ціни акцій на біржі. Розглянемо ряд )(2 kε для моделі,
побудованої у попередньому розділі (приклад 1) АР (АР(1,5,8)) (коливання
цін акцій на біржі, рис.2; часткова АКФ на рис. 3).
В результаті дослідження АКФ і ЧАКФ встановлено:
1. Значення коефіцієнтів АКФ: 124,01 =ρ ; 107,02 =ρ ; 066,04 −=ρ ;
103,05 =ρ ; 069,010 −=ρ .
0
0 ,5
1
1 ,5
1 1 1 2 1 3 1 4 1 5 1 6 1 7 1 8 1 9 1
Ім
пу
ль
си
k, час
)(2 kε
Рис. 2. Автокореляційна функція ряду
П.І. Бідюк
ISSN 1681–6048 System Research & Information Technologies, 2004, № 1 126
2. Значення коефіцієнтів ЧАКФ: 124,01,1 =Φ ; 093,02,2 =Φ ; =Φ 4,4
072,0−= ; 127,05,5 =Φ ; 91,010,10 −=Φ .
3. Для математичного опису процесу необхідно розглянути моделі
АР(1), АР(2), АР(3), АР(4). Найбільш вірогідні номери запізнювань, які вхо-
дять до складу моделі: 1, 2, 4, 5, 10. У табл. 3 наведено варіанти оцінювання
декількох можливих структур регресійної моделі.
Т а б л и ц я 3 . Варіанти оцінювання дисперсії вартості акцій однієї з ком-
паній, що входять до числа провідних на Нью-Йоркській фондовій біржі за
1996 р.
(1) (1, 2) (1, 2, 4) (1, 2, 4, 5) (1, 2, 4, 5, 10)
a0
0,0851
(4,4618)
0,0769
(3,6166)
0,0822
(3,4885)
0,0714
(2,7802)
0,0814
(2,8342)
a1
0,1242
(1,2149)
0,1138
(1,0956)
0,1110
(1,0549)
0,1187
(1,1231)
0,1145
(1,0484)
a2 0,0927
(0,8945)
0,1056
(0,9999)
0,1123
(1,0581)
0,1192
(1,0871)
a 3 –0,0762
(–0,7276)
–0,0960
(–0,9054)
–0,1016
(–0,9274)
a 4 0,1251
(1,1845)
0,1247
(1,1385)
a 5 –0,0856
(–0,7837)
RSS 2,4041 2,3826 2,3560 2,3106 2,2628
AIC –0,8076 –0,7846 –0,7517 –0,7377 –0,6735
BSC –0,7542 –0,7040 –0,6428 –0,6006 –0,5034
DW 2,0196 1,9899 1,9712 1,9771 1,9738
F 0,0157 0,0248 0,0311 0,0497 0,0566
R2 0,0155 0,0242 0,0307 0,0474 0,0536
З табл. 3 видно, що найкраща модель, яка описує дисперсію з обчисле-
них варіантів — це АР(1, 2), оскільки для неї 9899,1DW = , 7846,0AIC −= .
Таким чином, модель процесу має вигляд
-0,15
-0,1
-0,05
0
0,05
0,1
0,15
1 11 21 31 41 51 61 71 81 91s
ЧАКФ
Рис. 3. Часткова автокореляційна функція ряду
Моделювання і прогнозування гетероскедастичних процесів
Системні дослідження та інформаційні технології, 2004, № 1 127
)2(0927,0)1(1138,00769,0)( 222 −+−+= kkk εεε .
Значення 3826,2RSS = і 0242,0R 2 = свідчать, що модель можна по-
кращати за рахунок введення ковзного середнього. Варіанти оцінювання
моделей з ковзним середнім наведені в табл. 4.
Т а б л и ц я 4 . Варіанти оцінювання моделей з ковзним середнім
(1) (1, 2) (1, 2, 4) (1, 2, 4, 5) (1, 2, 4, 5, 10)
0a 0,0851
(6,18E+14)
0,0769
(1,24E+16)
0,0822
(1,80E+15)
0,0714
(7,47E+14)
0,0814
(6,23E+14)
1a 0,1242
(8,94E+13)
0,1138
(7,93E+13)
0,1110
(2,12E+14)
0,1187
(1,21E+14)
0,1145
(9,07E+13)
2a 0,0927
(4,16E+14)
0,1056
(1,15E+15)
0,1123
(5,60E+14)
0,1192
(4,34E+14)
3a –0,0762
(–1,18E+15)
–0,0960
(–5,86E+14)
–0,1016
(–4,38E+14)
4a 0,1251
(7,10E+14)
0,1247
(5,07E+14)
5a –0,0856
(–3,71E+14)
6a
–1,34E–14
(–9,6131)
–1,35E–14
(–9,3986)
–4,60E–15
(–8,7229)
–8,91E–15
(–8,9278)
–1,12E–14
(–8,6915)
RSS 6,69E–30 3,83E–30 8,77E–31 5,27E–30 9,71E–30
DW 0,4843 1,1944 1,2519 2,0675 2,0796
R2 1,0000 1,0000 1,0000 1,0000 1,0000
З табл. 4 видно, що краща модель обов’язково повинна містить ковзне
середнє. З обчислених варіантів моделей кращою є АРКС ))1(),5,4,2,1(( ,
оскільки для неї 0675,2DW = , 1R 2 = . Крім того, велика роль t -статистики
для оцінок коефіцієнтів свідчить про їх значимість із статистичної точки
зору. Таким чином, модель, яка адекватно описує дисперсію, можемо запи-
сати так:
−−+−+= )2(1123,0)1(1187,00714,0)( 2
1
2
1
2
1 kkk εεε
)()5(1257,0)4(096,0 2
2
1
2
1 kkk εεε +−+−− .
Приклад 3.4. Ціни акцій компанії УКРНАФТА. Розглянемо ряд )(2 kε
для побудованої в попередньому розділі (приклад 2) моделі АР )3,2,1( що-
денної вартості акцій компанії УКРНАФТА за 2001 р. В результаті дослі-
дження АКФ і ЧАКФ встановлені такі значення коефіцієнтів:
1. АКФ: 132,0;038,0;028,0;006,0;166,0 109321 ===−== ρρρρρ .
2. ЧАКФ: ;043,0;036,0;035,0;166,0 9,93,32,21,1 =Φ=Φ−=Φ=Φ
122,010,10 =Φ .
П.І. Бідюк
ISSN 1681–6048 System Research & Information Technologies, 2004, № 1 128
Для математичного опису процесу необхідно розглянути моделі АР(1),
АР(2), АР(3), АР(4). Найбільш вірогідні номери запізнювань, які входять до
складу моделі: 1, 2, 3, 9, 10. У табл. 5 наведені варіанти оцінювання декіль-
кох можливих структур регресійної моделі.
Т а б л и ц я 5 . Варіанти оцінювання дисперсії щоденної вартості акцій
компанії УКРНАФТА за 2001 р.
(1) (1, 2) (1, 2, 3) (1, 2, 3, 9) (1, 2, 3, 9, 10)
0a 0,1652
(5,1101)
0,1777
(5,2338)
0,1738
(4,8391)
0,1606
(4,1112)
0,1350
(3,3577)
1a 0,1666
(3,1342)
0,1199
(1,9116)
0,1180
(1,8648)
0,1230
(1,9169)
0,1164
(1,8261)
2a –0,0263
(–0,4872)
–0,0495
(–0,7817)
–0,0458
(–0,7101)
–0,0429
(–0,6701)
3a 0,0369
(0,6801)
0,0507
(0,7907)
0,0504
(0,7913)
4a 0,0397
(0,7376)
0,0403
(0,6384)
5a 0,1218
(2,2372)
RSS 58,5397 57,8552 57,6733 57,1763 55,8335
AIC 1,3820 1,3818 1,3909 1,4151 1,4037
BSC 1,4098 1,4235 1,4468 1,4862 1,4892
DW 2,0848 2,0029 1,9978 2,0121 2,0110
F 0,0389 0,0146 0,0164 0,0201 0,0440
R2 0,0374 0,0144 0,0161 0,0197 0,0421
Аналіз отриманих результатів дозволяє зробити такі висновки:
Найкраща модель, яка описує дисперсію з обчислених варіантів —
АР(1, 2), оскільки для неї 0029,2DW = , 0144,0R 2 = , 4235,1AIC = (табл. 5).
Таким чином, модель, що адекватно описує процес, запишемо як
)2(0263,0)1(1199,01777,0)( 2
1
2
1
2
1 −−−+= kkk εεε .
Значення 8552,57RSS = показує, що модель можна поліпшити за раху-
нок введення ковзного середнього. Оцінки параметрів моделей з ковзним
середнім наведено в табл. 6.
Аналіз отриманих результатів дозволяє зробити такі висновки:
Адекватна модель повинна обов’язково мати ковзне середнє. З обчис-
лених варіантів моделей кращою є АРКС((1,2,3), (1)), оскільки для неї
1976,2DW = , 1R 2 = (табл. 6). Таким чином, модель, що адекватно описує
дисперсію, можемо записати як
)()3(0369,0)2(0495,0)1(1180,01738,0)( 2
2
1
2
1
2
1
2
1 kkkkk εεεεε +−+−−−+= .
Моделювання і прогнозування гетероскедастичних процесів
Системні дослідження та інформаційні технології, 2004, № 1 129
Т а б л и ц я 6 . Варіанти оцінювання моделей з ковзним середнім
(1) (1, 2) (1, 2, 3) (1, 2, 3, 9) (1, 2, 3, 9, 10)
0β 0,1652
(2,49E+15)
0,1777
(1,98E+14)
0,1738
(1,48E+15)
0,1606
(2,56E+14)
0,1350
(3,54E+15)
1β 0,1666
(5,59E+14)
0,1199
(2,32E+14)
0,1180
(1,84E+14)
0,1230
(3,56E+14)
0,1164
(5,82E+14)
2β –0,0263
(–4,33E+13)
–0,0495
(–6,19E+14)
–0,0458
(–9,58E+13)
–0,0429
(–1,11E+15)
3β 0,0369
(9,27E+14)
0,0507
(1,86E+14)
0,0504
(1,62E+15)
4β 0,0397
(1,72E+14)
0,0403
(1,34E+15)
5β 0,1218
(3,75E+15)
6β
4,87E–15
(16,0641)
8,13E–14
(15,7368)
–8,31E–15
(–12,9103)
–5,35E–14
(–15,4494)
–2,78E–15
(–13,7294)
RSS 5,06E–29 3,63E–28 1,09E–29 7,65E–28 1,29E–29
DW 1,7425 1,6296 2,1976 1,8840 1,5241
R2 1,0000 1,0000 1,0000 1,0000 1,0000
Отримані моделі далі будуть використані для побудови прогнозу.
4. ПРОГНОЗУВАННЯ ПРОЦЕСІВ ЗА ДОПОМОГОЮ РІЗНИЦЕВИХ
РІВНЯНЬ
Приклад 4.1. Отримання функції прогнозування за допомогою розв'язку
різницевого рівняння для процесу АРІКС(1,1,2)
)2()1()()1()( 210 −+−+++−= kkkakyky εβεβε .
Введемо позначення: )2()1()()( 21 −+−+= kkkke εβεβε і перепишемо
задане рівняння )()1()( 0 kekyaky +−+= , розв’язок якого має вигляд
∑
=
++=
k
i
ieykaky
1
00 )()( . Звідси знайдемо 0y : ∑
=
−−=
k
i
iekakyy
1
00 )()( .
Розв’язок для моменту sk + : ∑
+
=
+++=+
sk
i
ieskaysky
1
00 )()()( .
Підставимо в цей розв’язок отриманий вище вираз для 0y .
∑∑∑
=
+
==
+++=+++−−=+
s
i
sk
i
k
i
ikesakyiesakaiekakysky
1
0
11
000 )()()()()()( .
Оскільки ∑ ∑ ∑∑
= = ==
−++−+++=+
s
i
s
i
s
i
s
i
ikeikikike
1 1 1
21
1
)2()1()()( βεβε ,
то
П.І. Бідюк
ISSN 1681–6048 System Research & Information Technologies, 2004, № 1 130
∑ ∑∑
= ==
−++−+++++=+
s
i
s
i
s
i
ikeikiksakysky
1 1
21
1
0 )2()1()()()( βεβε .
На основі останнього рівняння запишемо функцію прогнозування на один
крок: )1()()()]1([ 210 −+++=+ kkkyakyEk εβεβ , оскільки =+ )]([ ikEk ε
0,0 >∀i .
Функція прогнозування на два кроки
)1()()()(2)]2([ 2210 −++++=+ kkkyakyEk εβεββ ,
і для довільного числа кроків прогнозування маємо
)1()()()()]([ 2210 −++++=+ kkkysaskyEk εβεββ .
Отримане рівняння — це рівняння прямої (її нахил визначається коефі-
цієнтом 0a ), на яку накладається зважений випадковий процес. Для порів-
няння точності прогнозу на основі різницевих рівнянь скористаємось фільт-
ром Калмана та методом, запропонованим в пакеті Eviews.
Критерії аналізу точності прогнозу. Існує багато методів, які можна
застосувати для порівняння прогнозуючих моделей. Один з критеріїв, що
використовується найчастіше, є середньоквадратична похибка або її квадра-
тний корінь. Цей критерій представляє собою суму квадратичних відхилень
прогнозованих значень від досліджуваних.
Корінь з середньоквадратичної похибки, що використовує N прогно-
зованих значень, має форму
( )∑
=
−=
N
k
kyky
N
ky
1
2222 )()(1))((RMSE .
Інший спосіб визначення якості прогнозуючої моделі базується на мо-
дулі відносного відхилення від істинного значення. Усереднений модуль
відносної похибки обчислюється за формулою
∑
=
−
=
N
k ky
kyky
N
ky
1
2
)(
)()(1))((MAPE .
Міра стійкості до відхилень від усталеного стану виражена за допомо-
гою медіани квадратичної похибки
( )2222 )()(Median))((MedSE kykyky −= .
Ці три критерії були порівняні між собою з використанням індексу
працездатності, взятого з теорії прийняття рішень (правило Севіджа-
Ньюханса)
∑
=
−
=
n
j ii
iii
i EC
ECEC
1 )(min
)(minPerf ,
Моделювання і прогнозування гетероскедастичних процесів
Системні дослідження та інформаційні технології, 2004, № 1 131
де EC — один з критеріїв, описаних вище; n означає кількість акцій, для
яких отримані прогнози. Він може бути інтерпретований як відносна втрата
точності однією з моделей порівняно з моделлю, постфактум кращою для
акції j .
Зручним методом контролю якості є використання регресії
)()()( 22 kkyky εωυ ++= .
Розглянемо конкретні приклади застосування розробленої методики
для побудови прогнозу поведінки дисперсії ряду.
Приклад 4.2. Розглянемо ряд, що описує дисперсію вартості акцій од-
нієї з провідних компаній на Нью-Йоркській фондовій біржі. На основі
отриманої вище моделі, яка адекватно описує процес
−−−−+= )2(1123,0)1(1187,00714,0)( 2
1
2
1
2
1 kkk εεε
)()5(1257,0)4(096,0 2
2
1
2
1 kkk εεε +−+−− ,
побудовано прогноз вартості акцій на 5 кроків та порівняно його з реальни-
ми значеннями ряду. Графік прогнозу наведено на рис. 4.
Статистичні параметри отриманого прогнозу наведені в табл. 7.
Т а б л и ц я 7 . Оцінка якості прогнозу
Максимальне відхилення Мінімальне відхилення Сума квадра-
тів похибок Метод прогнозу-
вання Абсолютне 2
1ε∆ , % Абсолютне 2
1ε∆ , %
За моделлю 0,055 73 0,003 8 0,0338
Фільтр Калмана 0,059 78 0,007 12 0,0337
Метод подібних
траєкторій 0,058 77 0,007 10 0,0335
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
1 2 3 4 5
2
1ε
k
Рис. 4. Порівняльний графік прогнозу дисперсії вартості акцій однієї з провідних
компаній на Нью-Йоркській фондовій біржі: істинні значення; на
основі моделі; фільтр Калмана; метод подібних траєкторій
П.І. Бідюк
ISSN 1681–6048 System Research & Information Technologies, 2004, № 1 132
Приклад 4.3. Побудуємо прогноз поведінки ряду, що відображає дис-
персію вартості акцій УКРНАФТА. Адекватна модель, яка описує диспер-
сію, має вигляд
)()3(0369,0)2(0495,0)1(1180,01738,0)( 2
2
1
2
1
2
1
2
1 kkkkk εεεεε +−+−−−+= .
Знайдемо однорідний розв’язок: 00369,00495,0118,0 23 =−+− ααα .
Оскільки дане рівняння має один дійсний корінь ( 4311,01 −=a ) та два
комплексні, повний розв’язок має вигляд
pskkpd ykrAyk ++++= )(cos)( 21
2
1 βθβαε ,
де 2 ar ′= ,
2
1
2
)cos(
a
a
′
′
=θ .
Значення 1a′ та 2a′ знайдемо так: з рівняння 032
2
1
3 =−−= aaa ααα
знайдемо значення дійсного кореня 1α і запишемо: ×− )( 1αα
0)( 21
2 =′+′+× aa αα . Розкривши дужки, виразимо 1a′ , 2a′ через значення 1a
і 2a .
012111
2
2
2
1
3 =′−′−−′+′+ ααααααα aaaaa ,
0)()( 12112
2
11
3 =′−′′−′+−′+ αααα aaaaaa ,
а звідси 5491,0111 −=+=′ aa α , 2862,0211
2
12 =++′ aaaaa .
Таким чином 11,2;535,0 == θr .
Частковий розв’язок для детермінованої частини:
pdpdpdpd yyyy 0369,00495,01180,01738,0 −+−= або 2634,0=pdy .
Частковий розв’язок для стохастичної частини:
∑
∞
=
−=
0
),(
i
i
ps iky εβ де ...,2,1,0,1 == iai
iβ .
Повний розв’язок: pskpd yAyk ++= αε )(2
1 .
Для того щоб знайти значення невідомої констант 21,, ββA скориста-
ємось початковими умовами: 659,1)1(;809,4)0( 2
1
2
1 == εε ; 450,0)2(2
1 =ε .
В результаті отримаємо 0041,1;8771,3;6272,6 21 =−== ββA .
Отже повний розв’язок має вигляд
++⋅⋅−−+= )0041,111,2(cos535,08771,3)4311,0(6272,62634,0)(2
1 kk kkε
∑
∞
=
−−+
0
)()8513,0(
i
i ikε .
Моделювання і прогнозування гетероскедастичних процесів
Системні дослідження та інформаційні технології, 2004, № 1 133
Отриманий розв’язок свідчить про присутність гармонійного коливаль-
ного процесу, який відповідає реальним коливанням цін акцій компанії
УКРНАФТА. Загалом розв’язок має збіжний характер, оскільки
535,0;4311,0 =−= rα , тобто обидва значення є меншими одиниці за моду-
лем.
Таким чином, прогнозоване значення математичного сподівання дис-
персії на s періодів дискретизації на основі отриманого розв’язку можна за-
писати як
[ ] −−++++ kkysk )4311,0(1858,0/28,0)(2634,0)(2
1ε
[ ] ×+−− 5348,0/0227,6)1(ky
[ ]+−−−⋅× 8771,3/)8906,6)2((arccos11,2cos535,0 kyss
∑
−
=
−+−+
1
0
)()8513,0(
s
i
i iskε .
Побудуємо прогноз вартості акцій на 5 кроків та порівняймо його з ре-
альними значеннями ряду. Графік прогнозу наведено на рис 5.
Статистичні параметри отриманого прогнозу наведені в табл. 8.
Т а б л и ц я 8 . Характеристики якості прогнозу
Максимальне відхилення Мінімальне відхилення Метод прогнозу-
вання Абсолютне 2
1ε∆ , % Абсолютне 2
1ε∆ , %
Сума квад-
ратів похи-
бок
Прогнозуюча
функція 0,2418 39,19 0,0465 6,95 0,1068
На основі
розв’язку 0,2494 40,24 0,0316 9,47 0,1682
Метод подібних
траєкторій 0,1486 36,45 0,0263 5,74 0,1174
0
0,2
0,4
0,6
0,8
1 2 3 4 5
2
1ε
k
Рис. 5. Порівняльний графік прогнозу поведінки ряду, який описує дисперсію вар-
тості акцій УКРНАФТА: істинні значення; на основі прогнозуючої
функції; повного розв’язку; метод подібних траєкторій
П.І. Бідюк
ISSN 1681–6048 System Research & Information Technologies, 2004, № 1 134
Таким чином, запропонований системний підхід може бути використа-
ний при побудові математичних моделей процесів за часовими рядами та
прогнозів поведінки рядів, зокрема, гетероскедастичних та нелінійних щодо
змінних процесів. Для більшості моделей кращим є прогноз на основі моде-
лі, але при прогнозуванні на один крок кращим є прогноз, побудований за
допомогою фільтра Калмана, що пояснюється вибором оптимального кое-
фіцієнта фільтра.
ВИСНОВКИ
Розроблена методика ітеративної побудови моделей гетероскедастичних
процесів на основі часових рядів, яка дає можливість отримати модель з ви-
соким ступенем адекватності для опису динаміки дисперсії часового ряду.
Запропоновано метод подальшого підвищення адекватності моделей гетеро-
скедастичних процесів у випадку присутності імпульсних адитивних скла-
дових часового ряду шляхом врахування цих складових при оцінюванні па-
раметрів моделі. При цьому незначне ускладнення процедури оцінювання
параметрів моделі дозволяє суттєво поліпшити її якість. Наведено приклади
використання запропонованої методики опису гетероскедастичних процесів
до прогнозування конкретних фінансово-економічних процесів. Отримані
результати прогнозування свідчать про їх високу якість, що дозволяє скори-
статися ними при прийнятті рішень оперативного управління.
ЛІТЕРАТУРА
1. Ивахненко А.Г. Индуктивный метод самоорганизации моделей сложных сис-
тем. — Киев: Наук. думка, 1982. — 296 с.
2. Себер Дж. Прикладной регрессионный анализ. — М.: Мир, 1982. — 450 с.
3. Бард Й. Нелинейное оценивание параметров. — М.: Статистика, 1979. — 349 с.
4. Дрейпер Н., Смит Г. Прикладной регрессионный анализ. — М.: Финансы и
статистика, 1986. — 2. — 366 с.
5. Бідюк П.І., Зворигіна Т.А. Структурний аналіз методики побудови регресійних
моделей за спостереженнями часового ряду // УСиМ. — 2003. — № 3. —
С. 93–99.
6. Бідюк П.І., Половцев О.В. Аналіз та моделювання економічних процесів пере-
хідного періоду. — Київ: НТУУ «КПІ», 1999. — 230 с.
7. Бидюк П.И., Баклан И.В., Рифа В.Н. Системный подход к построению регрес-
сионной модели по временным рядам // Системні дослідження та
інформаційні технології. — 2002. — № 3. — С. 114–131.
8. Enders W. Applied econometric time series. — New York: John Wiley & Sons, Inc.,
1995. — 434 p.
9. Johnston J., DiNardo J. Econometric methods. — New York: McGraw—Hill, Inc.,
1997. — 530 p.
Надійшла 25.07.2003
|