Моделювання динаміки ринку криптовалют з використанням інструментів машинного навчання
The article analyzes the dynamics of the cryptocurrency market (Bitcoin) using econometric estimation tools based on machine learning models. The forecasting method is improved based on time series decomposition and lagged shifts of financial indicators. An ensemble of short-term forecast models for...
Gespeichert in:
| Datum: | 2023 |
|---|---|
| Hauptverfasser: | , , |
| Format: | Artikel |
| Sprache: | Ukrainisch |
| Veröffentlicht: |
The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute"
2023
|
| Schlagworte: | |
| Online Zugang: | https://journal.iasa.kpi.ua/article/view/283237 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
| Назва журналу: | System research and information technologies |
| Завантажити файл: | |
Institution
System research and information technologies| _version_ | 1866302910484185088 |
|---|---|
| author | Martjanov, Dmytro Vyklyuk, Yaroslav Fleychuk, Mariya |
| author_facet | Martjanov, Dmytro Vyklyuk, Yaroslav Fleychuk, Mariya |
| author_sort | Martjanov, Dmytro |
| baseUrl_str | http://journal.iasa.kpi.ua/oai |
| collection | OJS |
| datestamp_date | 2024-02-01T21:03:07Z |
| description | The article analyzes the dynamics of the cryptocurrency market (Bitcoin) using econometric estimation tools based on machine learning models. The forecasting method is improved based on time series decomposition and lagged shifts of financial indicators. An ensemble of short-term forecast models for the Bitcoin exchange rate is built, and its accuracy is analyzed and compared to individual component models. Time series models are used along with calculated financial indicators (ADODS, NATR, TRANGE, ATR, OBV, RSI, ADTV). The absolute deviation of the short-term forecast amounted to $9.5, which is 0.06% of the absolute value. |
| doi_str_mv | 10.20535/SRIT.2308-8893.2023.4.04 |
| first_indexed | 2025-07-17T10:28:13Z |
| format | Article |
| fulltext |
Д. Мартьянов, Я. Виклюк, М. Флейчук, 2023
54 ISSN 1681–6048 System Research & Information Technologies, 2023, № 4
TIДC
ТЕОРЕТИЧНІ ТА ПРИКЛАДНІ ПРОБЛЕМИ
ІНТЕЛЕКТУАЛЬНИХ СИСТЕМ ПІДТРИМАННЯ
ПРИЙНЯТТЯ РІШЕНЬ
УДК 004.02, 004.67, 004.891.3
DOI: 10.20535/SRIT.2308-8893.2023.4.04
МОДЕЛЮВАННЯ ДИНАМІКИ РИНКУ КРИПТОВАЛЮТ
З ВИКОРИСТАННЯМ ІНСТРУМЕНТІВ
МАШИННОГО НАВЧАННЯ
Д. МАРТЬЯНОВ, Я. ВИКЛЮК, М. ФЛЕЙЧУК
Анотація. Проаналізовано динаміку кон’юнктури ринку криптовалют (Bit-
coin) з використанням інструментарію економетричного оцінювання на основі
моделей машинного навчання. Удосконалено метод прогнозування на основі
декомпозиції часових рядів та лагових зміщень фінансових індикаторів. Побу-
довано ансамбль моделей короткочасного прогнозу курсу Bitcoin та проаналі-
зовано його точність порівняно з окремими складовими моделями. Використа-
но моделі часових рядів на основі розрахованих фінансових індикаторів
(ADODS, NATR, TRANGE, ATR, OBV, RSI, ADTV). Абсолютне відхилення
короткочасного прогнозу склало 9,5$ що становить 0,06% від абсолютного
значення.
Ключові слова: ансамблі моделей, машине навчання, часовий ряд, криптова-
люта.
АКТУАЛЬНІСТЬ
На сучасному етапі фінансові ринки розвиваються надзвичайно високими
темпами, зокрема ринок криптовалют; економетричне моделювання може
стати основою для визначення факторів впливу на ціни та обсяги торгів
криптовалютами. Таке моделювання передбачає збирання відповідних да-
них, визначення структури моделі, оцінювання її параметрів і проведення
відповідного статистичного аналізу. Економетричні моделі можуть ґрунту-
ватися на різних методологіях, таких як аналіз часових рядів, регресійний
аналіз чи аналіз панельних даних.
Ключові етапи моделювання ринку криптовалют: Збирання даних. З
цією метою можливе використання ретроспективних даних про ціни на
криптовалюту, обсяги торгів, ринкові та фінансові показники та інші змінні.
Ці дані можна отримати з різних джерел (біржі криптовалют,
постачальників фінансових даних і публічних баз даних навіть з
можливістю їх комерційного використання).
Специфікація моделі. Визначення структури моделі, що окреслює
зв’язок між залежною змінною (наприклад, ціною криптовалюти) і незалеж-
ними змінними (наприклад, ринковими та фінансовими показниками, інши-
ми економічними факторами). Цей етап може передбачати вибір відповід-
Моделювання динаміки ринку криптовалют з використанням інструментів …
Системні дослідження та інформаційні технології, 2023, № 4 55
них економетричних методів, таких, як моделі авторегресійної інтегрованої
ковзної середньої (ARIMA) [1], моделі векторної авторегресії (VAR) [2] або
алгоритми машинного навчання [3].
Оцінювання параметрів. Цей крок передбачає адаптацію моделі до рет-
роспективних даних та оцінювання відповідних коефіцієнтів, які окреслю-
ють зв’язки між змінними.
Оцінювання моделі. Оцінювання відповідності оцінюваної моделі. Для
оцінювання продуктивності моделі можна використовувати різноманітні
статистичні тести, такі як перевірка гіпотез, діагностика моделі та перевірка
поза вибіркою (наприклад, F-критерій Фішера [4], рівень статистичної по-
хибки [5], Т-критерій Ст’юдента [6], Тест Гренджера [7], Тест Дарбіна–
Уотсона [8] тощо).
Прогнозування та аналіз. Після успішно застосованих описаних вище
етапів модель можна використовувати для прогнозування та аналізу сцена-
ріїв або ж відсіяти.
Указані кроки та побудова дієвої моделі допомагають зрозуміти потен-
ційні майбутні тенденції та поведінку ринку криптовалют на основі оціне-
них взаємозв’язків.
Важливо зазначити, що економетричні моделі ґрунтуються на історич-
них даних і припущеннях, а їх точність залежить від обмежень і невизначе-
ностей. Ринок криптовалют відомий своєю нестабільністю та чутливістю до
зовнішніх факторів, таких як нормативні зміни, технологічний прогрес, інфля-
ційні або девальваційні очікування (фіктивні змінні), інші тенденції ринку, які
можуть створювати проблеми для економіко-математичного моделювання.
Для застосування економетричного моделювання з метою прогнозува-
ня тенденцій ринку криптовалют необхідно мати глибинне розуміння спе-
цифічних методів статистичного аналізу та особливостей динаміки дослі-
джуваного ринку.
Аналіз останніх досліджень та розробок у даній галузі може допомогти
підвищити точність і надійність моделей.
АНАЛІЗ ОСТАННІХ ПУБЛІКАЦІЙ
З активізацією ринку криптовалют значна кількість вітчизняних та зарубіж-
них учених зацікавилися питаннями аналізу та прогнозування цього ринку
з використанням сучасних методів та інструментів. З одного боку, масштаб-
не глобальне зацікавлення цим ринком фінансовими трейдерами, з огляду
на можливість одержання значної маржі у короткостроковому періоді та до-
ступ до масштабних баз даних (динамічних датасетів з поділом на численні
часові лаги) створює істотні перспективи для економетричного моделюван-
ня; на такий тип дослідження існує значний попит в аналітичних колах.
Із другого боку, високий рівень волатильності та вплив багатьох
суб’єктивних факторів, що важко піддаються екстраполяції, потребує від
аналітиків даних використання комплексного підходу та застосування різ-
номанітних методів і інструментів для об’єктивного обґрунтування прикла-
дних моделей прогнозування динаміки ринку криптовалют та миттєвого
прийняття рішень трейдерами, що подекуди буває непростим завданням
щодо вирішення.
Д. Мартьянов, Я. Виклюк, М. Флейчук
ISSN 1681–6048 System Research & Information Technologies, 2023, № 4 56
Питанням прогнозування курсу криптовалют, зокрема Bitcoin, з ураху-
ванням низки факторів, що впливають на його вартість, а також окресленню
щоденних тенденцій на ринку Bitcoin присвячено працю G. Gurupradeep,
M. Harishvaran, K. Amsavalli [9]. У згаданій праці для прогнозування ціни
закриття наступного дня, враховано такі фактори, як ціна відкриття, найви-
ща ціна, найнижча ціна, ціна закриття, обсяг Bitcoin, обсяг інших валют і
зважена ціна. При цьому автори використовують інструменти Scikit-Learn і
моделі «випадкового лісу» і прогнозування.
Л. Кібальник у своїх дослідженнях [10] підтверджує, що ринок крипто-
валют характеризується значною волатильністю, курсовими коливаннями,
складністю застосування адміністративних методів регулювання та кризо-
вими явищами. Тому, як вважають автори, використання традиційних мето-
дів моделювання є неефективним, оскільки з викорстанням класичних мето-
дів аналізу досить важко отримати адекватні прогнози стосовно розвитку
цього ринку. Дослідники пропонують застосування інструментарію фракта-
льного аналізу та аналізу динаміки волатильності, що дозволяє здійснювати
постійний моніторинг стану ринку та прогнозування динаміки криптовалют
різного ступеня капіталізації.
Цікавим видається науковий підхід L. Catania та S. Grassi [11]. Науковці
також відзначють, що дослідження фінансових часових рядів криптовалют
досить складно піддається моделюванню, демонструючи екстремальні спо-
стереження, асиметрії та часто нелінійні характеристики, які важко прогно-
зувати. Автори розробляють динамічну модель нового типу, здатну врахува-
ти довгострокову пам’ять і асиметрію в процесі волатильності, а також
наявність змінних у часі асиметрії та ексцесу. Емпіричне дослідження, ви-
конане на великому масиві реальних даних щодо наборів криптовалют, за-
свідчує докази наявності тривалої пам’яті та ефекту кредитного плеча, що
можна вважати вагомим внеском у теорію динаміки волатильності. Такі ре-
зультати є важливими для управління інвестиційними активами та ризика-
ми, пов’язанами з цим процесом.
Таким чином, аналіз та моделювання ринку криптовалют розкриває
важливі наукові горизонти для застосування сучасного інструментарію еко-
нометричного прогнозування на фінансових ринках у прикладній площині.
ПОСТАНОВКА ЗАВДАННЯ
З огляду на викладене вище, сформулюємо мету дослідження, як побудову
ансамблевої моделі короткочасного прогнозу курсу Bitcoin на базі історич-
них даних та на фінансових індикаторах цієї криптовалюти. У роботі вико-
ристано історичні дані з розбиттям по одній хвилині за 11,5 днів. Усього
набір даних містив 18 056 записів і складався з таких змінних: «price» (курс
криптовалюти), «volume» (обсяг трансакції), «count» (кількість трансакцій),
«open» (курс на початок торгів), «high» (рівень максимального курсу),
«close» (курс криптовалюти на завершення певного періоду), «low» (рівень
мінімального курсу). Слід зазначити, що у наявному реальному ряду даних
окремі з них були пропущені, проте період відсутності даних не перевищу-
вав трьох хвилин. Тому для подальшого аналізу відсутні дані були заповнені
з використанням методу інтерполяції з використанням лінійної регресії. Ре-
зультат інтерполяції наведено на риc. 1.
Як відомо, моделі прогнозування курсу валют можна поділити на дві
категорії.
Моделювання динаміки ринку криптовалют з використанням інструментів …
Системні дослідження та інформаційні технології, 2023, № 4 57
1. Модель часових рядів. Досліджується значення криптовалюти з ура-
хуванням її значень за попередні періоди часу без урахування інших
факторів [12].
2. Модель на основі фінансових індикаторів. Курс криптовалюти
прогнозується на основі фінансових індикаторів, які у своїй природі врахо-
вують часові затримки та характеристики криптовалюти за попередні мо-
менти часу [13].
Розраховано авторами.
У роботі поєднано ці два підходи та використано різноманітні методи
машинного навчання, а також поєднано найбільш дієві з них в ансамбль.
Алгоритм розрахунку:
1) розрахунок фінансових індикаторів;
2) часова декомпозиція цільового поля;
3) визначення лагових затримок та формалізація моделі;
4) побудова та аналіз множини моделей машинного навчання;
5) побудова прогнозу на основі ансамблю моделей.
РОЗРАХУНОК ФІНАНСОВИХ ІНДИКАТОРІВ
Як досліджувані індикатори обрано найбільш популярні та вживані харак-
теристики кон’юнктури ринку криптовалют: ADODS, NATR, TRANGE,
ATR, OBV, RSI, ADTV.
Коротко викладемо основні підходи до розрахунку цих фінансових ін-
дикаторів.
ADODS — Chaikin A/D Oscillator [14].
Цей індикатор на основі обсягу для вимірювання сукупного грошового
потоку. Індикатор припускає, що ступінь тиску купівлі або продажу можна
визначити за розташуванням закриття з урахуванням значень максимуму та
мінімуму обмінного курсу за досліджуваний період.
Рис. 1. Динаміка курсу та обсягів продажу Bitcoin, 2022-11-13 – 2022-11-23
Д. Мартьянов, Я. Виклюк, М. Флейчук
ISSN 1681–6048 System Research & Information Technologies, 2023, № 4 58
Крива ADODS — це загальна сума кожного періоду обсягу грошових
потоків (MVF):
olume
LowHigh
CloseHighLowClose
MFV V
) () (
;
1P PADODS ADODS MFV ,
де p — індикатор періоду.
ATR Normalized (NATR) [15].
Цей індикатор використовується в технічному аналізі для вимірювання
рівня волатильності і визначається за рівняннями:
100 ATR
NATR
Close
;
1
1P
p
ATR n TR
ATR
n
, (1)
де p — індикатор періоду; n — кількість періодів;
1
1 n
P i
i
ATR TR
n
;
] , ), [(max 11 pppppp CloseLowCloseHighLowHighTR , (2)
де n — аналізована кількість періодів часу; p — індикатор періоду; TR —
діапазон торгівлі.
Ttue Range (TRANCE) [16] — це технічний індикатор, що вимірює
денний діапазон курсу плюс будь-який розрив від ціни закриття попере-
днього дня ((2)).
Середній справжній діапазон (ATR) [17] — це індикатор технічного
аналізу, який вимірює волатильність ринку шляхом розкладання всього діа-
пазону ціни активу за цей період (рівняння (1)).
Балансовий обсяг (OBV) [18] — це технічний індикатор імпульсу то-
ргівлі, який використовує потік обсягу для прогнозування змін курсу акцій:
,:
;:0
;:
1
1
1
1
pp
pp
pp
pp
CloseCloseVolume
CloseClose
CloseCloseVolume
OBVOBV
де p — індикатор періоду.
Індекс відносної сили (RSI) — широко використовуваний індикатор
осцилятора. Для трейдерів із середньою реверсією він може генерувати сиг-
нали для визначення рівня перекупленої чи перепроданої ціни. RSI також
можна використовувати для визначення сили руху тренду:
1
100
100
LossAvg
GainAvg
RSI onestep ,
Моделювання динаміки ринку криптовалют з використанням інструментів …
Системні дослідження та інформаційні технології, 2023, № 4 59
де Avg Gain — середній прибуток (в абсолютному вираженні); Avg Loss
— середній збиток в абсолютному вираженні.
Середній прибуток ( Avg Gain ) або збиток ( Avg Loss ) [19], що ви-
користовується у цьому методі, є середнім відсотковим приростом або збит-
ком відповідно впродовж досліджуваного періоду. У формулі використову-
ється абсолютне значення обсягу середніх втрат. Періоди із втратою ціни
враховуються як нуль у розрахунках середнього прибутку. Лаги з тенденці-
єю до підвищення цін враховуються як нуль у процесі розрахунку середньо-
го збитку. Стандартна кількість періодів, які використовуються для розра-
хунку початкового значення RSI, становить 14.
За умови коли буде розраховано значення 14 періодів, можна перехо-
дити до виконання наступного етапу, метою якого є згладжування результа-
тів таким чином, щоб RSI лише наближався до 100 чи до нуля на чітко окре-
сленому трендовому ринку:
1
1
) (13) (
) (13) (
1
100
100
pp
pp
twostep
LossAvgLossAvg
GainAvgGainAvg
RSI .
Середній щоденний обсяг торгів (ADTV) — це середній обсяг прода-
жу певної валюти впродовж дня. Середній щоденний обсяг торгів є важли-
вим показником, оскільки високий або ж низький обсяг торгів приваблює
різні типи трейдерів та інвесторів. Багато трейдерів та інвесторів віддають
перевагу вищому рівню середнього щоденного обсягу торгів порівняно з
низьким, оскільки за умови великого обсягу легше відкривати та виходити з
позицій. Активи з невеликим обсягом мають менше покупців і продавців, і
тому, в цьому випадку, може бути важче увійти або вийти на торги на рівні
бажаної ціни:
trades
Volume
ADTV daily
.
ЧАСОВА ДЕКОМПОЗИЦІЯ ЦІЛЬОВОГО ПОЛЯ
Як декомпозицію цільового поля у дослідженні обрано адитивну модель
(11) [20]:
)()()()( tResidialtSeasonaltTrendtprice .
Трендову залежність ) (tTrend [21] розраховано як лінійну згортку ме-
тодом найменших квадратів, екстрапольованим на обох кінцях [22].
Сезонна компонента )(tSeasonal визначалась методом ковзного серед-
нього із періодом один день (1440 хв) [23].
Результат до композиції подано на рис. 2. Як видно з рисунка, на графі-
ку взаємозв’язку курсу Bitcoin з досліджуваними фінансовими індикаторами
спостерігаються чіткі трендові та сезонні компоненти залежності з невели-
кими розривами у період вихідних днів. У результаті декомпозиції компо-
нента )(Re tsidial виступатиме в ролі цільового поля.
Д. Мартьянов, Я. Виклюк, М. Флейчук
ISSN 1681–6048 System Research & Information Technologies, 2023, № 4 60
Порівняння динаміки фінансових індикаторів з отриманою випадковою
компонентою показано на рис. 3.
Рис. 2. Декомпозиція часового ряду курсу Bitcoin, 2022-11-13 – 2022-11-23.
Розраховано авторами.
Рис. 3. Динаміка залежності курсу Bitcoin від фінансових індикаторів, 2022-
11-13 – 2022-11-23
Розраховано авторами
Моделювання динаміки ринку криптовалют з використанням інструментів …
Системні дослідження та інформаційні технології, 2023, № 4 61
Як видно з рис. 3, динаміка досліджуваної залежної змінної від фінан-
сових індикаторів суттєво розрізняються і потребують подальшого аналізу
та встановлення наявності природи і типу функціональної залежності.
ВИЗНАЧЕННЯ ЛАГОВИХ ЗАТРИМОК ТА ФОРМАЛІЗАЦІЯ МОДЕЛІ
Додатково, для аналізу наявності факту і напряму зв’язку між фінансовими
індикаторами та цільовим полем, виконано кореляційний аналіз (рис. 4).
Як видно з аналізу, між полями ATR та NATR існує сильний лінійний
зв’язок, тому для подальшого аналізу залишено поле NATR, оскільки воно
являє собою нормалізоване ATR. Також існує зв’язок між полем Volume та
TRANGE. Цей зв’язок є на межі лінійного, тому прийнято рішення залиши-
ти ці два поля для подальшого детальнішого аналізу. Окрім того, можна по-
бачити, що випадкова компонента майже не корелює лінійно з жодним із
зазначених фінансових індикаторів. Це свідчить або про відсутність ліній-
ного зв’язку та необхідність використання нелінійних моделей, або про не-
обхідність побудови комплексної лінійної моделі, що включає в себе всі за-
значені фінансові індикатори (багатофакторної регресійної моделі). Проте,
як показує практика трейдингу на ринку криптовалют, саме визначені нами
індикатори найчастіше враховуються трейдерами для прийняття швидких
біржових рішень.
Рис. 4. Матриця кореляційного зв’язку між фінансовими індикаторами динаміки
ринку криптовалют та курсом Bitcoin, 2022-11-13 – 2022-11-23
Розраховано авторами
Д. Мартьянов, Я. Виклюк, М. Флейчук
ISSN 1681–6048 System Research & Information Technologies, 2023, № 4 62
Для врахування впливу лагової затримки випадкової компоненти
))(( tResudial виконано автокореляційний аналіз у межах сезонної компоне-
нти, тобто на 1440 хв. Результат аналізу подано на рис. 5.
Як видно з рисунка, лагова кореляція істотно знижується до нуля і обе-
рнено зростає в межах лагу 465 хв (7 год 45 хв), що відповідає сценарію кла-
сичних торгів на ринку криптовалют. Для уточнення необхідного лагу та
усунення взаємної кореляції виконано частковий автокореляційний аналіз.
Результат ілюструє рис. 6.
Рис. 5. Автокореляційний аналіз для випадкової компоненти ))(( tResudial ,
2022-11-13 – 2022-11-23
Розраховано авторами
Рис. 6. Частковий автокореляційний аналіз для випадкової компоненти
))(( tResudial , 2022-11-13 – 2022-11-23
Розраховано авторами.
Моделювання динаміки ринку криптовалют з використанням інструментів …
Системні дослідження та інформаційні технології, 2023, № 4 63
Як видно з рис. 6, найвищого рівня кореляційний зв’язок притаманний
для компоненти з лаговою затримкою 1, 2 та 1440. Для встановлення наяв-
ності лагових затримок між іншими фінансовими індикаторами та випадко-
вою компонентною також виконано відповідний автокореляційний аналіз
(рис. 7). Як видно з рисунка, всі коефіцієнти кореляції є дуже низькими,
тому немає сенсу враховувати лагову затримку під час побудови моделей.
Це пояснюється специфікою викоаного аналізу. Оскільки йдеться про
розбиття даних по одній хвилині, то логічним є відсутність такого впливу,
адже кон’юнктура ринку криптовалют у таких часових лагах дуже швидко
змінюється і часто трейдери враховують більші часові лаги.
Таким чином, у результаті проведеного аналізу формалізовану модель
прогнозу курсу Bitcoin можна подати у такому вигляді:
),1(), (()()()1( tResudialtResudialFtSeasonaltTrendtBITUSD
),(), (),1440(), 465(), 2( tADODStvolumetResudialtResudialtResudial
)(),(), (), (),( tADTVtRSItOBVtTRANGEtNATR . (3)
Як видно з рівняння (3), курс Bitcoin можна розраховувати як суму
трендової, сезонної та випадкової компонент, яка прогнозується за допомо-
гою ансамблю моделей.
ПОБУДОВА ТА АНАЛІЗ МНОЖИНИ МОДЕЛЕЙ МАШИННОГО
НАВЧАННЯ
Одним із завдань дослідження є побудова моделі для прогнозу курсу валют
на майбутні періоди. Модель, подана у вигляді рівняння (3), дає змогу про-
гнозувати лише на один період наперед. Для побудови прогнозу на декілька
майбутніх періодів можна застосувати два підходи:
Рис. 7. Залежність коефіцієнта кореляції між випадковою компонентою ))(( tResudial
та фінансовими індикаторами з відповідним часовим лагом, 2022-11-13 – 2022-11-23
Розраховано авторами
7
5
6
23
4
1
1 — 2 — 3 — 4 —
5 — 6 — 7 —
Д. Мартьянов, Я. Виклюк, М. Флейчук
ISSN 1681–6048 System Research & Information Technologies, 2023, № 4 64
1. Для кожного із факторів побудувати прогнозну модель на один
період наперед і відповідно використовувати прогнозні значення як вхідні
для прогнозування на наступний період часу (ланцюговий метод).
Як вихідне поле використовувати значення )lag( tResidial зміщеного
на необхідні періоди наперед.
Перший підхід потребує побудови великої кількості моделей і зумовить
накопичення помилки за ітерацій на кожний наступний період. Другий під-
хід дозволить зменшити накопичувальну помилку, але потребує побудови
окремої моделі для кожного лагу прогнозування. Тому для розрахунків об-
рано саме другий підхід.
Як тестові моделі виокремлено: лінійну множинну регресію [24]
(Linear), регресію Губара [25] (Huber) та нейронну мережу зворотного по-
ширення помилки [26] (MLP), що складається із двох прошарків по 100 ней-
ронів кожен. Для тестування точності та адекватності моделей використано
кросвалідацію з величиною розбиття 3. Результати оцінювання точності
прогнозування наведено в табл. 1.
Як видно з таблиці, точність прогнозу у випадку тестових даних є до-
сить високою. Як і слід було очікувати, зі збільшенням часу прогнозу точ-
ність моделей поступово зменшується. Однак навіть на 10 періодів наперед
вона є досить висока.
Т а б л и ц я 1 . Коефіцієнти кореляції моделі прогнозу (R2) для різних лагів
для )lag( tResudial , 2022-11-13 – 2022-11-23
Lag Linear MLP Huber VotingRegressor
0 0,99 0,99 0,99 0,99
1 0,98 0,98 0,98 0,98
2 0,97 0,96 0,97 0,97
3 0,96 0,96 0,96 0,96
4 0,96 0,94 0,95 0,95
5 0,95 0,92 0,95 0,95
6 0,94 0,93 0,94 0,94
7 0,93 0,92 0,93 0,93
8 0,92 0,91 0,92 0,92
9 0,91 0,90 0,91 0,91
10 0,90 0,89 0,90 0,90
Розраховано авторами.
Для уникнення випадкових флуктуацій моделей їх об’єднано в ан-
самбль за допомогою VotingRegressor, який усереднює результати окремих
моделей.
ПОБУДОВА ПРОГНОЗУ НА ОСНОВІ АНСАМБЛЮ МОДЕЛЕЙ
Для побудови прогнозу набір даних було поділено на навчальний та тесто-
вий в пропорції 90/10. Як тестовий набір обрано дані за останній період. Ре-
зультати навчання і тестування наведено в табл. 2.
Моделювання динаміки ринку криптовалют з використанням інструментів …
Системні дослідження та інформаційні технології, 2023, № 4 65
Т а б л и ц я 2 . Точність навчання (R2) на навчальному та тестового набор
даних для )lag( tResidial
Linear MLP Huber VotingRegressor
Lag
Train Test Train Test Train Test Train Test
0 0,99 0,99 0,99 0,95 0,99 0,99 0,99 0,99
1 0,99 0,98 0,99 0,98 0,98 0,98 0,99 0,98
2 0,98 0,97 0,98 0,97 0,97 0,97 0,98 0,97
3 0,97 0,96 0,97 0,94 0,97 0,96 0,97 0,96
4 0,96 0,95 0,94 0,85 0,96 0,95 0,96 0,95
5 0,95 0,94 0,93 0,88 0,95 0,94 0,95 0,90
6 0,94 0,93 0,94 0,89 0,94 0,93 0,94 0,92
7 0,93 0,92 0,93 0,92 0,93 0,92 0,93 0,92
8 0,92 0,91 0,92 0,89 0,92 0,91 0,92 0,91
9 0,91 0,90 0,91 0,89 0,91 0,90 0,91 0,89
10 0,90 0,89 0,91 0,86 0,90 0,89 0,90 0,87
Розраховано авторами.
Як видно з таблиці, точність навчання поступово спадає з лагом про-
гнозу. Чим менша затримка в прогнозі, тим точніший результат. У розгля-
дуваному випадку, кожен лаг становить 1 хв. Отже, чим швидше буде при-
йнято рішення, тим менша помилка в його прийнятті. Це точність прогнозу
для випадкової компоненти числового ряду. Для визначення точності моделі
(3) необхідно до цих результатів додати сезонну та трендову компоненти і
побудувати прогноз реального курсу валют. Прогноз курсу Bitcoin для тес-
тових значень подано на рис. 8.
Як видно з рисунка, значення мають досить сильне відхилення від реа-
льних даних, однак розрахунок середнього абсолютного відхилення стано-
вить 9,5, що становить 0,06% від абсолютного значення. Це може свідчити
про достатній рівень точності моделі.
Рис. 8. Прогноз курсу Bitcoin згідно з розробленим ансамблем моделей на 10 хв
наперед порівняно з тестовими даними
Розраховано авторами
3
1
4
52
1 —
2 —
3 —
4 —
5 —
Д. Мартьянов, Я. Виклюк, М. Флейчук
ISSN 1681–6048 System Research & Information Technologies, 2023, № 4 66
ВИСНОВКИ
1. На сучасному етапі фінансові ринки розвиваються надзвичайно ви-
сокими темпами, зокрема і ринок криптовалют, для якого економетричне
моделювання може стати основою для визначення факторів впливу на його
кон’юнктуру. Попри істотні можливості застосування економетричного
інструментарію для аналізу цього ринку (генерування об’ємних даних у ре-
жимі реального часу), слід вказати й на певні обмеження такого аналізу, зо-
крема істотна волатильність ринку та часто суб’єктивний чи інтуїтивний
характер прийняття рішень трейдерами криптовалют.
2. Для оперативного прийняття рішень щодо купівлі-продажу валют-
них активів на фондових біржах запропоновано застосування ансамблевої
моделі короткочасного прогнозу курсу валюти, ґрунтуючись на історичних
даних основних характеристик ринкової кон’юнктури (курс криптовалюти,
обсяг транзакції, кількість транзакцій, курс на початок торгів, рівень макси-
мального курсу, курс криптовалюти на завершення певного періоду, рівень
мінімального курсу та фінансових індикаторах цієї криптовалюти (ADODS,
NATR, TRANGE, ATR, OBV, RSI, ADTV).
3. У процесі аналізу моделі прогнозування курсу криптовалют можна
використати дві категорії моделей: модель часових рядів; модель на основі
фінансових індикаторів.
4. Визначено ключові етапи моделювання ринку криптовалют: 1) зби-
рання даних; 2) специфікація моделі; 3) оцінювання параметрів; 4) оціню-
вання моделі; 5) прогнозування та аналіз.
5. Серед основних кроків для побудови моделі для аналізу ринку крип-
товалют рекомендовано застосовувати: часову декомпозицію цільового по-
ля; визначення лагових затримок та формалізацію моделі; побудову та ана-
ліз множини моделей машинного навчання; побудову прогнозу на основі
ансамблю моделей.
6. Основні висновки з виконаного аналізу:
у взаємозв’язку курсу Bitcoin з досліджуваними фінансовими інди-
каторами спостерігаються чіткі трендові та сезонні компонентні залежності
з невеликими розривами у період вихідних днів;
найміцніший зв’язок визначено між такими змінними, як ATR і
NATR, а також Volume та TRANGE. Цей зв’язок є на межі лінійного, тому
прийнято рішення залишити ці два поля для подальшого детальнішого
аналізу. Відзначено, що випадкова компонента майже не корелює лінійно з
жодним із зазначених фінансових індикаторів. Це свідчить або про відсут-
ність лінійного зв’язку та необхідність використання нелінійних моделей,
або про потребу побудови комплексної лінійної моделі, що включає в себе
основні фінансові індикатори (багатофакторної регресійної моделі);
установлено, що лагова кореляція істотно знижується до нуля і
обернено зростає в межах лагу 465 хв (7 год 45 хв), що відповідає сценарію
класичних торгів на ринку криптовалют; найвищий рівень кореляційного
зв’язку притаманний для компоненти з лаговою затримкою 1, 2 та 1440;
оскільки всі коефіцієнти кореляції між випадковою компонентою та фінан-
совими індикаторами є надто низькими, тому немає сенсу враховувати лаго-
ву затримку у побудові такого типу моделей; курс Bitcoin можна розрахову-
вати як суму трендової, сезонної та випадкової компонент, яка
прогнозується за допомогою ансамблю моделей.
Моделювання динаміки ринку криптовалют з використанням інструментів …
Системні дослідження та інформаційні технології, 2023, № 4 67
ЛІТЕРАТУРА
1. Gandhi Pratik, 7 Statistical Tests to validate and help to fit ARIMA model. Available:
https://towardsdatascience.com/7-statistical-tests-to-validate-and-help-to-fit-arima-
model-33c5853e2e93
2. Kotzé Kevin, Vector autoregression models. Available: https://kevinkotze.github.io/
ts-7-var/.
3. Taiwo Oladipupo Ayodele, Types of Machine Learning P.19-28. Algorithms. Avail-
able: https://cdn.intechopen.com/pdfs/10694/InTech-Types_of_machine_learning_
algorithms.pdf
4. Onchiri Sureiman and Callen Moraa Mangera, “F-test of overall significance in re-
gression analysis simplified,” Journal of the Practice of Cardiovascular Sciences,
vol. 6, issue 2, pp. 116–122, May-August 2020. doi: 10.4103/jpcs.jpcs_18_20.
5. Sander Greenland et al., “Statistical Tests, P-values, Confidence Intervals, and
Power: A Guide to Misinterpretations,” The American Statistician, Online Supple-
ment, pp. 1–12, 2016. Available: https://events.gwdg.de/event/482/attachments/
391/580/anwer_to_the_ASA_statement_misinterpretations.pdf
6. L. Brown, “The conditional level of Student’s – test,” The Annals of Mathematical
Statistics, vol. 38, no. 4, pp. 1068–1071, Aug., 1967. Available: https://faculty.
wharton.upenn.edu/wp-content/uploads/2012/04/Conditional-level-of-students-t-
test.pdf
7. Xiaojun Song and Abderrahim Taamouti, “A better understanding of Granger cau-
sality analysis: A big data environment,” Oxford Bulletin of Economics & Statistics,
pp. 2–25, August 2019. Available: https://www.researchgate.net/publication/
329803300_A_Better_Understanding_of_Granger_Causality_Analysis_A_Big_Data
_Environment
8. Champion Robert and Mills M. Terence, “Demonstrating the Durbin-Watson Statis-
tic,” Journal of the Royal Statistical Society Series D (The Statistician), 47(4), pp.
643–644, December 1998. doi: 10.1111/1467-9884.00161.
9. G. Gurupradeep, M. Harishvaran, and K. Amsavalli, “Cryptocurrency Price Predic-
tion using Machine Learning, 2023,” International Journal of Advanced Research in
Computer and Communication Engineering, vol. 12, issue 4, pp. 808–814, April
2023. doi: 10.17148/IJARCCE.2023.124140.
10. L.O. Kibalnyk, O.A. Kovtun, and G.B. Danylchuk, “Modeling and analysis of the
current state of the cryptocurrency market,” Economics and management in the
period of digital transformation of business, society and the state: materials of the
Jubilee International Scientific and Practical Conference (May 28–29, 2020,
Zaporizhzhia). Zaporizhzhia: ZNU Engineering Institute, 2020, pp. 112–117.
11. Leopoldo Catania and Stefano Grassi, “Modelling Crypto–Currencies Financial
Time–Series,” SSRN Electronic Journal, pp. 2–38, August 2017. doi:
10.2139/ssrn.3028486.
12. George E.P. Box, Time series analysis: forecasting and control; fifth edition, 2016,
668 p. Available: http://repo.darmajaya.ac.id/4781/1/Time%20Series%20 Analy-
sis_%20Forecasting%20and%20Control%20%28%20PDFDrive%20%29.pdf
13. Andrea Majdáková, Blanka Giertliová, and Iveta Hajdúchová, “Prediction by finan-
cial and economic analysis in the conditions of forest enterprises,” Journal of Forest
Science, 66, 2020 (1), pp. 1–8. Available: https://www.agriculturejournals.cz/
pdfs/jfs/2020/01/01.pdf
14. Chaikin A/D Oscillator. Available: https://www.cryptohopper.com/resources/ tech-
nical-indicators/283-chaikin-a-d-oscillator.
15. Normalized Average True Range. Available: https://taapi.io/indicators/normalized-
average-true-range/
16. Average True Range. Available: https://www.fidelity.com/learning-center/trading-
investing/technical-analysis/technical-indicator-guide/atr.
Д. Мартьянов, Я. Виклюк, М. Флейчук
ISSN 1681–6048 System Research & Information Technologies, 2023, № 4 68
17. Average True Range. Available: https://www.wallstreetmojo.com/average-true-
range/
18. William Wai Him Tsang and Terence Tai Leung Chong, “Profitability of the On-
Balance Volume Indicator,” Economics Bulletin, 29(3), pp. 2424–2431, January 2009.
19. Average Rate Of Return: Meaning, How To Calculate And Uses. Available:
https://in.indeed.com/career-advice/career-development/average-rate-of-retur
20. Kramar Vadim and Alchakov Vasiliy, “Time-Series Forecasting of Seasonal Data
Using Machine Learning Methods,” Algorithms, vol. 16, issue 5, pp. 2–16, 2023. doi:
10.3390/a16050248.
21. Andrius Buteikis, Time series with trend and seasonality components. 66 p. Avail-
able: http://web.vu.lt/mif/a.buteikis/wp-content/uploads/2019/02/Lecture_03.pdf
22. Harding Ben and Clayton V. Deutsch, Trend Modeling and Modeling with a Trend.
May 12, 2021, 14 p. Available: https://geostatisticslessons.com/lessons/trendmodeling
23. R. Shumway and D. Stoffer, Time series analyses and its applications; 3rd ed. 2011,
576 p. Available: http://pzs.dstu.dp.ua/DataMining/times/bibl/TimeSeries.pdf
24. Hariaji Joko, Simple Linear Regression (SLR) Model and Multiple Linear Regres-
sion (MLR) Model, May 2021, pp. 1–34. doi:10.13140/RG.2.2.17237.35044.
25. Qiang Sun and Wenxin Zhou, “Adaptive Huber Regression,” Journal of the Ameri-
can Statistical Association. October 2018, 56 p. doi: 10.1080/01621459.
2018.154312. https://www.researchgate.net/publication/317732614_Adaptive_
Huber_Regression
26. Dastres Roza and Soori Mohsen, “Artificial Neural Network Systems,” International
Journal of Imaging and Robotics, 21(2), pp. 13–25, March 2021. Available: https:
//www.researchgate.net/publication/350486076_Artificial_Neural_Network_Systems
Надійшла 30.06.2023
INFORMATION ON THE ARTICLE
Dmytro I. Martjanov, ORCID: 0009-0003-3919-4412, Lviv Polytechnic National
University, Ukraine, e-mail: d.martjnoff@gmail.com
Yaroslav I. Vyklyuk, ORCID: 0000-0003-4766-4659, Lviv Polytechnic National
University, Ukraine, e-mail: vyklyuk@ukr.net
Mariya I. Fleychuk, ORCID: 0000-0002-0417-9066, Stepan Gzhytskyi National
University of Veterinary Medicine and Biotechnologies, Ukraine, e-mail:
fleychukm@gmail.com
MODELING CRYPTOCURRENCY MARKET DYNAMICS USING MACHINE
LEARNING TOOLS / D.I. Martjanov, Ya.I. Vyklyuk, M.I. Fleychuk
Abstract.The article analyzes the dynamics of the cryptocurrency market (Bitcoin)
using econometric estimation tools based on machine learning models. The forecast-
ing method is improved based on time series decomposition and lagged shifts of fi-
nancial indicators. An ensemble of short-term forecast models for the Bitcoin ex-
change rate is built, and its accuracy is analyzed and compared to individual
component models. Time series models are used along with calculated financial in-
dicators (ADODS, NATR, TRANGE, ATR, OBV, RSI, ADTV). The absolute de-
viation of the short-term forecast amounted to $9.5, which is 0.06% of the absolute
value.
Keywords: ensemble models, machine learning, time series, cryptocurrency.
|
| id | journaliasakpiua-article-283237 |
| institution | System research and information technologies |
| keywords_txt_mv | keywords |
| language | Ukrainian |
| last_indexed | 2025-07-17T10:28:13Z |
| publishDate | 2023 |
| publisher | The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" |
| record_format | ojs |
| resource_txt_mv | journaliasakpiua/db/f5ccbae970c46b7b819a730094d160db.pdf |
| spelling | journaliasakpiua-article-2832372024-02-01T21:03:07Z Modeling cryptocurrency market dynamics using machine learning tools Моделювання динаміки ринку криптовалют з використанням інструментів машинного навчання Martjanov, Dmytro Vyklyuk, Yaroslav Fleychuk, Mariya ensemble models machine learning time series cryptocurrency ансамблі моделей машине навчання часовий ряд криптовалюта The article analyzes the dynamics of the cryptocurrency market (Bitcoin) using econometric estimation tools based on machine learning models. The forecasting method is improved based on time series decomposition and lagged shifts of financial indicators. An ensemble of short-term forecast models for the Bitcoin exchange rate is built, and its accuracy is analyzed and compared to individual component models. Time series models are used along with calculated financial indicators (ADODS, NATR, TRANGE, ATR, OBV, RSI, ADTV). The absolute deviation of the short-term forecast amounted to $9.5, which is 0.06% of the absolute value. Проаналізовано динаміку кон’юнктури ринку криптовалют (Bitcoin) з використанням інструментарію економетричного оцінювання на основі моделей машинного навчання. Удосконалено метод прогнозування на основі декомпозиції часових рядів та лагових зміщень фінансових індикаторів. Побудовано ансамбль моделей короткочасного прогнозу курсу Bitcoin та проаналізовано його точність порівняно з окремими складовими моделями. Використано моделі часових рядів на основі розрахованих фінансових індикаторів (ADODS, NATR, TRANGE, ATR, OBV, RSI, ADTV). Абсолютне відхилення короткочасного прогнозу склало 9,5$ що становить 0,06% від абсолютного значення. The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2023-12-26 Article Article application/pdf https://journal.iasa.kpi.ua/article/view/283237 10.20535/SRIT.2308-8893.2023.4.04 System research and information technologies; No. 4 (2023); 54-68 Системные исследования и информационные технологии; № 4 (2023); 54-68 Системні дослідження та інформаційні технології; № 4 (2023); 54-68 2308-8893 1681-6048 uk https://journal.iasa.kpi.ua/article/view/283237/290374 |
| spellingShingle | ансамблі моделей машине навчання часовий ряд криптовалюта Martjanov, Dmytro Vyklyuk, Yaroslav Fleychuk, Mariya Моделювання динаміки ринку криптовалют з використанням інструментів машинного навчання |
| title | Моделювання динаміки ринку криптовалют з використанням інструментів машинного навчання |
| title_alt | Modeling cryptocurrency market dynamics using machine learning tools |
| title_full | Моделювання динаміки ринку криптовалют з використанням інструментів машинного навчання |
| title_fullStr | Моделювання динаміки ринку криптовалют з використанням інструментів машинного навчання |
| title_full_unstemmed | Моделювання динаміки ринку криптовалют з використанням інструментів машинного навчання |
| title_short | Моделювання динаміки ринку криптовалют з використанням інструментів машинного навчання |
| title_sort | моделювання динаміки ринку криптовалют з використанням інструментів машинного навчання |
| topic | ансамблі моделей машине навчання часовий ряд криптовалюта |
| topic_facet | ensemble models machine learning time series cryptocurrency ансамблі моделей машине навчання часовий ряд криптовалюта |
| url | https://journal.iasa.kpi.ua/article/view/283237 |
| work_keys_str_mv | AT martjanovdmytro modelingcryptocurrencymarketdynamicsusingmachinelearningtools AT vyklyukyaroslav modelingcryptocurrencymarketdynamicsusingmachinelearningtools AT fleychukmariya modelingcryptocurrencymarketdynamicsusingmachinelearningtools AT martjanovdmytro modelûvannâdinamíkirinkukriptovalûtzvikoristannâmínstrumentívmašinnogonavčannâ AT vyklyukyaroslav modelûvannâdinamíkirinkukriptovalûtzvikoristannâmínstrumentívmašinnogonavčannâ AT fleychukmariya modelûvannâdinamíkirinkukriptovalûtzvikoristannâmínstrumentívmašinnogonavčannâ |