From temporal data to dynamic causal models

We present a brief review of dynamic causal model inference from data. A vector autoregressive models is of our prime interest. The architecture, representation and schemes of measurement of temporal data and time series data are outlined. We argue that require- ment to data characteristics should c...

Повний опис

Збережено в:
Бібліографічні деталі
Дата:2023
Автор: Balabanov, O.S.
Формат: Стаття
Мова:Ukrainian
Опубліковано: Інститут програмних систем НАН України 2023
Теми:
Онлайн доступ:https://pp.isofts.kiev.ua/index.php/ojs1/article/view/520
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Problems in programming
Завантажити файл: Pdf

Репозитарії

Problems in programming
id pp_isofts_kiev_ua-article-520
record_format ojs
resource_txt_mv ppisoftskievua/e8/e605e684f166d74a216472c7c3c5e6e8.pdf
spelling pp_isofts_kiev_ua-article-5202023-06-25T06:05:31Z From temporal data to dynamic causal models Від темпоральних даних до динамічних каузальних моделей Balabanov, O.S. causal model; dynamic process; time series; conditional independence; Granger causality; causal relationship UDC 004.048:519.7 каузальні моделі; динамічні процеси; часові ряди даних; умовна незалежність; каузальність за Грейнджером; каузальні зв’язки УДК 004.048:519.7 We present a brief review of dynamic causal model inference from data. A vector autoregressive models is of our prime interest. The architecture, representation and schemes of measurement of temporal data and time series data are outlined. We argue that require- ment to data characteristics should come from the nature of dynamic process at hand and goals of model inference. To describe and evaluate temporal data one may use terms of longitude, measurement frequency etc. Data measurement frequency is crucial factor in order to an inferred model be adequate. Data longitude and observation session duration may be expressed via several temporal horizons, such as closest horizon, 2-step horizon, influence attainability horizon, oscillatory horizon, and evolutionary horizon. To justify a dynamic causal model inference from data, analyst needs to assume the dynamic process is stationary or at least obeys structural regularity. The main specificity of task of dynamic causal model inference is known temporal order of variables and certain structural regularity. If maximal lag of influence is unknown, inference of dynamic causal model faces additional problems. We examine the Granger’s causality concept and outline its deficiency in real circumstances. It is argued that Granger causality is incorrect as practical tool of causal discovery. In contrast, certain rules of edge orientation (included in known constraint-based algorithms of model inference) can reveal unconfounded causal relationship.Prombles in programming 2022; 3-4: 183-195 Доповідь присвячена огляду проблем виведення динамічних каузальних моделей з емпіричних даних, з акцентом на моделі векторних авторегресійних процесів. Типізовано і охарактеризовано схеми збору, архітектуру і форми репрезентації темпоральних даних та часових рядів даних. Показано, що вимоги до архітектури темпоральних даних диктуються характером динамічного процесу і потребами виведення адекватної моделі. Виділено основні типи динамічних процесів, зокрема, рекурентні процеси, «запрограмовані» процеси, потоки стохастичних подій, лічильні процеси тощо. Для характеристики довжини темпоральних даних запропоновано кілька часових горизонтів, визначених на основі структури моделі, лагу каузальних зв’язків процесу, довжини шляхів впливу, довжини зворотних зв’язків тощо. Частота вимірювання даних критично важлива для адекватності виве- деної моделі і визначається тривалістю елементарних впливів між компонентами векторного процесу і швидкістю дії зворотних зв’язків. Відображено роль припущень у виведенні динамічної моделі з даних, зокрема, припущень стаціонарності та регулярності структури. Виділено особливості виведення динамічних каузальних моделей (у порівнянні із статичними моделями), окреслено тактику врахування темпорального порядку змінних. Проаналізовано проблеми, пов’язані з невідомим лагом післядії та існуванням прихованих автокорельованих часових рядів. Представлено концепцію каузальності за Грейнджером і вказано на її недосконалість в реальних умовах неповноти інформації. Проведено порівняльний аналіз критерію каузальності за Грейнджером та правил орієнтації ребер в апараті каузальних мереж з точки зору їх спроможності виявляти каузальні відношення.Prombles in programming 2022; 3-4: 183-195 Інститут програмних систем НАН України 2023-01-23 Article Article application/pdf https://pp.isofts.kiev.ua/index.php/ojs1/article/view/520 10.15407/pp2022.03-04.183 PROBLEMS IN PROGRAMMING; No 3-4 (2022); 183-195 ПРОБЛЕМЫ ПРОГРАММИРОВАНИЯ; No 3-4 (2022); 183-195 ПРОБЛЕМИ ПРОГРАМУВАННЯ; No 3-4 (2022); 183-195 1727-4907 10.15407/pp2022.03-04 uk https://pp.isofts.kiev.ua/index.php/ojs1/article/view/520/559 Copyright (c) 2023 PROBLEMS IN PROGRAMMING
institution Problems in programming
baseUrl_str https://pp.isofts.kiev.ua/index.php/ojs1/oai
datestamp_date 2023-06-25T06:05:31Z
collection OJS
language Ukrainian
topic causal model
dynamic process
time series
conditional independence
Granger causality
causal relationship
UDC 004.048:519.7
spellingShingle causal model
dynamic process
time series
conditional independence
Granger causality
causal relationship
UDC 004.048:519.7
Balabanov, O.S.
From temporal data to dynamic causal models
topic_facet causal model
dynamic process
time series
conditional independence
Granger causality
causal relationship
UDC 004.048:519.7
каузальні моделі
динамічні процеси
часові ряди даних
умовна незалежність
каузальність за Грейнджером
каузальні зв’язки
УДК 004.048:519.7
format Article
author Balabanov, O.S.
author_facet Balabanov, O.S.
author_sort Balabanov, O.S.
title From temporal data to dynamic causal models
title_short From temporal data to dynamic causal models
title_full From temporal data to dynamic causal models
title_fullStr From temporal data to dynamic causal models
title_full_unstemmed From temporal data to dynamic causal models
title_sort from temporal data to dynamic causal models
title_alt Від темпоральних даних до динамічних каузальних моделей
description We present a brief review of dynamic causal model inference from data. A vector autoregressive models is of our prime interest. The architecture, representation and schemes of measurement of temporal data and time series data are outlined. We argue that require- ment to data characteristics should come from the nature of dynamic process at hand and goals of model inference. To describe and evaluate temporal data one may use terms of longitude, measurement frequency etc. Data measurement frequency is crucial factor in order to an inferred model be adequate. Data longitude and observation session duration may be expressed via several temporal horizons, such as closest horizon, 2-step horizon, influence attainability horizon, oscillatory horizon, and evolutionary horizon. To justify a dynamic causal model inference from data, analyst needs to assume the dynamic process is stationary or at least obeys structural regularity. The main specificity of task of dynamic causal model inference is known temporal order of variables and certain structural regularity. If maximal lag of influence is unknown, inference of dynamic causal model faces additional problems. We examine the Granger’s causality concept and outline its deficiency in real circumstances. It is argued that Granger causality is incorrect as practical tool of causal discovery. In contrast, certain rules of edge orientation (included in known constraint-based algorithms of model inference) can reveal unconfounded causal relationship.Prombles in programming 2022; 3-4: 183-195
publisher Інститут програмних систем НАН України
publishDate 2023
url https://pp.isofts.kiev.ua/index.php/ojs1/article/view/520
work_keys_str_mv AT balabanovos fromtemporaldatatodynamiccausalmodels
AT balabanovos vídtemporalʹnihdanihdodinamíčnihkauzalʹnihmodelej
first_indexed 2024-09-12T19:29:43Z
last_indexed 2024-09-12T19:29:43Z
_version_ 1815407510338666496
fulltext 183 Моделі і засоби систем баз даних та знань УДК 004.048:519.7 https://doi.org/10.15407/pp2022.03-04.183 ВІД ТЕМПОРАЛЬНИХ ДАНИХ ДО ДИНАМІЧНИХ КАУЗАЛЬНИХ МОДЕЛЕЙ Олександр Балабанов Доповідь присвячена огляду проблем виведення динамічних каузальних моделей з емпіричних даних, з акцентом на моделі век- торних авторегресійних процесів. Типізовано і охарактеризовано схеми збору, архітектуру і форми репрезентації темпоральних даних та часових рядів даних. Показано, що вимоги до архітектури темпоральних даних диктуються характером динамічного процесу і потребами виведення адекватної моделі. Виділено основні типи динамічних процесів, зокрема, рекурентні проце- си, «запрограмовані» процеси, потоки стохастичних подій, лічильні процеси тощо. Для характеристики довжини темпоральних даних запропоновано кілька часових горизонтів, визначених на основі структури моделі, лагу каузальних зв’язків процесу, до- вжини шляхів впливу, довжини зворотних зв’язків тощо. Частота вимірювання даних критично важлива для адекватності виве- деної моделі і визначається тривалістю елементарних впливів між компонентами векторного процесу і швидкістю дії зворотних зв’язків. Відображено роль припущень у виведенні динамічної моделі з даних, зокрема, припущень стаціонарності та регу- лярності структури. Виділено особливості виведення динамічних каузальних моделей (у порівнянні із статичними моделями), окреслено тактику врахування темпорального порядку змінних. Проаналізовано проблеми, пов’язані з невідомим лагом післядії та існуванням прихованих автокорельованих часових рядів. Представлено концепцію каузальності за Грейнджером і вказано на її недосконалість в реальних умовах неповноти інформації. Проведено порівняльний аналіз критерію каузальності за Грейнджером та правил орієнтації ребер в апараті каузальних мереж з точки зору їх спроможності виявляти каузальні відношення. Ключові слова: каузальні моделі, динамічні процеси, часові ряди даних, умовна незалежність, каузальність за Грейнджером, каузальні зв’язки. We present a brief review of dynamic causal model inference from data. A vector autoregressive models is of our prime interest. The architecture, representation and schemes of measurement of temporal data and time series data are outlined. We argue that require- ment to data characteristics should come from the nature of dynamic process at hand and goals of model inference. To describe and evaluate temporal data one may use terms of longitude, measurement frequency etc. Data measurement frequency is crucial factor in order to an inferred model be adequate. Data longitude and observation session duration may be expressed via several temporal horizons, such as closest horizon, 2-step horizon, influence attainability horizon, oscillatory horizon, and evolutionary horizon. To justify a dynamic causal model inference from data, analyst needs to assume the dynamic process is stationary or at least obeys structural regularity. The main specificity of task of dynamic causal model inference is known temporal order of variables and certain structural regularity. If maximal lag of influence is unknown, inference of dynamic causal model faces additional problems. We examine the Granger’s causality concept and outline its deficiency in real circumstances. It is argued that Granger causality is incorrect as practical tool of causal discovery. In contrast, certain rules of edge orientation (included in known constraint-based algorithms of model inference) can reveal unconfounded causal relationship. Keywords: causal model, dynamic process, time series, conditional independence, Granger causality, causal relationship. 1. Емпіричні каузальні моделі. Динамічні моделі Каузальні моделі створюються з метою адекватно відображати і пояснювати впливи та взаємодії між підпроцесами (або подіями) в середовищі. На відміну від суто описової (феноменологічної) моделі, каузальна модель має бути не тільки узгоджена із зібраними емпіричними даними, але й адекватна в розу- мінні здатності прогнозувати наслідки управління об’єктами (середовищем), тобто спроможна прогнозува- ти ефекти втручань в об’єкт. Традиційно каузальні моделі створювалися зусиллями прикладних експертів та математиків. Водночас каузальний ефект визначали на основі активних рандомізованих експериментів. З настанням епохи Великих Даних аналітики змінили постановки задач, і тепер визначальну роль відіграє аналіз емпіричних даних спостережень (а експертні знання та ненадійні припущення залучаються обереж- но) [1, 2]. Протягом останніх трьох десятиліть увага дослідників зсунулася до моделей типу каузальних мереж. Емпірична каузальна мережа має структурно описувати систему зв’язків та каузальних відношень на такому рівні деталізації й точності, який відповідає точності, повноті та обсягу використаних даних. Каузальні мережі є багатоцільовими предиктивними та генеративними моделями [2–7]. Вони дозволяють оперативно розв’язувати аналітичні задачі у бажаному форматі (обираючи цільову змінну без потреби по- вторно виводити модель). Динамічні каузальні мережі розширюють можливості стандартних каузальних мереж. Доповідь доповнює огляд аналітики Великих Даних (поданий в [2]) в аспекті темпоральних даних та виведення динамічних моделей. Каузальна мережа («статична») задається як пара ( Моделі і засоби систем баз даних та знань © О.С. Балабанов, 2022 ISSN 1727-4907. Проблеми програмування. 2022. №3-4. Спеціальний випуск УДК 004.048:519.7 https://doi.org/10.15407/pp2022.03-04..... ВІД ТЕМПОРАЛЬНИХ ДАНИХ ДО ДИНАМІЧНИХ КАУЗАЛЬНИХ МОДЕЛЕЙ Олександр Балабанов Доповідь присвячена огляду проблем виведення динамічних каузальних моделей з емпіричних даних, з акцентом на моделі векторних авторегресійних процесів. Типізовано і охарактеризовано схеми збору, архітектуру і форми репрезентації темпоральних даних та часових рядів даних. Показано, що вимоги до архітектури темпоральних даних диктуються характером динамічного процесу і потребами виведення адекватної моделі. Виділено основні типи динамічних процесів, зокрема, рекурентні процеси, «запрограмовані» процеси, потоки стохастичних подій, лічильні процеси тощо. Для характеристики довжини темпоральних даних запропоновано кілька часових горизонтів, визначених на основі структури моделі, лагу каузальних зв'язків процесу, довжини шляхів впливу, довжини зворотних зв'язків тощо. Частота вимірювання даних критично важлива для адекватності виведеної моделі і визначається тривалістю елементарних впливів між компонентами векторного процесу і швидкістю дії зворотних зв'язків. Відображено роль припущень у виведенні динамічної моделі з даних, зокрема, припущень стаціонарності та регулярності структури. Виділено особливості виведення динамічних каузальних моделей (у порівнянні із статичними моделями), окреслено тактику врахування темпорального порядку змінних. Проаналізовано проблеми, пов'язані з невідомим лагом післядії та існуванням прихованих автокорельованих часових рядів. Представлено концепцію каузальності за Грейнджером і вказано на її недосконалість в реальних умовах неповноти інформації. Проведено порівняльний аналіз критерію каузальності за Грейнджером та правил орієнтації ребер в апараті каузальних мереж з точки зору їх спроможності виявляти каузальні відношення. Ключові слова: каузальні моделі, динамічні процеси, часові ряди даних, умовна незалежність, каузальність за Грейнджером, каузальні зв'язки. We present a brief review of dynamic causal model inference from data. A vector autoregressive models is of our prime interest. The architecture, representation and schemes of measurement of temporal data and time series data are outlined. We argue that requirement to data characteristics should come from the nature of dynamic process at hand and goals of model inference. To describe and evaluate temporal data one may use terms of longitude, measurement frequency etc. Data measurement frequency is crucial factor in order to an inferred model be adequate. Data longitude and observation session duration may be expressed via several temporal horizons, such as closest horizon, 2-step horizon, influence attainability horizon, oscillatory horizon, and evolutionary horizon. To justify a dynamic causal model inference from data, analyst needs to assume the dynamic process is stationary or at least obeys structural regularity. The main specificity of task of dynamic causal model inference is known temporal order of variables and certain structural regularity. If maximal lag of influence is unknown, inference of dynamic causal model faces additional problems. We examine the Granger’s causality concept and outline its deficiency in real circumstances. It is argued that Granger causality is incorrect as practical tool of causal discovery. In contrast, certain rules of edge orientation (included in known constraint-based algorithms of model inference) can reveal unconfounded causal relationship. Keywords: causal model, dynamic process, time series, conditional independence, Granger causality, causal relationship. 1. Емпіричні каузальні моделі. Динамічні моделі Каузальні моделі створюються з метою адекватно відображати і пояснювати впливи та взаємодії між підпроцесами (або подіями) в середовищі. На відміну від суто описової (феноменологічної) моделі, каузальна модель має бути не тільки узгоджена із зібраними емпіричними даними, але й адекватна в розумінні здатності прогнозувати наслідки управління об'єктами (середовищем), тобто спроможна прогнозувати ефекти втручань в об'єкт. Традиційно каузальні моделі створювалися зусиллями прикладних експертів та математиків. Водночас каузальний ефект визначали на основі активних рандомізованих експериментів. З настанням епохи Великих Даних аналітики змінили постановки задач, і тепер визначальну роль відіграє аналіз емпіричних даних спостережень (а експертні знання та ненадійні припущення залучаються обережно) [1, 2]. Протягом останніх трьох десятиліть увага дослідників зсунулася до моделей типу каузальних мереж. Емпірична каузальна мережа має структурно описувати систему зв'язків та каузальних відношень на такому рівні деталізації й точності, який відповідає точності, повноті та обсягу використаних даних. Каузальні мережі є багатоцільовими предиктивними та генеративними моделями [2–7]. Вони дозволяють оперативно розв'язувати аналітичні задачі у бажаному форматі (обираючи цільову змінну без потреби повторно виводити модель). Динамічні каузальні мережі розширюють можливості стандартних каузальних мереж. Доповідь доповнює огляд аналітики Великих Даних (поданий в [2]) в аспекті темпоральних даних та виведення динамічних моделей. Каузальна мережа («статична») задається як пара ( ,G ), де G – орграф,  – параметри (прив'язані до G ). Вершини графу відповідають змінним, а ребра – безпосереднім статистичним (каузальним) зв'язкам. Зв'язок YX → поєднує причину X та наслідок Y . Параметри  кількісно характеризують зв'язки. Зазвичай орграф G – ациклонний, тобто не містить строго орієнтованих циклів. Тоді набір каузальних зв'язків моделі накладає відповідні обмеження на темпоральний порядок змінних (відносну послідовність змінних у часі). Наприклад, якщо в моделі є орієнтований шлях ZYX →→→ , то Z не може стояти в порядку раніше, ніж X . Можна задати темпоральний порядок змінних як знання (апріорні, предметні). Темпоральний порядок може бути частковим або повним. Якщо на вході не задано темпорального порядку змінних, то модель, виведена з ), де G – орграф, Моделі і засоби систем баз даних та знань © О.С. Балабанов, 2022 ISSN 1727-4907. Проблеми програмування. 2022. №3-4. Спеціальний випуск УДК 004.048:519.7 https://doi.org/10.15407/pp2022.03-04..... ВІД ТЕМПОРАЛЬНИХ ДАНИХ ДО ДИНАМІЧНИХ КАУЗАЛЬНИХ МОДЕЛЕЙ Олександр Балабанов Доповідь присвячена огляду проблем виведення динамічних каузальних моделей з емпіричних даних, з акцентом на моделі векторних авторегресійних процесів. Типізовано і охарактеризовано схеми збору, архітектуру і форми репрезентації темпоральних даних та часових рядів даних. Показано, що вимоги до архітектури темпоральних даних диктуються характером динамічного процесу і потребами виведення адекватної моделі. Виділено основні типи динамічних процесів, зокрема, рекурентні процеси, «запрограмовані» процеси, потоки стохастичних подій, лічильні процеси тощо. Для характеристики довжини темпоральних даних запропоновано кілька часових горизонтів, визначених на основі структури моделі, лагу каузальних зв'язків процесу, довжини шляхів впливу, довжини зворотних зв'язків тощо. Частота вимірювання даних критично важлива для адекватності виведеної моделі і визначається тривалістю елементарних впливів між компонентами векторного процесу і швидкістю дії зворотних зв'язків. Відображено роль припущень у виведенні динамічної моделі з даних, зокрема, припущень стаціонарності та регулярності структури. Виділено особливості виведення динамічних каузальних моделей (у порівнянні із статичними моделями), окреслено тактику врахування темпорального порядку змінних. Проаналізовано проблеми, пов'язані з невідомим лагом післядії та існуванням прихованих автокорельованих часових рядів. Представлено концепцію каузальності за Грейнджером і вказано на її недосконалість в реальних умовах неповноти інформації. Проведено порівняльний аналіз критерію каузальності за Грейнджером та правил орієнтації ребер в апараті каузальних мереж з точки зору їх спроможності виявляти каузальні відношення. Ключові слова: каузальні моделі, динамічні процеси, часові ряди даних, умовна незалежність, каузальність за Грейнджером, каузальні зв'язки. We present a brief review of dynamic causal model inference from data. A vector autoregressive models is of our prime interest. The architecture, representation and schemes of measurement of temporal data and time series data are outlined. We argue that requirement to data characteristics should come from the nature of dynamic process at hand and goals of model inference. To describe and evaluate temporal data one may use terms of longitude, measurement frequency etc. Data measurement frequency is crucial factor in order to an inferred model be adequate. Data longitude and observation session duration may be expressed via several temporal horizons, such as closest horizon, 2-step horizon, influence attainability horizon, oscillatory horizon, and evolutionary horizon. To justify a dynamic causal model inference from data, analyst needs to assume the dynamic process is stationary or at least obeys structural regularity. The main specificity of task of dynamic causal model inference is known temporal order of variables and certain structural regularity. If maximal lag of influence is unknown, inference of dynamic causal model faces additional problems. We examine the Granger’s causality concept and outline its deficiency in real circumstances. It is argued that Granger causality is incorrect as practical tool of causal discovery. In contrast, certain rules of edge orientation (included in known constraint-based algorithms of model inference) can reveal unconfounded causal relationship. Keywords: causal model, dynamic process, time series, conditional independence, Granger causality, causal relationship. 1. Емпіричні каузальні моделі. Динамічні моделі Каузальні моделі створюються з метою адекватно відображати і пояснювати впливи та взаємодії між підпроцесами (або подіями) в середовищі. На відміну від суто описової (феноменологічної) моделі, каузальна модель має бути не тільки узгоджена із зібраними емпіричними даними, але й адекватна в розумінні здатності прогнозувати наслідки управління об'єктами (середовищем), тобто спроможна прогнозувати ефекти втручань в об'єкт. Традиційно каузальні моделі створювалися зусиллями прикладних експертів та математиків. Водночас каузальний ефект визначали на основі активних рандомізованих експериментів. З настанням епохи Великих Даних аналітики змінили постановки задач, і тепер визначальну роль відіграє аналіз емпіричних даних спостережень (а експертні знання та ненадійні припущення залучаються обережно) [1, 2]. Протягом останніх трьох десятиліть увага дослідників зсунулася до моделей типу каузальних мереж. Емпірична каузальна мережа має структурно описувати систему зв'язків та каузальних відношень на такому рівні деталізації й точності, який відповідає точності, повноті та обсягу використаних даних. Каузальні мережі є багатоцільовими предиктивними та генеративними моделями [2–7]. Вони дозволяють оперативно розв'язувати аналітичні задачі у бажаному форматі (обираючи цільову змінну без потреби повторно виводити модель). Динамічні каузальні мережі розширюють можливості стандартних каузальних мереж. Доповідь доповнює огляд аналітики Великих Даних (поданий в [2]) в аспекті темпоральних даних та виведення динамічних моделей. Каузальна мережа («статична») задається як пара ( ,G ), де G – орграф,  – параметри (прив'язані до G ). Вершини графу відповідають змінним, а ребра – безпосереднім статистичним (каузальним) зв'язкам. Зв'язок YX → поєднує причину X та наслідок Y . Параметри  кількісно характеризують зв'язки. Зазвичай орграф G – ациклонний, тобто не містить строго орієнтованих циклів. Тоді набір каузальних зв'язків моделі накладає відповідні обмеження на темпоральний порядок змінних (відносну послідовність змінних у часі). Наприклад, якщо в моделі є орієнтований шлях ZYX →→→ , то Z не може стояти в порядку раніше, ніж X . Можна задати темпоральний порядок змінних як знання (апріорні, предметні). Темпоральний порядок може бути частковим або повним. Якщо на вході не задано темпорального порядку змінних, то модель, виведена з – параметри (прив’язані до G). Вершини графу відповідають змінним, а ребра – безпосереднім статистичним (каузальним) зв’язкам. Зв’язок Моделі і засоби систем баз даних та знань © О.С. Балабанов, 2022 ISSN 1727-4907. Проблеми програмування. 2022. №3-4. Спеціальний випуск УДК 004.048:519.7 https://doi.org/10.15407/pp2022.03-04..... ВІД ТЕМПОРАЛЬНИХ ДАНИХ ДО ДИНАМІЧНИХ КАУЗАЛЬНИХ МОДЕЛЕЙ Олександр Балабанов Доповідь присвячена огляду проблем виведення динамічних каузальних моделей з емпіричних даних, з акцентом на моделі векторних авторегресійних процесів. Типізовано і охарактеризовано схеми збору, архітектуру і форми репрезентації темпоральних даних та часових рядів даних. Показано, що вимоги до архітектури темпоральних даних диктуються характером динамічного процесу і потребами виведення адекватної моделі. Виділено основні типи динамічних процесів, зокрема, рекурентні процеси, «запрограмовані» процеси, потоки стохастичних подій, лічильні процеси тощо. Для характеристики довжини темпоральних даних запропоновано кілька часових горизонтів, визначених на основі структури моделі, лагу каузальних зв'язків процесу, довжини шляхів впливу, довжини зворотних зв'язків тощо. Частота вимірювання даних критично важлива для адекватності виведеної моделі і визначається тривалістю елементарних впливів між компонентами векторного процесу і швидкістю дії зворотних зв'язків. Відображено роль припущень у виведенні динамічної моделі з даних, зокрема, припущень стаціонарності та регулярності структури. Виділено особливості виведення динамічних каузальних моделей (у порівнянні із статичними моделями), окреслено тактику врахування темпорального порядку змінних. Проаналізовано проблеми, пов'язані з невідомим лагом післядії та існуванням прихованих автокорельованих часових рядів. Представлено концепцію каузальності за Грейнджером і вказано на її недосконалість в реальних умовах неповноти інформації. Проведено порівняльний аналіз критерію каузальності за Грейнджером та правил орієнтації ребер в апараті каузальних мереж з точки зору їх спроможності виявляти каузальні відношення. Ключові слова: каузальні моделі, динамічні процеси, часові ряди даних, умовна незалежність, каузальність за Грейнджером, каузальні зв'язки. We present a brief review of dynamic causal model inference from data. A vector autoregressive models is of our prime interest. The architecture, representation and schemes of measurement of temporal data and time series data are outlined. We argue that requirement to data characteristics should come from the nature of dynamic process at hand and goals of model inference. To describe and evaluate temporal data one may use terms of longitude, measurement frequency etc. Data measurement frequency is crucial factor in order to an inferred model be adequate. Data longitude and observation session duration may be expressed via several temporal horizons, such as closest horizon, 2-step horizon, influence attainability horizon, oscillatory horizon, and evolutionary horizon. To justify a dynamic causal model inference from data, analyst needs to assume the dynamic process is stationary or at least obeys structural regularity. The main specificity of task of dynamic causal model inference is known temporal order of variables and certain structural regularity. If maximal lag of influence is unknown, inference of dynamic causal model faces additional problems. We examine the Granger’s causality concept and outline its deficiency in real circumstances. It is argued that Granger causality is incorrect as practical tool of causal discovery. In contrast, certain rules of edge orientation (included in known constraint-based algorithms of model inference) can reveal unconfounded causal relationship. Keywords: causal model, dynamic process, time series, conditional independence, Granger causality, causal relationship. 1. Емпіричні каузальні моделі. Динамічні моделі Каузальні моделі створюються з метою адекватно відображати і пояснювати впливи та взаємодії між підпроцесами (або подіями) в середовищі. На відміну від суто описової (феноменологічної) моделі, каузальна модель має бути не тільки узгоджена із зібраними емпіричними даними, але й адекватна в розумінні здатності прогнозувати наслідки управління об'єктами (середовищем), тобто спроможна прогнозувати ефекти втручань в об'єкт. Традиційно каузальні моделі створювалися зусиллями прикладних експертів та математиків. Водночас каузальний ефект визначали на основі активних рандомізованих експериментів. З настанням епохи Великих Даних аналітики змінили постановки задач, і тепер визначальну роль відіграє аналіз емпіричних даних спостережень (а експертні знання та ненадійні припущення залучаються обережно) [1, 2]. Протягом останніх трьох десятиліть увага дослідників зсунулася до моделей типу каузальних мереж. Емпірична каузальна мережа має структурно описувати систему зв'язків та каузальних відношень на такому рівні деталізації й точності, який відповідає точності, повноті та обсягу використаних даних. Каузальні мережі є багатоцільовими предиктивними та генеративними моделями [2–7]. Вони дозволяють оперативно розв'язувати аналітичні задачі у бажаному форматі (обираючи цільову змінну без потреби повторно виводити модель). Динамічні каузальні мережі розширюють можливості стандартних каузальних мереж. Доповідь доповнює огляд аналітики Великих Даних (поданий в [2]) в аспекті темпоральних даних та виведення динамічних моделей. Каузальна мережа («статична») задається як пара ( ,G ), де G – орграф,  – параметри (прив'язані до G ). Вершини графу відповідають змінним, а ребра – безпосереднім статистичним (каузальним) зв'язкам. Зв'язок YX → поєднує причину X та наслідок Y . Параметри  кількісно характеризують зв'язки. Зазвичай орграф G – ациклонний, тобто не містить строго орієнтованих циклів. Тоді набір каузальних зв'язків моделі накладає відповідні обмеження на темпоральний порядок змінних (відносну послідовність змінних у часі). Наприклад, якщо в моделі є орієнтований шлях ZYX →→→ , то Z не може стояти в порядку раніше, ніж X . Можна задати темпоральний порядок змінних як знання (апріорні, предметні). Темпоральний порядок може бути частковим або повним. Якщо на вході не задано темпорального порядку змінних, то модель, виведена з поєднує причину X та наслідок Y. Параметри Моделі і засоби систем баз даних та знань © О.С. Балабанов, 2022 ISSN 1727-4907. Проблеми програмування. 2022. №3-4. Спеціальний випуск УДК 004.048:519.7 https://doi.org/10.15407/pp2022.03-04..... ВІД ТЕМПОРАЛЬНИХ ДАНИХ ДО ДИНАМІЧНИХ КАУЗАЛЬНИХ МОДЕЛЕЙ Олександр Балабанов Доповідь присвячена огляду проблем виведення динамічних каузальних моделей з емпіричних даних, з акцентом на моделі векторних авторегресійних процесів. Типізовано і охарактеризовано схеми збору, архітектуру і форми репрезентації темпоральних даних та часових рядів даних. Показано, що вимоги до архітектури темпоральних даних диктуються характером динамічного процесу і потребами виведення адекватної моделі. Виділено основні типи динамічних процесів, зокрема, рекурентні процеси, «запрограмовані» процеси, потоки стохастичних подій, лічильні процеси тощо. Для характеристики довжини темпоральних даних запропоновано кілька часових горизонтів, визначених на основі структури моделі, лагу каузальних зв'язків процесу, довжини шляхів впливу, довжини зворотних зв'язків тощо. Частота вимірювання даних критично важлива для адекватності виведеної моделі і визначається тривалістю елементарних впливів між компонентами векторного процесу і швидкістю дії зворотних зв'язків. Відображено роль припущень у виведенні динамічної моделі з даних, зокрема, припущень стаціонарності та регулярності структури. Виділено особливості виведення динамічних каузальних моделей (у порівнянні із статичними моделями), окреслено тактику врахування темпорального порядку змінних. Проаналізовано проблеми, пов'язані з невідомим лагом післядії та існуванням прихованих автокорельованих часових рядів. Представлено концепцію каузальності за Грейнджером і вказано на її недосконалість в реальних умовах неповноти інформації. Проведено порівняльний аналіз критерію каузальності за Грейнджером та правил орієнтації ребер в апараті каузальних мереж з точки зору їх спроможності виявляти каузальні відношення. Ключові слова: каузальні моделі, динамічні процеси, часові ряди даних, умовна незалежність, каузальність за Грейнджером, каузальні зв'язки. We present a brief review of dynamic causal model inference from data. A vector autoregressive models is of our prime interest. The architecture, representation and schemes of measurement of temporal data and time series data are outlined. We argue that requirement to data characteristics should come from the nature of dynamic process at hand and goals of model inference. To describe and evaluate temporal data one may use terms of longitude, measurement frequency etc. Data measurement frequency is crucial factor in order to an inferred model be adequate. Data longitude and observation session duration may be expressed via several temporal horizons, such as closest horizon, 2-step horizon, influence attainability horizon, oscillatory horizon, and evolutionary horizon. To justify a dynamic causal model inference from data, analyst needs to assume the dynamic process is stationary or at least obeys structural regularity. The main specificity of task of dynamic causal model inference is known temporal order of variables and certain structural regularity. If maximal lag of influence is unknown, inference of dynamic causal model faces additional problems. We examine the Granger’s causality concept and outline its deficiency in real circumstances. It is argued that Granger causality is incorrect as practical tool of causal discovery. In contrast, certain rules of edge orientation (included in known constraint-based algorithms of model inference) can reveal unconfounded causal relationship. Keywords: causal model, dynamic process, time series, conditional independence, Granger causality, causal relationship. 1. Емпіричні каузальні моделі. Динамічні моделі Каузальні моделі створюються з метою адекватно відображати і пояснювати впливи та взаємодії між підпроцесами (або подіями) в середовищі. На відміну від суто описової (феноменологічної) моделі, каузальна модель має бути не тільки узгоджена із зібраними емпіричними даними, але й адекватна в розумінні здатності прогнозувати наслідки управління об'єктами (середовищем), тобто спроможна прогнозувати ефекти втручань в об'єкт. Традиційно каузальні моделі створювалися зусиллями прикладних експертів та математиків. Водночас каузальний ефект визначали на основі активних рандомізованих експериментів. З настанням епохи Великих Даних аналітики змінили постановки задач, і тепер визначальну роль відіграє аналіз емпіричних даних спостережень (а експертні знання та ненадійні припущення залучаються обережно) [1, 2]. Протягом останніх трьох десятиліть увага дослідників зсунулася до моделей типу каузальних мереж. Емпірична каузальна мережа має структурно описувати систему зв'язків та каузальних відношень на такому рівні деталізації й точності, який відповідає точності, повноті та обсягу використаних даних. Каузальні мережі є багатоцільовими предиктивними та генеративними моделями [2–7]. Вони дозволяють оперативно розв'язувати аналітичні задачі у бажаному форматі (обираючи цільову змінну без потреби повторно виводити модель). Динамічні каузальні мережі розширюють можливості стандартних каузальних мереж. Доповідь доповнює огляд аналітики Великих Даних (поданий в [2]) в аспекті темпоральних даних та виведення динамічних моделей. Каузальна мережа («статична») задається як пара ( ,G ), де G – орграф,  – параметри (прив'язані до G ). Вершини графу відповідають змінним, а ребра – безпосереднім статистичним (каузальним) зв'язкам. Зв'язок YX → поєднує причину X та наслідок Y . Параметри  кількісно характеризують зв'язки. Зазвичай орграф G – ациклонний, тобто не містить строго орієнтованих циклів. Тоді набір каузальних зв'язків моделі накладає відповідні обмеження на темпоральний порядок змінних (відносну послідовність змінних у часі). Наприклад, якщо в моделі є орієнтований шлях ZYX →→→ , то Z не може стояти в порядку раніше, ніж X . Можна задати темпоральний порядок змінних як знання (апріорні, предметні). Темпоральний порядок може бути частковим або повним. Якщо на вході не задано темпорального порядку змінних, то модель, виведена з кількісно характеризують зв’язки. Зазви- чай орграф G – ациклонний, тобто не містить строго орієнтованих циклів. Тоді набір каузальних зв’язків моделі накладає відповідні обмеження на темпоральний порядок змінних (відносну послідовність змінних у часі). Наприклад, якщо в моделі є орієнтований шлях Моделі і засоби систем баз даних та знань © О.С. Балабанов, 2022 ISSN 1727-4907. Проблеми програмування. 2022. №3-4. Спеціальний випуск УДК 004.048:519.7 https://doi.org/10.15407/pp2022.03-04..... ВІД ТЕМПОРАЛЬНИХ ДАНИХ ДО ДИНАМІЧНИХ КАУЗАЛЬНИХ МОДЕЛЕЙ Олександр Балабанов Доповідь присвячена огляду проблем виведення динамічних каузальних моделей з емпіричних даних, з акцентом на моделі векторних авторегресійних процесів. Типізовано і охарактеризовано схеми збору, архітектуру і форми репрезентації темпоральних даних та часових рядів даних. Показано, що вимоги до архітектури темпоральних даних диктуються характером динамічного процесу і потребами виведення адекватної моделі. Виділено основні типи динамічних процесів, зокрема, рекурентні процеси, «запрограмовані» процеси, потоки стохастичних подій, лічильні процеси тощо. Для характеристики довжини темпоральних даних запропоновано кілька часових горизонтів, визначених на основі структури моделі, лагу каузальних зв'язків процесу, довжини шляхів впливу, довжини зворотних зв'язків тощо. Частота вимірювання даних критично важлива для адекватності виведеної моделі і визначається тривалістю елементарних впливів між компонентами векторного процесу і швидкістю дії зворотних зв'язків. Відображено роль припущень у виведенні динамічної моделі з даних, зокрема, припущень стаціонарності та регулярності структури. Виділено особливості виведення динамічних каузальних моделей (у порівнянні із статичними моделями), окреслено тактику врахування темпорального порядку змінних. Проаналізовано проблеми, пов'язані з невідомим лагом післядії та існуванням прихованих автокорельованих часових рядів. Представлено концепцію каузальності за Грейнджером і вказано на її недосконалість в реальних умовах неповноти інформації. Проведено порівняльний аналіз критерію каузальності за Грейнджером та правил орієнтації ребер в апараті каузальних мереж з точки зору їх спроможності виявляти каузальні відношення. Ключові слова: каузальні моделі, динамічні процеси, часові ряди даних, умовна незалежність, каузальність за Грейнджером, каузальні зв'язки. We present a brief review of dynamic causal model inference from data. A vector autoregressive models is of our prime interest. The architecture, representation and schemes of measurement of temporal data and time series data are outlined. We argue that requirement to data characteristics should come from the nature of dynamic process at hand and goals of model inference. To describe and evaluate temporal data one may use terms of longitude, measurement frequency etc. Data measurement frequency is crucial factor in order to an inferred model be adequate. Data longitude and observation session duration may be expressed via several temporal horizons, such as closest horizon, 2-step horizon, influence attainability horizon, oscillatory horizon, and evolutionary horizon. To justify a dynamic causal model inference from data, analyst needs to assume the dynamic process is stationary or at least obeys structural regularity. The main specificity of task of dynamic causal model inference is known temporal order of variables and certain structural regularity. If maximal lag of influence is unknown, inference of dynamic causal model faces additional problems. We examine the Granger’s causality concept and outline its deficiency in real circumstances. It is argued that Granger causality is incorrect as practical tool of causal discovery. In contrast, certain rules of edge orientation (included in known constraint-based algorithms of model inference) can reveal unconfounded causal relationship. Keywords: causal model, dynamic process, time series, conditional independence, Granger causality, causal relationship. 1. Емпіричні каузальні моделі. Динамічні моделі Каузальні моделі створюються з метою адекватно відображати і пояснювати впливи та взаємодії між підпроцесами (або подіями) в середовищі. На відміну від суто описової (феноменологічної) моделі, каузальна модель має бути не тільки узгоджена із зібраними емпіричними даними, але й адекватна в розумінні здатності прогнозувати наслідки управління об'єктами (середовищем), тобто спроможна прогнозувати ефекти втручань в об'єкт. Традиційно каузальні моделі створювалися зусиллями прикладних експертів та математиків. Водночас каузальний ефект визначали на основі активних рандомізованих експериментів. З настанням епохи Великих Даних аналітики змінили постановки задач, і тепер визначальну роль відіграє аналіз емпіричних даних спостережень (а експертні знання та ненадійні припущення залучаються обережно) [1, 2]. Протягом останніх трьох десятиліть увага дослідників зсунулася до моделей типу каузальних мереж. Емпірична каузальна мережа має структурно описувати систему зв'язків та каузальних відношень на такому рівні деталізації й точності, який відповідає точності, повноті та обсягу використаних даних. Каузальні мережі є багатоцільовими предиктивними та генеративними моделями [2–7]. Вони дозволяють оперативно розв'язувати аналітичні задачі у бажаному форматі (обираючи цільову змінну без потреби повторно виводити модель). Динамічні каузальні мережі розширюють можливості стандартних каузальних мереж. Доповідь доповнює огляд аналітики Великих Даних (поданий в [2]) в аспекті темпоральних даних та виведення динамічних моделей. Каузальна мережа («статична») задається як пара ( ,G ), де G – орграф,  – параметри (прив'язані до G ). Вершини графу відповідають змінним, а ребра – безпосереднім статистичним (каузальним) зв'язкам. Зв'язок YX → поєднує причину X та наслідок Y . Параметри  кількісно характеризують зв'язки. Зазвичай орграф G – ациклонний, тобто не містить строго орієнтованих циклів. Тоді набір каузальних зв'язків моделі накладає відповідні обмеження на темпоральний порядок змінних (відносну послідовність змінних у часі). Наприклад, якщо в моделі є орієнтований шлях ZYX →→→ , то Z не може стояти в порядку раніше, ніж X . Можна задати темпоральний порядок змінних як знання (апріорні, предметні). Темпоральний порядок може бути частковим або повним. Якщо на вході не задано темпорального порядку змінних, то модель, виведена з не може стояти в порядку ра- ніше, ніж X. Можна задати темпоральний порядок змінних як знання (апріорні, предметні). Темпоральний порядок може бути частковим або повним. Якщо на вході не задано темпорального порядку змінних, то © О.С. Балабанов, 2022 ISSN 1727-4907. Проблеми програмування. 2022. № 3-4. Спеціальний випуск 184 Моделі і засоби систем баз даних та знань модель, виведена з даних, складається переважно з неорієнтованих та неповністю орієнтованих ребер. Тоді темпоральний порядок змінних залишається майже невизначеним. Каузальна мережа з темпоральним порядком змінних ще не є динамічною каузальною моделлю. Динамічні каузальні мережі характеризуються поглибленою часовою прив’язкою змінних моделі. За стан- дартної репрезентації каузальна мережа («статична») утворюється з різних змінних, пов’язаних статис- тичними залежностями. Зазвичай кожна змінна відображає окремий показник (підпроцес, компоненту), виміряний в «характерний момент» розвитку процесу, причому інтервали часу між виміряними змінними можуть залишатися не визначеними. Перший крок до динамічного відображення – це приписування трива- лості інтервалам часу між змінними (подіями). Щоб модель набула повноцінного динамічного характеру, замість кожної окремої («великої», «титульної») змінної в моделі представляють серію «моментальних» змінних з мітками часу, і кожна серія репрезентує послідовні стани (фази) відповідного підпроцесу (ком- поненти). Тобто змінна «розщеплюється» на фази (розгортається). Дані, з яких виводиться стандартна («статична») каузальна мережа, складаються з незалежних ви- падків (прецедентів). Для того, щоб стандартна модель могла описати процес переходу між фазами одного і того самого підпроцесу (між однойменними змінними в різні моменти), значення цих змінних мають міс- титися в межах кожного запису даних (в одному й тому випадку). Залежності між записами даних навіть не розглядаються в ході виведення «статичних» каузальних мереж. Натомість дані, призначені для виведення моделі динамічного процесу, організовані так, що послідовні записи описують той самий процес на послі- довних фазах розвитку. Тоді розбиття даних на записи стає несуттєвим, технічним питанням програміста. В ході виведення моделі аналізуються залежності між змінними з кількох записів даних одночасно. Завдя- ки часовому виміру динамічні моделі отримують можливість оперувати таким поняттями, як лаг післядії, швидкість зміни, періодичність, спектр, форма сигналу і т.д. З’являються підстави розділяти «корисний сигнал» та «гамір» у єдиному потоці даних. Саме динамічні каузальні мережі здатні коректно описати функціонування системи із зворотними зв’язками. У науковій літературі сформовано кілька математичних репрезентацій для опису поведінки динамічних об’єктів. Найбільш відомі репрезентації: марковський лан- цюг; дискретний процес у неперервному часі; неперервний процес у неперервному часі; дифузний процес; стохастичний точковий процес; системи диференційних рівнянь (звичайних та стохастичних) тощо [8–12]. 2. Динамічні процеси та архітектура темпоральних даних Дані для виведення «статичної» каузальної мережі вимірюються таким чином, щоб зафіксувати потріб- ні характеристики в «характерні моменти» процесу. Такі «характерні моменти» обирає фахівець (або на етапі збору даних, або на етапі попередньої обробки). Зазвичай обрати такі моменти легко, наприклад, коли потрібні характеристики змінюються дуже повільно або швидко досягають стабільного стану (після завершення пере- хідного процесу). Образно кажучи, дані збираються «ощадливо» через підхожий «трафарет». Натомість коли йдеться про виведення моделей динамічних процесів, доводиться збирати дані більш інтенсивно, регулярно й систематично. Потрібно враховувати характер поведінки процесів, для яких хочемо вивести модель. Для того, щоб надати уявлення про різноманіття динамічних процесів, доцільно виділити кіль- ка архетипів об’єктів моделювання, які потребують принципово різних підходів до аналізу. Можна класифікувати темпоральні дані згідно природи генераторів даних. В [2] виокремлено наступні класи генераторів: природні процеси; ергатичні системи (або цілеспрямовані об’єкти); бібліотеки «паттер- нів», послідовностей, сигналів. В контексті даної доповіді доцільно виділити декілька кластерів дина- мічних процесів з точки зору парадигми їх розвитку (генерації). Тоді, по-перше, виділяємо «затемне- ні», чи «запрограмовані», процеси, програма яких невідома. «Затемнені» процеси повністю керуються невідомими й незрозумілими зовнішніми (латентними) драйверами. Більш того, дані часто являють собою суміш «затемнених» процесів (які «запрограмовані» по різному). Легко зрозуміти, що спостере- ження за такими процесами дають недостатньо інформації для виділення закономірностей, пояснення механізму їх розвитку чи вироблення прогнозів. По-друге, можна уявити деякі повністю автономні процеси, ізольовані від зовнішнього світу. Динаміка кожного такого процесу є результатом самороз- витку. Поведінка різних ізольованих процесів може варіювати від дуже простої й прогнозованої до ха- отичної. Можливості вивести адекватну модель подібного процесу – доволі обмежені, але кращі, ніж для «затемнених» процесів. В центрі уваги доповіді знаходяться «типові» процеси, які розвиваються згідно стабільної структури зв’язків між компонентами процесу та згідно «інерційних» залежностей. Припускаємо, що типові процеси спостерігаються достатньо систематично (хоча й не повністю), і зазнають впливу зовнішніх факторів (більшість з яких спостерігається). Отже, «типові» процеси роз- виваються закономірно, так що можливо емпірично вивести доволі адекватну модель генерації даних. Виведення моделей вказаних процесів спирається на аналіз післядії минулих станів і ефектів впливу спостережуваних зовнішніх змінних (факторів). Для детального аналізу оберемо звужений клас про- цесів, а саме – рекурентні процеси з дійсними змінними. Для таких процесів переважно використо- вуються моделі авторегресійного типу. Для опису і аналізу таких процесів релевантним апаратом є марковські властивості та умовні незалежності. До цих питань повернемося у наступному розділі. Початкове уявлення про архітектуру темпоральних даних дає схематизація, відображена на рис. 1. Дотримуємося загальноприйнятого принципу: одна модель – один об’єкт (середовище). Виділяємо два роди об’єктів моделювання: 1) один екземпляр (складної) системи; 2) популяція багатьох екземплярів, 185 Моделі і засоби систем баз даних та знань які різняться несуттєво і тому описуються спільною моделлю. Множина екземплярів популяції породжує множину спостережень (записів) даних для аналізу. Повторюваність спостережень необхідна не тільки для статистичних методів аналізу й виведення моделі, але також і для евристичних методів, що відносяться до самонавчання алгоритмів [2]. Повторення спостережень може розгортатися у часі або у «просторі». Повторюваність спостережень у просторі – це багато екземплярів популяції. (Зазвичай прийнято, що ек- земпляри популяції є автономними і в певному сенсі взаємонезалежними. В разі, якщо доступний тільки один екземпляр об’єкту, потрібний обсяг даних створюється багатократними повтореннями спостережень за цим екземпляром (у часі). Як сурогатний спосіб повторень у просторі можна застосувати повторення у часі у спеціальному режимі, з багатократним перезапуском функціонування об’єкту від стартових умов. Згідно схеми повторюваності спостережень отримуємо початкову класифікацію архітектури даних, як по- казано на рис. 1. З чотирьох схем (типів архітектури), відображених на рис. 1, практично типовими є дві: а) багато (коротких) рядів даних; б) один довгий (тривалий) ряд даних. Вважається, що в обох цих схемах дані генеруються єдиною моделлю. Втім, у ситуації «б» можливий випадок, коли схема генерації даних повільно змінюється. З іншого боку, в деяких випадках ситуації «а» дані навряд чи доцільно називати темпоральними. Зазначимо, що на рис. 1 наочні зображення наводять на думку про регулярний формат даних. Насправді дані можуть збиратися в нерегулярних форматах. Наприклад, дані можуть бути виміряні «спорадично», згідно «трафарету», за схемою «вікно з маскою». Тоді кожна змінна вимірюється у свій від- повідний момент (зазвичай зсунутий відносно вимірювання інших змінних). Моделі і засоби систем баз даних та знань [Введите текст] Початкове уявлення про архітектуру темпоральних даних дає схематизація, відображена на рис. 1. Дотримуємося загальноприйнятого принципу: одна модель – один об'єкт (середовище). Виділяємо два роди об'єктів моделювання: 1) один екземпляр (складної) системи; 2) популяція багатьох екземплярів, які різняться несуттєво і тому описуються спільною моделлю. Множина екземплярів популяції породжує множину спостережень (записів) даних для аналізу. Повторюваність спостережень необхідна не тільки для статистичних методів аналізу й виведення моделі, але також і для евристичних методів, що відносяться до самонавчання алгоритмів [2]. Повторення спостережень може розгортатися у часі або у «просторі». Повторюваність спостережень у просторі – це багато екземплярів популяції. (Зазвичай прийнято, що екземпляри популяції є автономними і в певному сенсі взаємонезалежними. В разі, якщо доступний тільки один екземпляр об'єкту, потрібний обсяг даних створюється багатократними повтореннями спостережень за цим екземпляром (у часі). Як сурогатний спосіб повторень у просторі можна застосувати повторення у часі у спеціальному режимі, з багатократним перезапуском функціонування об'єкту від стартових умов. Згідно схеми повторюваності спостережень отримуємо початкову класифікацію архітектури даних, як показано на рис. 1. З чотирьох схем (типів архітектури), відображених на рис. 1, практично типовими є дві: а) багато (коротких) рядів даних; б) один довгий (тривалий) ряд даних. Вважається, що в обох цих схемах дані генеруються єдиною моделлю. Втім, у ситуації «б» можливий випадок, коли схема генерації даних повільно змінюється. З іншого боку, в деяких випадках ситуації «а» дані навряд чи доцільно називати темпоральними. Зазначимо, що на рис. 1 наочні зображення наводять на думку про регулярний формат даних. Насправді дані можуть збиратися в нерегулярних форматах. Наприклад, дані можуть бути виміряні «спорадично», згідно «трафарету», за схемою «вікно з маскою». Тоді кожна змінна вимірюється у свій відповідний момент (зазвичай зсунутий відносно вимірювання інших змінних). Якщо для повторюваності спостережень обрано багатократне виконання циклу функціонування одного об'єкту, причому це досягається перезапуском з початкових умов, то виведена модель буде адекватною саме для цього режиму (повторення циклу функціонування об'єкту з перезапуском). Відзначимо також, що не завжди можна й чітко розмежувати схеми «один екземпляр – багато екземплярів». Об'єкт моделювання може радикально еволюціонувати в часі, так що важко говорити, що на початку та в кінці еволюції маємо той самий «екземпляр». Наприклад, уявімо, що поставлена задача вивести модель поведінки комахи, життєвий цикл якої включає гіперметаморфоз. Навряд чи розумно виводити одну модель для фази личинки та для фази імаго. Втім, на практиці зазвичай мають справу з менш радикальними змінами характеру поведінки процесу. Зокрема, моделюються зміни поведінки, які називають переключенням режиму функціонування (коли додаються або зникають окремі зв'язки в моделі та змінюються параметри) [13]. Тепер можна уточнити поняття довжини часового ряду даних (тривалості спостереження за динамічним процесом). Зрозуміло, що немає абсолютної одиниці (мірки) часу для визначення довжини ряду. Все залежить від динаміки та швидкості процесів. Наприклад, в деяких медичних та соціальних задачах кожний запис даних може охоплювати ціле життя людини. При цьому дані можуть формально вважатися «короткими», і доречно Охоплено один “цикл” функціонування (без повторюваності у часі) Відображено повторюваність у часі (довгий ряд даних) Один “екземпляр” Багато “екземплярів” популяції Рис. 1. Архітектура темпоральних даних (повторюваність у часі та у просторі) Катастрофічно мало даних Зокрема, дані для “статичної” моделі з темпоральним порядком. Файли “event log”; траси транзакцій. Ряснота даних. Багаті можливості Типовий ряд даних Час Рис. 1. Архітектура темпоральних даних (повторюваність у часі та у просторі) Якщо для повторюваності спостережень обрано багатократне виконання циклу функціонування одного об’єкту, причому це досягається перезапуском з початкових умов, то виведена модель буде адекватною саме для цього режиму (повторення циклу функціонування об’єкту з перезапуском). Відзначимо також, що не за- вжди можна й чітко розмежувати схеми «один екземпляр – багато екземплярів». Об’єкт моделювання може радикально еволюціонувати в часі, так що важко говорити, що на початку та в кінці еволюції маємо той самий «екземпляр». Наприклад, уявімо, що поставлена задача вивести модель поведінки комахи, життєвий цикл якої включає гіперметаморфоз. Навряд чи розумно виводити одну модель для фази личинки та для фази імаго. Втім, на практиці зазвичай мають справу з менш радикальними змінами характеру поведінки процесу. Зокрема, моделюються зміни поведінки, які називають переключенням режиму функціонування (коли додаються або зникають окремі зв’язки в моделі та змінюються параметри) [13]. Тепер можна уточнити поняття довжини часового ряду даних (тривалості спостереження за ди- намічним процесом). Зрозуміло, що немає абсолютної одиниці (мірки) часу для визначення довжини ряду. Все залежить від динаміки та швидкості процесів. Наприклад, в деяких медичних та соціальних задачах кожний запис даних може охоплювати ціле життя людини. При цьому дані можуть формально вважатися «короткими», і доречно виводити «статичну» каузальну модель. (Така ситуація відповідає лівому долішньому квадранту на рис. 1). Можна виділити декілька горизонтів (масштабів) довжини рядів даних. «Найближчий» (мінімально-необхідний) горизонт – коли «сеанс» спостереження проце- су охоплює всі безпосередні (елементарні) зв’язки між змінними (в тому числі – з найдовшим лагом). 186 Моделі і засоби систем баз даних та знань Протягом «найближчого» горизонту каузальні «сигнали» встигають добігти від причини до безпосеред- ніх наслідків. Другий («2-кроковий») горизонт довжини потребує, щоб протягом сеансу спостережен- ня встигали подіяти (розповсюдитися) кожні два послідовні безпосередніх впливи. (Це важливо для ідентифікації каузального характеру зв’язків.) Третій горизонт довжини даних – «горизонт досяжності впливу», – потребує, щоб протягом сеансу спостереження встигали подіяти (розповсюдитися) всі опо- середковані впливи між компонентами ряду. Циклічний або «осциляторний» горизонт довжини перед- бачає, що охоплено такий період часу, протягом якого встигають спрацювати зворотні зв’язки. Тобто якщо в об’єкті «сигнал» від змінної X поширюється через інші змінні (Z,W..,) і потім повертається назад до змінної X, то тривалість обігу сигналу по цьому колу має цілком вкладатися в сеанс спостереження процесу. Найближчий та 2-кроковий горизонти довжини даних актуальні, коли маємо дані за схемою «а», тобто багато коротких рядів даних (на рис. 1 – внизу зліва). Ще один («еволюційний») горизонт довжини ряду даних претендує не те, щоб сеанс спосте- реження процесу охоплював період часу, протягом якого встигає відбутися зміна характеру поведінки процесу (еволюція), яку ми хочемо відобразити в моделі. Для виведення моделі з адекватним відобра- женням процесу розвитку (еволюції) потрібні дані, віднесені до четвертого квадранту на рис. 1 (багато екземплярів з довгими рядами даних для кожного екземпляру). В принципі, можна вивести модель роз- витку з одного ряду даних, але тоді вимоги до довжини ряду багатократно посилюються. Повнота даних в часовому вимірі також потребує достатньої частоти (темпу) збору даних. Тільки пара «довжина + частота» даних спільно можуть забезпечити достатню інформацію про поведінку динамічного процесу у часі. Виконання вимог до цієї пари характеристик робить можливим виведення адекватної моделі про- цесу. Питання частоти збору даних роз’яснюється після конкретизації «фізики» процесів у часі та типів змінних (показників). Виділимо два принципових типи процесів: рекурентний процес та процес у неперервному часі. Відповідно отримуємо два типи даних: 1) дані рекурентних процесів; 2) дані процесів у неперервному часі (рис. 2). Ситуацію рекурентного процесу («1») маємо, коли розглядається послідовність «активних фаз (станів)» процесу в певні моменти часу (короткі інтервали), а в проміжках часу між моментами «ак- тивного стану» процес або не визначений, або недоступний в принципі. (Наприклад, марковський ланцюг визначений тільки на ліченій множині моментів, а «пасивних станів» просто немає.) Можлива ситуація, що характеристики процесу в «пасивному стані» також доступні вимірюванню; в такому разі розгляд даних як для рекурентної моделі можна пояснити тим, що вимірювання «пасивних станів» не дадуть додатко- вої інформації для створення моделі. Рекурентний процес розвивається чітко визначеними (регулярними) дискретними кроками. Образно кажучи, такий динамічний процес стрибає у часі. Ясно, що дані рекурент- ного процесу мають збиратися в моменти «активного стану». Отже, темп (частота) збору даних має бути прив’язаний до ритму рекурентного процесу. Якщо частота збору даних є меншою, ніж частота активних станів, то такі дані будуть незадовільними (у літературі це називають терміном undersampled data). Моделі і засоби систем баз даних та знань виводити «статичну» каузальну модель. (Така ситуація відповідає лівому долішньому квадранту на рис. 1). Можна виділити декілька горизонтів (масштабів) довжини рядів даних. «Найближчий» (мінімально- необхідний) горизонт – коли «сеанс» спостереження процесу охоплює всі безпосередні (елементарні) зв'язки між змінними (в тому числі – з найдовшим лагом). Протягом «найближчого» горизонту каузальні «сигнали» встигають добігти від причини до безпосередніх наслідків. Другий («2-кроковий») горизонт довжини потребує, щоб протягом сеансу спостереження встигали подіяти (розповсюдитися) кожні два послідовні безпосередніх впливи. (Це важливо для ідентифікації каузального характеру зв'язків.) Третій горизонт довжини даних – «горизонт досяжності впливу», – потребує, щоб протягом сеансу спостереження встигали подіяти (розповсюдитися) всі опосередковані впливи між компонентами ряду. Циклічний або «осциляторний» горизонт довжини передбачає, що охоплено такий період часу, протягом якого встигають спрацювати зворотні зв'язки. Тобто якщо в об'єкті «сигнал» від змінної X поширюється через інші змінні ( ..,WZ ,) і потім повертається назад до змінної X , то тривалість обігу сигналу по цьому колу має цілком вкладатися в сеанс спостереження процесу. Найближчий та 2-кроковий горизонти довжини даних актуальні, коли маємо дані за схемою «а», тобто багато коротких рядів даних (на рис. 1 – внизу зліва). Ще один («еволюційний») горизонт довжини ряду даних претендує не те, щоб сеанс спостереження процесу охоплював період часу, протягом якого встигає відбутися зміна характеру поведінки процесу (еволюція), яку ми хочемо відобразити в моделі. Для виведення моделі з адекватним відображенням процесу розвитку (еволюції) потрібні дані, віднесені до четвертого квадранту на рис. 1 (багато екземплярів з довгими рядами даних для кожного екземпляру). В принципі, можна вивести модель розвитку з одного ряду даних, але тоді вимоги до довжини ряду багатократно посилюються. Повнота даних в часовому вимірі також потребує достатньої частоти (темпу) збору даних. Тільки пара «довжина + частота» даних спільно можуть забезпечити достатню інформацію про поведінку динамічного процесу у часі. Виконання вимог до цієї пари характеристик робить можливим виведення адекватної моделі процесу. Питання частоти збору даних роз'яснюється після конкретизації «фізики» процесів у часі та типів змінних (показників). Виділимо два принципових типи процесів: рекурентний процес та процес у неперервному часі. Відповідно отримуємо два типи даних: 1) дані рекурентних процесів; 2) дані процесів у неперервному часі (рис. 2). Ситуацію рекурентного процесу («1») маємо, коли розглядається послідовність «активних фаз (станів)» процесу в певні моменти часу (короткі інтервали), а в проміжках часу між моментами «активного стану» процес або не визначений, або недоступний в принципі. (Наприклад, марковський ланцюг визначений тільки на ліченій множині моментів, а «пасивних станів» просто немає.) Можлива ситуація, що характеристики процесу в «пасивному стані» також доступні вимірюванню; в такому разі розгляд даних як для рекурентної моделі можна пояснити тим, що вимірювання «пасивних станів» не дадуть додаткової інформації для створення моделі. Темпоральні дані Дані рекурентних процесів Дані процесів у неперервному часі Вимірювання за схемою «вікно з маскою» (звичайні векторні часові ряди) (варіанти пауз та зсувів) Повноформатні вимірювання на кожному кроці схемою «вікно з маскою» неперервних процесів з дійсними змінними Рис. 2. Архітектура темпоральних даних (шкали часу та типи змінних) V1 Потоки випадкових подій Дані неперервних процесів з дійсними змінними Дані неперервних процесів з дискретними змінними Дані (дискретних) подій V3 V2 Рис. 2. Архітектура темпоральних даних (шкали часу та типи змінних) 187 Моделі і засоби систем баз даних та знань Натомість процес у неперервному часі («2») розвивається і розглядається безперервно (контину- ально); відтак, аналітик й користувач потребують моделі, де час входить у рівняння в явному вигляді. В такому разі немає наперед визначених моментів, коли потрібно вимірювати дані. Це залежить від обставин і технічних можливостей. (Також можна виокремити проміжну проблемну ситуацію, коли процес розви- вається як неперервний, але інтерес аналітика й користувача зосереджений виключно на певних моментах часу. Тоді до якого з двох вказаних типів процесів віднести обраний процес, залежить від вибору аналіти- ка: яку модель він хоче виводити; чи буде дійсна змінна часу входити у рівняння в явному вигляді, чи ні.) Аналітик може обрати модель рекурентного процесу як апроксимацію процесу у неперервному часі, і тоді точність апроксимації буде критично залежати від частоти збору даних. Для подальшої класифікації процесів у неперервному часі та даних для них потрібно розглянути на- ступну ознаку архітектури даних – простір значень змінних (рис. 2). Виділяємо три типи даних: дані неперерв- них процесів з дійсними змінними (V1); дані процесів з дискретними змінними (V2); дані потоків (дискретних) подій (V3). Випадок «V1» зазвичай відображає неперервний довготривалий процес. Випадок «V2» відображає дискретний процес у неперервному часі. Дані неперервних процесів у неперервному часі утворюються за допо- могою вимірювання значень змінних у заплановані моменти часу. Дані спостережень за потоками подій («V3») утворюються за допомогою фіксації часу, коли відбулась подія. Отже, «прилад» спостереження має постійно перебувати у готовності, бо момент події (і генерації запису первинних даних) є непередбачуваний і визнача- ється самою «природою». Якщо зарезервовано кілька класів (типів) подій, які фіксуються одним «приладом», то фіксується також клас (ідентифікатор) події. Дані процесів із дискретними змінними можна трактувати ана- логічно неперервним змінним або аналогічно подіям. Дані типу «V2» відрізняється від даних типу «V3» («по- дії») тим, що дискретна змінна існує у неперервному часі (навіть коли вона залишається постійною). Якщо поглянути на багатовимірний дискретний процес як на послідовність подій, то такі події об’єктивно груповані відповідно до окремих підпроцесів. Не завжди обов’язково фіксувати кожний перехід дискретної змінної від одного значення до іншого (такий перехід може бути менш важливим, ніж справжня «подія»). У науковій літературі створено апарат, який дозволяє потік стохастичних подій репрезентувати як дис- кретний процес у неперервному часі. Для цього використовуються лічильні процеси, або процеси підрахунку (counting processes) [8, 11]. Особливість лічильних процесів полягає в тому, що значення кожної змінної зростає на одиницю у випадкові моменти часу. У дискретних процесах, що описують обслуговування у чергах, зміни стану відбуваються в обох напрямках (+1 або –1). Згідно теорії стохастичних процесів, за дискретним процесом стоїть дійсна характеристика, «інтенсивність», яка визначає ймовірність зміни стану дискретного процесу, але яка безпосередньо не спостерігається. Моделі і засоби систем баз даних та знань [Введите текст] Рекурентний процес розвивається чітко визначеними (регулярними) дискретними кроками. Образно кажучи, такий динамічний процес стрибає у часі. Ясно, що дані рекурентного процесу мають збиратися в моменти «активного стану». Отже, темп (частота) збору даних має бути прив'язаний до ритму рекурентного процесу. Якщо частота збору даних є меншою, ніж частота активних станів, то такі дані будуть незадовільними (у літературі це називають терміном undersampled data). Натомість процес у неперервному часі («2») розвивається і розглядається безперервно (континуально); відтак, аналітик й користувач потребують моделі, де час входить у рівняння в явному вигляді. В такому разі немає наперед визначених моментів, коли потрібно вимірювати дані. Це залежить від обставин і технічних можливостей. (Також можна виокремити проміжну проблемну ситуацію, коли процес розвивається як неперервний, але інтерес аналітика й користувача зосереджений виключно на певних моментах часу. Тоді до якого з двох вказаних типів процесів віднести обраний процес, залежить від вибору аналітика: яку модель він хоче виводити; чи буде дійсна змінна часу входити у рівняння в явному вигляді, чи ні.) Аналітик може обрати модель рекурентного процесу як апроксимацію процесу у неперервному часі, і тоді точність апроксимації буде критично залежати від частоти збору даних. Для подальшої класифікації процесів у неперервному часі та даних для них потрібно розглянути наступну ознаку архітектури даних – простір значень змінних (рис. 2). Виділяємо три типи даних: дані неперервних процесів з дійсними змінними (V1); дані процесів з дискретними змінними (V2); дані потоків (дискретних) подій (V3). Випадок «V1» зазвичай відображає неперервний довготривалий процес. Випадок «V2» відображає дискретний процес у неперервному часі. Дані неперервних процесів у неперервному часі утворюються за допомогою вимірювання значень змінних у заплановані моменти часу. Дані спостережень за потоками подій («V3») утворюються за допомогою фіксації часу, коли відбулась подія. Отже, «прилад» спостереження має постійно перебувати у готовності, бо момент події (і генерації запису первинних даних) є непередбачуваний і визначається самою «природою». Якщо зарезервовано кілька класів (типів) подій, які фіксуються одним «приладом», то фіксується також клас (ідентифікатор) події. Дані процесів із дискретними змінними можна трактувати аналогічно неперервним змінним або аналогічно подіям. Дані типу «V2» відрізняється від даних типу «V3» («події») тим, що дискретна змінна існує у неперервному часі (навіть коли вона залишається постійною). Якщо поглянути на багатовимірний дискретний процес як на послідовність подій, то такі події об'єктивно груповані відповідно до окремих підпроцесів. Не завжди обов'язково фіксувати кожний перехід дискретної змінної від одного значення до іншого (такий перехід може бути менш важливим, ніж справжня «подія»). У науковій літературі створено апарат, який дозволяє потік стохастичних подій репрезентувати як дискретний процес у неперервному часі. Для цього використовуються лічильні процеси, або процеси підрахунку (counting processes) [8, 11]. Особливість лічильних процесів полягає в тому, що значення кожної змінної зростає на одиницю у випадкові моменти часу. У дискретних процесах, що описують обслуговування у чергах, зміни стану відбуваються в обох напрямках (+1 або –1). Згідно теорії стохастичних процесів, за дискретним процесом стоїть дійсна характеристика, «інтенсивність», яка визначає ймовірність зміни стану дискретного процесу, але яка безпосередньо не спостерігається. Рис. 3. Структура авторегресійного процесу X Y Z W e(t) e(t-1) e(t-2) u(t) u(t-1) u(t-2) Рис. 3. Структура авторегресійного процесу Нехай маємо неперервний процес з дійсними змінними; якщо похідні змінних у часі Моделі і засоби систем баз даних та знань Нехай маємо неперервний процес з дійсними змінними; якщо похідні змінних у часі dtdx / мають великі значення, то вимоги до частоти збору даних різко підсилюються. На якісному рівні можна сформулювати наступну, не жорстку, але важливу, вимогу до частоти збору даних. Нехай в системі існують зворотні зв'язки, які функціонують як поширення «сигналу» вздовж відповідних шляхів у структурі моделі. Тоді частота (темп) збору даних має бути такою, щоб зафіксувати проміжні фази поширення сигналу вздовж шляху кожного зворотного зв'язку. Тоді зворотні зв'язки будуть відображені в моделі у вигляді спіралі (а не у вигляді циклону). Проілюструємо вищеозначені горизонти (масштаби) довжини рядів даних. На рис. 3 зображено схему рекурентного динамічного процесу, який генерується згідно моделі векторної авторегресії. В цій моделі найдовший безпосередній каузальний зв'язок має лаг 2; це зв'язок tt XZ →−2 . «Вікно» спостереження (позначене пунктирним квадратом) охоплює три послідовні значення кожної змінної (три кроки). В даному разі таке «вікно» «захоплює» всі безпосередні каузальні зв'язки моделі. Тому, якщо дані спостережень зібрані у форматі такого «вікна», то найближчий горизонт (масштаб) довжини рядів даних забезпечено. Але таке «вікно» не забезпечує 2-кроковий горизонт довжини, бо є ланцюг зв'язків 12 +− →→ ttt WXZ , і для його явної репрезентації потрібні випадки (записи) даних довжиною 4 кроки. Вказане «вікно» довжиною три кроки також не покриває «осциляторного» горизонту довжини для цього часового ряду, бо в системі функціонує зворотний зв'язок, що складається із наступної послідовності безпосередніх каузальних зв'язків: 212 +−− →→→ tttt XZYX . Цей зворотний зв'язок здійснюється за чотири кроки, і щоб наочно побачити його, треба репрезентувати ряд даних довжиною 5 кроків кожної змінної. Зрозуміло, якщо дані зібрано за схемою «довгі ряди даних» (на рис. 1 – справа), то вказані горизонти довжини забезпечуються автоматично. Натомість проблема частоти (темпу) збору даних – більш критична. Якщо частота збору даних є меншою, ніж справжня періодичність вказаного рекурентного динамічного процесу, можливості вивести адекватну модель звузяться. Наприклад, якщо в ряду даних значення змінних фіксуються тільки для одного із п’яти кроків вказаного процесу (рис. 3), то не вдасться відтворити спіраль зворотного зв'язку 212 +−− →→→ tttt XZYX . З'являться моментальні (ізохронні) зв'язки. Як правило, за умовчанням вважається, що вимірювання значень даних відбувається «миттєво». Якщо маємо швидкий неперервний процес з дійсними змінними (коли dtdx / сягає великих значень), а вимірювальний прилад фіксує якесь «середнє» значення змінної x за кінцевий інтервал часу t , то такі дані можуть спричинити викривлення моделі. 3 Каузальність та марковські властивості у векторних часових рядах Серед відомих підходів та методів аналізу часових рядів даних, мабуть, найбільшого поширення набула техніка векторної авторегресії [9, 10]. З економетрики ці методи розповсюдилися на інші сфери, зокрема, експериментальну біологію. В моделях авторегресії, як і в каузальних мережах, поведінка системи описується за допомогою прямих зв'язків між компонентами. Такі моделі формально відповідають рекурентному процесу. Одна з перших концепцій каузальності була запропонована К. Грейнджером (Granger C.W.J.) [16–18]. (Строго кажучи, первинно була сформульована концепція «не-каузальності», і вже як комплементарне з'явилося поняття каузальності.) Концепція каузальності за Грейнджером походить від традиційних уявлень, які були поширені в соціології та економетриці першої половини 20-го століття. Початкова ідея проста: для того, щоб відповісти на питання, чи є змінна X причиною для Y , треба знайти всі змінні, які (можливо) впливають на Y . Тоді «фіксація» значень всіх цих змінних, разом із змінною X , мусить призвести до того, що Y обернеться на константу. Змінюємо умови цього уявного експерименту: фіксуємо значення всіх вказаних змінних (причин), окрім самої X . Тоді, якщо варіювання X супроводжується варіюванням Y (причому змінна X йде у часі раніше, ніж Y ), то змінна X є причиною для Y . Але накреслену ідею важко провести у житті. Практично неможливо зафіксувати абсолютно всі фактори, які можуть впливати на обрану зміну Y . Тому для практичного виявлення каузальних відношень обирають критерій з менш жорсткими умовами експерименту. Треба зафіксувати тільки ті фактори, які впливають на X та Y паралельно (тобто в умови включають тільки спільні причини змінних X та Y ). Тоді критерієм каузального відношення буде не альтернатива «константність – неконстантність» ефекту Y , а альтернатива «незалежність – залежність» Y від X за обраних умов. Залежність за вказаних умов свідчить, що X є причиною для Y . І цю залежність можна використати для прогнозування. Відштовхнемося від поняття «не-каузальності» за Грейнджером. Грейнджер розглядає задачу прогнозування показника (ефекту) Y й аналізує гіпотетичну причину X з точки зору її інформативності для прогнозу. Задача полягає у прогнозуванні значення показника 1+tY (ефекту, наслідку) на основі наявної інформації. Ясно, що для прогнозу аналітик чи комп'ютер може знати і врахувати тільки інформацію про минуле (включно із найостаннішим, «свіжим»). (Такі умови відрізняють задачу прогнозування від задачі заповнення пропуску в базі даних, яку іноді теж називають «предикція».) Нехай t – вся інформація у світі на момент часу t (принаймні інформація, релевантна одночасно для X та Y ), а tX – значення змінної X в момент часу t . Позначимо через tt X\ інформацію у світі на момент часу t , за виключенням значення tX . Вище аргументовано: якщо X не є причиною для Y , то з врахуванням інформації tt X\ значення 1+tY не залежить від tX . Відтак, прогноз розподілення змінної 1+tY на основі інформації tt X\ не відрізняється від прогнозу на мають великі значення, то вимоги до частоти збору даних різко підсилюються. На якісному рівні можна сфор- мулювати наступну, не жорстку, але важливу, вимогу до частоти збору даних. Нехай в системі існують зворотні зв’язки, які функціонують як поширення «сигналу» вздовж відповідних шляхів у структурі мо- делі. Тоді частота (темп) збору даних має бути такою, щоб зафіксувати проміжні фази поширення сигналу вздовж шляху кожного зворотного зв’язку. Тоді зворотні зв’язки будуть відображені в моделі у вигляді спіралі (а не у вигляді циклону). 188 Моделі і засоби систем баз даних та знань Проілюструємо вищеозначені горизонти (масштаби) довжини рядів даних. На рис. 3 зображено схему рекурентного динамічного процесу, який генерується згідно моделі векторної авторегресії. В цій моделі най- довший безпосередній каузальний зв’язок має лаг 2; це зв’язок Моделі і засоби систем баз даних та знань Нехай маємо неперервний процес з дійсними змінними; якщо похідні змінних у часі dtdx / мають великі значення, то вимоги до частоти збору даних різко підсилюються. На якісному рівні можна сформулювати наступну, не жорстку, але важливу, вимогу до частоти збору даних. Нехай в системі існують зворотні зв'язки, які функціонують як поширення «сигналу» вздовж відповідних шляхів у структурі моделі. Тоді частота (темп) збору даних має бути такою, щоб зафіксувати проміжні фази поширення сигналу вздовж шляху кожного зворотного зв'язку. Тоді зворотні зв'язки будуть відображені в моделі у вигляді спіралі (а не у вигляді циклону). Проілюструємо вищеозначені горизонти (масштаби) довжини рядів даних. На рис. 3 зображено схему рекурентного динамічного процесу, який генерується згідно моделі векторної авторегресії. В цій моделі найдовший безпосередній каузальний зв'язок має лаг 2; це зв'язок tt XZ →−2 . «Вікно» спостереження (позначене пунктирним квадратом) охоплює три послідовні значення кожної змінної (три кроки). В даному разі таке «вікно» «захоплює» всі безпосередні каузальні зв'язки моделі. Тому, якщо дані спостережень зібрані у форматі такого «вікна», то найближчий горизонт (масштаб) довжини рядів даних забезпечено. Але таке «вікно» не забезпечує 2-кроковий горизонт довжини, бо є ланцюг зв'язків 12 +− →→ ttt WXZ , і для його явної репрезентації потрібні випадки (записи) даних довжиною 4 кроки. Вказане «вікно» довжиною три кроки також не покриває «осциляторного» горизонту довжини для цього часового ряду, бо в системі функціонує зворотний зв'язок, що складається із наступної послідовності безпосередніх каузальних зв'язків: 212 +−− →→→ tttt XZYX . Цей зворотний зв'язок здійснюється за чотири кроки, і щоб наочно побачити його, треба репрезентувати ряд даних довжиною 5 кроків кожної змінної. Зрозуміло, якщо дані зібрано за схемою «довгі ряди даних» (на рис. 1 – справа), то вказані горизонти довжини забезпечуються автоматично. Натомість проблема частоти (темпу) збору даних – більш критична. Якщо частота збору даних є меншою, ніж справжня періодичність вказаного рекурентного динамічного процесу, можливості вивести адекватну модель звузяться. Наприклад, якщо в ряду даних значення змінних фіксуються тільки для одного із п’яти кроків вказаного процесу (рис. 3), то не вдасться відтворити спіраль зворотного зв'язку 212 +−− →→→ tttt XZYX . З'являться моментальні (ізохронні) зв'язки. Як правило, за умовчанням вважається, що вимірювання значень даних відбувається «миттєво». Якщо маємо швидкий неперервний процес з дійсними змінними (коли dtdx / сягає великих значень), а вимірювальний прилад фіксує якесь «середнє» значення змінної x за кінцевий інтервал часу t , то такі дані можуть спричинити викривлення моделі. 3 Каузальність та марковські властивості у векторних часових рядах Серед відомих підходів та методів аналізу часових рядів даних, мабуть, найбільшого поширення набула техніка векторної авторегресії [9, 10]. З економетрики ці методи розповсюдилися на інші сфери, зокрема, експериментальну біологію. В моделях авторегресії, як і в каузальних мережах, поведінка системи описується за допомогою прямих зв'язків між компонентами. Такі моделі формально відповідають рекурентному процесу. Одна з перших концепцій каузальності була запропонована К. Грейнджером (Granger C.W.J.) [16–18]. (Строго кажучи, первинно була сформульована концепція «не-каузальності», і вже як комплементарне з'явилося поняття каузальності.) Концепція каузальності за Грейнджером походить від традиційних уявлень, які були поширені в соціології та економетриці першої половини 20-го століття. Початкова ідея проста: для того, щоб відповісти на питання, чи є змінна X причиною для Y , треба знайти всі змінні, які (можливо) впливають на Y . Тоді «фіксація» значень всіх цих змінних, разом із змінною X , мусить призвести до того, що Y обернеться на константу. Змінюємо умови цього уявного експерименту: фіксуємо значення всіх вказаних змінних (причин), окрім самої X . Тоді, якщо варіювання X супроводжується варіюванням Y (причому змінна X йде у часі раніше, ніж Y ), то змінна X є причиною для Y . Але накреслену ідею важко провести у житті. Практично неможливо зафіксувати абсолютно всі фактори, які можуть впливати на обрану зміну Y . Тому для практичного виявлення каузальних відношень обирають критерій з менш жорсткими умовами експерименту. Треба зафіксувати тільки ті фактори, які впливають на X та Y паралельно (тобто в умови включають тільки спільні причини змінних X та Y ). Тоді критерієм каузального відношення буде не альтернатива «константність – неконстантність» ефекту Y , а альтернатива «незалежність – залежність» Y від X за обраних умов. Залежність за вказаних умов свідчить, що X є причиною для Y . І цю залежність можна використати для прогнозування. Відштовхнемося від поняття «не-каузальності» за Грейнджером. Грейнджер розглядає задачу прогнозування показника (ефекту) Y й аналізує гіпотетичну причину X з точки зору її інформативності для прогнозу. Задача полягає у прогнозуванні значення показника 1+tY (ефекту, наслідку) на основі наявної інформації. Ясно, що для прогнозу аналітик чи комп'ютер може знати і врахувати тільки інформацію про минуле (включно із найостаннішим, «свіжим»). (Такі умови відрізняють задачу прогнозування від задачі заповнення пропуску в базі даних, яку іноді теж називають «предикція».) Нехай t – вся інформація у світі на момент часу t (принаймні інформація, релевантна одночасно для X та Y ), а tX – значення змінної X в момент часу t . Позначимо через tt X\ інформацію у світі на момент часу t , за виключенням значення tX . Вище аргументовано: якщо X не є причиною для Y , то з врахуванням інформації tt X\ значення 1+tY не залежить від tX . Відтак, прогноз розподілення змінної 1+tY на основі інформації tt X\ не відрізняється від прогнозу на . «Вікно» спостереження (позначене пунктирним квадратом) охоплює три послідовні значення кожної змінної (три кроки). В даному разі таке «ві- кно» «захоплює» всі безпосередні каузальні зв’язки моделі. Тому, якщо дані спостережень зібрані у форматі такого «вікна», то найближчий горизонт (масштаб) довжини рядів даних забезпечено. Але таке «вікно» не забезпечує 2-кроковий горизонт довжини, бо є ланцюг зв’язків Моделі і засоби систем баз даних та знань Нехай маємо неперервний процес з дійсними змінними; якщо похідні змінних у часі dtdx / мають великі значення, то вимоги до частоти збору даних різко підсилюються. На якісному рівні можна сформулювати наступну, не жорстку, але важливу, вимогу до частоти збору даних. Нехай в системі існують зворотні зв'язки, які функціонують як поширення «сигналу» вздовж відповідних шляхів у структурі моделі. Тоді частота (темп) збору даних має бути такою, щоб зафіксувати проміжні фази поширення сигналу вздовж шляху кожного зворотного зв'язку. Тоді зворотні зв'язки будуть відображені в моделі у вигляді спіралі (а не у вигляді циклону). Проілюструємо вищеозначені горизонти (масштаби) довжини рядів даних. На рис. 3 зображено схему рекурентного динамічного процесу, який генерується згідно моделі векторної авторегресії. В цій моделі найдовший безпосередній каузальний зв'язок має лаг 2; це зв'язок tt XZ →−2 . «Вікно» спостереження (позначене пунктирним квадратом) охоплює три послідовні значення кожної змінної (три кроки). В даному разі таке «вікно» «захоплює» всі безпосередні каузальні зв'язки моделі. Тому, якщо дані спостережень зібрані у форматі такого «вікна», то найближчий горизонт (масштаб) довжини рядів даних забезпечено. Але таке «вікно» не забезпечує 2-кроковий горизонт довжини, бо є ланцюг зв'язків 12 +− →→ ttt WXZ , і для його явної репрезентації потрібні випадки (записи) даних довжиною 4 кроки. Вказане «вікно» довжиною три кроки також не покриває «осциляторного» горизонту довжини для цього часового ряду, бо в системі функціонує зворотний зв'язок, що складається із наступної послідовності безпосередніх каузальних зв'язків: 212 +−− →→→ tttt XZYX . Цей зворотний зв'язок здійснюється за чотири кроки, і щоб наочно побачити його, треба репрезентувати ряд даних довжиною 5 кроків кожної змінної. Зрозуміло, якщо дані зібрано за схемою «довгі ряди даних» (на рис. 1 – справа), то вказані горизонти довжини забезпечуються автоматично. Натомість проблема частоти (темпу) збору даних – більш критична. Якщо частота збору даних є меншою, ніж справжня періодичність вказаного рекурентного динамічного процесу, можливості вивести адекватну модель звузяться. Наприклад, якщо в ряду даних значення змінних фіксуються тільки для одного із п’яти кроків вказаного процесу (рис. 3), то не вдасться відтворити спіраль зворотного зв'язку 212 +−− →→→ tttt XZYX . З'являться моментальні (ізохронні) зв'язки. Як правило, за умовчанням вважається, що вимірювання значень даних відбувається «миттєво». Якщо маємо швидкий неперервний процес з дійсними змінними (коли dtdx / сягає великих значень), а вимірювальний прилад фіксує якесь «середнє» значення змінної x за кінцевий інтервал часу t , то такі дані можуть спричинити викривлення моделі. 3 Каузальність та марковські властивості у векторних часових рядах Серед відомих підходів та методів аналізу часових рядів даних, мабуть, найбільшого поширення набула техніка векторної авторегресії [9, 10]. З економетрики ці методи розповсюдилися на інші сфери, зокрема, експериментальну біологію. В моделях авторегресії, як і в каузальних мережах, поведінка системи описується за допомогою прямих зв'язків між компонентами. Такі моделі формально відповідають рекурентному процесу. Одна з перших концепцій каузальності була запропонована К. Грейнджером (Granger C.W.J.) [16–18]. (Строго кажучи, первинно була сформульована концепція «не-каузальності», і вже як комплементарне з'явилося поняття каузальності.) Концепція каузальності за Грейнджером походить від традиційних уявлень, які були поширені в соціології та економетриці першої половини 20-го століття. Початкова ідея проста: для того, щоб відповісти на питання, чи є змінна X причиною для Y , треба знайти всі змінні, які (можливо) впливають на Y . Тоді «фіксація» значень всіх цих змінних, разом із змінною X , мусить призвести до того, що Y обернеться на константу. Змінюємо умови цього уявного експерименту: фіксуємо значення всіх вказаних змінних (причин), окрім самої X . Тоді, якщо варіювання X супроводжується варіюванням Y (причому змінна X йде у часі раніше, ніж Y ), то змінна X є причиною для Y . Але накреслену ідею важко провести у житті. Практично неможливо зафіксувати абсолютно всі фактори, які можуть впливати на обрану зміну Y . Тому для практичного виявлення каузальних відношень обирають критерій з менш жорсткими умовами експерименту. Треба зафіксувати тільки ті фактори, які впливають на X та Y паралельно (тобто в умови включають тільки спільні причини змінних X та Y ). Тоді критерієм каузального відношення буде не альтернатива «константність – неконстантність» ефекту Y , а альтернатива «незалежність – залежність» Y від X за обраних умов. Залежність за вказаних умов свідчить, що X є причиною для Y . І цю залежність можна використати для прогнозування. Відштовхнемося від поняття «не-каузальності» за Грейнджером. Грейнджер розглядає задачу прогнозування показника (ефекту) Y й аналізує гіпотетичну причину X з точки зору її інформативності для прогнозу. Задача полягає у прогнозуванні значення показника 1+tY (ефекту, наслідку) на основі наявної інформації. Ясно, що для прогнозу аналітик чи комп'ютер може знати і врахувати тільки інформацію про минуле (включно із найостаннішим, «свіжим»). (Такі умови відрізняють задачу прогнозування від задачі заповнення пропуску в базі даних, яку іноді теж називають «предикція».) Нехай t – вся інформація у світі на момент часу t (принаймні інформація, релевантна одночасно для X та Y ), а tX – значення змінної X в момент часу t . Позначимо через tt X\ інформацію у світі на момент часу t , за виключенням значення tX . Вище аргументовано: якщо X не є причиною для Y , то з врахуванням інформації tt X\ значення 1+tY не залежить від tX . Відтак, прогноз розподілення змінної 1+tY на основі інформації tt X\ не відрізняється від прогнозу на , і для його явної репрезентації потрібні випадки (записи) даних довжиною 4 кроки. Вказане «вікно» довжиною три кроки також не покриває «осциляторного» горизонту довжини для цього часового ряду, бо в системі функціонує зворотний зв’язок, що складається із наступної послідовності безпосередніх каузальних зв’язків: Моделі і засоби систем баз даних та знань Нехай маємо неперервний процес з дійсними змінними; якщо похідні змінних у часі dtdx / мають великі значення, то вимоги до частоти збору даних різко підсилюються. На якісному рівні можна сформулювати наступну, не жорстку, але важливу, вимогу до частоти збору даних. Нехай в системі існують зворотні зв'язки, які функціонують як поширення «сигналу» вздовж відповідних шляхів у структурі моделі. Тоді частота (темп) збору даних має бути такою, щоб зафіксувати проміжні фази поширення сигналу вздовж шляху кожного зворотного зв'язку. Тоді зворотні зв'язки будуть відображені в моделі у вигляді спіралі (а не у вигляді циклону). Проілюструємо вищеозначені горизонти (масштаби) довжини рядів даних. На рис. 3 зображено схему рекурентного динамічного процесу, який генерується згідно моделі векторної авторегресії. В цій моделі найдовший безпосередній каузальний зв'язок має лаг 2; це зв'язок tt XZ →−2 . «Вікно» спостереження (позначене пунктирним квадратом) охоплює три послідовні значення кожної змінної (три кроки). В даному разі таке «вікно» «захоплює» всі безпосередні каузальні зв'язки моделі. Тому, якщо дані спостережень зібрані у форматі такого «вікна», то найближчий горизонт (масштаб) довжини рядів даних забезпечено. Але таке «вікно» не забезпечує 2-кроковий горизонт довжини, бо є ланцюг зв'язків 12 +− →→ ttt WXZ , і для його явної репрезентації потрібні випадки (записи) даних довжиною 4 кроки. Вказане «вікно» довжиною три кроки також не покриває «осциляторного» горизонту довжини для цього часового ряду, бо в системі функціонує зворотний зв'язок, що складається із наступної послідовності безпосередніх каузальних зв'язків: 212 +−− →→→ tttt XZYX . Цей зворотний зв'язок здійснюється за чотири кроки, і щоб наочно побачити його, треба репрезентувати ряд даних довжиною 5 кроків кожної змінної. Зрозуміло, якщо дані зібрано за схемою «довгі ряди даних» (на рис. 1 – справа), то вказані горизонти довжини забезпечуються автоматично. Натомість проблема частоти (темпу) збору даних – більш критична. Якщо частота збору даних є меншою, ніж справжня періодичність вказаного рекурентного динамічного процесу, можливості вивести адекватну модель звузяться. Наприклад, якщо в ряду даних значення змінних фіксуються тільки для одного із п’яти кроків вказаного процесу (рис. 3), то не вдасться відтворити спіраль зворотного зв'язку 212 +−− →→→ tttt XZYX . З'являться моментальні (ізохронні) зв'язки. Як правило, за умовчанням вважається, що вимірювання значень даних відбувається «миттєво». Якщо маємо швидкий неперервний процес з дійсними змінними (коли dtdx / сягає великих значень), а вимірювальний прилад фіксує якесь «середнє» значення змінної x за кінцевий інтервал часу t , то такі дані можуть спричинити викривлення моделі. 3 Каузальність та марковські властивості у векторних часових рядах Серед відомих підходів та методів аналізу часових рядів даних, мабуть, найбільшого поширення набула техніка векторної авторегресії [9, 10]. З економетрики ці методи розповсюдилися на інші сфери, зокрема, експериментальну біологію. В моделях авторегресії, як і в каузальних мережах, поведінка системи описується за допомогою прямих зв'язків між компонентами. Такі моделі формально відповідають рекурентному процесу. Одна з перших концепцій каузальності була запропонована К. Грейнджером (Granger C.W.J.) [16–18]. (Строго кажучи, первинно була сформульована концепція «не-каузальності», і вже як комплементарне з'явилося поняття каузальності.) Концепція каузальності за Грейнджером походить від традиційних уявлень, які були поширені в соціології та економетриці першої половини 20-го століття. Початкова ідея проста: для того, щоб відповісти на питання, чи є змінна X причиною для Y , треба знайти всі змінні, які (можливо) впливають на Y . Тоді «фіксація» значень всіх цих змінних, разом із змінною X , мусить призвести до того, що Y обернеться на константу. Змінюємо умови цього уявного експерименту: фіксуємо значення всіх вказаних змінних (причин), окрім самої X . Тоді, якщо варіювання X супроводжується варіюванням Y (причому змінна X йде у часі раніше, ніж Y ), то змінна X є причиною для Y . Але накреслену ідею важко провести у житті. Практично неможливо зафіксувати абсолютно всі фактори, які можуть впливати на обрану зміну Y . Тому для практичного виявлення каузальних відношень обирають критерій з менш жорсткими умовами експерименту. Треба зафіксувати тільки ті фактори, які впливають на X та Y паралельно (тобто в умови включають тільки спільні причини змінних X та Y ). Тоді критерієм каузального відношення буде не альтернатива «константність – неконстантність» ефекту Y , а альтернатива «незалежність – залежність» Y від X за обраних умов. Залежність за вказаних умов свідчить, що X є причиною для Y . І цю залежність можна використати для прогнозування. Відштовхнемося від поняття «не-каузальності» за Грейнджером. Грейнджер розглядає задачу прогнозування показника (ефекту) Y й аналізує гіпотетичну причину X з точки зору її інформативності для прогнозу. Задача полягає у прогнозуванні значення показника 1+tY (ефекту, наслідку) на основі наявної інформації. Ясно, що для прогнозу аналітик чи комп'ютер може знати і врахувати тільки інформацію про минуле (включно із найостаннішим, «свіжим»). (Такі умови відрізняють задачу прогнозування від задачі заповнення пропуску в базі даних, яку іноді теж називають «предикція».) Нехай t – вся інформація у світі на момент часу t (принаймні інформація, релевантна одночасно для X та Y ), а tX – значення змінної X в момент часу t . Позначимо через tt X\ інформацію у світі на момент часу t , за виключенням значення tX . Вище аргументовано: якщо X не є причиною для Y , то з врахуванням інформації tt X\ значення 1+tY не залежить від tX . Відтак, прогноз розподілення змінної 1+tY на основі інформації tt X\ не відрізняється від прогнозу на . Цей зворот- ний зв’язок здійснюється за чотири кроки, і щоб наочно побачити його, треба репрезентувати ряд даних довжи- ною 5 кроків кожної змінної. Зрозуміло, якщо дані зібрано за схемою «довгі ряди даних» (на рис. 1 – справа), то вказані горизонти довжини забезпечуються автоматично. Натомість проблема частоти (темпу) збору даних – більш критична. Якщо частота збору даних є меншою, ніж справжня періодичність вказаного рекурентного динамічного процесу, можливості вивести адекватну модель звузяться. Наприклад, якщо в ряду даних значен- ня змінних фіксуються тільки для одного із п’яти кроків вказаного процесу (рис. 3), то не вдасться відтворити спіраль зворотного зв’язку Моделі і засоби систем баз даних та знань Нехай маємо неперервний процес з дійсними змінними; якщо похідні змінних у часі dtdx / мають великі значення, то вимоги до частоти збору даних різко підсилюються. На якісному рівні можна сформулювати наступну, не жорстку, але важливу, вимогу до частоти збору даних. Нехай в системі існують зворотні зв'язки, які функціонують як поширення «сигналу» вздовж відповідних шляхів у структурі моделі. Тоді частота (темп) збору даних має бути такою, щоб зафіксувати проміжні фази поширення сигналу вздовж шляху кожного зворотного зв'язку. Тоді зворотні зв'язки будуть відображені в моделі у вигляді спіралі (а не у вигляді циклону). Проілюструємо вищеозначені горизонти (масштаби) довжини рядів даних. На рис. 3 зображено схему рекурентного динамічного процесу, який генерується згідно моделі векторної авторегресії. В цій моделі найдовший безпосередній каузальний зв'язок має лаг 2; це зв'язок tt XZ →−2 . «Вікно» спостереження (позначене пунктирним квадратом) охоплює три послідовні значення кожної змінної (три кроки). В даному разі таке «вікно» «захоплює» всі безпосередні каузальні зв'язки моделі. Тому, якщо дані спостережень зібрані у форматі такого «вікна», то найближчий горизонт (масштаб) довжини рядів даних забезпечено. Але таке «вікно» не забезпечує 2-кроковий горизонт довжини, бо є ланцюг зв'язків 12 +− →→ ttt WXZ , і для його явної репрезентації потрібні випадки (записи) даних довжиною 4 кроки. Вказане «вікно» довжиною три кроки також не покриває «осциляторного» горизонту довжини для цього часового ряду, бо в системі функціонує зворотний зв'язок, що складається із наступної послідовності безпосередніх каузальних зв'язків: 212 +−− →→→ tttt XZYX . Цей зворотний зв'язок здійснюється за чотири кроки, і щоб наочно побачити його, треба репрезентувати ряд даних довжиною 5 кроків кожної змінної. Зрозуміло, якщо дані зібрано за схемою «довгі ряди даних» (на рис. 1 – справа), то вказані горизонти довжини забезпечуються автоматично. Натомість проблема частоти (темпу) збору даних – більш критична. Якщо частота збору даних є меншою, ніж справжня періодичність вказаного рекурентного динамічного процесу, можливості вивести адекватну модель звузяться. Наприклад, якщо в ряду даних значення змінних фіксуються тільки для одного із п’яти кроків вказаного процесу (рис. 3), то не вдасться відтворити спіраль зворотного зв'язку 212 +−− →→→ tttt XZYX . З'являться моментальні (ізохронні) зв'язки. Як правило, за умовчанням вважається, що вимірювання значень даних відбувається «миттєво». Якщо маємо швидкий неперервний процес з дійсними змінними (коли dtdx / сягає великих значень), а вимірювальний прилад фіксує якесь «середнє» значення змінної x за кінцевий інтервал часу t , то такі дані можуть спричинити викривлення моделі. 3 Каузальність та марковські властивості у векторних часових рядах Серед відомих підходів та методів аналізу часових рядів даних, мабуть, найбільшого поширення набула техніка векторної авторегресії [9, 10]. З економетрики ці методи розповсюдилися на інші сфери, зокрема, експериментальну біологію. В моделях авторегресії, як і в каузальних мережах, поведінка системи описується за допомогою прямих зв'язків між компонентами. Такі моделі формально відповідають рекурентному процесу. Одна з перших концепцій каузальності була запропонована К. Грейнджером (Granger C.W.J.) [16–18]. (Строго кажучи, первинно була сформульована концепція «не-каузальності», і вже як комплементарне з'явилося поняття каузальності.) Концепція каузальності за Грейнджером походить від традиційних уявлень, які були поширені в соціології та економетриці першої половини 20-го століття. Початкова ідея проста: для того, щоб відповісти на питання, чи є змінна X причиною для Y , треба знайти всі змінні, які (можливо) впливають на Y . Тоді «фіксація» значень всіх цих змінних, разом із змінною X , мусить призвести до того, що Y обернеться на константу. Змінюємо умови цього уявного експерименту: фіксуємо значення всіх вказаних змінних (причин), окрім самої X . Тоді, якщо варіювання X супроводжується варіюванням Y (причому змінна X йде у часі раніше, ніж Y ), то змінна X є причиною для Y . Але накреслену ідею важко провести у житті. Практично неможливо зафіксувати абсолютно всі фактори, які можуть впливати на обрану зміну Y . Тому для практичного виявлення каузальних відношень обирають критерій з менш жорсткими умовами експерименту. Треба зафіксувати тільки ті фактори, які впливають на X та Y паралельно (тобто в умови включають тільки спільні причини змінних X та Y ). Тоді критерієм каузального відношення буде не альтернатива «константність – неконстантність» ефекту Y , а альтернатива «незалежність – залежність» Y від X за обраних умов. Залежність за вказаних умов свідчить, що X є причиною для Y . І цю залежність можна використати для прогнозування. Відштовхнемося від поняття «не-каузальності» за Грейнджером. Грейнджер розглядає задачу прогнозування показника (ефекту) Y й аналізує гіпотетичну причину X з точки зору її інформативності для прогнозу. Задача полягає у прогнозуванні значення показника 1+tY (ефекту, наслідку) на основі наявної інформації. Ясно, що для прогнозу аналітик чи комп'ютер може знати і врахувати тільки інформацію про минуле (включно із найостаннішим, «свіжим»). (Такі умови відрізняють задачу прогнозування від задачі заповнення пропуску в базі даних, яку іноді теж називають «предикція».) Нехай t – вся інформація у світі на момент часу t (принаймні інформація, релевантна одночасно для X та Y ), а tX – значення змінної X в момент часу t . Позначимо через tt X\ інформацію у світі на момент часу t , за виключенням значення tX . Вище аргументовано: якщо X не є причиною для Y , то з врахуванням інформації tt X\ значення 1+tY не залежить від tX . Відтак, прогноз розподілення змінної 1+tY на основі інформації tt X\ не відрізняється від прогнозу на . З’являться моментальні (ізохронні) зв’язки. Як правило, за умовчанням вважається, що вимірювання значень даних відбувається «миттєво». Якщо маємо швидкий неперервний процес з дійсними змінними (коли Моделі і засоби систем баз даних та знань Нехай маємо неперервний процес з дійсними змінними; якщо похідні змінних у часі dtdx / мають великі значення, то вимоги до частоти збору даних різко підсилюються. На якісному рівні можна сформулювати наступну, не жорстку, але важливу, вимогу до частоти збору даних. Нехай в системі існують зворотні зв'язки, які функціонують як поширення «сигналу» вздовж відповідних шляхів у структурі моделі. Тоді частота (темп) збору даних має бути такою, щоб зафіксувати проміжні фази поширення сигналу вздовж шляху кожного зворотного зв'язку. Тоді зворотні зв'язки будуть відображені в моделі у вигляді спіралі (а не у вигляді циклону). Проілюструємо вищеозначені горизонти (масштаби) довжини рядів даних. На рис. 3 зображено схему рекурентного динамічного процесу, який генерується згідно моделі векторної авторегресії. В цій моделі найдовший безпосередній каузальний зв'язок має лаг 2; це зв'язок tt XZ →−2 . «Вікно» спостереження (позначене пунктирним квадратом) охоплює три послідовні значення кожної змінної (три кроки). В даному разі таке «вікно» «захоплює» всі безпосередні каузальні зв'язки моделі. Тому, якщо дані спостережень зібрані у форматі такого «вікна», то найближчий горизонт (масштаб) довжини рядів даних забезпечено. Але таке «вікно» не забезпечує 2-кроковий горизонт довжини, бо є ланцюг зв'язків 12 +− →→ ttt WXZ , і для його явної репрезентації потрібні випадки (записи) даних довжиною 4 кроки. Вказане «вікно» довжиною три кроки також не покриває «осциляторного» горизонту довжини для цього часового ряду, бо в системі функціонує зворотний зв'язок, що складається із наступної послідовності безпосередніх каузальних зв'язків: 212 +−− →→→ tttt XZYX . Цей зворотний зв'язок здійснюється за чотири кроки, і щоб наочно побачити його, треба репрезентувати ряд даних довжиною 5 кроків кожної змінної. Зрозуміло, якщо дані зібрано за схемою «довгі ряди даних» (на рис. 1 – справа), то вказані горизонти довжини забезпечуються автоматично. Натомість проблема частоти (темпу) збору даних – більш критична. Якщо частота збору даних є меншою, ніж справжня періодичність вказаного рекурентного динамічного процесу, можливості вивести адекватну модель звузяться. Наприклад, якщо в ряду даних значення змінних фіксуються тільки для одного із п’яти кроків вказаного процесу (рис. 3), то не вдасться відтворити спіраль зворотного зв'язку 212 +−− →→→ tttt XZYX . З'являться моментальні (ізохронні) зв'язки. Як правило, за умовчанням вважається, що вимірювання значень даних відбувається «миттєво». Якщо маємо швидкий неперервний процес з дійсними змінними (коли dtdx / сягає великих значень), а вимірювальний прилад фіксує якесь «середнє» значення змінної x за кінцевий інтервал часу t , то такі дані можуть спричинити викривлення моделі. 3 Каузальність та марковські властивості у векторних часових рядах Серед відомих підходів та методів аналізу часових рядів даних, мабуть, найбільшого поширення набула техніка векторної авторегресії [9, 10]. З економетрики ці методи розповсюдилися на інші сфери, зокрема, експериментальну біологію. В моделях авторегресії, як і в каузальних мережах, поведінка системи описується за допомогою прямих зв'язків між компонентами. Такі моделі формально відповідають рекурентному процесу. Одна з перших концепцій каузальності була запропонована К. Грейнджером (Granger C.W.J.) [16–18]. (Строго кажучи, первинно була сформульована концепція «не-каузальності», і вже як комплементарне з'явилося поняття каузальності.) Концепція каузальності за Грейнджером походить від традиційних уявлень, які були поширені в соціології та економетриці першої половини 20-го століття. Початкова ідея проста: для того, щоб відповісти на питання, чи є змінна X причиною для Y , треба знайти всі змінні, які (можливо) впливають на Y . Тоді «фіксація» значень всіх цих змінних, разом із змінною X , мусить призвести до того, що Y обернеться на константу. Змінюємо умови цього уявного експерименту: фіксуємо значення всіх вказаних змінних (причин), окрім самої X . Тоді, якщо варіювання X супроводжується варіюванням Y (причому змінна X йде у часі раніше, ніж Y ), то змінна X є причиною для Y . Але накреслену ідею важко провести у житті. Практично неможливо зафіксувати абсолютно всі фактори, які можуть впливати на обрану зміну Y . Тому для практичного виявлення каузальних відношень обирають критерій з менш жорсткими умовами експерименту. Треба зафіксувати тільки ті фактори, які впливають на X та Y паралельно (тобто в умови включають тільки спільні причини змінних X та Y ). Тоді критерієм каузального відношення буде не альтернатива «константність – неконстантність» ефекту Y , а альтернатива «незалежність – залежність» Y від X за обраних умов. Залежність за вказаних умов свідчить, що X є причиною для Y . І цю залежність можна використати для прогнозування. Відштовхнемося від поняття «не-каузальності» за Грейнджером. Грейнджер розглядає задачу прогнозування показника (ефекту) Y й аналізує гіпотетичну причину X з точки зору її інформативності для прогнозу. Задача полягає у прогнозуванні значення показника 1+tY (ефекту, наслідку) на основі наявної інформації. Ясно, що для прогнозу аналітик чи комп'ютер може знати і врахувати тільки інформацію про минуле (включно із найостаннішим, «свіжим»). (Такі умови відрізняють задачу прогнозування від задачі заповнення пропуску в базі даних, яку іноді теж називають «предикція».) Нехай t – вся інформація у світі на момент часу t (принаймні інформація, релевантна одночасно для X та Y ), а tX – значення змінної X в момент часу t . Позначимо через tt X\ інформацію у світі на момент часу t , за виключенням значення tX . Вище аргументовано: якщо X не є причиною для Y , то з врахуванням інформації tt X\ значення 1+tY не залежить від tX . Відтак, прогноз розподілення змінної 1+tY на основі інформації tt X\ не відрізняється від прогнозу на сягає великих значень), а вимірювальний прилад фіксує якесь «середнє» значення змінної x за кінцевий інтервал часу Моделі і засоби систем баз даних та знань Нехай маємо неперервний процес з дійсними змінними; якщо похідні змінних у часі dtdx / мають великі значення, то вимоги до частоти збору даних різко підсилюються. На якісному рівні можна сформулювати наступну, не жорстку, але важливу, вимогу до частоти збору даних. Нехай в системі існують зворотні зв'язки, які функціонують як поширення «сигналу» вздовж відповідних шляхів у структурі моделі. Тоді частота (темп) збору даних має бути такою, щоб зафіксувати проміжні фази поширення сигналу вздовж шляху кожного зворотного зв'язку. Тоді зворотні зв'язки будуть відображені в моделі у вигляді спіралі (а не у вигляді циклону). Проілюструємо вищеозначені горизонти (масштаби) довжини рядів даних. На рис. 3 зображено схему рекурентного динамічного процесу, який генерується згідно моделі векторної авторегресії. В цій моделі найдовший безпосередній каузальний зв'язок має лаг 2; це зв'язок tt XZ →−2 . «Вікно» спостереження (позначене пунктирним квадратом) охоплює три послідовні значення кожної змінної (три кроки). В даному разі таке «вікно» «захоплює» всі безпосередні каузальні зв'язки моделі. Тому, якщо дані спостережень зібрані у форматі такого «вікна», то найближчий горизонт (масштаб) довжини рядів даних забезпечено. Але таке «вікно» не забезпечує 2-кроковий горизонт довжини, бо є ланцюг зв'язків 12 +− →→ ttt WXZ , і для його явної репрезентації потрібні випадки (записи) даних довжиною 4 кроки. Вказане «вікно» довжиною три кроки також не покриває «осциляторного» горизонту довжини для цього часового ряду, бо в системі функціонує зворотний зв'язок, що складається із наступної послідовності безпосередніх каузальних зв'язків: 212 +−− →→→ tttt XZYX . Цей зворотний зв'язок здійснюється за чотири кроки, і щоб наочно побачити його, треба репрезентувати ряд даних довжиною 5 кроків кожної змінної. Зрозуміло, якщо дані зібрано за схемою «довгі ряди даних» (на рис. 1 – справа), то вказані горизонти довжини забезпечуються автоматично. Натомість проблема частоти (темпу) збору даних – більш критична. Якщо частота збору даних є меншою, ніж справжня періодичність вказаного рекурентного динамічного процесу, можливості вивести адекватну модель звузяться. Наприклад, якщо в ряду даних значення змінних фіксуються тільки для одного із п’яти кроків вказаного процесу (рис. 3), то не вдасться відтворити спіраль зворотного зв'язку 212 +−− →→→ tttt XZYX . З'являться моментальні (ізохронні) зв'язки. Як правило, за умовчанням вважається, що вимірювання значень даних відбувається «миттєво». Якщо маємо швидкий неперервний процес з дійсними змінними (коли dtdx / сягає великих значень), а вимірювальний прилад фіксує якесь «середнє» значення змінної x за кінцевий інтервал часу t , то такі дані можуть спричинити викривлення моделі. 3 Каузальність та марковські властивості у векторних часових рядах Серед відомих підходів та методів аналізу часових рядів даних, мабуть, найбільшого поширення набула техніка векторної авторегресії [9, 10]. З економетрики ці методи розповсюдилися на інші сфери, зокрема, експериментальну біологію. В моделях авторегресії, як і в каузальних мережах, поведінка системи описується за допомогою прямих зв'язків між компонентами. Такі моделі формально відповідають рекурентному процесу. Одна з перших концепцій каузальності була запропонована К. Грейнджером (Granger C.W.J.) [16–18]. (Строго кажучи, первинно була сформульована концепція «не-каузальності», і вже як комплементарне з'явилося поняття каузальності.) Концепція каузальності за Грейнджером походить від традиційних уявлень, які були поширені в соціології та економетриці першої половини 20-го століття. Початкова ідея проста: для того, щоб відповісти на питання, чи є змінна X причиною для Y , треба знайти всі змінні, які (можливо) впливають на Y . Тоді «фіксація» значень всіх цих змінних, разом із змінною X , мусить призвести до того, що Y обернеться на константу. Змінюємо умови цього уявного експерименту: фіксуємо значення всіх вказаних змінних (причин), окрім самої X . Тоді, якщо варіювання X супроводжується варіюванням Y (причому змінна X йде у часі раніше, ніж Y ), то змінна X є причиною для Y . Але накреслену ідею важко провести у житті. Практично неможливо зафіксувати абсолютно всі фактори, які можуть впливати на обрану зміну Y . Тому для практичного виявлення каузальних відношень обирають критерій з менш жорсткими умовами експерименту. Треба зафіксувати тільки ті фактори, які впливають на X та Y паралельно (тобто в умови включають тільки спільні причини змінних X та Y ). Тоді критерієм каузального відношення буде не альтернатива «константність – неконстантність» ефекту Y , а альтернатива «незалежність – залежність» Y від X за обраних умов. Залежність за вказаних умов свідчить, що X є причиною для Y . І цю залежність можна використати для прогнозування. Відштовхнемося від поняття «не-каузальності» за Грейнджером. Грейнджер розглядає задачу прогнозування показника (ефекту) Y й аналізує гіпотетичну причину X з точки зору її інформативності для прогнозу. Задача полягає у прогнозуванні значення показника 1+tY (ефекту, наслідку) на основі наявної інформації. Ясно, що для прогнозу аналітик чи комп'ютер може знати і врахувати тільки інформацію про минуле (включно із найостаннішим, «свіжим»). (Такі умови відрізняють задачу прогнозування від задачі заповнення пропуску в базі даних, яку іноді теж називають «предикція».) Нехай t – вся інформація у світі на момент часу t (принаймні інформація, релевантна одночасно для X та Y ), а tX – значення змінної X в момент часу t . Позначимо через tt X\ інформацію у світі на момент часу t , за виключенням значення tX . Вище аргументовано: якщо X не є причиною для Y , то з врахуванням інформації tt X\ значення 1+tY не залежить від tX . Відтак, прогноз розподілення змінної 1+tY на основі інформації tt X\ не відрізняється від прогнозу на , то такі дані можуть спричинити викривлення моделі. 3. Каузальність та марковські властивості у векторних часових рядах Серед відомих підходів та методів аналізу часових рядів даних, мабуть, найбільшого поширення набула техніка векторної авторегресії [9, 10]. З економетрики ці методи розповсюдилися на інші сфери, зо- крема, експериментальну біологію. В моделях авторегресії, як і в каузальних мережах, поведінка системи описується за допомогою прямих зв’язків між компонентами. Такі моделі формально відповідають рекурент- ному процесу. Одна з перших концепцій каузальності була запропонована К. Грейнджером (Granger C.W.J.) [16–18]. (Строго кажучи, первинно була сформульована концепція «не-каузальності», і вже як комплементарне з’явилося поняття каузальності.) Концепція каузальності за Грейнджером походить від традиційних уявлень, які були по- ширені в соціології та економетриці першої половини 20-го століття. Початкова ідея проста: для того, щоб відповісти на питання, чи є змінна X причиною для Y, треба знайти всі змінні, які (можливо) впливають на Y. Тоді «фіксація» значень всіх цих змінних, разом із змінною X, мусить призвести до того, що Y обернеться на константу. Змінюємо умови цього уявного експерименту: фіксуємо значення всіх вказаних змінних (причин), окрім самої X. Тоді, якщо варіювання X супроводжується варіюванням Y (причому змінна X йде у часі раніше, ніж Y), то змінна X є причиною для Y. Але накреслену ідею важко провести у житті. Практично неможливо зафіксувати абсолютно всі фактори, які можуть впливати на обрану зміну Y. Тому для практичного виявлення каузальних відношень обирають критерій з менш жорсткими умовами експерименту. Треба зафіксувати тільки ті фактори, які впливають на X та Y паралельно (тобто в умови включають тільки спільні причини змінних X та Y). Тоді критерієм каузального відношення буде не альтернатива «константність – неконстантність» ефекту Y, а альтернатива «незалежність – залежність» Y від X за обраних умов. Залежність за вказаних умов свідчить, що X є причиною для Y. І цю залежність можна використати для прогнозування. Відштовхнемося від поняття «не-каузальності» за Грейнджером. Грейнджер розглядає задачу про- гнозування показника (ефекту) Y й аналізує гіпотетичну причину X з точки зору її інформативності для про- гнозу. Задача полягає у прогнозуванні значення показника Моделі і засоби систем баз даних та знань Нехай маємо неперервний процес з дійсними змінними; якщо похідні змінних у часі dtdx / мають великі значення, то вимоги до частоти збору даних різко підсилюються. На якісному рівні можна сформулювати наступну, не жорстку, але важливу, вимогу до частоти збору даних. Нехай в системі існують зворотні зв'язки, які функціонують як поширення «сигналу» вздовж відповідних шляхів у структурі моделі. Тоді частота (темп) збору даних має бути такою, щоб зафіксувати проміжні фази поширення сигналу вздовж шляху кожного зворотного зв'язку. Тоді зворотні зв'язки будуть відображені в моделі у вигляді спіралі (а не у вигляді циклону). Проілюструємо вищеозначені горизонти (масштаби) довжини рядів даних. На рис. 3 зображено схему рекурентного динамічного процесу, який генерується згідно моделі векторної авторегресії. В цій моделі найдовший безпосередній каузальний зв'язок має лаг 2; це зв'язок tt XZ →−2 . «Вікно» спостереження (позначене пунктирним квадратом) охоплює три послідовні значення кожної змінної (три кроки). В даному разі таке «вікно» «захоплює» всі безпосередні каузальні зв'язки моделі. Тому, якщо дані спостережень зібрані у форматі такого «вікна», то найближчий горизонт (масштаб) довжини рядів даних забезпечено. Але таке «вікно» не забезпечує 2-кроковий горизонт довжини, бо є ланцюг зв'язків 12 +− →→ ttt WXZ , і для його явної репрезентації потрібні випадки (записи) даних довжиною 4 кроки. Вказане «вікно» довжиною три кроки також не покриває «осциляторного» горизонту довжини для цього часового ряду, бо в системі функціонує зворотний зв'язок, що складається із наступної послідовності безпосередніх каузальних зв'язків: 212 +−− →→→ tttt XZYX . Цей зворотний зв'язок здійснюється за чотири кроки, і щоб наочно побачити його, треба репрезентувати ряд даних довжиною 5 кроків кожної змінної. Зрозуміло, якщо дані зібрано за схемою «довгі ряди даних» (на рис. 1 – справа), то вказані горизонти довжини забезпечуються автоматично. Натомість проблема частоти (темпу) збору даних – більш критична. Якщо частота збору даних є меншою, ніж справжня періодичність вказаного рекурентного динамічного процесу, можливості вивести адекватну модель звузяться. Наприклад, якщо в ряду даних значення змінних фіксуються тільки для одного із п’яти кроків вказаного процесу (рис. 3), то не вдасться відтворити спіраль зворотного зв'язку 212 +−− →→→ tttt XZYX . З'являться моментальні (ізохронні) зв'язки. Як правило, за умовчанням вважається, що вимірювання значень даних відбувається «миттєво». Якщо маємо швидкий неперервний процес з дійсними змінними (коли dtdx / сягає великих значень), а вимірювальний прилад фіксує якесь «середнє» значення змінної x за кінцевий інтервал часу t , то такі дані можуть спричинити викривлення моделі. 3 Каузальність та марковські властивості у векторних часових рядах Серед відомих підходів та методів аналізу часових рядів даних, мабуть, найбільшого поширення набула техніка векторної авторегресії [9, 10]. З економетрики ці методи розповсюдилися на інші сфери, зокрема, експериментальну біологію. В моделях авторегресії, як і в каузальних мережах, поведінка системи описується за допомогою прямих зв'язків між компонентами. Такі моделі формально відповідають рекурентному процесу. Одна з перших концепцій каузальності була запропонована К. Грейнджером (Granger C.W.J.) [16–18]. (Строго кажучи, первинно була сформульована концепція «не-каузальності», і вже як комплементарне з'явилося поняття каузальності.) Концепція каузальності за Грейнджером походить від традиційних уявлень, які були поширені в соціології та економетриці першої половини 20-го століття. Початкова ідея проста: для того, щоб відповісти на питання, чи є змінна X причиною для Y , треба знайти всі змінні, які (можливо) впливають на Y . Тоді «фіксація» значень всіх цих змінних, разом із змінною X , мусить призвести до того, що Y обернеться на константу. Змінюємо умови цього уявного експерименту: фіксуємо значення всіх вказаних змінних (причин), окрім самої X . Тоді, якщо варіювання X супроводжується варіюванням Y (причому змінна X йде у часі раніше, ніж Y ), то змінна X є причиною для Y . Але накреслену ідею важко провести у житті. Практично неможливо зафіксувати абсолютно всі фактори, які можуть впливати на обрану зміну Y . Тому для практичного виявлення каузальних відношень обирають критерій з менш жорсткими умовами експерименту. Треба зафіксувати тільки ті фактори, які впливають на X та Y паралельно (тобто в умови включають тільки спільні причини змінних X та Y ). Тоді критерієм каузального відношення буде не альтернатива «константність – неконстантність» ефекту Y , а альтернатива «незалежність – залежність» Y від X за обраних умов. Залежність за вказаних умов свідчить, що X є причиною для Y . І цю залежність можна використати для прогнозування. Відштовхнемося від поняття «не-каузальності» за Грейнджером. Грейнджер розглядає задачу прогнозування показника (ефекту) Y й аналізує гіпотетичну причину X з точки зору її інформативності для прогнозу. Задача полягає у прогнозуванні значення показника 1+tY (ефекту, наслідку) на основі наявної інформації. Ясно, що для прогнозу аналітик чи комп'ютер може знати і врахувати тільки інформацію про минуле (включно із найостаннішим, «свіжим»). (Такі умови відрізняють задачу прогнозування від задачі заповнення пропуску в базі даних, яку іноді теж називають «предикція».) Нехай t – вся інформація у світі на момент часу t (принаймні інформація, релевантна одночасно для X та Y ), а tX – значення змінної X в момент часу t . Позначимо через tt X\ інформацію у світі на момент часу t , за виключенням значення tX . Вище аргументовано: якщо X не є причиною для Y , то з врахуванням інформації tt X\ значення 1+tY не залежить від tX . Відтак, прогноз розподілення змінної 1+tY на основі інформації tt X\ не відрізняється від прогнозу на (ефекту, наслідку) на основі наявної інфор- мації. Ясно, що для прогнозу аналітик чи комп’ютер може знати і врахувати тільки інформацію про минуле (включно із найостаннішим, «свіжим»). (Такі умови відрізняють задачу прогнозування від задачі заповнення пропуску в базі даних, яку іноді теж називають «предикція».) Нехай Моделі і засоби систем баз даних та знань Нехай маємо неперервний процес з дійсними змінними; якщо похідні змінних у часі dtdx / мають великі значення, то вимоги до частоти збору даних різко підсилюються. На якісному рівні можна сформулювати наступну, не жорстку, але важливу, вимогу до частоти збору даних. Нехай в системі існують зворотні зв'язки, які функціонують як поширення «сигналу» вздовж відповідних шляхів у структурі моделі. Тоді частота (темп) збору даних має бути такою, щоб зафіксувати проміжні фази поширення сигналу вздовж шляху кожного зворотного зв'язку. Тоді зворотні зв'язки будуть відображені в моделі у вигляді спіралі (а не у вигляді циклону). Проілюструємо вищеозначені горизонти (масштаби) довжини рядів даних. На рис. 3 зображено схему рекурентного динамічного процесу, який генерується згідно моделі векторної авторегресії. В цій моделі найдовший безпосередній каузальний зв'язок має лаг 2; це зв'язок tt XZ →−2 . «Вікно» спостереження (позначене пунктирним квадратом) охоплює три послідовні значення кожної змінної (три кроки). В даному разі таке «вікно» «захоплює» всі безпосередні каузальні зв'язки моделі. Тому, якщо дані спостережень зібрані у форматі такого «вікна», то найближчий горизонт (масштаб) довжини рядів даних забезпечено. Але таке «вікно» не забезпечує 2-кроковий горизонт довжини, бо є ланцюг зв'язків 12 +− →→ ttt WXZ , і для його явної репрезентації потрібні випадки (записи) даних довжиною 4 кроки. Вказане «вікно» довжиною три кроки також не покриває «осциляторного» горизонту довжини для цього часового ряду, бо в системі функціонує зворотний зв'язок, що складається із наступної послідовності безпосередніх каузальних зв'язків: 212 +−− →→→ tttt XZYX . Цей зворотний зв'язок здійснюється за чотири кроки, і щоб наочно побачити його, треба репрезентувати ряд даних довжиною 5 кроків кожної змінної. Зрозуміло, якщо дані зібрано за схемою «довгі ряди даних» (на рис. 1 – справа), то вказані горизонти довжини забезпечуються автоматично. Натомість проблема частоти (темпу) збору даних – більш критична. Якщо частота збору даних є меншою, ніж справжня періодичність вказаного рекурентного динамічного процесу, можливості вивести адекватну модель звузяться. Наприклад, якщо в ряду даних значення змінних фіксуються тільки для одного із п’яти кроків вказаного процесу (рис. 3), то не вдасться відтворити спіраль зворотного зв'язку 212 +−− →→→ tttt XZYX . З'являться моментальні (ізохронні) зв'язки. Як правило, за умовчанням вважається, що вимірювання значень даних відбувається «миттєво». Якщо маємо швидкий неперервний процес з дійсними змінними (коли dtdx / сягає великих значень), а вимірювальний прилад фіксує якесь «середнє» значення змінної x за кінцевий інтервал часу t , то такі дані можуть спричинити викривлення моделі. 3 Каузальність та марковські властивості у векторних часових рядах Серед відомих підходів та методів аналізу часових рядів даних, мабуть, найбільшого поширення набула техніка векторної авторегресії [9, 10]. З економетрики ці методи розповсюдилися на інші сфери, зокрема, експериментальну біологію. В моделях авторегресії, як і в каузальних мережах, поведінка системи описується за допомогою прямих зв'язків між компонентами. Такі моделі формально відповідають рекурентному процесу. Одна з перших концепцій каузальності була запропонована К. Грейнджером (Granger C.W.J.) [16–18]. (Строго кажучи, первинно була сформульована концепція «не-каузальності», і вже як комплементарне з'явилося поняття каузальності.) Концепція каузальності за Грейнджером походить від традиційних уявлень, які були поширені в соціології та економетриці першої половини 20-го століття. Початкова ідея проста: для того, щоб відповісти на питання, чи є змінна X причиною для Y , треба знайти всі змінні, які (можливо) впливають на Y . Тоді «фіксація» значень всіх цих змінних, разом із змінною X , мусить призвести до того, що Y обернеться на константу. Змінюємо умови цього уявного експерименту: фіксуємо значення всіх вказаних змінних (причин), окрім самої X . Тоді, якщо варіювання X супроводжується варіюванням Y (причому змінна X йде у часі раніше, ніж Y ), то змінна X є причиною для Y . Але накреслену ідею важко провести у житті. Практично неможливо зафіксувати абсолютно всі фактори, які можуть впливати на обрану зміну Y . Тому для практичного виявлення каузальних відношень обирають критерій з менш жорсткими умовами експерименту. Треба зафіксувати тільки ті фактори, які впливають на X та Y паралельно (тобто в умови включають тільки спільні причини змінних X та Y ). Тоді критерієм каузального відношення буде не альтернатива «константність – неконстантність» ефекту Y , а альтернатива «незалежність – залежність» Y від X за обраних умов. Залежність за вказаних умов свідчить, що X є причиною для Y . І цю залежність можна використати для прогнозування. Відштовхнемося від поняття «не-каузальності» за Грейнджером. Грейнджер розглядає задачу прогнозування показника (ефекту) Y й аналізує гіпотетичну причину X з точки зору її інформативності для прогнозу. Задача полягає у прогнозуванні значення показника 1+tY (ефекту, наслідку) на основі наявної інформації. Ясно, що для прогнозу аналітик чи комп'ютер може знати і врахувати тільки інформацію про минуле (включно із найостаннішим, «свіжим»). (Такі умови відрізняють задачу прогнозування від задачі заповнення пропуску в базі даних, яку іноді теж називають «предикція».) Нехай t – вся інформація у світі на момент часу t (принаймні інформація, релевантна одночасно для X та Y ), а tX – значення змінної X в момент часу t . Позначимо через tt X\ інформацію у світі на момент часу t , за виключенням значення tX . Вище аргументовано: якщо X не є причиною для Y , то з врахуванням інформації tt X\ значення 1+tY не залежить від tX . Відтак, прогноз розподілення змінної 1+tY на основі інформації tt X\ не відрізняється від прогнозу на – вся інформація у світі на момент часу t (принаймні інформація, релевантна одночасно для X та Y), а Моделі і засоби систем баз даних та знань Нехай маємо неперервний процес з дійсними змінними; якщо похідні змінних у часі dtdx / мають великі значення, то вимоги до частоти збору даних різко підсилюються. На якісному рівні можна сформулювати наступну, не жорстку, але важливу, вимогу до частоти збору даних. Нехай в системі існують зворотні зв'язки, які функціонують як поширення «сигналу» вздовж відповідних шляхів у структурі моделі. Тоді частота (темп) збору даних має бути такою, щоб зафіксувати проміжні фази поширення сигналу вздовж шляху кожного зворотного зв'язку. Тоді зворотні зв'язки будуть відображені в моделі у вигляді спіралі (а не у вигляді циклону). Проілюструємо вищеозначені горизонти (масштаби) довжини рядів даних. На рис. 3 зображено схему рекурентного динамічного процесу, який генерується згідно моделі векторної авторегресії. В цій моделі найдовший безпосередній каузальний зв'язок має лаг 2; це зв'язок tt XZ →−2 . «Вікно» спостереження (позначене пунктирним квадратом) охоплює три послідовні значення кожної змінної (три кроки). В даному разі таке «вікно» «захоплює» всі безпосередні каузальні зв'язки моделі. Тому, якщо дані спостережень зібрані у форматі такого «вікна», то найближчий горизонт (масштаб) довжини рядів даних забезпечено. Але таке «вікно» не забезпечує 2-кроковий горизонт довжини, бо є ланцюг зв'язків 12 +− →→ ttt WXZ , і для його явної репрезентації потрібні випадки (записи) даних довжиною 4 кроки. Вказане «вікно» довжиною три кроки також не покриває «осциляторного» горизонту довжини для цього часового ряду, бо в системі функціонує зворотний зв'язок, що складається із наступної послідовності безпосередніх каузальних зв'язків: 212 +−− →→→ tttt XZYX . Цей зворотний зв'язок здійснюється за чотири кроки, і щоб наочно побачити його, треба репрезентувати ряд даних довжиною 5 кроків кожної змінної. Зрозуміло, якщо дані зібрано за схемою «довгі ряди даних» (на рис. 1 – справа), то вказані горизонти довжини забезпечуються автоматично. Натомість проблема частоти (темпу) збору даних – більш критична. Якщо частота збору даних є меншою, ніж справжня періодичність вказаного рекурентного динамічного процесу, можливості вивести адекватну модель звузяться. Наприклад, якщо в ряду даних значення змінних фіксуються тільки для одного із п’яти кроків вказаного процесу (рис. 3), то не вдасться відтворити спіраль зворотного зв'язку 212 +−− →→→ tttt XZYX . З'являться моментальні (ізохронні) зв'язки. Як правило, за умовчанням вважається, що вимірювання значень даних відбувається «миттєво». Якщо маємо швидкий неперервний процес з дійсними змінними (коли dtdx / сягає великих значень), а вимірювальний прилад фіксує якесь «середнє» значення змінної x за кінцевий інтервал часу t , то такі дані можуть спричинити викривлення моделі. 3 Каузальність та марковські властивості у векторних часових рядах Серед відомих підходів та методів аналізу часових рядів даних, мабуть, найбільшого поширення набула техніка векторної авторегресії [9, 10]. З економетрики ці методи розповсюдилися на інші сфери, зокрема, експериментальну біологію. В моделях авторегресії, як і в каузальних мережах, поведінка системи описується за допомогою прямих зв'язків між компонентами. Такі моделі формально відповідають рекурентному процесу. Одна з перших концепцій каузальності була запропонована К. Грейнджером (Granger C.W.J.) [16–18]. (Строго кажучи, первинно була сформульована концепція «не-каузальності», і вже як комплементарне з'явилося поняття каузальності.) Концепція каузальності за Грейнджером походить від традиційних уявлень, які були поширені в соціології та економетриці першої половини 20-го століття. Початкова ідея проста: для того, щоб відповісти на питання, чи є змінна X причиною для Y , треба знайти всі змінні, які (можливо) впливають на Y . Тоді «фіксація» значень всіх цих змінних, разом із змінною X , мусить призвести до того, що Y обернеться на константу. Змінюємо умови цього уявного експерименту: фіксуємо значення всіх вказаних змінних (причин), окрім самої X . Тоді, якщо варіювання X супроводжується варіюванням Y (причому змінна X йде у часі раніше, ніж Y ), то змінна X є причиною для Y . Але накреслену ідею важко провести у житті. Практично неможливо зафіксувати абсолютно всі фактори, які можуть впливати на обрану зміну Y . Тому для практичного виявлення каузальних відношень обирають критерій з менш жорсткими умовами експерименту. Треба зафіксувати тільки ті фактори, які впливають на X та Y паралельно (тобто в умови включають тільки спільні причини змінних X та Y ). Тоді критерієм каузального відношення буде не альтернатива «константність – неконстантність» ефекту Y , а альтернатива «незалежність – залежність» Y від X за обраних умов. Залежність за вказаних умов свідчить, що X є причиною для Y . І цю залежність можна використати для прогнозування. Відштовхнемося від поняття «не-каузальності» за Грейнджером. Грейнджер розглядає задачу прогнозування показника (ефекту) Y й аналізує гіпотетичну причину X з точки зору її інформативності для прогнозу. Задача полягає у прогнозуванні значення показника 1+tY (ефекту, наслідку) на основі наявної інформації. Ясно, що для прогнозу аналітик чи комп'ютер може знати і врахувати тільки інформацію про минуле (включно із найостаннішим, «свіжим»). (Такі умови відрізняють задачу прогнозування від задачі заповнення пропуску в базі даних, яку іноді теж називають «предикція».) Нехай t – вся інформація у світі на момент часу t (принаймні інформація, релевантна одночасно для X та Y ), а tX – значення змінної X в момент часу t . Позначимо через tt X\ інформацію у світі на момент часу t , за виключенням значення tX . Вище аргументовано: якщо X не є причиною для Y , то з врахуванням інформації tt X\ значення 1+tY не залежить від tX . Відтак, прогноз розподілення змінної 1+tY на основі інформації tt X\ не відрізняється від прогнозу на – значення змінної X в момент часу t. Позначимо через Моделі і засоби систем баз даних та знань Нехай маємо неперервний процес з дійсними змінними; якщо похідні змінних у часі dtdx / мають великі значення, то вимоги до частоти збору даних різко підсилюються. На якісному рівні можна сформулювати наступну, не жорстку, але важливу, вимогу до частоти збору даних. Нехай в системі існують зворотні зв'язки, які функціонують як поширення «сигналу» вздовж відповідних шляхів у структурі моделі. Тоді частота (темп) збору даних має бути такою, щоб зафіксувати проміжні фази поширення сигналу вздовж шляху кожного зворотного зв'язку. Тоді зворотні зв'язки будуть відображені в моделі у вигляді спіралі (а не у вигляді циклону). Проілюструємо вищеозначені горизонти (масштаби) довжини рядів даних. На рис. 3 зображено схему рекурентного динамічного процесу, який генерується згідно моделі векторної авторегресії. В цій моделі найдовший безпосередній каузальний зв'язок має лаг 2; це зв'язок tt XZ →−2 . «Вікно» спостереження (позначене пунктирним квадратом) охоплює три послідовні значення кожної змінної (три кроки). В даному разі таке «вікно» «захоплює» всі безпосередні каузальні зв'язки моделі. Тому, якщо дані спостережень зібрані у форматі такого «вікна», то найближчий горизонт (масштаб) довжини рядів даних забезпечено. Але таке «вікно» не забезпечує 2-кроковий горизонт довжини, бо є ланцюг зв'язків 12 +− →→ ttt WXZ , і для його явної репрезентації потрібні випадки (записи) даних довжиною 4 кроки. Вказане «вікно» довжиною три кроки також не покриває «осциляторного» горизонту довжини для цього часового ряду, бо в системі функціонує зворотний зв'язок, що складається із наступної послідовності безпосередніх каузальних зв'язків: 212 +−− →→→ tttt XZYX . Цей зворотний зв'язок здійснюється за чотири кроки, і щоб наочно побачити його, треба репрезентувати ряд даних довжиною 5 кроків кожної змінної. Зрозуміло, якщо дані зібрано за схемою «довгі ряди даних» (на рис. 1 – справа), то вказані горизонти довжини забезпечуються автоматично. Натомість проблема частоти (темпу) збору даних – більш критична. Якщо частота збору даних є меншою, ніж справжня періодичність вказаного рекурентного динамічного процесу, можливості вивести адекватну модель звузяться. Наприклад, якщо в ряду даних значення змінних фіксуються тільки для одного із п’яти кроків вказаного процесу (рис. 3), то не вдасться відтворити спіраль зворотного зв'язку 212 +−− →→→ tttt XZYX . З'являться моментальні (ізохронні) зв'язки. Як правило, за умовчанням вважається, що вимірювання значень даних відбувається «миттєво». Якщо маємо швидкий неперервний процес з дійсними змінними (коли dtdx / сягає великих значень), а вимірювальний прилад фіксує якесь «середнє» значення змінної x за кінцевий інтервал часу t , то такі дані можуть спричинити викривлення моделі. 3 Каузальність та марковські властивості у векторних часових рядах Серед відомих підходів та методів аналізу часових рядів даних, мабуть, найбільшого поширення набула техніка векторної авторегресії [9, 10]. З економетрики ці методи розповсюдилися на інші сфери, зокрема, експериментальну біологію. В моделях авторегресії, як і в каузальних мережах, поведінка системи описується за допомогою прямих зв'язків між компонентами. Такі моделі формально відповідають рекурентному процесу. Одна з перших концепцій каузальності була запропонована К. Грейнджером (Granger C.W.J.) [16–18]. (Строго кажучи, первинно була сформульована концепція «не-каузальності», і вже як комплементарне з'явилося поняття каузальності.) Концепція каузальності за Грейнджером походить від традиційних уявлень, які були поширені в соціології та економетриці першої половини 20-го століття. Початкова ідея проста: для того, щоб відповісти на питання, чи є змінна X причиною для Y , треба знайти всі змінні, які (можливо) впливають на Y . Тоді «фіксація» значень всіх цих змінних, разом із змінною X , мусить призвести до того, що Y обернеться на константу. Змінюємо умови цього уявного експерименту: фіксуємо значення всіх вказаних змінних (причин), окрім самої X . Тоді, якщо варіювання X супроводжується варіюванням Y (причому змінна X йде у часі раніше, ніж Y ), то змінна X є причиною для Y . Але накреслену ідею важко провести у житті. Практично неможливо зафіксувати абсолютно всі фактори, які можуть впливати на обрану зміну Y . Тому для практичного виявлення каузальних відношень обирають критерій з менш жорсткими умовами експерименту. Треба зафіксувати тільки ті фактори, які впливають на X та Y паралельно (тобто в умови включають тільки спільні причини змінних X та Y ). Тоді критерієм каузального відношення буде не альтернатива «константність – неконстантність» ефекту Y , а альтернатива «незалежність – залежність» Y від X за обраних умов. Залежність за вказаних умов свідчить, що X є причиною для Y . І цю залежність можна використати для прогнозування. Відштовхнемося від поняття «не-каузальності» за Грейнджером. Грейнджер розглядає задачу прогнозування показника (ефекту) Y й аналізує гіпотетичну причину X з точки зору її інформативності для прогнозу. Задача полягає у прогнозуванні значення показника 1+tY (ефекту, наслідку) на основі наявної інформації. Ясно, що для прогнозу аналітик чи комп'ютер може знати і врахувати тільки інформацію про минуле (включно із найостаннішим, «свіжим»). (Такі умови відрізняють задачу прогнозування від задачі заповнення пропуску в базі даних, яку іноді теж називають «предикція».) Нехай t – вся інформація у світі на момент часу t (принаймні інформація, релевантна одночасно для X та Y ), а tX – значення змінної X в момент часу t . Позначимо через tt X\ інформацію у світі на момент часу t , за виключенням значення tX . Вище аргументовано: якщо X не є причиною для Y , то з врахуванням інформації tt X\ значення 1+tY не залежить від tX . Відтак, прогноз розподілення змінної 1+tY на основі інформації tt X\ не відрізняється від прогнозу на інформацію у світі на момент часу t, за виключенням значення Моделі і засоби систем баз даних та знань Нехай маємо неперервний процес з дійсними змінними; якщо похідні змінних у часі dtdx / мають великі значення, то вимоги до частоти збору даних різко підсилюються. На якісному рівні можна сформулювати наступну, не жорстку, але важливу, вимогу до частоти збору даних. Нехай в системі існують зворотні зв'язки, які функціонують як поширення «сигналу» вздовж відповідних шляхів у структурі моделі. Тоді частота (темп) збору даних має бути такою, щоб зафіксувати проміжні фази поширення сигналу вздовж шляху кожного зворотного зв'язку. Тоді зворотні зв'язки будуть відображені в моделі у вигляді спіралі (а не у вигляді циклону). Проілюструємо вищеозначені горизонти (масштаби) довжини рядів даних. На рис. 3 зображено схему рекурентного динамічного процесу, який генерується згідно моделі векторної авторегресії. В цій моделі найдовший безпосередній каузальний зв'язок має лаг 2; це зв'язок tt XZ →−2 . «Вікно» спостереження (позначене пунктирним квадратом) охоплює три послідовні значення кожної змінної (три кроки). В даному разі таке «вікно» «захоплює» всі безпосередні каузальні зв'язки моделі. Тому, якщо дані спостережень зібрані у форматі такого «вікна», то найближчий горизонт (масштаб) довжини рядів даних забезпечено. Але таке «вікно» не забезпечує 2-кроковий горизонт довжини, бо є ланцюг зв'язків 12 +− →→ ttt WXZ , і для його явної репрезентації потрібні випадки (записи) даних довжиною 4 кроки. Вказане «вікно» довжиною три кроки також не покриває «осциляторного» горизонту довжини для цього часового ряду, бо в системі функціонує зворотний зв'язок, що складається із наступної послідовності безпосередніх каузальних зв'язків: 212 +−− →→→ tttt XZYX . Цей зворотний зв'язок здійснюється за чотири кроки, і щоб наочно побачити його, треба репрезентувати ряд даних довжиною 5 кроків кожної змінної. Зрозуміло, якщо дані зібрано за схемою «довгі ряди даних» (на рис. 1 – справа), то вказані горизонти довжини забезпечуються автоматично. Натомість проблема частоти (темпу) збору даних – більш критична. Якщо частота збору даних є меншою, ніж справжня періодичність вказаного рекурентного динамічного процесу, можливості вивести адекватну модель звузяться. Наприклад, якщо в ряду даних значення змінних фіксуються тільки для одного із п’яти кроків вказаного процесу (рис. 3), то не вдасться відтворити спіраль зворотного зв'язку 212 +−− →→→ tttt XZYX . З'являться моментальні (ізохронні) зв'язки. Як правило, за умовчанням вважається, що вимірювання значень даних відбувається «миттєво». Якщо маємо швидкий неперервний процес з дійсними змінними (коли dtdx / сягає великих значень), а вимірювальний прилад фіксує якесь «середнє» значення змінної x за кінцевий інтервал часу t , то такі дані можуть спричинити викривлення моделі. 3 Каузальність та марковські властивості у векторних часових рядах Серед відомих підходів та методів аналізу часових рядів даних, мабуть, найбільшого поширення набула техніка векторної авторегресії [9, 10]. З економетрики ці методи розповсюдилися на інші сфери, зокрема, експериментальну біологію. В моделях авторегресії, як і в каузальних мережах, поведінка системи описується за допомогою прямих зв'язків між компонентами. Такі моделі формально відповідають рекурентному процесу. Одна з перших концепцій каузальності була запропонована К. Грейнджером (Granger C.W.J.) [16–18]. (Строго кажучи, первинно була сформульована концепція «не-каузальності», і вже як комплементарне з'явилося поняття каузальності.) Концепція каузальності за Грейнджером походить від традиційних уявлень, які були поширені в соціології та економетриці першої половини 20-го століття. Початкова ідея проста: для того, щоб відповісти на питання, чи є змінна X причиною для Y , треба знайти всі змінні, які (можливо) впливають на Y . Тоді «фіксація» значень всіх цих змінних, разом із змінною X , мусить призвести до того, що Y обернеться на константу. Змінюємо умови цього уявного експерименту: фіксуємо значення всіх вказаних змінних (причин), окрім самої X . Тоді, якщо варіювання X супроводжується варіюванням Y (причому змінна X йде у часі раніше, ніж Y ), то змінна X є причиною для Y . Але накреслену ідею важко провести у житті. Практично неможливо зафіксувати абсолютно всі фактори, які можуть впливати на обрану зміну Y . Тому для практичного виявлення каузальних відношень обирають критерій з менш жорсткими умовами експерименту. Треба зафіксувати тільки ті фактори, які впливають на X та Y паралельно (тобто в умови включають тільки спільні причини змінних X та Y ). Тоді критерієм каузального відношення буде не альтернатива «константність – неконстантність» ефекту Y , а альтернатива «незалежність – залежність» Y від X за обраних умов. Залежність за вказаних умов свідчить, що X є причиною для Y . І цю залежність можна використати для прогнозування. Відштовхнемося від поняття «не-каузальності» за Грейнджером. Грейнджер розглядає задачу прогнозування показника (ефекту) Y й аналізує гіпотетичну причину X з точки зору її інформативності для прогнозу. Задача полягає у прогнозуванні значення показника 1+tY (ефекту, наслідку) на основі наявної інформації. Ясно, що для прогнозу аналітик чи комп'ютер може знати і врахувати тільки інформацію про минуле (включно із найостаннішим, «свіжим»). (Такі умови відрізняють задачу прогнозування від задачі заповнення пропуску в базі даних, яку іноді теж називають «предикція».) Нехай t – вся інформація у світі на момент часу t (принаймні інформація, релевантна одночасно для X та Y ), а tX – значення змінної X в момент часу t . Позначимо через tt X\ інформацію у світі на момент часу t , за виключенням значення tX . Вище аргументовано: якщо X не є причиною для Y , то з врахуванням інформації tt X\ значення 1+tY не залежить від tX . Відтак, прогноз розподілення змінної 1+tY на основі інформації tt X\ не відрізняється від прогнозу на . Вище аргумен- товано: якщо X не є причиною для Y, то з врахуванням інформації Моделі і засоби систем баз даних та знань Нехай маємо неперервний процес з дійсними змінними; якщо похідні змінних у часі dtdx / мають великі значення, то вимоги до частоти збору даних різко підсилюються. На якісному рівні можна сформулювати наступну, не жорстку, але важливу, вимогу до частоти збору даних. Нехай в системі існують зворотні зв'язки, які функціонують як поширення «сигналу» вздовж відповідних шляхів у структурі моделі. Тоді частота (темп) збору даних має бути такою, щоб зафіксувати проміжні фази поширення сигналу вздовж шляху кожного зворотного зв'язку. Тоді зворотні зв'язки будуть відображені в моделі у вигляді спіралі (а не у вигляді циклону). Проілюструємо вищеозначені горизонти (масштаби) довжини рядів даних. На рис. 3 зображено схему рекурентного динамічного процесу, який генерується згідно моделі векторної авторегресії. В цій моделі найдовший безпосередній каузальний зв'язок має лаг 2; це зв'язок tt XZ →−2 . «Вікно» спостереження (позначене пунктирним квадратом) охоплює три послідовні значення кожної змінної (три кроки). В даному разі таке «вікно» «захоплює» всі безпосередні каузальні зв'язки моделі. Тому, якщо дані спостережень зібрані у форматі такого «вікна», то найближчий горизонт (масштаб) довжини рядів даних забезпечено. Але таке «вікно» не забезпечує 2-кроковий горизонт довжини, бо є ланцюг зв'язків 12 +− →→ ttt WXZ , і для його явної репрезентації потрібні випадки (записи) даних довжиною 4 кроки. Вказане «вікно» довжиною три кроки також не покриває «осциляторного» горизонту довжини для цього часового ряду, бо в системі функціонує зворотний зв'язок, що складається із наступної послідовності безпосередніх каузальних зв'язків: 212 +−− →→→ tttt XZYX . Цей зворотний зв'язок здійснюється за чотири кроки, і щоб наочно побачити його, треба репрезентувати ряд даних довжиною 5 кроків кожної змінної. Зрозуміло, якщо дані зібрано за схемою «довгі ряди даних» (на рис. 1 – справа), то вказані горизонти довжини забезпечуються автоматично. Натомість проблема частоти (темпу) збору даних – більш критична. Якщо частота збору даних є меншою, ніж справжня періодичність вказаного рекурентного динамічного процесу, можливості вивести адекватну модель звузяться. Наприклад, якщо в ряду даних значення змінних фіксуються тільки для одного із п’яти кроків вказаного процесу (рис. 3), то не вдасться відтворити спіраль зворотного зв'язку 212 +−− →→→ tttt XZYX . З'являться моментальні (ізохронні) зв'язки. Як правило, за умовчанням вважається, що вимірювання значень даних відбувається «миттєво». Якщо маємо швидкий неперервний процес з дійсними змінними (коли dtdx / сягає великих значень), а вимірювальний прилад фіксує якесь «середнє» значення змінної x за кінцевий інтервал часу t , то такі дані можуть спричинити викривлення моделі. 3 Каузальність та марковські властивості у векторних часових рядах Серед відомих підходів та методів аналізу часових рядів даних, мабуть, найбільшого поширення набула техніка векторної авторегресії [9, 10]. З економетрики ці методи розповсюдилися на інші сфери, зокрема, експериментальну біологію. В моделях авторегресії, як і в каузальних мережах, поведінка системи описується за допомогою прямих зв'язків між компонентами. Такі моделі формально відповідають рекурентному процесу. Одна з перших концепцій каузальності була запропонована К. Грейнджером (Granger C.W.J.) [16–18]. (Строго кажучи, первинно була сформульована концепція «не-каузальності», і вже як комплементарне з'явилося поняття каузальності.) Концепція каузальності за Грейнджером походить від традиційних уявлень, які були поширені в соціології та економетриці першої половини 20-го століття. Початкова ідея проста: для того, щоб відповісти на питання, чи є змінна X причиною для Y , треба знайти всі змінні, які (можливо) впливають на Y . Тоді «фіксація» значень всіх цих змінних, разом із змінною X , мусить призвести до того, що Y обернеться на константу. Змінюємо умови цього уявного експерименту: фіксуємо значення всіх вказаних змінних (причин), окрім самої X . Тоді, якщо варіювання X супроводжується варіюванням Y (причому змінна X йде у часі раніше, ніж Y ), то змінна X є причиною для Y . Але накреслену ідею важко провести у житті. Практично неможливо зафіксувати абсолютно всі фактори, які можуть впливати на обрану зміну Y . Тому для практичного виявлення каузальних відношень обирають критерій з менш жорсткими умовами експерименту. Треба зафіксувати тільки ті фактори, які впливають на X та Y паралельно (тобто в умови включають тільки спільні причини змінних X та Y ). Тоді критерієм каузального відношення буде не альтернатива «константність – неконстантність» ефекту Y , а альтернатива «незалежність – залежність» Y від X за обраних умов. Залежність за вказаних умов свідчить, що X є причиною для Y . І цю залежність можна використати для прогнозування. Відштовхнемося від поняття «не-каузальності» за Грейнджером. Грейнджер розглядає задачу прогнозування показника (ефекту) Y й аналізує гіпотетичну причину X з точки зору її інформативності для прогнозу. Задача полягає у прогнозуванні значення показника 1+tY (ефекту, наслідку) на основі наявної інформації. Ясно, що для прогнозу аналітик чи комп'ютер може знати і врахувати тільки інформацію про минуле (включно із найостаннішим, «свіжим»). (Такі умови відрізняють задачу прогнозування від задачі заповнення пропуску в базі даних, яку іноді теж називають «предикція».) Нехай t – вся інформація у світі на момент часу t (принаймні інформація, релевантна одночасно для X та Y ), а tX – значення змінної X в момент часу t . Позначимо через tt X\ інформацію у світі на момент часу t , за виключенням значення tX . Вище аргументовано: якщо X не є причиною для Y , то з врахуванням інформації tt X\ значення 1+tY не залежить від tX . Відтак, прогноз розподілення змінної 1+tY на основі інформації tt X\ не відрізняється від прогнозу на значення Моделі і засоби систем баз даних та знань Нехай маємо неперервний процес з дійсними змінними; якщо похідні змінних у часі dtdx / мають великі значення, то вимоги до частоти збору даних різко підсилюються. На якісному рівні можна сформулювати наступну, не жорстку, але важливу, вимогу до частоти збору даних. Нехай в системі існують зворотні зв'язки, які функціонують як поширення «сигналу» вздовж відповідних шляхів у структурі моделі. Тоді частота (темп) збору даних має бути такою, щоб зафіксувати проміжні фази поширення сигналу вздовж шляху кожного зворотного зв'язку. Тоді зворотні зв'язки будуть відображені в моделі у вигляді спіралі (а не у вигляді циклону). Проілюструємо вищеозначені горизонти (масштаби) довжини рядів даних. На рис. 3 зображено схему рекурентного динамічного процесу, який генерується згідно моделі векторної авторегресії. В цій моделі найдовший безпосередній каузальний зв'язок має лаг 2; це зв'язок tt XZ →−2 . «Вікно» спостереження (позначене пунктирним квадратом) охоплює три послідовні значення кожної змінної (три кроки). В даному разі таке «вікно» «захоплює» всі безпосередні каузальні зв'язки моделі. Тому, якщо дані спостережень зібрані у форматі такого «вікна», то найближчий горизонт (масштаб) довжини рядів даних забезпечено. Але таке «вікно» не забезпечує 2-кроковий горизонт довжини, бо є ланцюг зв'язків 12 +− →→ ttt WXZ , і для його явної репрезентації потрібні випадки (записи) даних довжиною 4 кроки. Вказане «вікно» довжиною три кроки також не покриває «осциляторного» горизонту довжини для цього часового ряду, бо в системі функціонує зворотний зв'язок, що складається із наступної послідовності безпосередніх каузальних зв'язків: 212 +−− →→→ tttt XZYX . Цей зворотний зв'язок здійснюється за чотири кроки, і щоб наочно побачити його, треба репрезентувати ряд даних довжиною 5 кроків кожної змінної. Зрозуміло, якщо дані зібрано за схемою «довгі ряди даних» (на рис. 1 – справа), то вказані горизонти довжини забезпечуються автоматично. Натомість проблема частоти (темпу) збору даних – більш критична. Якщо частота збору даних є меншою, ніж справжня періодичність вказаного рекурентного динамічного процесу, можливості вивести адекватну модель звузяться. Наприклад, якщо в ряду даних значення змінних фіксуються тільки для одного із п’яти кроків вказаного процесу (рис. 3), то не вдасться відтворити спіраль зворотного зв'язку 212 +−− →→→ tttt XZYX . З'являться моментальні (ізохронні) зв'язки. Як правило, за умовчанням вважається, що вимірювання значень даних відбувається «миттєво». Якщо маємо швидкий неперервний процес з дійсними змінними (коли dtdx / сягає великих значень), а вимірювальний прилад фіксує якесь «середнє» значення змінної x за кінцевий інтервал часу t , то такі дані можуть спричинити викривлення моделі. 3 Каузальність та марковські властивості у векторних часових рядах Серед відомих підходів та методів аналізу часових рядів даних, мабуть, найбільшого поширення набула техніка векторної авторегресії [9, 10]. З економетрики ці методи розповсюдилися на інші сфери, зокрема, експериментальну біологію. В моделях авторегресії, як і в каузальних мережах, поведінка системи описується за допомогою прямих зв'язків між компонентами. Такі моделі формально відповідають рекурентному процесу. Одна з перших концепцій каузальності була запропонована К. Грейнджером (Granger C.W.J.) [16–18]. (Строго кажучи, первинно була сформульована концепція «не-каузальності», і вже як комплементарне з'явилося поняття каузальності.) Концепція каузальності за Грейнджером походить від традиційних уявлень, які були поширені в соціології та економетриці першої половини 20-го століття. Початкова ідея проста: для того, щоб відповісти на питання, чи є змінна X причиною для Y , треба знайти всі змінні, які (можливо) впливають на Y . Тоді «фіксація» значень всіх цих змінних, разом із змінною X , мусить призвести до того, що Y обернеться на константу. Змінюємо умови цього уявного експерименту: фіксуємо значення всіх вказаних змінних (причин), окрім самої X . Тоді, якщо варіювання X супроводжується варіюванням Y (причому змінна X йде у часі раніше, ніж Y ), то змінна X є причиною для Y . Але накреслену ідею важко провести у житті. Практично неможливо зафіксувати абсолютно всі фактори, які можуть впливати на обрану зміну Y . Тому для практичного виявлення каузальних відношень обирають критерій з менш жорсткими умовами експерименту. Треба зафіксувати тільки ті фактори, які впливають на X та Y паралельно (тобто в умови включають тільки спільні причини змінних X та Y ). Тоді критерієм каузального відношення буде не альтернатива «константність – неконстантність» ефекту Y , а альтернатива «незалежність – залежність» Y від X за обраних умов. Залежність за вказаних умов свідчить, що X є причиною для Y . І цю залежність можна використати для прогнозування. Відштовхнемося від поняття «не-каузальності» за Грейнджером. Грейнджер розглядає задачу прогнозування показника (ефекту) Y й аналізує гіпотетичну причину X з точки зору її інформативності для прогнозу. Задача полягає у прогнозуванні значення показника 1+tY (ефекту, наслідку) на основі наявної інформації. Ясно, що для прогнозу аналітик чи комп'ютер може знати і врахувати тільки інформацію про минуле (включно із найостаннішим, «свіжим»). (Такі умови відрізняють задачу прогнозування від задачі заповнення пропуску в базі даних, яку іноді теж називають «предикція».) Нехай t – вся інформація у світі на момент часу t (принаймні інформація, релевантна одночасно для X та Y ), а tX – значення змінної X в момент часу t . Позначимо через tt X\ інформацію у світі на момент часу t , за виключенням значення tX . Вище аргументовано: якщо X не є причиною для Y , то з врахуванням інформації tt X\ значення 1+tY не залежить від tX . Відтак, прогноз розподілення змінної 1+tY на основі інформації tt X\ не відрізняється від прогнозу на не залежить від Моделі і засоби систем баз даних та знань Нехай маємо неперервний процес з дійсними змінними; якщо похідні змінних у часі dtdx / мають великі значення, то вимоги до частоти збору даних різко підсилюються. На якісному рівні можна сформулювати наступну, не жорстку, але важливу, вимогу до частоти збору даних. Нехай в системі існують зворотні зв'язки, які функціонують як поширення «сигналу» вздовж відповідних шляхів у структурі моделі. Тоді частота (темп) збору даних має бути такою, щоб зафіксувати проміжні фази поширення сигналу вздовж шляху кожного зворотного зв'язку. Тоді зворотні зв'язки будуть відображені в моделі у вигляді спіралі (а не у вигляді циклону). Проілюструємо вищеозначені горизонти (масштаби) довжини рядів даних. На рис. 3 зображено схему рекурентного динамічного процесу, який генерується згідно моделі векторної авторегресії. В цій моделі найдовший безпосередній каузальний зв'язок має лаг 2; це зв'язок tt XZ →−2 . «Вікно» спостереження (позначене пунктирним квадратом) охоплює три послідовні значення кожної змінної (три кроки). В даному разі таке «вікно» «захоплює» всі безпосередні каузальні зв'язки моделі. Тому, якщо дані спостережень зібрані у форматі такого «вікна», то найближчий горизонт (масштаб) довжини рядів даних забезпечено. Але таке «вікно» не забезпечує 2-кроковий горизонт довжини, бо є ланцюг зв'язків 12 +− →→ ttt WXZ , і для його явної репрезентації потрібні випадки (записи) даних довжиною 4 кроки. Вказане «вікно» довжиною три кроки також не покриває «осциляторного» горизонту довжини для цього часового ряду, бо в системі функціонує зворотний зв'язок, що складається із наступної послідовності безпосередніх каузальних зв'язків: 212 +−− →→→ tttt XZYX . Цей зворотний зв'язок здійснюється за чотири кроки, і щоб наочно побачити його, треба репрезентувати ряд даних довжиною 5 кроків кожної змінної. Зрозуміло, якщо дані зібрано за схемою «довгі ряди даних» (на рис. 1 – справа), то вказані горизонти довжини забезпечуються автоматично. Натомість проблема частоти (темпу) збору даних – більш критична. Якщо частота збору даних є меншою, ніж справжня періодичність вказаного рекурентного динамічного процесу, можливості вивести адекватну модель звузяться. Наприклад, якщо в ряду даних значення змінних фіксуються тільки для одного із п’яти кроків вказаного процесу (рис. 3), то не вдасться відтворити спіраль зворотного зв'язку 212 +−− →→→ tttt XZYX . З'являться моментальні (ізохронні) зв'язки. Як правило, за умовчанням вважається, що вимірювання значень даних відбувається «миттєво». Якщо маємо швидкий неперервний процес з дійсними змінними (коли dtdx / сягає великих значень), а вимірювальний прилад фіксує якесь «середнє» значення змінної x за кінцевий інтервал часу t , то такі дані можуть спричинити викривлення моделі. 3 Каузальність та марковські властивості у векторних часових рядах Серед відомих підходів та методів аналізу часових рядів даних, мабуть, найбільшого поширення набула техніка векторної авторегресії [9, 10]. З економетрики ці методи розповсюдилися на інші сфери, зокрема, експериментальну біологію. В моделях авторегресії, як і в каузальних мережах, поведінка системи описується за допомогою прямих зв'язків між компонентами. Такі моделі формально відповідають рекурентному процесу. Одна з перших концепцій каузальності була запропонована К. Грейнджером (Granger C.W.J.) [16–18]. (Строго кажучи, первинно була сформульована концепція «не-каузальності», і вже як комплементарне з'явилося поняття каузальності.) Концепція каузальності за Грейнджером походить від традиційних уявлень, які були поширені в соціології та економетриці першої половини 20-го століття. Початкова ідея проста: для того, щоб відповісти на питання, чи є змінна X причиною для Y , треба знайти всі змінні, які (можливо) впливають на Y . Тоді «фіксація» значень всіх цих змінних, разом із змінною X , мусить призвести до того, що Y обернеться на константу. Змінюємо умови цього уявного експерименту: фіксуємо значення всіх вказаних змінних (причин), окрім самої X . Тоді, якщо варіювання X супроводжується варіюванням Y (причому змінна X йде у часі раніше, ніж Y ), то змінна X є причиною для Y . Але накреслену ідею важко провести у житті. Практично неможливо зафіксувати абсолютно всі фактори, які можуть впливати на обрану зміну Y . Тому для практичного виявлення каузальних відношень обирають критерій з менш жорсткими умовами експерименту. Треба зафіксувати тільки ті фактори, які впливають на X та Y паралельно (тобто в умови включають тільки спільні причини змінних X та Y ). Тоді критерієм каузального відношення буде не альтернатива «константність – неконстантність» ефекту Y , а альтернатива «незалежність – залежність» Y від X за обраних умов. Залежність за вказаних умов свідчить, що X є причиною для Y . І цю залежність можна використати для прогнозування. Відштовхнемося від поняття «не-каузальності» за Грейнджером. Грейнджер розглядає задачу прогнозування показника (ефекту) Y й аналізує гіпотетичну причину X з точки зору її інформативності для прогнозу. Задача полягає у прогнозуванні значення показника 1+tY (ефекту, наслідку) на основі наявної інформації. Ясно, що для прогнозу аналітик чи комп'ютер може знати і врахувати тільки інформацію про минуле (включно із найостаннішим, «свіжим»). (Такі умови відрізняють задачу прогнозування від задачі заповнення пропуску в базі даних, яку іноді теж називають «предикція».) Нехай t – вся інформація у світі на момент часу t (принаймні інформація, релевантна одночасно для X та Y ), а tX – значення змінної X в момент часу t . Позначимо через tt X\ інформацію у світі на момент часу t , за виключенням значення tX . Вище аргументовано: якщо X не є причиною для Y , то з врахуванням інформації tt X\ значення 1+tY не залежить від tX . Відтак, прогноз розподілення змінної 1+tY на основі інформації tt X\ не відрізняється від прогнозу на . Відтак, прогноз розподілення змінної Моделі і засоби систем баз даних та знань Нехай маємо неперервний процес з дійсними змінними; якщо похідні змінних у часі dtdx / мають великі значення, то вимоги до частоти збору даних різко підсилюються. На якісному рівні можна сформулювати наступну, не жорстку, але важливу, вимогу до частоти збору даних. Нехай в системі існують зворотні зв'язки, які функціонують як поширення «сигналу» вздовж відповідних шляхів у структурі моделі. Тоді частота (темп) збору даних має бути такою, щоб зафіксувати проміжні фази поширення сигналу вздовж шляху кожного зворотного зв'язку. Тоді зворотні зв'язки будуть відображені в моделі у вигляді спіралі (а не у вигляді циклону). Проілюструємо вищеозначені горизонти (масштаби) довжини рядів даних. На рис. 3 зображено схему рекурентного динамічного процесу, який генерується згідно моделі векторної авторегресії. В цій моделі найдовший безпосередній каузальний зв'язок має лаг 2; це зв'язок tt XZ →−2 . «Вікно» спостереження (позначене пунктирним квадратом) охоплює три послідовні значення кожної змінної (три кроки). В даному разі таке «вікно» «захоплює» всі безпосередні каузальні зв'язки моделі. Тому, якщо дані спостережень зібрані у форматі такого «вікна», то найближчий горизонт (масштаб) довжини рядів даних забезпечено. Але таке «вікно» не забезпечує 2-кроковий горизонт довжини, бо є ланцюг зв'язків 12 +− →→ ttt WXZ , і для його явної репрезентації потрібні випадки (записи) даних довжиною 4 кроки. Вказане «вікно» довжиною три кроки також не покриває «осциляторного» горизонту довжини для цього часового ряду, бо в системі функціонує зворотний зв'язок, що складається із наступної послідовності безпосередніх каузальних зв'язків: 212 +−− →→→ tttt XZYX . Цей зворотний зв'язок здійснюється за чотири кроки, і щоб наочно побачити його, треба репрезентувати ряд даних довжиною 5 кроків кожної змінної. Зрозуміло, якщо дані зібрано за схемою «довгі ряди даних» (на рис. 1 – справа), то вказані горизонти довжини забезпечуються автоматично. Натомість проблема частоти (темпу) збору даних – більш критична. Якщо частота збору даних є меншою, ніж справжня періодичність вказаного рекурентного динамічного процесу, можливості вивести адекватну модель звузяться. Наприклад, якщо в ряду даних значення змінних фіксуються тільки для одного із п’яти кроків вказаного процесу (рис. 3), то не вдасться відтворити спіраль зворотного зв'язку 212 +−− →→→ tttt XZYX . З'являться моментальні (ізохронні) зв'язки. Як правило, за умовчанням вважається, що вимірювання значень даних відбувається «миттєво». Якщо маємо швидкий неперервний процес з дійсними змінними (коли dtdx / сягає великих значень), а вимірювальний прилад фіксує якесь «середнє» значення змінної x за кінцевий інтервал часу t , то такі дані можуть спричинити викривлення моделі. 3 Каузальність та марковські властивості у векторних часових рядах Серед відомих підходів та методів аналізу часових рядів даних, мабуть, найбільшого поширення набула техніка векторної авторегресії [9, 10]. З економетрики ці методи розповсюдилися на інші сфери, зокрема, експериментальну біологію. В моделях авторегресії, як і в каузальних мережах, поведінка системи описується за допомогою прямих зв'язків між компонентами. Такі моделі формально відповідають рекурентному процесу. Одна з перших концепцій каузальності була запропонована К. Грейнджером (Granger C.W.J.) [16–18]. (Строго кажучи, первинно була сформульована концепція «не-каузальності», і вже як комплементарне з'явилося поняття каузальності.) Концепція каузальності за Грейнджером походить від традиційних уявлень, які були поширені в соціології та економетриці першої половини 20-го століття. Початкова ідея проста: для того, щоб відповісти на питання, чи є змінна X причиною для Y , треба знайти всі змінні, які (можливо) впливають на Y . Тоді «фіксація» значень всіх цих змінних, разом із змінною X , мусить призвести до того, що Y обернеться на константу. Змінюємо умови цього уявного експерименту: фіксуємо значення всіх вказаних змінних (причин), окрім самої X . Тоді, якщо варіювання X супроводжується варіюванням Y (причому змінна X йде у часі раніше, ніж Y ), то змінна X є причиною для Y . Але накреслену ідею важко провести у житті. Практично неможливо зафіксувати абсолютно всі фактори, які можуть впливати на обрану зміну Y . Тому для практичного виявлення каузальних відношень обирають критерій з менш жорсткими умовами експерименту. Треба зафіксувати тільки ті фактори, які впливають на X та Y паралельно (тобто в умови включають тільки спільні причини змінних X та Y ). Тоді критерієм каузального відношення буде не альтернатива «константність – неконстантність» ефекту Y , а альтернатива «незалежність – залежність» Y від X за обраних умов. Залежність за вказаних умов свідчить, що X є причиною для Y . І цю залежність можна використати для прогнозування. Відштовхнемося від поняття «не-каузальності» за Грейнджером. Грейнджер розглядає задачу прогнозування показника (ефекту) Y й аналізує гіпотетичну причину X з точки зору її інформативності для прогнозу. Задача полягає у прогнозуванні значення показника 1+tY (ефекту, наслідку) на основі наявної інформації. Ясно, що для прогнозу аналітик чи комп'ютер може знати і врахувати тільки інформацію про минуле (включно із найостаннішим, «свіжим»). (Такі умови відрізняють задачу прогнозування від задачі заповнення пропуску в базі даних, яку іноді теж називають «предикція».) Нехай t – вся інформація у світі на момент часу t (принаймні інформація, релевантна одночасно для X та Y ), а tX – значення змінної X в момент часу t . Позначимо через tt X\ інформацію у світі на момент часу t , за виключенням значення tX . Вище аргументовано: якщо X не є причиною для Y , то з врахуванням інформації tt X\ значення 1+tY не залежить від tX . Відтак, прогноз розподілення змінної 1+tY на основі інформації tt X\ не відрізняється від прогнозу на на основі інформації Моделі і засоби систем баз даних та знань Нехай маємо неперервний процес з дійсними змінними; якщо похідні змінних у часі dtdx / мають великі значення, то вимоги до частоти збору даних різко підсилюються. На якісному рівні можна сформулювати наступну, не жорстку, але важливу, вимогу до частоти збору даних. Нехай в системі існують зворотні зв'язки, які функціонують як поширення «сигналу» вздовж відповідних шляхів у структурі моделі. Тоді частота (темп) збору даних має бути такою, щоб зафіксувати проміжні фази поширення сигналу вздовж шляху кожного зворотного зв'язку. Тоді зворотні зв'язки будуть відображені в моделі у вигляді спіралі (а не у вигляді циклону). Проілюструємо вищеозначені горизонти (масштаби) довжини рядів даних. На рис. 3 зображено схему рекурентного динамічного процесу, який генерується згідно моделі векторної авторегресії. В цій моделі найдовший безпосередній каузальний зв'язок має лаг 2; це зв'язок tt XZ →−2 . «Вікно» спостереження (позначене пунктирним квадратом) охоплює три послідовні значення кожної змінної (три кроки). В даному разі таке «вікно» «захоплює» всі безпосередні каузальні зв'язки моделі. Тому, якщо дані спостережень зібрані у форматі такого «вікна», то найближчий горизонт (масштаб) довжини рядів даних забезпечено. Але таке «вікно» не забезпечує 2-кроковий горизонт довжини, бо є ланцюг зв'язків 12 +− →→ ttt WXZ , і для його явної репрезентації потрібні випадки (записи) даних довжиною 4 кроки. Вказане «вікно» довжиною три кроки також не покриває «осциляторного» горизонту довжини для цього часового ряду, бо в системі функціонує зворотний зв'язок, що складається із наступної послідовності безпосередніх каузальних зв'язків: 212 +−− →→→ tttt XZYX . Цей зворотний зв'язок здійснюється за чотири кроки, і щоб наочно побачити його, треба репрезентувати ряд даних довжиною 5 кроків кожної змінної. Зрозуміло, якщо дані зібрано за схемою «довгі ряди даних» (на рис. 1 – справа), то вказані горизонти довжини забезпечуються автоматично. Натомість проблема частоти (темпу) збору даних – більш критична. Якщо частота збору даних є меншою, ніж справжня періодичність вказаного рекурентного динамічного процесу, можливості вивести адекватну модель звузяться. Наприклад, якщо в ряду даних значення змінних фіксуються тільки для одного із п’яти кроків вказаного процесу (рис. 3), то не вдасться відтворити спіраль зворотного зв'язку 212 +−− →→→ tttt XZYX . З'являться моментальні (ізохронні) зв'язки. Як правило, за умовчанням вважається, що вимірювання значень даних відбувається «миттєво». Якщо маємо швидкий неперервний процес з дійсними змінними (коли dtdx / сягає великих значень), а вимірювальний прилад фіксує якесь «середнє» значення змінної x за кінцевий інтервал часу t , то такі дані можуть спричинити викривлення моделі. 3 Каузальність та марковські властивості у векторних часових рядах Серед відомих підходів та методів аналізу часових рядів даних, мабуть, найбільшого поширення набула техніка векторної авторегресії [9, 10]. З економетрики ці методи розповсюдилися на інші сфери, зокрема, експериментальну біологію. В моделях авторегресії, як і в каузальних мережах, поведінка системи описується за допомогою прямих зв'язків між компонентами. Такі моделі формально відповідають рекурентному процесу. Одна з перших концепцій каузальності була запропонована К. Грейнджером (Granger C.W.J.) [16–18]. (Строго кажучи, первинно була сформульована концепція «не-каузальності», і вже як комплементарне з'явилося поняття каузальності.) Концепція каузальності за Грейнджером походить від традиційних уявлень, які були поширені в соціології та економетриці першої половини 20-го століття. Початкова ідея проста: для того, щоб відповісти на питання, чи є змінна X причиною для Y , треба знайти всі змінні, які (можливо) впливають на Y . Тоді «фіксація» значень всіх цих змінних, разом із змінною X , мусить призвести до того, що Y обернеться на константу. Змінюємо умови цього уявного експерименту: фіксуємо значення всіх вказаних змінних (причин), окрім самої X . Тоді, якщо варіювання X супроводжується варіюванням Y (причому змінна X йде у часі раніше, ніж Y ), то змінна X є причиною для Y . Але накреслену ідею важко провести у житті. Практично неможливо зафіксувати абсолютно всі фактори, які можуть впливати на обрану зміну Y . Тому для практичного виявлення каузальних відношень обирають критерій з менш жорсткими умовами експерименту. Треба зафіксувати тільки ті фактори, які впливають на X та Y паралельно (тобто в умови включають тільки спільні причини змінних X та Y ). Тоді критерієм каузального відношення буде не альтернатива «константність – неконстантність» ефекту Y , а альтернатива «незалежність – залежність» Y від X за обраних умов. Залежність за вказаних умов свідчить, що X є причиною для Y . І цю залежність можна використати для прогнозування. Відштовхнемося від поняття «не-каузальності» за Грейнджером. Грейнджер розглядає задачу прогнозування показника (ефекту) Y й аналізує гіпотетичну причину X з точки зору її інформативності для прогнозу. Задача полягає у прогнозуванні значення показника 1+tY (ефекту, наслідку) на основі наявної інформації. Ясно, що для прогнозу аналітик чи комп'ютер може знати і врахувати тільки інформацію про минуле (включно із найостаннішим, «свіжим»). (Такі умови відрізняють задачу прогнозування від задачі заповнення пропуску в базі даних, яку іноді теж називають «предикція».) Нехай t – вся інформація у світі на момент часу t (принаймні інформація, релевантна одночасно для X та Y ), а tX – значення змінної X в момент часу t . Позначимо через tt X\ інформацію у світі на момент часу t , за виключенням значення tX . Вище аргументовано: якщо X не є причиною для Y , то з врахуванням інформації tt X\ значення 1+tY не залежить від tX . Відтак, прогноз розподілення змінної 1+tY на основі інформації tt X\ не відрізняється від прогнозу на не відрізняється від прогнозу на основі інформації Моделі і засоби систем баз даних та знань [Введите текст] основі інформації t . «Не-причина» не покращує прогнозу наслідку. Формально це виражається як рівність умовних розподілень: )|()\|( 11 ttttt YpXYp = ++ . У більш стандартній формі це записується як ),\|()\|( 11 ttttttt XXYpXYp = ++ . (1) Отже, «не-каузальність» за Грейнджером може бути формалізована як умовна незалежність прогнозу від «не-причини» за умови врахування причин (релевантної інформації). Далі, поняття каузальності (за Грейнджером) формально з'являється як констатація не виконання рівності (1), тобто як констатація порушення цієї умовної незалежності. Змістовно, каузальність змінної X для наслідку Y (за Грейнджером) означає, що X несе «незамінну» інформацію для прогнозу наслідку Y . Проблема в тому, що факт цієї «незамінності» важко встановити. Вся релевантна інформація t у світі практично недоступна, і навіть не можна бути впевненим, що вдалося знайти всі можливі спільні причини для X та Y . Тому неможливо надійно перевірити чинність рівняння (1). Припустимо, аналітик здійснив перевірку сурогату рівняння (1) з використанням неповної інформації t . Тоді, якщо встановлено, що сурогат рівності (1) виконується, то висновок про відсутність каузального зв'язку між X та Y буде коректним. Натомість якщо встановлено, що сурогат рівності (1) не виконується, то висновок про каузальний зв'язок між X та Y правдоподібно може бути некоректним. Отже, концепції каузальності та не-каузальності (за Грейнджером) – несиметричні. Повернемося до цього пункту згодом. А зараз коротко розглянемо роль апарату умовної незалежності в динамічних і каузальних моделях. Класичне визначення марковської властивості встановлено для марковських ланцюгів. Але апарат марковських ланцюгів не є продуктивним для задачі виведення структур моделей (через абстрактність поняття стану). Важливою віхою досліджень в потрібному напрямку стала робота [12], яка адаптувала класичну теорію марковських процесів до реалістичної проблематики каузального моделювання. Замість «унітарного» марковского процесу аналізується система підпроцесів, що взаємодіють. Нехай структура авторегресійного процесу невідома. Для спрощення приймемо, що всі зовнішні фактори (тобто змінні поза набором X , Y , Z , W ) є взаємно незалежними, і кожний з них впливає на одну спостережувану змінну. Тоді наївний спосіб застосувати концепцію каузальності (за Грейнджером) для тестування гіпотетичного каузального зв'язку tt XW →−1 зведеться до перевірки виконання формули ),|()|( 1__ −= ttttt WXpXp , (2) де = t_  121012101210210 ,,..,,,,,..,,,,,..,,,,..,, −−−−−−− ttttttt ZZZZYYYYXXXXWWW . Набір умов t_ охоплює все минуле рядів X , Y , Z , W , за виключенням 1−tW (попереднього стану підпроцесу W ). Зрозуміло, що виконати перевірку рівності у подібному форматі практично неможливо. Для надійної оцінки умовної ймовірності з такою складною умовою потрібно мати величезний обсяг даних, а власне обчислення буде дуже важким. Потрібен акуратний й ефективний апарат аналізу даних, а також апарат аналізу графової структури темпоральної моделі. Принципова вразливість концепції каузальності Грейнджера полягає в тому, що вона залишає невизначеним, який прогноз мається на увазі – пасивний чи активний (ефект втручання). В класичних («статичних») каузальних мережах успішно застосовується поняття умовної незалежності та відповідний конструктивний критерій d -сепарації [3, 4, 7]. Як перенести цей апарат в контекст векторних часових рядів, де маємо довгі паралельні серії змінних? Приміром, якщо поглянути на векторний авторегресійний процес, зображений на рис. 3, то зрозуміло, що всі ряди основних змінних ( X , Y , Z , W ) є взаємозалежними. Але ці ряди відіграють різну роль в системі каузальних впливів. Зокрема, очевидно, що ряд W не впливає на інші ряди, але безпосередньо залежить тільки від ряду X . Щоб аналізувати структуру каузальних зв'язків між компонентами процесу, необхідно розглядати умовну незалежність у відповідному часовому форматі. Для векторних часових рядів функція сепарації полягає у тому, щоб акуратно «перерізати» паралельні серії змінних у відповідних фазах. Тобто конструктивний темпоральний критерій сепарації має залучати змінні, що знаходяться на коректно обраному «часовому фронті». Умовну незалежність «фронтового» типу в динамічних моделях називають «локальна незалежність». Припустимо, що в рекурентному процесі немає моментальних (ізохронних) зв'язків (вигляду tt RV → ), і що максимальний лаг автокореляційних зв'язків (вигляду tjt VV →− ) дорівнює m . Нехай треба перевірити факт, що ряд змінних W не впливає на ряд X . Нехай відомо, що немає жодного «третього» ряду, який впливає паралельно на ряди X та W . Спочатку хочемо перевірити, що ряд W не впливає на ряд X з лагом 1. Для того, щоб отримати остаточну позитивну або негативну відповідь на це питання, треба аналізувати умовну залежність між tX та 1−tW за кондиціонування змінних 11,.., −−− mtt XX , 22 ,.., −−− mtt WW . Якщо ця умовна залежність встановлена, то зв'язок tt XW →−1 присутній, інакше – відсутній. Наступним кроком можна тестувати факт, що ряд W не впливає на ряд X з лагом 2. Для цього треба тестувати умовну залежність між tX та 2−tW , з використанням в умові відповідних минулих значень цих рядів. Якщо відомо, що зв'язок tt XW →−1 існує, то змінну 1−tW треба включати в умову вказаного тесту. Якщо цього не зробити, то умовна залежність між tX та 2−tW може існувати завдяки шляху ttt XWW →→ −− 12 , а не завдяки безпосередньому зв'язку tt XW →−2 з лагом 2. . «Не-причина» не покращує прогнозу наслідку. Формально це виражається як рів- ність умовних розподілень: Моделі і засоби систем баз даних та знань [Введите текст] основі інформації t . «Не-причина» не покращує прогнозу наслідку. Формально це виражається як рівність умовних розподілень: )|()\|( 11 ttttt YpXYp = ++ . У більш стандартній формі це записується як ),\|()\|( 11 ttttttt XXYpXYp = ++ . (1) Отже, «не-каузальність» за Грейнджером може бути формалізована як умовна незалежність прогнозу від «не-причини» за умови врахування причин (релевантної інформації). Далі, поняття каузальності (за Грейнджером) формально з'являється як констатація не виконання рівності (1), тобто як констатація порушення цієї умовної незалежності. Змістовно, каузальність змінної X для наслідку Y (за Грейнджером) означає, що X несе «незамінну» інформацію для прогнозу наслідку Y . Проблема в тому, що факт цієї «незамінності» важко встановити. Вся релевантна інформація t у світі практично недоступна, і навіть не можна бути впевненим, що вдалося знайти всі можливі спільні причини для X та Y . Тому неможливо надійно перевірити чинність рівняння (1). Припустимо, аналітик здійснив перевірку сурогату рівняння (1) з використанням неповної інформації t . Тоді, якщо встановлено, що сурогат рівності (1) виконується, то висновок про відсутність каузального зв'язку між X та Y буде коректним. Натомість якщо встановлено, що сурогат рівності (1) не виконується, то висновок про каузальний зв'язок між X та Y правдоподібно може бути некоректним. Отже, концепції каузальності та не-каузальності (за Грейнджером) – несиметричні. Повернемося до цього пункту згодом. А зараз коротко розглянемо роль апарату умовної незалежності в динамічних і каузальних моделях. Класичне визначення марковської властивості встановлено для марковських ланцюгів. Але апарат марковських ланцюгів не є продуктивним для задачі виведення структур моделей (через абстрактність поняття стану). Важливою віхою досліджень в потрібному напрямку стала робота [12], яка адаптувала класичну теорію марковських процесів до реалістичної проблематики каузального моделювання. Замість «унітарного» марковского процесу аналізується система підпроцесів, що взаємодіють. Нехай структура авторегресійного процесу невідома. Для спрощення приймемо, що всі зовнішні фактори (тобто змінні поза набором X , Y , Z , W ) є взаємно незалежними, і кожний з них впливає на одну спостережувану змінну. Тоді наївний спосіб застосувати концепцію каузальності (за Грейнджером) для тестування гіпотетичного каузального зв'язку tt XW →−1 зведеться до перевірки виконання формули ),|()|( 1__ −= ttttt WXpXp , (2) де = t_  121012101210210 ,,..,,,,,..,,,,,..,,,,..,, −−−−−−− ttttttt ZZZZYYYYXXXXWWW . Набір умов t_ охоплює все минуле рядів X , Y , Z , W , за виключенням 1−tW (попереднього стану підпроцесу W ). Зрозуміло, що виконати перевірку рівності у подібному форматі практично неможливо. Для надійної оцінки умовної ймовірності з такою складною умовою потрібно мати величезний обсяг даних, а власне обчислення буде дуже важким. Потрібен акуратний й ефективний апарат аналізу даних, а також апарат аналізу графової структури темпоральної моделі. Принципова вразливість концепції каузальності Грейнджера полягає в тому, що вона залишає невизначеним, який прогноз мається на увазі – пасивний чи активний (ефект втручання). В класичних («статичних») каузальних мережах успішно застосовується поняття умовної незалежності та відповідний конструктивний критерій d -сепарації [3, 4, 7]. Як перенести цей апарат в контекст векторних часових рядів, де маємо довгі паралельні серії змінних? Приміром, якщо поглянути на векторний авторегресійний процес, зображений на рис. 3, то зрозуміло, що всі ряди основних змінних ( X , Y , Z , W ) є взаємозалежними. Але ці ряди відіграють різну роль в системі каузальних впливів. Зокрема, очевидно, що ряд W не впливає на інші ряди, але безпосередньо залежить тільки від ряду X . Щоб аналізувати структуру каузальних зв'язків між компонентами процесу, необхідно розглядати умовну незалежність у відповідному часовому форматі. Для векторних часових рядів функція сепарації полягає у тому, щоб акуратно «перерізати» паралельні серії змінних у відповідних фазах. Тобто конструктивний темпоральний критерій сепарації має залучати змінні, що знаходяться на коректно обраному «часовому фронті». Умовну незалежність «фронтового» типу в динамічних моделях називають «локальна незалежність». Припустимо, що в рекурентному процесі немає моментальних (ізохронних) зв'язків (вигляду tt RV → ), і що максимальний лаг автокореляційних зв'язків (вигляду tjt VV →− ) дорівнює m . Нехай треба перевірити факт, що ряд змінних W не впливає на ряд X . Нехай відомо, що немає жодного «третього» ряду, який впливає паралельно на ряди X та W . Спочатку хочемо перевірити, що ряд W не впливає на ряд X з лагом 1. Для того, щоб отримати остаточну позитивну або негативну відповідь на це питання, треба аналізувати умовну залежність між tX та 1−tW за кондиціонування змінних 11,.., −−− mtt XX , 22 ,.., −−− mtt WW . Якщо ця умовна залежність встановлена, то зв'язок tt XW →−1 присутній, інакше – відсутній. Наступним кроком можна тестувати факт, що ряд W не впливає на ряд X з лагом 2. Для цього треба тестувати умовну залежність між tX та 2−tW , з використанням в умові відповідних минулих значень цих рядів. Якщо відомо, що зв'язок tt XW →−1 існує, то змінну 1−tW треба включати в умову вказаного тесту. Якщо цього не зробити, то умовна залежність між tX та 2−tW може існувати завдяки шляху ttt XWW →→ −− 12 , а не завдяки безпосередньому зв'язку tt XW →−2 з лагом 2. . У більш стандартній формі це записується як Моделі і засоби систем баз даних та знань [Введите текст] основі інформації t . «Не-причина» не покращує прогнозу наслідку. Формально це виражається як рівність умовних розподілень: )|()\|( 11 ttttt YpXYp = ++ . У більш стандартній формі це записується як ),\|()\|( 11 ttttttt XXYpXYp = ++ . (1) Отже, «не-каузальність» за Грейнджером може бути формалізована як умовна незалежність прогнозу від «не-причини» за умови врахування причин (релевантної інформації). Далі, поняття каузальності (за Грейнджером) формально з'являється як констатація не виконання рівності (1), тобто як констатація порушення цієї умовної незалежності. Змістовно, каузальність змінної X для наслідку Y (за Грейнджером) означає, що X несе «незамінну» інформацію для прогнозу наслідку Y . Проблема в тому, що факт цієї «незамінності» важко встановити. Вся релевантна інформація t у світі практично недоступна, і навіть не можна бути впевненим, що вдалося знайти всі можливі спільні причини для X та Y . Тому неможливо надійно перевірити чинність рівняння (1). Припустимо, аналітик здійснив перевірку сурогату рівняння (1) з використанням неповної інформації t . Тоді, якщо встановлено, що сурогат рівності (1) виконується, то висновок про відсутність каузального зв'язку між X та Y буде коректним. Натомість якщо встановлено, що сурогат рівності (1) не виконується, то висновок про каузальний зв'язок між X та Y правдоподібно може бути некоректним. Отже, концепції каузальності та не-каузальності (за Грейнджером) – несиметричні. Повернемося до цього пункту згодом. А зараз коротко розглянемо роль апарату умовної незалежності в динамічних і каузальних моделях. Класичне визначення марковської властивості встановлено для марковських ланцюгів. Але апарат марковських ланцюгів не є продуктивним для задачі виведення структур моделей (через абстрактність поняття стану). Важливою віхою досліджень в потрібному напрямку стала робота [12], яка адаптувала класичну теорію марковських процесів до реалістичної проблематики каузального моделювання. Замість «унітарного» марковского процесу аналізується система підпроцесів, що взаємодіють. Нехай структура авторегресійного процесу невідома. Для спрощення приймемо, що всі зовнішні фактори (тобто змінні поза набором X , Y , Z , W ) є взаємно незалежними, і кожний з них впливає на одну спостережувану змінну. Тоді наївний спосіб застосувати концепцію каузальності (за Грейнджером) для тестування гіпотетичного каузального зв'язку tt XW →−1 зведеться до перевірки виконання формули ),|()|( 1__ −= ttttt WXpXp , (2) де = t_  121012101210210 ,,..,,,,,..,,,,,..,,,,..,, −−−−−−− ttttttt ZZZZYYYYXXXXWWW . Набір умов t_ охоплює все минуле рядів X , Y , Z , W , за виключенням 1−tW (попереднього стану підпроцесу W ). Зрозуміло, що виконати перевірку рівності у подібному форматі практично неможливо. Для надійної оцінки умовної ймовірності з такою складною умовою потрібно мати величезний обсяг даних, а власне обчислення буде дуже важким. Потрібен акуратний й ефективний апарат аналізу даних, а також апарат аналізу графової структури темпоральної моделі. Принципова вразливість концепції каузальності Грейнджера полягає в тому, що вона залишає невизначеним, який прогноз мається на увазі – пасивний чи активний (ефект втручання). В класичних («статичних») каузальних мережах успішно застосовується поняття умовної незалежності та відповідний конструктивний критерій d -сепарації [3, 4, 7]. Як перенести цей апарат в контекст векторних часових рядів, де маємо довгі паралельні серії змінних? Приміром, якщо поглянути на векторний авторегресійний процес, зображений на рис. 3, то зрозуміло, що всі ряди основних змінних ( X , Y , Z , W ) є взаємозалежними. Але ці ряди відіграють різну роль в системі каузальних впливів. Зокрема, очевидно, що ряд W не впливає на інші ряди, але безпосередньо залежить тільки від ряду X . Щоб аналізувати структуру каузальних зв'язків між компонентами процесу, необхідно розглядати умовну незалежність у відповідному часовому форматі. Для векторних часових рядів функція сепарації полягає у тому, щоб акуратно «перерізати» паралельні серії змінних у відповідних фазах. Тобто конструктивний темпоральний критерій сепарації має залучати змінні, що знаходяться на коректно обраному «часовому фронті». Умовну незалежність «фронтового» типу в динамічних моделях називають «локальна незалежність». Припустимо, що в рекурентному процесі немає моментальних (ізохронних) зв'язків (вигляду tt RV → ), і що максимальний лаг автокореляційних зв'язків (вигляду tjt VV →− ) дорівнює m . Нехай треба перевірити факт, що ряд змінних W не впливає на ряд X . Нехай відомо, що немає жодного «третього» ряду, який впливає паралельно на ряди X та W . Спочатку хочемо перевірити, що ряд W не впливає на ряд X з лагом 1. Для того, щоб отримати остаточну позитивну або негативну відповідь на це питання, треба аналізувати умовну залежність між tX та 1−tW за кондиціонування змінних 11,.., −−− mtt XX , 22 ,.., −−− mtt WW . Якщо ця умовна залежність встановлена, то зв'язок tt XW →−1 присутній, інакше – відсутній. Наступним кроком можна тестувати факт, що ряд W не впливає на ряд X з лагом 2. Для цього треба тестувати умовну залежність між tX та 2−tW , з використанням в умові відповідних минулих значень цих рядів. Якщо відомо, що зв'язок tt XW →−1 існує, то змінну 1−tW треба включати в умову вказаного тесту. Якщо цього не зробити, то умовна залежність між tX та 2−tW може існувати завдяки шляху ttt XWW →→ −− 12 , а не завдяки безпосередньому зв'язку tt XW →−2 з лагом 2. . (1) Отже, «не-каузальність» за Грейнджером може бути формалізована як умовна незалежність прогнозу від «не-причини» за умови врахування причин (релевантної інформації). Далі, поняття каузальності (за Грейн- джером) формально з’являється як констатація не виконання рівності (1), тобто як констатація порушення цієї умовної незалежності. Змістовно, каузальність змінної X для наслідку Y (за Грейнджером) означає, що X несе «незамінну» інформацію для прогнозу наслідку Y. Проблема в тому, що факт цієї «незамінності» важко вста- новити. Вся релевантна інформація Моделі і засоби систем баз даних та знань [Введите текст] основі інформації t . «Не-причина» не покращує прогнозу наслідку. Формально це виражається як рівність умовних розподілень: )|()\|( 11 ttttt YpXYp = ++ . У більш стандартній формі це записується як ),\|()\|( 11 ttttttt XXYpXYp = ++ . (1) Отже, «не-каузальність» за Грейнджером може бути формалізована як умовна незалежність прогнозу від «не-причини» за умови врахування причин (релевантної інформації). Далі, поняття каузальності (за Грейнджером) формально з'являється як констатація не виконання рівності (1), тобто як констатація порушення цієї умовної незалежності. Змістовно, каузальність змінної X для наслідку Y (за Грейнджером) означає, що X несе «незамінну» інформацію для прогнозу наслідку Y . Проблема в тому, що факт цієї «незамінності» важко встановити. Вся релевантна інформація t у світі практично недоступна, і навіть не можна бути впевненим, що вдалося знайти всі можливі спільні причини для X та Y . Тому неможливо надійно перевірити чинність рівняння (1). Припустимо, аналітик здійснив перевірку сурогату рівняння (1) з використанням неповної інформації t . Тоді, якщо встановлено, що сурогат рівності (1) виконується, то висновок про відсутність каузального зв'язку між X та Y буде коректним. Натомість якщо встановлено, що сурогат рівності (1) не виконується, то висновок про каузальний зв'язок між X та Y правдоподібно може бути некоректним. Отже, концепції каузальності та не-каузальності (за Грейнджером) – несиметричні. Повернемося до цього пункту згодом. А зараз коротко розглянемо роль апарату умовної незалежності в динамічних і каузальних моделях. Класичне визначення марковської властивості встановлено для марковських ланцюгів. Але апарат марковських ланцюгів не є продуктивним для задачі виведення структур моделей (через абстрактність поняття стану). Важливою віхою досліджень в потрібному напрямку стала робота [12], яка адаптувала класичну теорію марковських процесів до реалістичної проблематики каузального моделювання. Замість «унітарного» марковского процесу аналізується система підпроцесів, що взаємодіють. Нехай структура авторегресійного процесу невідома. Для спрощення приймемо, що всі зовнішні фактори (тобто змінні поза набором X , Y , Z , W ) є взаємно незалежними, і кожний з них впливає на одну спостережувану змінну. Тоді наївний спосіб застосувати концепцію каузальності (за Грейнджером) для тестування гіпотетичного каузального зв'язку tt XW →−1 зведеться до перевірки виконання формули ),|()|( 1__ −= ttttt WXpXp , (2) де = t_  121012101210210 ,,..,,,,,..,,,,,..,,,,..,, −−−−−−− ttttttt ZZZZYYYYXXXXWWW . Набір умов t_ охоплює все минуле рядів X , Y , Z , W , за виключенням 1−tW (попереднього стану підпроцесу W ). Зрозуміло, що виконати перевірку рівності у подібному форматі практично неможливо. Для надійної оцінки умовної ймовірності з такою складною умовою потрібно мати величезний обсяг даних, а власне обчислення буде дуже важким. Потрібен акуратний й ефективний апарат аналізу даних, а також апарат аналізу графової структури темпоральної моделі. Принципова вразливість концепції каузальності Грейнджера полягає в тому, що вона залишає невизначеним, який прогноз мається на увазі – пасивний чи активний (ефект втручання). В класичних («статичних») каузальних мережах успішно застосовується поняття умовної незалежності та відповідний конструктивний критерій d -сепарації [3, 4, 7]. Як перенести цей апарат в контекст векторних часових рядів, де маємо довгі паралельні серії змінних? Приміром, якщо поглянути на векторний авторегресійний процес, зображений на рис. 3, то зрозуміло, що всі ряди основних змінних ( X , Y , Z , W ) є взаємозалежними. Але ці ряди відіграють різну роль в системі каузальних впливів. Зокрема, очевидно, що ряд W не впливає на інші ряди, але безпосередньо залежить тільки від ряду X . Щоб аналізувати структуру каузальних зв'язків між компонентами процесу, необхідно розглядати умовну незалежність у відповідному часовому форматі. Для векторних часових рядів функція сепарації полягає у тому, щоб акуратно «перерізати» паралельні серії змінних у відповідних фазах. Тобто конструктивний темпоральний критерій сепарації має залучати змінні, що знаходяться на коректно обраному «часовому фронті». Умовну незалежність «фронтового» типу в динамічних моделях називають «локальна незалежність». Припустимо, що в рекурентному процесі немає моментальних (ізохронних) зв'язків (вигляду tt RV → ), і що максимальний лаг автокореляційних зв'язків (вигляду tjt VV →− ) дорівнює m . Нехай треба перевірити факт, що ряд змінних W не впливає на ряд X . Нехай відомо, що немає жодного «третього» ряду, який впливає паралельно на ряди X та W . Спочатку хочемо перевірити, що ряд W не впливає на ряд X з лагом 1. Для того, щоб отримати остаточну позитивну або негативну відповідь на це питання, треба аналізувати умовну залежність між tX та 1−tW за кондиціонування змінних 11,.., −−− mtt XX , 22 ,.., −−− mtt WW . Якщо ця умовна залежність встановлена, то зв'язок tt XW →−1 присутній, інакше – відсутній. Наступним кроком можна тестувати факт, що ряд W не впливає на ряд X з лагом 2. Для цього треба тестувати умовну залежність між tX та 2−tW , з використанням в умові відповідних минулих значень цих рядів. Якщо відомо, що зв'язок tt XW →−1 існує, то змінну 1−tW треба включати в умову вказаного тесту. Якщо цього не зробити, то умовна залежність між tX та 2−tW може існувати завдяки шляху ttt XWW →→ −− 12 , а не завдяки безпосередньому зв'язку tt XW →−2 з лагом 2. у світі практично недоступна, і навіть не можна бути впевненим, що вдалося знайти всі можливі спільні причини для X та Y. Тому неможливо надійно перевірити чинність рівняння 189 Моделі і засоби систем баз даних та знань (1). Припустимо, аналітик здійснив перевірку сурогату рівняння (1) з використанням неповної інформації Моделі і засоби систем баз даних та знань [Введите текст] основі інформації t . «Не-причина» не покращує прогнозу наслідку. Формально це виражається як рівність умовних розподілень: )|()\|( 11 ttttt YpXYp = ++ . У більш стандартній формі це записується як ),\|()\|( 11 ttttttt XXYpXYp = ++ . (1) Отже, «не-каузальність» за Грейнджером може бути формалізована як умовна незалежність прогнозу від «не-причини» за умови врахування причин (релевантної інформації). Далі, поняття каузальності (за Грейнджером) формально з'являється як констатація не виконання рівності (1), тобто як констатація порушення цієї умовної незалежності. Змістовно, каузальність змінної X для наслідку Y (за Грейнджером) означає, що X несе «незамінну» інформацію для прогнозу наслідку Y . Проблема в тому, що факт цієї «незамінності» важко встановити. Вся релевантна інформація t у світі практично недоступна, і навіть не можна бути впевненим, що вдалося знайти всі можливі спільні причини для X та Y . Тому неможливо надійно перевірити чинність рівняння (1). Припустимо, аналітик здійснив перевірку сурогату рівняння (1) з використанням неповної інформації t . Тоді, якщо встановлено, що сурогат рівності (1) виконується, то висновок про відсутність каузального зв'язку між X та Y буде коректним. Натомість якщо встановлено, що сурогат рівності (1) не виконується, то висновок про каузальний зв'язок між X та Y правдоподібно може бути некоректним. Отже, концепції каузальності та не-каузальності (за Грейнджером) – несиметричні. Повернемося до цього пункту згодом. А зараз коротко розглянемо роль апарату умовної незалежності в динамічних і каузальних моделях. Класичне визначення марковської властивості встановлено для марковських ланцюгів. Але апарат марковських ланцюгів не є продуктивним для задачі виведення структур моделей (через абстрактність поняття стану). Важливою віхою досліджень в потрібному напрямку стала робота [12], яка адаптувала класичну теорію марковських процесів до реалістичної проблематики каузального моделювання. Замість «унітарного» марковского процесу аналізується система підпроцесів, що взаємодіють. Нехай структура авторегресійного процесу невідома. Для спрощення приймемо, що всі зовнішні фактори (тобто змінні поза набором X , Y , Z , W ) є взаємно незалежними, і кожний з них впливає на одну спостережувану змінну. Тоді наївний спосіб застосувати концепцію каузальності (за Грейнджером) для тестування гіпотетичного каузального зв'язку tt XW →−1 зведеться до перевірки виконання формули ),|()|( 1__ −= ttttt WXpXp , (2) де = t_  121012101210210 ,,..,,,,,..,,,,,..,,,,..,, −−−−−−− ttttttt ZZZZYYYYXXXXWWW . Набір умов t_ охоплює все минуле рядів X , Y , Z , W , за виключенням 1−tW (попереднього стану підпроцесу W ). Зрозуміло, що виконати перевірку рівності у подібному форматі практично неможливо. Для надійної оцінки умовної ймовірності з такою складною умовою потрібно мати величезний обсяг даних, а власне обчислення буде дуже важким. Потрібен акуратний й ефективний апарат аналізу даних, а також апарат аналізу графової структури темпоральної моделі. Принципова вразливість концепції каузальності Грейнджера полягає в тому, що вона залишає невизначеним, який прогноз мається на увазі – пасивний чи активний (ефект втручання). В класичних («статичних») каузальних мережах успішно застосовується поняття умовної незалежності та відповідний конструктивний критерій d -сепарації [3, 4, 7]. Як перенести цей апарат в контекст векторних часових рядів, де маємо довгі паралельні серії змінних? Приміром, якщо поглянути на векторний авторегресійний процес, зображений на рис. 3, то зрозуміло, що всі ряди основних змінних ( X , Y , Z , W ) є взаємозалежними. Але ці ряди відіграють різну роль в системі каузальних впливів. Зокрема, очевидно, що ряд W не впливає на інші ряди, але безпосередньо залежить тільки від ряду X . Щоб аналізувати структуру каузальних зв'язків між компонентами процесу, необхідно розглядати умовну незалежність у відповідному часовому форматі. Для векторних часових рядів функція сепарації полягає у тому, щоб акуратно «перерізати» паралельні серії змінних у відповідних фазах. Тобто конструктивний темпоральний критерій сепарації має залучати змінні, що знаходяться на коректно обраному «часовому фронті». Умовну незалежність «фронтового» типу в динамічних моделях називають «локальна незалежність». Припустимо, що в рекурентному процесі немає моментальних (ізохронних) зв'язків (вигляду tt RV → ), і що максимальний лаг автокореляційних зв'язків (вигляду tjt VV →− ) дорівнює m . Нехай треба перевірити факт, що ряд змінних W не впливає на ряд X . Нехай відомо, що немає жодного «третього» ряду, який впливає паралельно на ряди X та W . Спочатку хочемо перевірити, що ряд W не впливає на ряд X з лагом 1. Для того, щоб отримати остаточну позитивну або негативну відповідь на це питання, треба аналізувати умовну залежність між tX та 1−tW за кондиціонування змінних 11,.., −−− mtt XX , 22 ,.., −−− mtt WW . Якщо ця умовна залежність встановлена, то зв'язок tt XW →−1 присутній, інакше – відсутній. Наступним кроком можна тестувати факт, що ряд W не впливає на ряд X з лагом 2. Для цього треба тестувати умовну залежність між tX та 2−tW , з використанням в умові відповідних минулих значень цих рядів. Якщо відомо, що зв'язок tt XW →−1 існує, то змінну 1−tW треба включати в умову вказаного тесту. Якщо цього не зробити, то умовна залежність між tX та 2−tW може існувати завдяки шляху ttt XWW →→ −− 12 , а не завдяки безпосередньому зв'язку tt XW →−2 з лагом 2. . Тоді, якщо встановлено, що сурогат рівності (1) виконується, то висновок про відсутність каузального зв’язку між X та Y буде коректним. Натомість якщо встановлено, що сурогат рівності (1) не виконується, то висновок про каузальний зв’язок між X та Y правдоподібно може бути некоректним. Отже, концепції каузальності та не-каузальності (за Грейнджером) – несиметричні. Повернемося до цього пункту згодом. А зараз коротко роз- глянемо роль апарату умовної незалежності в динамічних і каузальних моделях. Класичне визначення марковської властивості встановлено для марковських ланцюгів. Але апарат мар- ковських ланцюгів не є продуктивним для задачі виведення структур моделей (через абстрактність поняття стану). Важливою віхою досліджень в потрібному напрямку стала робота [12], яка адаптувала класичну теорію марковських процесів до реалістичної проблематики каузального моделювання. Замість «унітарного» марков- ского процесу аналізується система підпроцесів, що взаємодіють. Нехай структура авторегресійного процесу невідома. Для спрощення приймемо, що всі зовнішні фак- тори (тобто змінні поза набором Моделі і засоби систем баз даних та знань [Введите текст] основі інформації t . «Не-причина» не покращує прогнозу наслідку. Формально це виражається як рівність умовних розподілень: )|()\|( 11 ttttt YpXYp = ++ . У більш стандартній формі це записується як ),\|()\|( 11 ttttttt XXYpXYp = ++ . (1) Отже, «не-каузальність» за Грейнджером може бути формалізована як умовна незалежність прогнозу від «не-причини» за умови врахування причин (релевантної інформації). Далі, поняття каузальності (за Грейнджером) формально з'являється як констатація не виконання рівності (1), тобто як констатація порушення цієї умовної незалежності. Змістовно, каузальність змінної X для наслідку Y (за Грейнджером) означає, що X несе «незамінну» інформацію для прогнозу наслідку Y . Проблема в тому, що факт цієї «незамінності» важко встановити. Вся релевантна інформація t у світі практично недоступна, і навіть не можна бути впевненим, що вдалося знайти всі можливі спільні причини для X та Y . Тому неможливо надійно перевірити чинність рівняння (1). Припустимо, аналітик здійснив перевірку сурогату рівняння (1) з використанням неповної інформації t . Тоді, якщо встановлено, що сурогат рівності (1) виконується, то висновок про відсутність каузального зв'язку між X та Y буде коректним. Натомість якщо встановлено, що сурогат рівності (1) не виконується, то висновок про каузальний зв'язок між X та Y правдоподібно може бути некоректним. Отже, концепції каузальності та не-каузальності (за Грейнджером) – несиметричні. Повернемося до цього пункту згодом. А зараз коротко розглянемо роль апарату умовної незалежності в динамічних і каузальних моделях. Класичне визначення марковської властивості встановлено для марковських ланцюгів. Але апарат марковських ланцюгів не є продуктивним для задачі виведення структур моделей (через абстрактність поняття стану). Важливою віхою досліджень в потрібному напрямку стала робота [12], яка адаптувала класичну теорію марковських процесів до реалістичної проблематики каузального моделювання. Замість «унітарного» марковского процесу аналізується система підпроцесів, що взаємодіють. Нехай структура авторегресійного процесу невідома. Для спрощення приймемо, що всі зовнішні фактори (тобто змінні поза набором X , Y , Z , W ) є взаємно незалежними, і кожний з них впливає на одну спостережувану змінну. Тоді наївний спосіб застосувати концепцію каузальності (за Грейнджером) для тестування гіпотетичного каузального зв'язку tt XW →−1 зведеться до перевірки виконання формули ),|()|( 1__ −= ttttt WXpXp , (2) де = t_  121012101210210 ,,..,,,,,..,,,,,..,,,,..,, −−−−−−− ttttttt ZZZZYYYYXXXXWWW . Набір умов t_ охоплює все минуле рядів X , Y , Z , W , за виключенням 1−tW (попереднього стану підпроцесу W ). Зрозуміло, що виконати перевірку рівності у подібному форматі практично неможливо. Для надійної оцінки умовної ймовірності з такою складною умовою потрібно мати величезний обсяг даних, а власне обчислення буде дуже важким. Потрібен акуратний й ефективний апарат аналізу даних, а також апарат аналізу графової структури темпоральної моделі. Принципова вразливість концепції каузальності Грейнджера полягає в тому, що вона залишає невизначеним, який прогноз мається на увазі – пасивний чи активний (ефект втручання). В класичних («статичних») каузальних мережах успішно застосовується поняття умовної незалежності та відповідний конструктивний критерій d -сепарації [3, 4, 7]. Як перенести цей апарат в контекст векторних часових рядів, де маємо довгі паралельні серії змінних? Приміром, якщо поглянути на векторний авторегресійний процес, зображений на рис. 3, то зрозуміло, що всі ряди основних змінних ( X , Y , Z , W ) є взаємозалежними. Але ці ряди відіграють різну роль в системі каузальних впливів. Зокрема, очевидно, що ряд W не впливає на інші ряди, але безпосередньо залежить тільки від ряду X . Щоб аналізувати структуру каузальних зв'язків між компонентами процесу, необхідно розглядати умовну незалежність у відповідному часовому форматі. Для векторних часових рядів функція сепарації полягає у тому, щоб акуратно «перерізати» паралельні серії змінних у відповідних фазах. Тобто конструктивний темпоральний критерій сепарації має залучати змінні, що знаходяться на коректно обраному «часовому фронті». Умовну незалежність «фронтового» типу в динамічних моделях називають «локальна незалежність». Припустимо, що в рекурентному процесі немає моментальних (ізохронних) зв'язків (вигляду tt RV → ), і що максимальний лаг автокореляційних зв'язків (вигляду tjt VV →− ) дорівнює m . Нехай треба перевірити факт, що ряд змінних W не впливає на ряд X . Нехай відомо, що немає жодного «третього» ряду, який впливає паралельно на ряди X та W . Спочатку хочемо перевірити, що ряд W не впливає на ряд X з лагом 1. Для того, щоб отримати остаточну позитивну або негативну відповідь на це питання, треба аналізувати умовну залежність між tX та 1−tW за кондиціонування змінних 11,.., −−− mtt XX , 22 ,.., −−− mtt WW . Якщо ця умовна залежність встановлена, то зв'язок tt XW →−1 присутній, інакше – відсутній. Наступним кроком можна тестувати факт, що ряд W не впливає на ряд X з лагом 2. Для цього треба тестувати умовну залежність між tX та 2−tW , з використанням в умові відповідних минулих значень цих рядів. Якщо відомо, що зв'язок tt XW →−1 існує, то змінну 1−tW треба включати в умову вказаного тесту. Якщо цього не зробити, то умовна залежність між tX та 2−tW може існувати завдяки шляху ttt XWW →→ −− 12 , а не завдяки безпосередньому зв'язку tt XW →−2 з лагом 2. ) є взаємно незалежними, і кожний з них впливає на одну спосте- режувану змінну. Тоді наївний спосіб застосувати концепцію каузальності (за Грейнджером) для тестування гіпотетичного каузального зв’язку Моделі і засоби систем баз даних та знань [Введите текст] основі інформації t . «Не-причина» не покращує прогнозу наслідку. Формально це виражається як рівність умовних розподілень: )|()\|( 11 ttttt YpXYp = ++ . У більш стандартній формі це записується як ),\|()\|( 11 ttttttt XXYpXYp = ++ . (1) Отже, «не-каузальність» за Грейнджером може бути формалізована як умовна незалежність прогнозу від «не-причини» за умови врахування причин (релевантної інформації). Далі, поняття каузальності (за Грейнджером) формально з'являється як констатація не виконання рівності (1), тобто як констатація порушення цієї умовної незалежності. Змістовно, каузальність змінної X для наслідку Y (за Грейнджером) означає, що X несе «незамінну» інформацію для прогнозу наслідку Y . Проблема в тому, що факт цієї «незамінності» важко встановити. Вся релевантна інформація t у світі практично недоступна, і навіть не можна бути впевненим, що вдалося знайти всі можливі спільні причини для X та Y . Тому неможливо надійно перевірити чинність рівняння (1). Припустимо, аналітик здійснив перевірку сурогату рівняння (1) з використанням неповної інформації t . Тоді, якщо встановлено, що сурогат рівності (1) виконується, то висновок про відсутність каузального зв'язку між X та Y буде коректним. Натомість якщо встановлено, що сурогат рівності (1) не виконується, то висновок про каузальний зв'язок між X та Y правдоподібно може бути некоректним. Отже, концепції каузальності та не-каузальності (за Грейнджером) – несиметричні. Повернемося до цього пункту згодом. А зараз коротко розглянемо роль апарату умовної незалежності в динамічних і каузальних моделях. Класичне визначення марковської властивості встановлено для марковських ланцюгів. Але апарат марковських ланцюгів не є продуктивним для задачі виведення структур моделей (через абстрактність поняття стану). Важливою віхою досліджень в потрібному напрямку стала робота [12], яка адаптувала класичну теорію марковських процесів до реалістичної проблематики каузального моделювання. Замість «унітарного» марковского процесу аналізується система підпроцесів, що взаємодіють. Нехай структура авторегресійного процесу невідома. Для спрощення приймемо, що всі зовнішні фактори (тобто змінні поза набором X , Y , Z , W ) є взаємно незалежними, і кожний з них впливає на одну спостережувану змінну. Тоді наївний спосіб застосувати концепцію каузальності (за Грейнджером) для тестування гіпотетичного каузального зв'язку tt XW →−1 зведеться до перевірки виконання формули ),|()|( 1__ −= ttttt WXpXp , (2) де = t_  121012101210210 ,,..,,,,,..,,,,,..,,,,..,, −−−−−−− ttttttt ZZZZYYYYXXXXWWW . Набір умов t_ охоплює все минуле рядів X , Y , Z , W , за виключенням 1−tW (попереднього стану підпроцесу W ). Зрозуміло, що виконати перевірку рівності у подібному форматі практично неможливо. Для надійної оцінки умовної ймовірності з такою складною умовою потрібно мати величезний обсяг даних, а власне обчислення буде дуже важким. Потрібен акуратний й ефективний апарат аналізу даних, а також апарат аналізу графової структури темпоральної моделі. Принципова вразливість концепції каузальності Грейнджера полягає в тому, що вона залишає невизначеним, який прогноз мається на увазі – пасивний чи активний (ефект втручання). В класичних («статичних») каузальних мережах успішно застосовується поняття умовної незалежності та відповідний конструктивний критерій d -сепарації [3, 4, 7]. Як перенести цей апарат в контекст векторних часових рядів, де маємо довгі паралельні серії змінних? Приміром, якщо поглянути на векторний авторегресійний процес, зображений на рис. 3, то зрозуміло, що всі ряди основних змінних ( X , Y , Z , W ) є взаємозалежними. Але ці ряди відіграють різну роль в системі каузальних впливів. Зокрема, очевидно, що ряд W не впливає на інші ряди, але безпосередньо залежить тільки від ряду X . Щоб аналізувати структуру каузальних зв'язків між компонентами процесу, необхідно розглядати умовну незалежність у відповідному часовому форматі. Для векторних часових рядів функція сепарації полягає у тому, щоб акуратно «перерізати» паралельні серії змінних у відповідних фазах. Тобто конструктивний темпоральний критерій сепарації має залучати змінні, що знаходяться на коректно обраному «часовому фронті». Умовну незалежність «фронтового» типу в динамічних моделях називають «локальна незалежність». Припустимо, що в рекурентному процесі немає моментальних (ізохронних) зв'язків (вигляду tt RV → ), і що максимальний лаг автокореляційних зв'язків (вигляду tjt VV →− ) дорівнює m . Нехай треба перевірити факт, що ряд змінних W не впливає на ряд X . Нехай відомо, що немає жодного «третього» ряду, який впливає паралельно на ряди X та W . Спочатку хочемо перевірити, що ряд W не впливає на ряд X з лагом 1. Для того, щоб отримати остаточну позитивну або негативну відповідь на це питання, треба аналізувати умовну залежність між tX та 1−tW за кондиціонування змінних 11,.., −−− mtt XX , 22 ,.., −−− mtt WW . Якщо ця умовна залежність встановлена, то зв'язок tt XW →−1 присутній, інакше – відсутній. Наступним кроком можна тестувати факт, що ряд W не впливає на ряд X з лагом 2. Для цього треба тестувати умовну залежність між tX та 2−tW , з використанням в умові відповідних минулих значень цих рядів. Якщо відомо, що зв'язок tt XW →−1 існує, то змінну 1−tW треба включати в умову вказаного тесту. Якщо цього не зробити, то умовна залежність між tX та 2−tW може існувати завдяки шляху ttt XWW →→ −− 12 , а не завдяки безпосередньому зв'язку tt XW →−2 з лагом 2. зведеться до перевірки виконання формули Моделі і засоби систем баз даних та знань [Введите текст] основі інформації t . «Не-причина» не покращує прогнозу наслідку. Формально це виражається як рівність умовних розподілень: )|()\|( 11 ttttt YpXYp = ++ . У більш стандартній формі це записується як ),\|()\|( 11 ttttttt XXYpXYp = ++ . (1) Отже, «не-каузальність» за Грейнджером може бути формалізована як умовна незалежність прогнозу від «не-причини» за умови врахування причин (релевантної інформації). Далі, поняття каузальності (за Грейнджером) формально з'являється як констатація не виконання рівності (1), тобто як констатація порушення цієї умовної незалежності. Змістовно, каузальність змінної X для наслідку Y (за Грейнджером) означає, що X несе «незамінну» інформацію для прогнозу наслідку Y . Проблема в тому, що факт цієї «незамінності» важко встановити. Вся релевантна інформація t у світі практично недоступна, і навіть не можна бути впевненим, що вдалося знайти всі можливі спільні причини для X та Y . Тому неможливо надійно перевірити чинність рівняння (1). Припустимо, аналітик здійснив перевірку сурогату рівняння (1) з використанням неповної інформації t . Тоді, якщо встановлено, що сурогат рівності (1) виконується, то висновок про відсутність каузального зв'язку між X та Y буде коректним. Натомість якщо встановлено, що сурогат рівності (1) не виконується, то висновок про каузальний зв'язок між X та Y правдоподібно може бути некоректним. Отже, концепції каузальності та не-каузальності (за Грейнджером) – несиметричні. Повернемося до цього пункту згодом. А зараз коротко розглянемо роль апарату умовної незалежності в динамічних і каузальних моделях. Класичне визначення марковської властивості встановлено для марковських ланцюгів. Але апарат марковських ланцюгів не є продуктивним для задачі виведення структур моделей (через абстрактність поняття стану). Важливою віхою досліджень в потрібному напрямку стала робота [12], яка адаптувала класичну теорію марковських процесів до реалістичної проблематики каузального моделювання. Замість «унітарного» марковского процесу аналізується система підпроцесів, що взаємодіють. Нехай структура авторегресійного процесу невідома. Для спрощення приймемо, що всі зовнішні фактори (тобто змінні поза набором X , Y , Z , W ) є взаємно незалежними, і кожний з них впливає на одну спостережувану змінну. Тоді наївний спосіб застосувати концепцію каузальності (за Грейнджером) для тестування гіпотетичного каузального зв'язку tt XW →−1 зведеться до перевірки виконання формули ),|()|( 1__ −= ttttt WXpXp , (2) де = t_  121012101210210 ,,..,,,,,..,,,,,..,,,,..,, −−−−−−− ttttttt ZZZZYYYYXXXXWWW . Набір умов t_ охоплює все минуле рядів X , Y , Z , W , за виключенням 1−tW (попереднього стану підпроцесу W ). Зрозуміло, що виконати перевірку рівності у подібному форматі практично неможливо. Для надійної оцінки умовної ймовірності з такою складною умовою потрібно мати величезний обсяг даних, а власне обчислення буде дуже важким. Потрібен акуратний й ефективний апарат аналізу даних, а також апарат аналізу графової структури темпоральної моделі. Принципова вразливість концепції каузальності Грейнджера полягає в тому, що вона залишає невизначеним, який прогноз мається на увазі – пасивний чи активний (ефект втручання). В класичних («статичних») каузальних мережах успішно застосовується поняття умовної незалежності та відповідний конструктивний критерій d -сепарації [3, 4, 7]. Як перенести цей апарат в контекст векторних часових рядів, де маємо довгі паралельні серії змінних? Приміром, якщо поглянути на векторний авторегресійний процес, зображений на рис. 3, то зрозуміло, що всі ряди основних змінних ( X , Y , Z , W ) є взаємозалежними. Але ці ряди відіграють різну роль в системі каузальних впливів. Зокрема, очевидно, що ряд W не впливає на інші ряди, але безпосередньо залежить тільки від ряду X . Щоб аналізувати структуру каузальних зв'язків між компонентами процесу, необхідно розглядати умовну незалежність у відповідному часовому форматі. Для векторних часових рядів функція сепарації полягає у тому, щоб акуратно «перерізати» паралельні серії змінних у відповідних фазах. Тобто конструктивний темпоральний критерій сепарації має залучати змінні, що знаходяться на коректно обраному «часовому фронті». Умовну незалежність «фронтового» типу в динамічних моделях називають «локальна незалежність». Припустимо, що в рекурентному процесі немає моментальних (ізохронних) зв'язків (вигляду tt RV → ), і що максимальний лаг автокореляційних зв'язків (вигляду tjt VV →− ) дорівнює m . Нехай треба перевірити факт, що ряд змінних W не впливає на ряд X . Нехай відомо, що немає жодного «третього» ряду, який впливає паралельно на ряди X та W . Спочатку хочемо перевірити, що ряд W не впливає на ряд X з лагом 1. Для того, щоб отримати остаточну позитивну або негативну відповідь на це питання, треба аналізувати умовну залежність між tX та 1−tW за кондиціонування змінних 11,.., −−− mtt XX , 22 ,.., −−− mtt WW . Якщо ця умовна залежність встановлена, то зв'язок tt XW →−1 присутній, інакше – відсутній. Наступним кроком можна тестувати факт, що ряд W не впливає на ряд X з лагом 2. Для цього треба тестувати умовну залежність між tX та 2−tW , з використанням в умові відповідних минулих значень цих рядів. Якщо відомо, що зв'язок tt XW →−1 існує, то змінну 1−tW треба включати в умову вказаного тесту. Якщо цього не зробити, то умовна залежність між tX та 2−tW може існувати завдяки шляху ttt XWW →→ −− 12 , а не завдяки безпосередньому зв'язку tt XW →−2 з лагом 2. , (2) де Моделі і засоби систем баз даних та знань [Введите текст] основі інформації t . «Не-причина» не покращує прогнозу наслідку. Формально це виражається як рівність умовних розподілень: )|()\|( 11 ttttt YpXYp = ++ . У більш стандартній формі це записується як ),\|()\|( 11 ttttttt XXYpXYp = ++ . (1) Отже, «не-каузальність» за Грейнджером може бути формалізована як умовна незалежність прогнозу від «не-причини» за умови врахування причин (релевантної інформації). Далі, поняття каузальності (за Грейнджером) формально з'являється як констатація не виконання рівності (1), тобто як констатація порушення цієї умовної незалежності. Змістовно, каузальність змінної X для наслідку Y (за Грейнджером) означає, що X несе «незамінну» інформацію для прогнозу наслідку Y . Проблема в тому, що факт цієї «незамінності» важко встановити. Вся релевантна інформація t у світі практично недоступна, і навіть не можна бути впевненим, що вдалося знайти всі можливі спільні причини для X та Y . Тому неможливо надійно перевірити чинність рівняння (1). Припустимо, аналітик здійснив перевірку сурогату рівняння (1) з використанням неповної інформації t . Тоді, якщо встановлено, що сурогат рівності (1) виконується, то висновок про відсутність каузального зв'язку між X та Y буде коректним. Натомість якщо встановлено, що сурогат рівності (1) не виконується, то висновок про каузальний зв'язок між X та Y правдоподібно може бути некоректним. Отже, концепції каузальності та не-каузальності (за Грейнджером) – несиметричні. Повернемося до цього пункту згодом. А зараз коротко розглянемо роль апарату умовної незалежності в динамічних і каузальних моделях. Класичне визначення марковської властивості встановлено для марковських ланцюгів. Але апарат марковських ланцюгів не є продуктивним для задачі виведення структур моделей (через абстрактність поняття стану). Важливою віхою досліджень в потрібному напрямку стала робота [12], яка адаптувала класичну теорію марковських процесів до реалістичної проблематики каузального моделювання. Замість «унітарного» марковского процесу аналізується система підпроцесів, що взаємодіють. Нехай структура авторегресійного процесу невідома. Для спрощення приймемо, що всі зовнішні фактори (тобто змінні поза набором X , Y , Z , W ) є взаємно незалежними, і кожний з них впливає на одну спостережувану змінну. Тоді наївний спосіб застосувати концепцію каузальності (за Грейнджером) для тестування гіпотетичного каузального зв'язку tt XW →−1 зведеться до перевірки виконання формули ),|()|( 1__ −= ttttt WXpXp , (2) де = t_  121012101210210 ,,..,,,,,..,,,,,..,,,,..,, −−−−−−− ttttttt ZZZZYYYYXXXXWWW . Набір умов t_ охоплює все минуле рядів X , Y , Z , W , за виключенням 1−tW (попереднього стану підпроцесу W ). Зрозуміло, що виконати перевірку рівності у подібному форматі практично неможливо. Для надійної оцінки умовної ймовірності з такою складною умовою потрібно мати величезний обсяг даних, а власне обчислення буде дуже важким. Потрібен акуратний й ефективний апарат аналізу даних, а також апарат аналізу графової структури темпоральної моделі. Принципова вразливість концепції каузальності Грейнджера полягає в тому, що вона залишає невизначеним, який прогноз мається на увазі – пасивний чи активний (ефект втручання). В класичних («статичних») каузальних мережах успішно застосовується поняття умовної незалежності та відповідний конструктивний критерій d -сепарації [3, 4, 7]. Як перенести цей апарат в контекст векторних часових рядів, де маємо довгі паралельні серії змінних? Приміром, якщо поглянути на векторний авторегресійний процес, зображений на рис. 3, то зрозуміло, що всі ряди основних змінних ( X , Y , Z , W ) є взаємозалежними. Але ці ряди відіграють різну роль в системі каузальних впливів. Зокрема, очевидно, що ряд W не впливає на інші ряди, але безпосередньо залежить тільки від ряду X . Щоб аналізувати структуру каузальних зв'язків між компонентами процесу, необхідно розглядати умовну незалежність у відповідному часовому форматі. Для векторних часових рядів функція сепарації полягає у тому, щоб акуратно «перерізати» паралельні серії змінних у відповідних фазах. Тобто конструктивний темпоральний критерій сепарації має залучати змінні, що знаходяться на коректно обраному «часовому фронті». Умовну незалежність «фронтового» типу в динамічних моделях називають «локальна незалежність». Припустимо, що в рекурентному процесі немає моментальних (ізохронних) зв'язків (вигляду tt RV → ), і що максимальний лаг автокореляційних зв'язків (вигляду tjt VV →− ) дорівнює m . Нехай треба перевірити факт, що ряд змінних W не впливає на ряд X . Нехай відомо, що немає жодного «третього» ряду, який впливає паралельно на ряди X та W . Спочатку хочемо перевірити, що ряд W не впливає на ряд X з лагом 1. Для того, щоб отримати остаточну позитивну або негативну відповідь на це питання, треба аналізувати умовну залежність між tX та 1−tW за кондиціонування змінних 11,.., −−− mtt XX , 22 ,.., −−− mtt WW . Якщо ця умовна залежність встановлена, то зв'язок tt XW →−1 присутній, інакше – відсутній. Наступним кроком можна тестувати факт, що ряд W не впливає на ряд X з лагом 2. Для цього треба тестувати умовну залежність між tX та 2−tW , з використанням в умові відповідних минулих значень цих рядів. Якщо відомо, що зв'язок tt XW →−1 існує, то змінну 1−tW треба включати в умову вказаного тесту. Якщо цього не зробити, то умовна залежність між tX та 2−tW може існувати завдяки шляху ttt XWW →→ −− 12 , а не завдяки безпосередньому зв'язку tt XW →−2 з лагом 2. Моделі і засоби систем баз даних та знань [Введите текст] основі інформації t . «Не-причина» не покращує прогнозу наслідку. Формально це виражається як рівність умовних розподілень: )|()\|( 11 ttttt YpXYp = ++ . У більш стандартній формі це записується як ),\|()\|( 11 ttttttt XXYpXYp = ++ . (1) Отже, «не-каузальність» за Грейнджером може бути формалізована як умовна незалежність прогнозу від «не-причини» за умови врахування причин (релевантної інформації). Далі, поняття каузальності (за Грейнджером) формально з'являється як констатація не виконання рівності (1), тобто як констатація порушення цієї умовної незалежності. Змістовно, каузальність змінної X для наслідку Y (за Грейнджером) означає, що X несе «незамінну» інформацію для прогнозу наслідку Y . Проблема в тому, що факт цієї «незамінності» важко встановити. Вся релевантна інформація t у світі практично недоступна, і навіть не можна бути впевненим, що вдалося знайти всі можливі спільні причини для X та Y . Тому неможливо надійно перевірити чинність рівняння (1). Припустимо, аналітик здійснив перевірку сурогату рівняння (1) з використанням неповної інформації t . Тоді, якщо встановлено, що сурогат рівності (1) виконується, то висновок про відсутність каузального зв'язку між X та Y буде коректним. Натомість якщо встановлено, що сурогат рівності (1) не виконується, то висновок про каузальний зв'язок між X та Y правдоподібно може бути некоректним. Отже, концепції каузальності та не-каузальності (за Грейнджером) – несиметричні. Повернемося до цього пункту згодом. А зараз коротко розглянемо роль апарату умовної незалежності в динамічних і каузальних моделях. Класичне визначення марковської властивості встановлено для марковських ланцюгів. Але апарат марковських ланцюгів не є продуктивним для задачі виведення структур моделей (через абстрактність поняття стану). Важливою віхою досліджень в потрібному напрямку стала робота [12], яка адаптувала класичну теорію марковських процесів до реалістичної проблематики каузального моделювання. Замість «унітарного» марковского процесу аналізується система підпроцесів, що взаємодіють. Нехай структура авторегресійного процесу невідома. Для спрощення приймемо, що всі зовнішні фактори (тобто змінні поза набором X , Y , Z , W ) є взаємно незалежними, і кожний з них впливає на одну спостережувану змінну. Тоді наївний спосіб застосувати концепцію каузальності (за Грейнджером) для тестування гіпотетичного каузального зв'язку tt XW →−1 зведеться до перевірки виконання формули ),|()|( 1__ −= ttttt WXpXp , (2) де = t_  121012101210210 ,,..,,,,,..,,,,,..,,,,..,, −−−−−−− ttttttt ZZZZYYYYXXXXWWW . Набір умов t_ охоплює все минуле рядів X , Y , Z , W , за виключенням 1−tW (попереднього стану підпроцесу W ). Зрозуміло, що виконати перевірку рівності у подібному форматі практично неможливо. Для надійної оцінки умовної ймовірності з такою складною умовою потрібно мати величезний обсяг даних, а власне обчислення буде дуже важким. Потрібен акуратний й ефективний апарат аналізу даних, а також апарат аналізу графової структури темпоральної моделі. Принципова вразливість концепції каузальності Грейнджера полягає в тому, що вона залишає невизначеним, який прогноз мається на увазі – пасивний чи активний (ефект втручання). В класичних («статичних») каузальних мережах успішно застосовується поняття умовної незалежності та відповідний конструктивний критерій d -сепарації [3, 4, 7]. Як перенести цей апарат в контекст векторних часових рядів, де маємо довгі паралельні серії змінних? Приміром, якщо поглянути на векторний авторегресійний процес, зображений на рис. 3, то зрозуміло, що всі ряди основних змінних ( X , Y , Z , W ) є взаємозалежними. Але ці ряди відіграють різну роль в системі каузальних впливів. Зокрема, очевидно, що ряд W не впливає на інші ряди, але безпосередньо залежить тільки від ряду X . Щоб аналізувати структуру каузальних зв'язків між компонентами процесу, необхідно розглядати умовну незалежність у відповідному часовому форматі. Для векторних часових рядів функція сепарації полягає у тому, щоб акуратно «перерізати» паралельні серії змінних у відповідних фазах. Тобто конструктивний темпоральний критерій сепарації має залучати змінні, що знаходяться на коректно обраному «часовому фронті». Умовну незалежність «фронтового» типу в динамічних моделях називають «локальна незалежність». Припустимо, що в рекурентному процесі немає моментальних (ізохронних) зв'язків (вигляду tt RV → ), і що максимальний лаг автокореляційних зв'язків (вигляду tjt VV →− ) дорівнює m . Нехай треба перевірити факт, що ряд змінних W не впливає на ряд X . Нехай відомо, що немає жодного «третього» ряду, який впливає паралельно на ряди X та W . Спочатку хочемо перевірити, що ряд W не впливає на ряд X з лагом 1. Для того, щоб отримати остаточну позитивну або негативну відповідь на це питання, треба аналізувати умовну залежність між tX та 1−tW за кондиціонування змінних 11,.., −−− mtt XX , 22 ,.., −−− mtt WW . Якщо ця умовна залежність встановлена, то зв'язок tt XW →−1 присутній, інакше – відсутній. Наступним кроком можна тестувати факт, що ряд W не впливає на ряд X з лагом 2. Для цього треба тестувати умовну залежність між tX та 2−tW , з використанням в умові відповідних минулих значень цих рядів. Якщо відомо, що зв'язок tt XW →−1 існує, то змінну 1−tW треба включати в умову вказаного тесту. Якщо цього не зробити, то умовна залежність між tX та 2−tW може існувати завдяки шляху ttt XWW →→ −− 12 , а не завдяки безпосередньому зв'язку tt XW →−2 з лагом 2. . Набір умов Моделі і засоби систем баз даних та знань [Введите текст] основі інформації t . «Не-причина» не покращує прогнозу наслідку. Формально це виражається як рівність умовних розподілень: )|()\|( 11 ttttt YpXYp = ++ . У більш стандартній формі це записується як ),\|()\|( 11 ttttttt XXYpXYp = ++ . (1) Отже, «не-каузальність» за Грейнджером може бути формалізована як умовна незалежність прогнозу від «не-причини» за умови врахування причин (релевантної інформації). Далі, поняття каузальності (за Грейнджером) формально з'являється як констатація не виконання рівності (1), тобто як констатація порушення цієї умовної незалежності. Змістовно, каузальність змінної X для наслідку Y (за Грейнджером) означає, що X несе «незамінну» інформацію для прогнозу наслідку Y . Проблема в тому, що факт цієї «незамінності» важко встановити. Вся релевантна інформація t у світі практично недоступна, і навіть не можна бути впевненим, що вдалося знайти всі можливі спільні причини для X та Y . Тому неможливо надійно перевірити чинність рівняння (1). Припустимо, аналітик здійснив перевірку сурогату рівняння (1) з використанням неповної інформації t . Тоді, якщо встановлено, що сурогат рівності (1) виконується, то висновок про відсутність каузального зв'язку між X та Y буде коректним. Натомість якщо встановлено, що сурогат рівності (1) не виконується, то висновок про каузальний зв'язок між X та Y правдоподібно може бути некоректним. Отже, концепції каузальності та не-каузальності (за Грейнджером) – несиметричні. Повернемося до цього пункту згодом. А зараз коротко розглянемо роль апарату умовної незалежності в динамічних і каузальних моделях. Класичне визначення марковської властивості встановлено для марковських ланцюгів. Але апарат марковських ланцюгів не є продуктивним для задачі виведення структур моделей (через абстрактність поняття стану). Важливою віхою досліджень в потрібному напрямку стала робота [12], яка адаптувала класичну теорію марковських процесів до реалістичної проблематики каузального моделювання. Замість «унітарного» марковского процесу аналізується система підпроцесів, що взаємодіють. Нехай структура авторегресійного процесу невідома. Для спрощення приймемо, що всі зовнішні фактори (тобто змінні поза набором X , Y , Z , W ) є взаємно незалежними, і кожний з них впливає на одну спостережувану змінну. Тоді наївний спосіб застосувати концепцію каузальності (за Грейнджером) для тестування гіпотетичного каузального зв'язку tt XW →−1 зведеться до перевірки виконання формули ),|()|( 1__ −= ttttt WXpXp , (2) де = t_  121012101210210 ,,..,,,,,..,,,,,..,,,,..,, −−−−−−− ttttttt ZZZZYYYYXXXXWWW . Набір умов t_ охоплює все минуле рядів X , Y , Z , W , за виключенням 1−tW (попереднього стану підпроцесу W ). Зрозуміло, що виконати перевірку рівності у подібному форматі практично неможливо. Для надійної оцінки умовної ймовірності з такою складною умовою потрібно мати величезний обсяг даних, а власне обчислення буде дуже важким. Потрібен акуратний й ефективний апарат аналізу даних, а також апарат аналізу графової структури темпоральної моделі. Принципова вразливість концепції каузальності Грейнджера полягає в тому, що вона залишає невизначеним, який прогноз мається на увазі – пасивний чи активний (ефект втручання). В класичних («статичних») каузальних мережах успішно застосовується поняття умовної незалежності та відповідний конструктивний критерій d -сепарації [3, 4, 7]. Як перенести цей апарат в контекст векторних часових рядів, де маємо довгі паралельні серії змінних? Приміром, якщо поглянути на векторний авторегресійний процес, зображений на рис. 3, то зрозуміло, що всі ряди основних змінних ( X , Y , Z , W ) є взаємозалежними. Але ці ряди відіграють різну роль в системі каузальних впливів. Зокрема, очевидно, що ряд W не впливає на інші ряди, але безпосередньо залежить тільки від ряду X . Щоб аналізувати структуру каузальних зв'язків між компонентами процесу, необхідно розглядати умовну незалежність у відповідному часовому форматі. Для векторних часових рядів функція сепарації полягає у тому, щоб акуратно «перерізати» паралельні серії змінних у відповідних фазах. Тобто конструктивний темпоральний критерій сепарації має залучати змінні, що знаходяться на коректно обраному «часовому фронті». Умовну незалежність «фронтового» типу в динамічних моделях називають «локальна незалежність». Припустимо, що в рекурентному процесі немає моментальних (ізохронних) зв'язків (вигляду tt RV → ), і що максимальний лаг автокореляційних зв'язків (вигляду tjt VV →− ) дорівнює m . Нехай треба перевірити факт, що ряд змінних W не впливає на ряд X . Нехай відомо, що немає жодного «третього» ряду, який впливає паралельно на ряди X та W . Спочатку хочемо перевірити, що ряд W не впливає на ряд X з лагом 1. Для того, щоб отримати остаточну позитивну або негативну відповідь на це питання, треба аналізувати умовну залежність між tX та 1−tW за кондиціонування змінних 11,.., −−− mtt XX , 22 ,.., −−− mtt WW . Якщо ця умовна залежність встановлена, то зв'язок tt XW →−1 присутній, інакше – відсутній. Наступним кроком можна тестувати факт, що ряд W не впливає на ряд X з лагом 2. Для цього треба тестувати умовну залежність між tX та 2−tW , з використанням в умові відповідних минулих значень цих рядів. Якщо відомо, що зв'язок tt XW →−1 існує, то змінну 1−tW треба включати в умову вказаного тесту. Якщо цього не зробити, то умовна залежність між tX та 2−tW може існувати завдяки шляху ttt XWW →→ −− 12 , а не завдяки безпосередньому зв'язку tt XW →−2 з лагом 2. охо- плює все минуле рядів Моделі і засоби систем баз даних та знань [Введите текст] основі інформації t . «Не-причина» не покращує прогнозу наслідку. Формально це виражається як рівність умовних розподілень: )|()\|( 11 ttttt YpXYp = ++ . У більш стандартній формі це записується як ),\|()\|( 11 ttttttt XXYpXYp = ++ . (1) Отже, «не-каузальність» за Грейнджером може бути формалізована як умовна незалежність прогнозу від «не-причини» за умови врахування причин (релевантної інформації). Далі, поняття каузальності (за Грейнджером) формально з'являється як констатація не виконання рівності (1), тобто як констатація порушення цієї умовної незалежності. Змістовно, каузальність змінної X для наслідку Y (за Грейнджером) означає, що X несе «незамінну» інформацію для прогнозу наслідку Y . Проблема в тому, що факт цієї «незамінності» важко встановити. Вся релевантна інформація t у світі практично недоступна, і навіть не можна бути впевненим, що вдалося знайти всі можливі спільні причини для X та Y . Тому неможливо надійно перевірити чинність рівняння (1). Припустимо, аналітик здійснив перевірку сурогату рівняння (1) з використанням неповної інформації t . Тоді, якщо встановлено, що сурогат рівності (1) виконується, то висновок про відсутність каузального зв'язку між X та Y буде коректним. Натомість якщо встановлено, що сурогат рівності (1) не виконується, то висновок про каузальний зв'язок між X та Y правдоподібно може бути некоректним. Отже, концепції каузальності та не-каузальності (за Грейнджером) – несиметричні. Повернемося до цього пункту згодом. А зараз коротко розглянемо роль апарату умовної незалежності в динамічних і каузальних моделях. Класичне визначення марковської властивості встановлено для марковських ланцюгів. Але апарат марковських ланцюгів не є продуктивним для задачі виведення структур моделей (через абстрактність поняття стану). Важливою віхою досліджень в потрібному напрямку стала робота [12], яка адаптувала класичну теорію марковських процесів до реалістичної проблематики каузального моделювання. Замість «унітарного» марковского процесу аналізується система підпроцесів, що взаємодіють. Нехай структура авторегресійного процесу невідома. Для спрощення приймемо, що всі зовнішні фактори (тобто змінні поза набором X , Y , Z , W ) є взаємно незалежними, і кожний з них впливає на одну спостережувану змінну. Тоді наївний спосіб застосувати концепцію каузальності (за Грейнджером) для тестування гіпотетичного каузального зв'язку tt XW →−1 зведеться до перевірки виконання формули ),|()|( 1__ −= ttttt WXpXp , (2) де = t_  121012101210210 ,,..,,,,,..,,,,,..,,,,..,, −−−−−−− ttttttt ZZZZYYYYXXXXWWW . Набір умов t_ охоплює все минуле рядів X , Y , Z , W , за виключенням 1−tW (попереднього стану підпроцесу W ). Зрозуміло, що виконати перевірку рівності у подібному форматі практично неможливо. Для надійної оцінки умовної ймовірності з такою складною умовою потрібно мати величезний обсяг даних, а власне обчислення буде дуже важким. Потрібен акуратний й ефективний апарат аналізу даних, а також апарат аналізу графової структури темпоральної моделі. Принципова вразливість концепції каузальності Грейнджера полягає в тому, що вона залишає невизначеним, який прогноз мається на увазі – пасивний чи активний (ефект втручання). В класичних («статичних») каузальних мережах успішно застосовується поняття умовної незалежності та відповідний конструктивний критерій d -сепарації [3, 4, 7]. Як перенести цей апарат в контекст векторних часових рядів, де маємо довгі паралельні серії змінних? Приміром, якщо поглянути на векторний авторегресійний процес, зображений на рис. 3, то зрозуміло, що всі ряди основних змінних ( X , Y , Z , W ) є взаємозалежними. Але ці ряди відіграють різну роль в системі каузальних впливів. Зокрема, очевидно, що ряд W не впливає на інші ряди, але безпосередньо залежить тільки від ряду X . Щоб аналізувати структуру каузальних зв'язків між компонентами процесу, необхідно розглядати умовну незалежність у відповідному часовому форматі. Для векторних часових рядів функція сепарації полягає у тому, щоб акуратно «перерізати» паралельні серії змінних у відповідних фазах. Тобто конструктивний темпоральний критерій сепарації має залучати змінні, що знаходяться на коректно обраному «часовому фронті». Умовну незалежність «фронтового» типу в динамічних моделях називають «локальна незалежність». Припустимо, що в рекурентному процесі немає моментальних (ізохронних) зв'язків (вигляду tt RV → ), і що максимальний лаг автокореляційних зв'язків (вигляду tjt VV →− ) дорівнює m . Нехай треба перевірити факт, що ряд змінних W не впливає на ряд X . Нехай відомо, що немає жодного «третього» ряду, який впливає паралельно на ряди X та W . Спочатку хочемо перевірити, що ряд W не впливає на ряд X з лагом 1. Для того, щоб отримати остаточну позитивну або негативну відповідь на це питання, треба аналізувати умовну залежність між tX та 1−tW за кондиціонування змінних 11,.., −−− mtt XX , 22 ,.., −−− mtt WW . Якщо ця умовна залежність встановлена, то зв'язок tt XW →−1 присутній, інакше – відсутній. Наступним кроком можна тестувати факт, що ряд W не впливає на ряд X з лагом 2. Для цього треба тестувати умовну залежність між tX та 2−tW , з використанням в умові відповідних минулих значень цих рядів. Якщо відомо, що зв'язок tt XW →−1 існує, то змінну 1−tW треба включати в умову вказаного тесту. Якщо цього не зробити, то умовна залежність між tX та 2−tW може існувати завдяки шляху ttt XWW →→ −− 12 , а не завдяки безпосередньому зв'язку tt XW →−2 з лагом 2. , за виключенням Моделі і засоби систем баз даних та знань [Введите текст] основі інформації t . «Не-причина» не покращує прогнозу наслідку. Формально це виражається як рівність умовних розподілень: )|()\|( 11 ttttt YpXYp = ++ . У більш стандартній формі це записується як ),\|()\|( 11 ttttttt XXYpXYp = ++ . (1) Отже, «не-каузальність» за Грейнджером може бути формалізована як умовна незалежність прогнозу від «не-причини» за умови врахування причин (релевантної інформації). Далі, поняття каузальності (за Грейнджером) формально з'являється як констатація не виконання рівності (1), тобто як констатація порушення цієї умовної незалежності. Змістовно, каузальність змінної X для наслідку Y (за Грейнджером) означає, що X несе «незамінну» інформацію для прогнозу наслідку Y . Проблема в тому, що факт цієї «незамінності» важко встановити. Вся релевантна інформація t у світі практично недоступна, і навіть не можна бути впевненим, що вдалося знайти всі можливі спільні причини для X та Y . Тому неможливо надійно перевірити чинність рівняння (1). Припустимо, аналітик здійснив перевірку сурогату рівняння (1) з використанням неповної інформації t . Тоді, якщо встановлено, що сурогат рівності (1) виконується, то висновок про відсутність каузального зв'язку між X та Y буде коректним. Натомість якщо встановлено, що сурогат рівності (1) не виконується, то висновок про каузальний зв'язок між X та Y правдоподібно може бути некоректним. Отже, концепції каузальності та не-каузальності (за Грейнджером) – несиметричні. Повернемося до цього пункту згодом. А зараз коротко розглянемо роль апарату умовної незалежності в динамічних і каузальних моделях. Класичне визначення марковської властивості встановлено для марковських ланцюгів. Але апарат марковських ланцюгів не є продуктивним для задачі виведення структур моделей (через абстрактність поняття стану). Важливою віхою досліджень в потрібному напрямку стала робота [12], яка адаптувала класичну теорію марковських процесів до реалістичної проблематики каузального моделювання. Замість «унітарного» марковского процесу аналізується система підпроцесів, що взаємодіють. Нехай структура авторегресійного процесу невідома. Для спрощення приймемо, що всі зовнішні фактори (тобто змінні поза набором X , Y , Z , W ) є взаємно незалежними, і кожний з них впливає на одну спостережувану змінну. Тоді наївний спосіб застосувати концепцію каузальності (за Грейнджером) для тестування гіпотетичного каузального зв'язку tt XW →−1 зведеться до перевірки виконання формули ),|()|( 1__ −= ttttt WXpXp , (2) де = t_  121012101210210 ,,..,,,,,..,,,,,..,,,,..,, −−−−−−− ttttttt ZZZZYYYYXXXXWWW . Набір умов t_ охоплює все минуле рядів X , Y , Z , W , за виключенням 1−tW (попереднього стану підпроцесу W ). Зрозуміло, що виконати перевірку рівності у подібному форматі практично неможливо. Для надійної оцінки умовної ймовірності з такою складною умовою потрібно мати величезний обсяг даних, а власне обчислення буде дуже важким. Потрібен акуратний й ефективний апарат аналізу даних, а також апарат аналізу графової структури темпоральної моделі. Принципова вразливість концепції каузальності Грейнджера полягає в тому, що вона залишає невизначеним, який прогноз мається на увазі – пасивний чи активний (ефект втручання). В класичних («статичних») каузальних мережах успішно застосовується поняття умовної незалежності та відповідний конструктивний критерій d -сепарації [3, 4, 7]. Як перенести цей апарат в контекст векторних часових рядів, де маємо довгі паралельні серії змінних? Приміром, якщо поглянути на векторний авторегресійний процес, зображений на рис. 3, то зрозуміло, що всі ряди основних змінних ( X , Y , Z , W ) є взаємозалежними. Але ці ряди відіграють різну роль в системі каузальних впливів. Зокрема, очевидно, що ряд W не впливає на інші ряди, але безпосередньо залежить тільки від ряду X . Щоб аналізувати структуру каузальних зв'язків між компонентами процесу, необхідно розглядати умовну незалежність у відповідному часовому форматі. Для векторних часових рядів функція сепарації полягає у тому, щоб акуратно «перерізати» паралельні серії змінних у відповідних фазах. Тобто конструктивний темпоральний критерій сепарації має залучати змінні, що знаходяться на коректно обраному «часовому фронті». Умовну незалежність «фронтового» типу в динамічних моделях називають «локальна незалежність». Припустимо, що в рекурентному процесі немає моментальних (ізохронних) зв'язків (вигляду tt RV → ), і що максимальний лаг автокореляційних зв'язків (вигляду tjt VV →− ) дорівнює m . Нехай треба перевірити факт, що ряд змінних W не впливає на ряд X . Нехай відомо, що немає жодного «третього» ряду, який впливає паралельно на ряди X та W . Спочатку хочемо перевірити, що ряд W не впливає на ряд X з лагом 1. Для того, щоб отримати остаточну позитивну або негативну відповідь на це питання, треба аналізувати умовну залежність між tX та 1−tW за кондиціонування змінних 11,.., −−− mtt XX , 22 ,.., −−− mtt WW . Якщо ця умовна залежність встановлена, то зв'язок tt XW →−1 присутній, інакше – відсутній. Наступним кроком можна тестувати факт, що ряд W не впливає на ряд X з лагом 2. Для цього треба тестувати умовну залежність між tX та 2−tW , з використанням в умові відповідних минулих значень цих рядів. Якщо відомо, що зв'язок tt XW →−1 існує, то змінну 1−tW треба включати в умову вказаного тесту. Якщо цього не зробити, то умовна залежність між tX та 2−tW може існувати завдяки шляху ttt XWW →→ −− 12 , а не завдяки безпосередньому зв'язку tt XW →−2 з лагом 2. (попереднього стану підпроцесу W). Зрозуміло, що виконати перевірку рівності у подібному форматі практично неможливо. Для надійної оцінки умовної ймо- вірності з такою складною умовою потрібно мати величезний обсяг даних, а власне обчислення буде дуже важким. Потрібен акуратний й ефективний апарат аналізу даних, а також апарат аналізу графової структу- ри темпоральної моделі. Принципова вразливість концепції каузальності Грейнджера полягає в тому, що вона залишає невизначеним, який прогноз мається на увазі – пасивний чи активний (ефект втручання). В класичних («статичних») каузальних мережах успішно застосовується поняття умовної незалежності та відповідний конструктивний критерій d-сепарації [3, 4, 7]. Як перенести цей апарат в контекст векторних часових рядів, де маємо довгі паралельні серії змінних? Приміром, якщо поглянути на векторний авторегресій- ний процес, зображений на рис. 3, то зрозуміло, що всі ряди основних змінних ( Моделі і засоби систем баз даних та знань [Введите текст] основі інформації t . «Не-причина» не покращує прогнозу наслідку. Формально це виражається як рівність умовних розподілень: )|()\|( 11 ttttt YpXYp = ++ . У більш стандартній формі це записується як ),\|()\|( 11 ttttttt XXYpXYp = ++ . (1) Отже, «не-каузальність» за Грейнджером може бути формалізована як умовна незалежність прогнозу від «не-причини» за умови врахування причин (релевантної інформації). Далі, поняття каузальності (за Грейнджером) формально з'являється як констатація не виконання рівності (1), тобто як констатація порушення цієї умовної незалежності. Змістовно, каузальність змінної X для наслідку Y (за Грейнджером) означає, що X несе «незамінну» інформацію для прогнозу наслідку Y . Проблема в тому, що факт цієї «незамінності» важко встановити. Вся релевантна інформація t у світі практично недоступна, і навіть не можна бути впевненим, що вдалося знайти всі можливі спільні причини для X та Y . Тому неможливо надійно перевірити чинність рівняння (1). Припустимо, аналітик здійснив перевірку сурогату рівняння (1) з використанням неповної інформації t . Тоді, якщо встановлено, що сурогат рівності (1) виконується, то висновок про відсутність каузального зв'язку між X та Y буде коректним. Натомість якщо встановлено, що сурогат рівності (1) не виконується, то висновок про каузальний зв'язок між X та Y правдоподібно може бути некоректним. Отже, концепції каузальності та не-каузальності (за Грейнджером) – несиметричні. Повернемося до цього пункту згодом. А зараз коротко розглянемо роль апарату умовної незалежності в динамічних і каузальних моделях. Класичне визначення марковської властивості встановлено для марковських ланцюгів. Але апарат марковських ланцюгів не є продуктивним для задачі виведення структур моделей (через абстрактність поняття стану). Важливою віхою досліджень в потрібному напрямку стала робота [12], яка адаптувала класичну теорію марковських процесів до реалістичної проблематики каузального моделювання. Замість «унітарного» марковского процесу аналізується система підпроцесів, що взаємодіють. Нехай структура авторегресійного процесу невідома. Для спрощення приймемо, що всі зовнішні фактори (тобто змінні поза набором X , Y , Z , W ) є взаємно незалежними, і кожний з них впливає на одну спостережувану змінну. Тоді наївний спосіб застосувати концепцію каузальності (за Грейнджером) для тестування гіпотетичного каузального зв'язку tt XW →−1 зведеться до перевірки виконання формули ),|()|( 1__ −= ttttt WXpXp , (2) де = t_  121012101210210 ,,..,,,,,..,,,,,..,,,,..,, −−−−−−− ttttttt ZZZZYYYYXXXXWWW . Набір умов t_ охоплює все минуле рядів X , Y , Z , W , за виключенням 1−tW (попереднього стану підпроцесу W ). Зрозуміло, що виконати перевірку рівності у подібному форматі практично неможливо. Для надійної оцінки умовної ймовірності з такою складною умовою потрібно мати величезний обсяг даних, а власне обчислення буде дуже важким. Потрібен акуратний й ефективний апарат аналізу даних, а також апарат аналізу графової структури темпоральної моделі. Принципова вразливість концепції каузальності Грейнджера полягає в тому, що вона залишає невизначеним, який прогноз мається на увазі – пасивний чи активний (ефект втручання). В класичних («статичних») каузальних мережах успішно застосовується поняття умовної незалежності та відповідний конструктивний критерій d -сепарації [3, 4, 7]. Як перенести цей апарат в контекст векторних часових рядів, де маємо довгі паралельні серії змінних? Приміром, якщо поглянути на векторний авторегресійний процес, зображений на рис. 3, то зрозуміло, що всі ряди основних змінних ( X , Y , Z , W ) є взаємозалежними. Але ці ряди відіграють різну роль в системі каузальних впливів. Зокрема, очевидно, що ряд W не впливає на інші ряди, але безпосередньо залежить тільки від ряду X . Щоб аналізувати структуру каузальних зв'язків між компонентами процесу, необхідно розглядати умовну незалежність у відповідному часовому форматі. Для векторних часових рядів функція сепарації полягає у тому, щоб акуратно «перерізати» паралельні серії змінних у відповідних фазах. Тобто конструктивний темпоральний критерій сепарації має залучати змінні, що знаходяться на коректно обраному «часовому фронті». Умовну незалежність «фронтового» типу в динамічних моделях називають «локальна незалежність». Припустимо, що в рекурентному процесі немає моментальних (ізохронних) зв'язків (вигляду tt RV → ), і що максимальний лаг автокореляційних зв'язків (вигляду tjt VV →− ) дорівнює m . Нехай треба перевірити факт, що ряд змінних W не впливає на ряд X . Нехай відомо, що немає жодного «третього» ряду, який впливає паралельно на ряди X та W . Спочатку хочемо перевірити, що ряд W не впливає на ряд X з лагом 1. Для того, щоб отримати остаточну позитивну або негативну відповідь на це питання, треба аналізувати умовну залежність між tX та 1−tW за кондиціонування змінних 11,.., −−− mtt XX , 22 ,.., −−− mtt WW . Якщо ця умовна залежність встановлена, то зв'язок tt XW →−1 присутній, інакше – відсутній. Наступним кроком можна тестувати факт, що ряд W не впливає на ряд X з лагом 2. Для цього треба тестувати умовну залежність між tX та 2−tW , з використанням в умові відповідних минулих значень цих рядів. Якщо відомо, що зв'язок tt XW →−1 існує, то змінну 1−tW треба включати в умову вказаного тесту. Якщо цього не зробити, то умовна залежність між tX та 2−tW може існувати завдяки шляху ttt XWW →→ −− 12 , а не завдяки безпосередньому зв'язку tt XW →−2 з лагом 2. ) є взаємозалежними. Але ці ряди відіграють різну роль в системі каузальних впливів. Зокрема, очевидно, що ряд W не впливає на інші ряди, але безпосередньо залежить тільки від ряду X. Щоб аналізувати структуру каузальних зв’язків між компонентами процесу, необхідно розглядати умовну незалежність у відповідному часовому форматі. Для век- торних часових рядів функція сепарації полягає у тому, щоб акуратно «перерізати» паралельні серії змінних у відповідних фазах. Тобто конструктивний темпоральний критерій сепарації має залучати змінні, що знаходять- ся на коректно обраному «часовому фронті». Умовну незалежність «фронтового» типу в динамічних моделях називають «локальна незалежність». Припустимо, що в рекурентному процесі немає моментальних (ізохронних) зв’язків (вигляду Моделі і засоби систем баз даних та знань [Введите текст] основі інформації t . «Не-причина» не покращує прогнозу наслідку. Формально це виражається як рівність умовних розподілень: )|()\|( 11 ttttt YpXYp = ++ . У більш стандартній формі це записується як ),\|()\|( 11 ttttttt XXYpXYp = ++ . (1) Отже, «не-каузальність» за Грейнджером може бути формалізована як умовна незалежність прогнозу від «не-причини» за умови врахування причин (релевантної інформації). Далі, поняття каузальності (за Грейнджером) формально з'являється як констатація не виконання рівності (1), тобто як констатація порушення цієї умовної незалежності. Змістовно, каузальність змінної X для наслідку Y (за Грейнджером) означає, що X несе «незамінну» інформацію для прогнозу наслідку Y . Проблема в тому, що факт цієї «незамінності» важко встановити. Вся релевантна інформація t у світі практично недоступна, і навіть не можна бути впевненим, що вдалося знайти всі можливі спільні причини для X та Y . Тому неможливо надійно перевірити чинність рівняння (1). Припустимо, аналітик здійснив перевірку сурогату рівняння (1) з використанням неповної інформації t . Тоді, якщо встановлено, що сурогат рівності (1) виконується, то висновок про відсутність каузального зв'язку між X та Y буде коректним. Натомість якщо встановлено, що сурогат рівності (1) не виконується, то висновок про каузальний зв'язок між X та Y правдоподібно може бути некоректним. Отже, концепції каузальності та не-каузальності (за Грейнджером) – несиметричні. Повернемося до цього пункту згодом. А зараз коротко розглянемо роль апарату умовної незалежності в динамічних і каузальних моделях. Класичне визначення марковської властивості встановлено для марковських ланцюгів. Але апарат марковських ланцюгів не є продуктивним для задачі виведення структур моделей (через абстрактність поняття стану). Важливою віхою досліджень в потрібному напрямку стала робота [12], яка адаптувала класичну теорію марковських процесів до реалістичної проблематики каузального моделювання. Замість «унітарного» марковского процесу аналізується система підпроцесів, що взаємодіють. Нехай структура авторегресійного процесу невідома. Для спрощення приймемо, що всі зовнішні фактори (тобто змінні поза набором X , Y , Z , W ) є взаємно незалежними, і кожний з них впливає на одну спостережувану змінну. Тоді наївний спосіб застосувати концепцію каузальності (за Грейнджером) для тестування гіпотетичного каузального зв'язку tt XW →−1 зведеться до перевірки виконання формули ),|()|( 1__ −= ttttt WXpXp , (2) де = t_  121012101210210 ,,..,,,,,..,,,,,..,,,,..,, −−−−−−− ttttttt ZZZZYYYYXXXXWWW . Набір умов t_ охоплює все минуле рядів X , Y , Z , W , за виключенням 1−tW (попереднього стану підпроцесу W ). Зрозуміло, що виконати перевірку рівності у подібному форматі практично неможливо. Для надійної оцінки умовної ймовірності з такою складною умовою потрібно мати величезний обсяг даних, а власне обчислення буде дуже важким. Потрібен акуратний й ефективний апарат аналізу даних, а також апарат аналізу графової структури темпоральної моделі. Принципова вразливість концепції каузальності Грейнджера полягає в тому, що вона залишає невизначеним, який прогноз мається на увазі – пасивний чи активний (ефект втручання). В класичних («статичних») каузальних мережах успішно застосовується поняття умовної незалежності та відповідний конструктивний критерій d -сепарації [3, 4, 7]. Як перенести цей апарат в контекст векторних часових рядів, де маємо довгі паралельні серії змінних? Приміром, якщо поглянути на векторний авторегресійний процес, зображений на рис. 3, то зрозуміло, що всі ряди основних змінних ( X , Y , Z , W ) є взаємозалежними. Але ці ряди відіграють різну роль в системі каузальних впливів. Зокрема, очевидно, що ряд W не впливає на інші ряди, але безпосередньо залежить тільки від ряду X . Щоб аналізувати структуру каузальних зв'язків між компонентами процесу, необхідно розглядати умовну незалежність у відповідному часовому форматі. Для векторних часових рядів функція сепарації полягає у тому, щоб акуратно «перерізати» паралельні серії змінних у відповідних фазах. Тобто конструктивний темпоральний критерій сепарації має залучати змінні, що знаходяться на коректно обраному «часовому фронті». Умовну незалежність «фронтового» типу в динамічних моделях називають «локальна незалежність». Припустимо, що в рекурентному процесі немає моментальних (ізохронних) зв'язків (вигляду tt RV → ), і що максимальний лаг автокореляційних зв'язків (вигляду tjt VV →− ) дорівнює m . Нехай треба перевірити факт, що ряд змінних W не впливає на ряд X . Нехай відомо, що немає жодного «третього» ряду, який впливає паралельно на ряди X та W . Спочатку хочемо перевірити, що ряд W не впливає на ряд X з лагом 1. Для того, щоб отримати остаточну позитивну або негативну відповідь на це питання, треба аналізувати умовну залежність між tX та 1−tW за кондиціонування змінних 11,.., −−− mtt XX , 22 ,.., −−− mtt WW . Якщо ця умовна залежність встановлена, то зв'язок tt XW →−1 присутній, інакше – відсутній. Наступним кроком можна тестувати факт, що ряд W не впливає на ряд X з лагом 2. Для цього треба тестувати умовну залежність між tX та 2−tW , з використанням в умові відповідних минулих значень цих рядів. Якщо відомо, що зв'язок tt XW →−1 існує, то змінну 1−tW треба включати в умову вказаного тесту. Якщо цього не зробити, то умовна залежність між tX та 2−tW може існувати завдяки шляху ttt XWW →→ −− 12 , а не завдяки безпосередньому зв'язку tt XW →−2 з лагом 2. ), і що максимальний лаг автокореляційних зв’язків (вигляду Моделі і засоби систем баз даних та знань [Введите текст] основі інформації t . «Не-причина» не покращує прогнозу наслідку. Формально це виражається як рівність умовних розподілень: )|()\|( 11 ttttt YpXYp = ++ . У більш стандартній формі це записується як ),\|()\|( 11 ttttttt XXYpXYp = ++ . (1) Отже, «не-каузальність» за Грейнджером може бути формалізована як умовна незалежність прогнозу від «не-причини» за умови врахування причин (релевантної інформації). Далі, поняття каузальності (за Грейнджером) формально з'являється як констатація не виконання рівності (1), тобто як констатація порушення цієї умовної незалежності. Змістовно, каузальність змінної X для наслідку Y (за Грейнджером) означає, що X несе «незамінну» інформацію для прогнозу наслідку Y . Проблема в тому, що факт цієї «незамінності» важко встановити. Вся релевантна інформація t у світі практично недоступна, і навіть не можна бути впевненим, що вдалося знайти всі можливі спільні причини для X та Y . Тому неможливо надійно перевірити чинність рівняння (1). Припустимо, аналітик здійснив перевірку сурогату рівняння (1) з використанням неповної інформації t . Тоді, якщо встановлено, що сурогат рівності (1) виконується, то висновок про відсутність каузального зв'язку між X та Y буде коректним. Натомість якщо встановлено, що сурогат рівності (1) не виконується, то висновок про каузальний зв'язок між X та Y правдоподібно може бути некоректним. Отже, концепції каузальності та не-каузальності (за Грейнджером) – несиметричні. Повернемося до цього пункту згодом. А зараз коротко розглянемо роль апарату умовної незалежності в динамічних і каузальних моделях. Класичне визначення марковської властивості встановлено для марковських ланцюгів. Але апарат марковських ланцюгів не є продуктивним для задачі виведення структур моделей (через абстрактність поняття стану). Важливою віхою досліджень в потрібному напрямку стала робота [12], яка адаптувала класичну теорію марковських процесів до реалістичної проблематики каузального моделювання. Замість «унітарного» марковского процесу аналізується система підпроцесів, що взаємодіють. Нехай структура авторегресійного процесу невідома. Для спрощення приймемо, що всі зовнішні фактори (тобто змінні поза набором X , Y , Z , W ) є взаємно незалежними, і кожний з них впливає на одну спостережувану змінну. Тоді наївний спосіб застосувати концепцію каузальності (за Грейнджером) для тестування гіпотетичного каузального зв'язку tt XW →−1 зведеться до перевірки виконання формули ),|()|( 1__ −= ttttt WXpXp , (2) де = t_  121012101210210 ,,..,,,,,..,,,,,..,,,,..,, −−−−−−− ttttttt ZZZZYYYYXXXXWWW . Набір умов t_ охоплює все минуле рядів X , Y , Z , W , за виключенням 1−tW (попереднього стану підпроцесу W ). Зрозуміло, що виконати перевірку рівності у подібному форматі практично неможливо. Для надійної оцінки умовної ймовірності з такою складною умовою потрібно мати величезний обсяг даних, а власне обчислення буде дуже важким. Потрібен акуратний й ефективний апарат аналізу даних, а також апарат аналізу графової структури темпоральної моделі. Принципова вразливість концепції каузальності Грейнджера полягає в тому, що вона залишає невизначеним, який прогноз мається на увазі – пасивний чи активний (ефект втручання). В класичних («статичних») каузальних мережах успішно застосовується поняття умовної незалежності та відповідний конструктивний критерій d -сепарації [3, 4, 7]. Як перенести цей апарат в контекст векторних часових рядів, де маємо довгі паралельні серії змінних? Приміром, якщо поглянути на векторний авторегресійний процес, зображений на рис. 3, то зрозуміло, що всі ряди основних змінних ( X , Y , Z , W ) є взаємозалежними. Але ці ряди відіграють різну роль в системі каузальних впливів. Зокрема, очевидно, що ряд W не впливає на інші ряди, але безпосередньо залежить тільки від ряду X . Щоб аналізувати структуру каузальних зв'язків між компонентами процесу, необхідно розглядати умовну незалежність у відповідному часовому форматі. Для векторних часових рядів функція сепарації полягає у тому, щоб акуратно «перерізати» паралельні серії змінних у відповідних фазах. Тобто конструктивний темпоральний критерій сепарації має залучати змінні, що знаходяться на коректно обраному «часовому фронті». Умовну незалежність «фронтового» типу в динамічних моделях називають «локальна незалежність». Припустимо, що в рекурентному процесі немає моментальних (ізохронних) зв'язків (вигляду tt RV → ), і що максимальний лаг автокореляційних зв'язків (вигляду tjt VV →− ) дорівнює m . Нехай треба перевірити факт, що ряд змінних W не впливає на ряд X . Нехай відомо, що немає жодного «третього» ряду, який впливає паралельно на ряди X та W . Спочатку хочемо перевірити, що ряд W не впливає на ряд X з лагом 1. Для того, щоб отримати остаточну позитивну або негативну відповідь на це питання, треба аналізувати умовну залежність між tX та 1−tW за кондиціонування змінних 11,.., −−− mtt XX , 22 ,.., −−− mtt WW . Якщо ця умовна залежність встановлена, то зв'язок tt XW →−1 присутній, інакше – відсутній. Наступним кроком можна тестувати факт, що ряд W не впливає на ряд X з лагом 2. Для цього треба тестувати умовну залежність між tX та 2−tW , з використанням в умові відповідних минулих значень цих рядів. Якщо відомо, що зв'язок tt XW →−1 існує, то змінну 1−tW треба включати в умову вказаного тесту. Якщо цього не зробити, то умовна залежність між tX та 2−tW може існувати завдяки шляху ttt XWW →→ −− 12 , а не завдяки безпосередньому зв'язку tt XW →−2 з лагом 2. ) дорівнює m. Нехай треба перевірити факт, що ряд змінних W не впливає на ряд X. Нехай відомо, що немає жодного «третього» ряду, який впливає пара- лельно на ряди X та W. Спочатку хочемо перевірити, що ряд W не впливає на ряд X з лагом 1. Для того, щоб отримати остаточну позитивну або негативну відповідь на це питання, треба аналізувати умовну залежність між Моделі і засоби систем баз даних та знань [Введите текст] основі інформації t . «Не-причина» не покращує прогнозу наслідку. Формально це виражається як рівність умовних розподілень: )|()\|( 11 ttttt YpXYp = ++ . У більш стандартній формі це записується як ),\|()\|( 11 ttttttt XXYpXYp = ++ . (1) Отже, «не-каузальність» за Грейнджером може бути формалізована як умовна незалежність прогнозу від «не-причини» за умови врахування причин (релевантної інформації). Далі, поняття каузальності (за Грейнджером) формально з'являється як констатація не виконання рівності (1), тобто як констатація порушення цієї умовної незалежності. Змістовно, каузальність змінної X для наслідку Y (за Грейнджером) означає, що X несе «незамінну» інформацію для прогнозу наслідку Y . Проблема в тому, що факт цієї «незамінності» важко встановити. Вся релевантна інформація t у світі практично недоступна, і навіть не можна бути впевненим, що вдалося знайти всі можливі спільні причини для X та Y . Тому неможливо надійно перевірити чинність рівняння (1). Припустимо, аналітик здійснив перевірку сурогату рівняння (1) з використанням неповної інформації t . Тоді, якщо встановлено, що сурогат рівності (1) виконується, то висновок про відсутність каузального зв'язку між X та Y буде коректним. Натомість якщо встановлено, що сурогат рівності (1) не виконується, то висновок про каузальний зв'язок між X та Y правдоподібно може бути некоректним. Отже, концепції каузальності та не-каузальності (за Грейнджером) – несиметричні. Повернемося до цього пункту згодом. А зараз коротко розглянемо роль апарату умовної незалежності в динамічних і каузальних моделях. Класичне визначення марковської властивості встановлено для марковських ланцюгів. Але апарат марковських ланцюгів не є продуктивним для задачі виведення структур моделей (через абстрактність поняття стану). Важливою віхою досліджень в потрібному напрямку стала робота [12], яка адаптувала класичну теорію марковських процесів до реалістичної проблематики каузального моделювання. Замість «унітарного» марковского процесу аналізується система підпроцесів, що взаємодіють. Нехай структура авторегресійного процесу невідома. Для спрощення приймемо, що всі зовнішні фактори (тобто змінні поза набором X , Y , Z , W ) є взаємно незалежними, і кожний з них впливає на одну спостережувану змінну. Тоді наївний спосіб застосувати концепцію каузальності (за Грейнджером) для тестування гіпотетичного каузального зв'язку tt XW →−1 зведеться до перевірки виконання формули ),|()|( 1__ −= ttttt WXpXp , (2) де = t_  121012101210210 ,,..,,,,,..,,,,,..,,,,..,, −−−−−−− ttttttt ZZZZYYYYXXXXWWW . Набір умов t_ охоплює все минуле рядів X , Y , Z , W , за виключенням 1−tW (попереднього стану підпроцесу W ). Зрозуміло, що виконати перевірку рівності у подібному форматі практично неможливо. Для надійної оцінки умовної ймовірності з такою складною умовою потрібно мати величезний обсяг даних, а власне обчислення буде дуже важким. Потрібен акуратний й ефективний апарат аналізу даних, а також апарат аналізу графової структури темпоральної моделі. Принципова вразливість концепції каузальності Грейнджера полягає в тому, що вона залишає невизначеним, який прогноз мається на увазі – пасивний чи активний (ефект втручання). В класичних («статичних») каузальних мережах успішно застосовується поняття умовної незалежності та відповідний конструктивний критерій d -сепарації [3, 4, 7]. Як перенести цей апарат в контекст векторних часових рядів, де маємо довгі паралельні серії змінних? Приміром, якщо поглянути на векторний авторегресійний процес, зображений на рис. 3, то зрозуміло, що всі ряди основних змінних ( X , Y , Z , W ) є взаємозалежними. Але ці ряди відіграють різну роль в системі каузальних впливів. Зокрема, очевидно, що ряд W не впливає на інші ряди, але безпосередньо залежить тільки від ряду X . Щоб аналізувати структуру каузальних зв'язків між компонентами процесу, необхідно розглядати умовну незалежність у відповідному часовому форматі. Для векторних часових рядів функція сепарації полягає у тому, щоб акуратно «перерізати» паралельні серії змінних у відповідних фазах. Тобто конструктивний темпоральний критерій сепарації має залучати змінні, що знаходяться на коректно обраному «часовому фронті». Умовну незалежність «фронтового» типу в динамічних моделях називають «локальна незалежність». Припустимо, що в рекурентному процесі немає моментальних (ізохронних) зв'язків (вигляду tt RV → ), і що максимальний лаг автокореляційних зв'язків (вигляду tjt VV →− ) дорівнює m . Нехай треба перевірити факт, що ряд змінних W не впливає на ряд X . Нехай відомо, що немає жодного «третього» ряду, який впливає паралельно на ряди X та W . Спочатку хочемо перевірити, що ряд W не впливає на ряд X з лагом 1. Для того, щоб отримати остаточну позитивну або негативну відповідь на це питання, треба аналізувати умовну залежність між tX та 1−tW за кондиціонування змінних 11,.., −−− mtt XX , 22 ,.., −−− mtt WW . Якщо ця умовна залежність встановлена, то зв'язок tt XW →−1 присутній, інакше – відсутній. Наступним кроком можна тестувати факт, що ряд W не впливає на ряд X з лагом 2. Для цього треба тестувати умовну залежність між tX та 2−tW , з використанням в умові відповідних минулих значень цих рядів. Якщо відомо, що зв'язок tt XW →−1 існує, то змінну 1−tW треба включати в умову вказаного тесту. Якщо цього не зробити, то умовна залежність між tX та 2−tW може існувати завдяки шляху ttt XWW →→ −− 12 , а не завдяки безпосередньому зв'язку tt XW →−2 з лагом 2. за кондиціонування змінних Моделі і засоби систем баз даних та знань [Введите текст] основі інформації t . «Не-причина» не покращує прогнозу наслідку. Формально це виражається як рівність умовних розподілень: )|()\|( 11 ttttt YpXYp = ++ . У більш стандартній формі це записується як ),\|()\|( 11 ttttttt XXYpXYp = ++ . (1) Отже, «не-каузальність» за Грейнджером може бути формалізована як умовна незалежність прогнозу від «не-причини» за умови врахування причин (релевантної інформації). Далі, поняття каузальності (за Грейнджером) формально з'являється як констатація не виконання рівності (1), тобто як констатація порушення цієї умовної незалежності. Змістовно, каузальність змінної X для наслідку Y (за Грейнджером) означає, що X несе «незамінну» інформацію для прогнозу наслідку Y . Проблема в тому, що факт цієї «незамінності» важко встановити. Вся релевантна інформація t у світі практично недоступна, і навіть не можна бути впевненим, що вдалося знайти всі можливі спільні причини для X та Y . Тому неможливо надійно перевірити чинність рівняння (1). Припустимо, аналітик здійснив перевірку сурогату рівняння (1) з використанням неповної інформації t . Тоді, якщо встановлено, що сурогат рівності (1) виконується, то висновок про відсутність каузального зв'язку між X та Y буде коректним. Натомість якщо встановлено, що сурогат рівності (1) не виконується, то висновок про каузальний зв'язок між X та Y правдоподібно може бути некоректним. Отже, концепції каузальності та не-каузальності (за Грейнджером) – несиметричні. Повернемося до цього пункту згодом. А зараз коротко розглянемо роль апарату умовної незалежності в динамічних і каузальних моделях. Класичне визначення марковської властивості встановлено для марковських ланцюгів. Але апарат марковських ланцюгів не є продуктивним для задачі виведення структур моделей (через абстрактність поняття стану). Важливою віхою досліджень в потрібному напрямку стала робота [12], яка адаптувала класичну теорію марковських процесів до реалістичної проблематики каузального моделювання. Замість «унітарного» марковского процесу аналізується система підпроцесів, що взаємодіють. Нехай структура авторегресійного процесу невідома. Для спрощення приймемо, що всі зовнішні фактори (тобто змінні поза набором X , Y , Z , W ) є взаємно незалежними, і кожний з них впливає на одну спостережувану змінну. Тоді наївний спосіб застосувати концепцію каузальності (за Грейнджером) для тестування гіпотетичного каузального зв'язку tt XW →−1 зведеться до перевірки виконання формули ),|()|( 1__ −= ttttt WXpXp , (2) де = t_  121012101210210 ,,..,,,,,..,,,,,..,,,,..,, −−−−−−− ttttttt ZZZZYYYYXXXXWWW . Набір умов t_ охоплює все минуле рядів X , Y , Z , W , за виключенням 1−tW (попереднього стану підпроцесу W ). Зрозуміло, що виконати перевірку рівності у подібному форматі практично неможливо. Для надійної оцінки умовної ймовірності з такою складною умовою потрібно мати величезний обсяг даних, а власне обчислення буде дуже важким. Потрібен акуратний й ефективний апарат аналізу даних, а також апарат аналізу графової структури темпоральної моделі. Принципова вразливість концепції каузальності Грейнджера полягає в тому, що вона залишає невизначеним, який прогноз мається на увазі – пасивний чи активний (ефект втручання). В класичних («статичних») каузальних мережах успішно застосовується поняття умовної незалежності та відповідний конструктивний критерій d -сепарації [3, 4, 7]. Як перенести цей апарат в контекст векторних часових рядів, де маємо довгі паралельні серії змінних? Приміром, якщо поглянути на векторний авторегресійний процес, зображений на рис. 3, то зрозуміло, що всі ряди основних змінних ( X , Y , Z , W ) є взаємозалежними. Але ці ряди відіграють різну роль в системі каузальних впливів. Зокрема, очевидно, що ряд W не впливає на інші ряди, але безпосередньо залежить тільки від ряду X . Щоб аналізувати структуру каузальних зв'язків між компонентами процесу, необхідно розглядати умовну незалежність у відповідному часовому форматі. Для векторних часових рядів функція сепарації полягає у тому, щоб акуратно «перерізати» паралельні серії змінних у відповідних фазах. Тобто конструктивний темпоральний критерій сепарації має залучати змінні, що знаходяться на коректно обраному «часовому фронті». Умовну незалежність «фронтового» типу в динамічних моделях називають «локальна незалежність». Припустимо, що в рекурентному процесі немає моментальних (ізохронних) зв'язків (вигляду tt RV → ), і що максимальний лаг автокореляційних зв'язків (вигляду tjt VV →− ) дорівнює m . Нехай треба перевірити факт, що ряд змінних W не впливає на ряд X . Нехай відомо, що немає жодного «третього» ряду, який впливає паралельно на ряди X та W . Спочатку хочемо перевірити, що ряд W не впливає на ряд X з лагом 1. Для того, щоб отримати остаточну позитивну або негативну відповідь на це питання, треба аналізувати умовну залежність між tX та 1−tW за кондиціонування змінних 11,.., −−− mtt XX , 22 ,.., −−− mtt WW . Якщо ця умовна залежність встановлена, то зв'язок tt XW →−1 присутній, інакше – відсутній. Наступним кроком можна тестувати факт, що ряд W не впливає на ряд X з лагом 2. Для цього треба тестувати умовну залежність між tX та 2−tW , з використанням в умові відповідних минулих значень цих рядів. Якщо відомо, що зв'язок tt XW →−1 існує, то змінну 1−tW треба включати в умову вказаного тесту. Якщо цього не зробити, то умовна залежність між tX та 2−tW може існувати завдяки шляху ttt XWW →→ −− 12 , а не завдяки безпосередньому зв'язку tt XW →−2 з лагом 2. . Якщо ця умовна залежність встановле- на, то зв’язок Моделі і засоби систем баз даних та знань [Введите текст] основі інформації t . «Не-причина» не покращує прогнозу наслідку. Формально це виражається як рівність умовних розподілень: )|()\|( 11 ttttt YpXYp = ++ . У більш стандартній формі це записується як ),\|()\|( 11 ttttttt XXYpXYp = ++ . (1) Отже, «не-каузальність» за Грейнджером може бути формалізована як умовна незалежність прогнозу від «не-причини» за умови врахування причин (релевантної інформації). Далі, поняття каузальності (за Грейнджером) формально з'являється як констатація не виконання рівності (1), тобто як констатація порушення цієї умовної незалежності. Змістовно, каузальність змінної X для наслідку Y (за Грейнджером) означає, що X несе «незамінну» інформацію для прогнозу наслідку Y . Проблема в тому, що факт цієї «незамінності» важко встановити. Вся релевантна інформація t у світі практично недоступна, і навіть не можна бути впевненим, що вдалося знайти всі можливі спільні причини для X та Y . Тому неможливо надійно перевірити чинність рівняння (1). Припустимо, аналітик здійснив перевірку сурогату рівняння (1) з використанням неповної інформації t . Тоді, якщо встановлено, що сурогат рівності (1) виконується, то висновок про відсутність каузального зв'язку між X та Y буде коректним. Натомість якщо встановлено, що сурогат рівності (1) не виконується, то висновок про каузальний зв'язок між X та Y правдоподібно може бути некоректним. Отже, концепції каузальності та не-каузальності (за Грейнджером) – несиметричні. Повернемося до цього пункту згодом. А зараз коротко розглянемо роль апарату умовної незалежності в динамічних і каузальних моделях. Класичне визначення марковської властивості встановлено для марковських ланцюгів. Але апарат марковських ланцюгів не є продуктивним для задачі виведення структур моделей (через абстрактність поняття стану). Важливою віхою досліджень в потрібному напрямку стала робота [12], яка адаптувала класичну теорію марковських процесів до реалістичної проблематики каузального моделювання. Замість «унітарного» марковского процесу аналізується система підпроцесів, що взаємодіють. Нехай структура авторегресійного процесу невідома. Для спрощення приймемо, що всі зовнішні фактори (тобто змінні поза набором X , Y , Z , W ) є взаємно незалежними, і кожний з них впливає на одну спостережувану змінну. Тоді наївний спосіб застосувати концепцію каузальності (за Грейнджером) для тестування гіпотетичного каузального зв'язку tt XW →−1 зведеться до перевірки виконання формули ),|()|( 1__ −= ttttt WXpXp , (2) де = t_  121012101210210 ,,..,,,,,..,,,,,..,,,,..,, −−−−−−− ttttttt ZZZZYYYYXXXXWWW . Набір умов t_ охоплює все минуле рядів X , Y , Z , W , за виключенням 1−tW (попереднього стану підпроцесу W ). Зрозуміло, що виконати перевірку рівності у подібному форматі практично неможливо. Для надійної оцінки умовної ймовірності з такою складною умовою потрібно мати величезний обсяг даних, а власне обчислення буде дуже важким. Потрібен акуратний й ефективний апарат аналізу даних, а також апарат аналізу графової структури темпоральної моделі. Принципова вразливість концепції каузальності Грейнджера полягає в тому, що вона залишає невизначеним, який прогноз мається на увазі – пасивний чи активний (ефект втручання). В класичних («статичних») каузальних мережах успішно застосовується поняття умовної незалежності та відповідний конструктивний критерій d -сепарації [3, 4, 7]. Як перенести цей апарат в контекст векторних часових рядів, де маємо довгі паралельні серії змінних? Приміром, якщо поглянути на векторний авторегресійний процес, зображений на рис. 3, то зрозуміло, що всі ряди основних змінних ( X , Y , Z , W ) є взаємозалежними. Але ці ряди відіграють різну роль в системі каузальних впливів. Зокрема, очевидно, що ряд W не впливає на інші ряди, але безпосередньо залежить тільки від ряду X . Щоб аналізувати структуру каузальних зв'язків між компонентами процесу, необхідно розглядати умовну незалежність у відповідному часовому форматі. Для векторних часових рядів функція сепарації полягає у тому, щоб акуратно «перерізати» паралельні серії змінних у відповідних фазах. Тобто конструктивний темпоральний критерій сепарації має залучати змінні, що знаходяться на коректно обраному «часовому фронті». Умовну незалежність «фронтового» типу в динамічних моделях називають «локальна незалежність». Припустимо, що в рекурентному процесі немає моментальних (ізохронних) зв'язків (вигляду tt RV → ), і що максимальний лаг автокореляційних зв'язків (вигляду tjt VV →− ) дорівнює m . Нехай треба перевірити факт, що ряд змінних W не впливає на ряд X . Нехай відомо, що немає жодного «третього» ряду, який впливає паралельно на ряди X та W . Спочатку хочемо перевірити, що ряд W не впливає на ряд X з лагом 1. Для того, щоб отримати остаточну позитивну або негативну відповідь на це питання, треба аналізувати умовну залежність між tX та 1−tW за кондиціонування змінних 11,.., −−− mtt XX , 22 ,.., −−− mtt WW . Якщо ця умовна залежність встановлена, то зв'язок tt XW →−1 присутній, інакше – відсутній. Наступним кроком можна тестувати факт, що ряд W не впливає на ряд X з лагом 2. Для цього треба тестувати умовну залежність між tX та 2−tW , з використанням в умові відповідних минулих значень цих рядів. Якщо відомо, що зв'язок tt XW →−1 існує, то змінну 1−tW треба включати в умову вказаного тесту. Якщо цього не зробити, то умовна залежність між tX та 2−tW може існувати завдяки шляху ttt XWW →→ −− 12 , а не завдяки безпосередньому зв'язку tt XW →−2 з лагом 2. присутній, інакше – відсутній. Наступним кроком можна тестувати факт, що ряд W не впливає на ряд X з лагом 2. Для цього треба тестувати умовну залежність між Моделі і засоби систем баз даних та знань [Введите текст] основі інформації t . «Не-причина» не покращує прогнозу наслідку. Формально це виражається як рівність умовних розподілень: )|()\|( 11 ttttt YpXYp = ++ . У більш стандартній формі це записується як ),\|()\|( 11 ttttttt XXYpXYp = ++ . (1) Отже, «не-каузальність» за Грейнджером може бути формалізована як умовна незалежність прогнозу від «не-причини» за умови врахування причин (релевантної інформації). Далі, поняття каузальності (за Грейнджером) формально з'являється як констатація не виконання рівності (1), тобто як констатація порушення цієї умовної незалежності. Змістовно, каузальність змінної X для наслідку Y (за Грейнджером) означає, що X несе «незамінну» інформацію для прогнозу наслідку Y . Проблема в тому, що факт цієї «незамінності» важко встановити. Вся релевантна інформація t у світі практично недоступна, і навіть не можна бути впевненим, що вдалося знайти всі можливі спільні причини для X та Y . Тому неможливо надійно перевірити чинність рівняння (1). Припустимо, аналітик здійснив перевірку сурогату рівняння (1) з використанням неповної інформації t . Тоді, якщо встановлено, що сурогат рівності (1) виконується, то висновок про відсутність каузального зв'язку між X та Y буде коректним. Натомість якщо встановлено, що сурогат рівності (1) не виконується, то висновок про каузальний зв'язок між X та Y правдоподібно може бути некоректним. Отже, концепції каузальності та не-каузальності (за Грейнджером) – несиметричні. Повернемося до цього пункту згодом. А зараз коротко розглянемо роль апарату умовної незалежності в динамічних і каузальних моделях. Класичне визначення марковської властивості встановлено для марковських ланцюгів. Але апарат марковських ланцюгів не є продуктивним для задачі виведення структур моделей (через абстрактність поняття стану). Важливою віхою досліджень в потрібному напрямку стала робота [12], яка адаптувала класичну теорію марковських процесів до реалістичної проблематики каузального моделювання. Замість «унітарного» марковского процесу аналізується система підпроцесів, що взаємодіють. Нехай структура авторегресійного процесу невідома. Для спрощення приймемо, що всі зовнішні фактори (тобто змінні поза набором X , Y , Z , W ) є взаємно незалежними, і кожний з них впливає на одну спостережувану змінну. Тоді наївний спосіб застосувати концепцію каузальності (за Грейнджером) для тестування гіпотетичного каузального зв'язку tt XW →−1 зведеться до перевірки виконання формули ),|()|( 1__ −= ttttt WXpXp , (2) де = t_  121012101210210 ,,..,,,,,..,,,,,..,,,,..,, −−−−−−− ttttttt ZZZZYYYYXXXXWWW . Набір умов t_ охоплює все минуле рядів X , Y , Z , W , за виключенням 1−tW (попереднього стану підпроцесу W ). Зрозуміло, що виконати перевірку рівності у подібному форматі практично неможливо. Для надійної оцінки умовної ймовірності з такою складною умовою потрібно мати величезний обсяг даних, а власне обчислення буде дуже важким. Потрібен акуратний й ефективний апарат аналізу даних, а також апарат аналізу графової структури темпоральної моделі. Принципова вразливість концепції каузальності Грейнджера полягає в тому, що вона залишає невизначеним, який прогноз мається на увазі – пасивний чи активний (ефект втручання). В класичних («статичних») каузальних мережах успішно застосовується поняття умовної незалежності та відповідний конструктивний критерій d -сепарації [3, 4, 7]. Як перенести цей апарат в контекст векторних часових рядів, де маємо довгі паралельні серії змінних? Приміром, якщо поглянути на векторний авторегресійний процес, зображений на рис. 3, то зрозуміло, що всі ряди основних змінних ( X , Y , Z , W ) є взаємозалежними. Але ці ряди відіграють різну роль в системі каузальних впливів. Зокрема, очевидно, що ряд W не впливає на інші ряди, але безпосередньо залежить тільки від ряду X . Щоб аналізувати структуру каузальних зв'язків між компонентами процесу, необхідно розглядати умовну незалежність у відповідному часовому форматі. Для векторних часових рядів функція сепарації полягає у тому, щоб акуратно «перерізати» паралельні серії змінних у відповідних фазах. Тобто конструктивний темпоральний критерій сепарації має залучати змінні, що знаходяться на коректно обраному «часовому фронті». Умовну незалежність «фронтового» типу в динамічних моделях називають «локальна незалежність». Припустимо, що в рекурентному процесі немає моментальних (ізохронних) зв'язків (вигляду tt RV → ), і що максимальний лаг автокореляційних зв'язків (вигляду tjt VV →− ) дорівнює m . Нехай треба перевірити факт, що ряд змінних W не впливає на ряд X . Нехай відомо, що немає жодного «третього» ряду, який впливає паралельно на ряди X та W . Спочатку хочемо перевірити, що ряд W не впливає на ряд X з лагом 1. Для того, щоб отримати остаточну позитивну або негативну відповідь на це питання, треба аналізувати умовну залежність між tX та 1−tW за кондиціонування змінних 11,.., −−− mtt XX , 22 ,.., −−− mtt WW . Якщо ця умовна залежність встановлена, то зв'язок tt XW →−1 присутній, інакше – відсутній. Наступним кроком можна тестувати факт, що ряд W не впливає на ряд X з лагом 2. Для цього треба тестувати умовну залежність між tX та 2−tW , з використанням в умові відповідних минулих значень цих рядів. Якщо відомо, що зв'язок tt XW →−1 існує, то змінну 1−tW треба включати в умову вказаного тесту. Якщо цього не зробити, то умовна залежність між tX та 2−tW може існувати завдяки шляху ttt XWW →→ −− 12 , а не завдяки безпосередньому зв'язку tt XW →−2 з лагом 2. , з використанням в умові відповідних минулих значень цих рядів. Якщо відомо, що зв’язок Моделі і засоби систем баз даних та знань [Введите текст] основі інформації t . «Не-причина» не покращує прогнозу наслідку. Формально це виражається як рівність умовних розподілень: )|()\|( 11 ttttt YpXYp = ++ . У більш стандартній формі це записується як ),\|()\|( 11 ttttttt XXYpXYp = ++ . (1) Отже, «не-каузальність» за Грейнджером може бути формалізована як умовна незалежність прогнозу від «не-причини» за умови врахування причин (релевантної інформації). Далі, поняття каузальності (за Грейнджером) формально з'являється як констатація не виконання рівності (1), тобто як констатація порушення цієї умовної незалежності. Змістовно, каузальність змінної X для наслідку Y (за Грейнджером) означає, що X несе «незамінну» інформацію для прогнозу наслідку Y . Проблема в тому, що факт цієї «незамінності» важко встановити. Вся релевантна інформація t у світі практично недоступна, і навіть не можна бути впевненим, що вдалося знайти всі можливі спільні причини для X та Y . Тому неможливо надійно перевірити чинність рівняння (1). Припустимо, аналітик здійснив перевірку сурогату рівняння (1) з використанням неповної інформації t . Тоді, якщо встановлено, що сурогат рівності (1) виконується, то висновок про відсутність каузального зв'язку між X та Y буде коректним. Натомість якщо встановлено, що сурогат рівності (1) не виконується, то висновок про каузальний зв'язок між X та Y правдоподібно може бути некоректним. Отже, концепції каузальності та не-каузальності (за Грейнджером) – несиметричні. Повернемося до цього пункту згодом. А зараз коротко розглянемо роль апарату умовної незалежності в динамічних і каузальних моделях. Класичне визначення марковської властивості встановлено для марковських ланцюгів. Але апарат марковських ланцюгів не є продуктивним для задачі виведення структур моделей (через абстрактність поняття стану). Важливою віхою досліджень в потрібному напрямку стала робота [12], яка адаптувала класичну теорію марковських процесів до реалістичної проблематики каузального моделювання. Замість «унітарного» марковского процесу аналізується система підпроцесів, що взаємодіють. Нехай структура авторегресійного процесу невідома. Для спрощення приймемо, що всі зовнішні фактори (тобто змінні поза набором X , Y , Z , W ) є взаємно незалежними, і кожний з них впливає на одну спостережувану змінну. Тоді наївний спосіб застосувати концепцію каузальності (за Грейнджером) для тестування гіпотетичного каузального зв'язку tt XW →−1 зведеться до перевірки виконання формули ),|()|( 1__ −= ttttt WXpXp , (2) де = t_  121012101210210 ,,..,,,,,..,,,,,..,,,,..,, −−−−−−− ttttttt ZZZZYYYYXXXXWWW . Набір умов t_ охоплює все минуле рядів X , Y , Z , W , за виключенням 1−tW (попереднього стану підпроцесу W ). Зрозуміло, що виконати перевірку рівності у подібному форматі практично неможливо. Для надійної оцінки умовної ймовірності з такою складною умовою потрібно мати величезний обсяг даних, а власне обчислення буде дуже важким. Потрібен акуратний й ефективний апарат аналізу даних, а також апарат аналізу графової структури темпоральної моделі. Принципова вразливість концепції каузальності Грейнджера полягає в тому, що вона залишає невизначеним, який прогноз мається на увазі – пасивний чи активний (ефект втручання). В класичних («статичних») каузальних мережах успішно застосовується поняття умовної незалежності та відповідний конструктивний критерій d -сепарації [3, 4, 7]. Як перенести цей апарат в контекст векторних часових рядів, де маємо довгі паралельні серії змінних? Приміром, якщо поглянути на векторний авторегресійний процес, зображений на рис. 3, то зрозуміло, що всі ряди основних змінних ( X , Y , Z , W ) є взаємозалежними. Але ці ряди відіграють різну роль в системі каузальних впливів. Зокрема, очевидно, що ряд W не впливає на інші ряди, але безпосередньо залежить тільки від ряду X . Щоб аналізувати структуру каузальних зв'язків між компонентами процесу, необхідно розглядати умовну незалежність у відповідному часовому форматі. Для векторних часових рядів функція сепарації полягає у тому, щоб акуратно «перерізати» паралельні серії змінних у відповідних фазах. Тобто конструктивний темпоральний критерій сепарації має залучати змінні, що знаходяться на коректно обраному «часовому фронті». Умовну незалежність «фронтового» типу в динамічних моделях називають «локальна незалежність». Припустимо, що в рекурентному процесі немає моментальних (ізохронних) зв'язків (вигляду tt RV → ), і що максимальний лаг автокореляційних зв'язків (вигляду tjt VV →− ) дорівнює m . Нехай треба перевірити факт, що ряд змінних W не впливає на ряд X . Нехай відомо, що немає жодного «третього» ряду, який впливає паралельно на ряди X та W . Спочатку хочемо перевірити, що ряд W не впливає на ряд X з лагом 1. Для того, щоб отримати остаточну позитивну або негативну відповідь на це питання, треба аналізувати умовну залежність між tX та 1−tW за кондиціонування змінних 11,.., −−− mtt XX , 22 ,.., −−− mtt WW . Якщо ця умовна залежність встановлена, то зв'язок tt XW →−1 присутній, інакше – відсутній. Наступним кроком можна тестувати факт, що ряд W не впливає на ряд X з лагом 2. Для цього треба тестувати умовну залежність між tX та 2−tW , з використанням в умові відповідних минулих значень цих рядів. Якщо відомо, що зв'язок tt XW →−1 існує, то змінну 1−tW треба включати в умову вказаного тесту. Якщо цього не зробити, то умовна залежність між tX та 2−tW може існувати завдяки шляху ttt XWW →→ −− 12 , а не завдяки безпосередньому зв'язку tt XW →−2 з лагом 2. існує, то змінну Моделі і засоби систем баз даних та знань [Введите текст] основі інформації t . «Не-причина» не покращує прогнозу наслідку. Формально це виражається як рівність умовних розподілень: )|()\|( 11 ttttt YpXYp = ++ . У більш стандартній формі це записується як ),\|()\|( 11 ttttttt XXYpXYp = ++ . (1) Отже, «не-каузальність» за Грейнджером може бути формалізована як умовна незалежність прогнозу від «не-причини» за умови врахування причин (релевантної інформації). Далі, поняття каузальності (за Грейнджером) формально з'являється як констатація не виконання рівності (1), тобто як констатація порушення цієї умовної незалежності. Змістовно, каузальність змінної X для наслідку Y (за Грейнджером) означає, що X несе «незамінну» інформацію для прогнозу наслідку Y . Проблема в тому, що факт цієї «незамінності» важко встановити. Вся релевантна інформація t у світі практично недоступна, і навіть не можна бути впевненим, що вдалося знайти всі можливі спільні причини для X та Y . Тому неможливо надійно перевірити чинність рівняння (1). Припустимо, аналітик здійснив перевірку сурогату рівняння (1) з використанням неповної інформації t . Тоді, якщо встановлено, що сурогат рівності (1) виконується, то висновок про відсутність каузального зв'язку між X та Y буде коректним. Натомість якщо встановлено, що сурогат рівності (1) не виконується, то висновок про каузальний зв'язок між X та Y правдоподібно може бути некоректним. Отже, концепції каузальності та не-каузальності (за Грейнджером) – несиметричні. Повернемося до цього пункту згодом. А зараз коротко розглянемо роль апарату умовної незалежності в динамічних і каузальних моделях. Класичне визначення марковської властивості встановлено для марковських ланцюгів. Але апарат марковських ланцюгів не є продуктивним для задачі виведення структур моделей (через абстрактність поняття стану). Важливою віхою досліджень в потрібному напрямку стала робота [12], яка адаптувала класичну теорію марковських процесів до реалістичної проблематики каузального моделювання. Замість «унітарного» марковского процесу аналізується система підпроцесів, що взаємодіють. Нехай структура авторегресійного процесу невідома. Для спрощення приймемо, що всі зовнішні фактори (тобто змінні поза набором X , Y , Z , W ) є взаємно незалежними, і кожний з них впливає на одну спостережувану змінну. Тоді наївний спосіб застосувати концепцію каузальності (за Грейнджером) для тестування гіпотетичного каузального зв'язку tt XW →−1 зведеться до перевірки виконання формули ),|()|( 1__ −= ttttt WXpXp , (2) де = t_  121012101210210 ,,..,,,,,..,,,,,..,,,,..,, −−−−−−− ttttttt ZZZZYYYYXXXXWWW . Набір умов t_ охоплює все минуле рядів X , Y , Z , W , за виключенням 1−tW (попереднього стану підпроцесу W ). Зрозуміло, що виконати перевірку рівності у подібному форматі практично неможливо. Для надійної оцінки умовної ймовірності з такою складною умовою потрібно мати величезний обсяг даних, а власне обчислення буде дуже важким. Потрібен акуратний й ефективний апарат аналізу даних, а також апарат аналізу графової структури темпоральної моделі. Принципова вразливість концепції каузальності Грейнджера полягає в тому, що вона залишає невизначеним, який прогноз мається на увазі – пасивний чи активний (ефект втручання). В класичних («статичних») каузальних мережах успішно застосовується поняття умовної незалежності та відповідний конструктивний критерій d -сепарації [3, 4, 7]. Як перенести цей апарат в контекст векторних часових рядів, де маємо довгі паралельні серії змінних? Приміром, якщо поглянути на векторний авторегресійний процес, зображений на рис. 3, то зрозуміло, що всі ряди основних змінних ( X , Y , Z , W ) є взаємозалежними. Але ці ряди відіграють різну роль в системі каузальних впливів. Зокрема, очевидно, що ряд W не впливає на інші ряди, але безпосередньо залежить тільки від ряду X . Щоб аналізувати структуру каузальних зв'язків між компонентами процесу, необхідно розглядати умовну незалежність у відповідному часовому форматі. Для векторних часових рядів функція сепарації полягає у тому, щоб акуратно «перерізати» паралельні серії змінних у відповідних фазах. Тобто конструктивний темпоральний критерій сепарації має залучати змінні, що знаходяться на коректно обраному «часовому фронті». Умовну незалежність «фронтового» типу в динамічних моделях називають «локальна незалежність». Припустимо, що в рекурентному процесі немає моментальних (ізохронних) зв'язків (вигляду tt RV → ), і що максимальний лаг автокореляційних зв'язків (вигляду tjt VV →− ) дорівнює m . Нехай треба перевірити факт, що ряд змінних W не впливає на ряд X . Нехай відомо, що немає жодного «третього» ряду, який впливає паралельно на ряди X та W . Спочатку хочемо перевірити, що ряд W не впливає на ряд X з лагом 1. Для того, щоб отримати остаточну позитивну або негативну відповідь на це питання, треба аналізувати умовну залежність між tX та 1−tW за кондиціонування змінних 11,.., −−− mtt XX , 22 ,.., −−− mtt WW . Якщо ця умовна залежність встановлена, то зв'язок tt XW →−1 присутній, інакше – відсутній. Наступним кроком можна тестувати факт, що ряд W не впливає на ряд X з лагом 2. Для цього треба тестувати умовну залежність між tX та 2−tW , з використанням в умові відповідних минулих значень цих рядів. Якщо відомо, що зв'язок tt XW →−1 існує, то змінну 1−tW треба включати в умову вказаного тесту. Якщо цього не зробити, то умовна залежність між tX та 2−tW може існувати завдяки шляху ttt XWW →→ −− 12 , а не завдяки безпосередньому зв'язку tt XW →−2 з лагом 2. треба включати в умову вказаного тесту. Якщо цього не зробити, то умовна залежність між Моделі і засоби систем баз даних та знань [Введите текст] основі інформації t . «Не-причина» не покращує прогнозу наслідку. Формально це виражається як рівність умовних розподілень: )|()\|( 11 ttttt YpXYp = ++ . У більш стандартній формі це записується як ),\|()\|( 11 ttttttt XXYpXYp = ++ . (1) Отже, «не-каузальність» за Грейнджером може бути формалізована як умовна незалежність прогнозу від «не-причини» за умови врахування причин (релевантної інформації). Далі, поняття каузальності (за Грейнджером) формально з'являється як констатація не виконання рівності (1), тобто як констатація порушення цієї умовної незалежності. Змістовно, каузальність змінної X для наслідку Y (за Грейнджером) означає, що X несе «незамінну» інформацію для прогнозу наслідку Y . Проблема в тому, що факт цієї «незамінності» важко встановити. Вся релевантна інформація t у світі практично недоступна, і навіть не можна бути впевненим, що вдалося знайти всі можливі спільні причини для X та Y . Тому неможливо надійно перевірити чинність рівняння (1). Припустимо, аналітик здійснив перевірку сурогату рівняння (1) з використанням неповної інформації t . Тоді, якщо встановлено, що сурогат рівності (1) виконується, то висновок про відсутність каузального зв'язку між X та Y буде коректним. Натомість якщо встановлено, що сурогат рівності (1) не виконується, то висновок про каузальний зв'язок між X та Y правдоподібно може бути некоректним. Отже, концепції каузальності та не-каузальності (за Грейнджером) – несиметричні. Повернемося до цього пункту згодом. А зараз коротко розглянемо роль апарату умовної незалежності в динамічних і каузальних моделях. Класичне визначення марковської властивості встановлено для марковських ланцюгів. Але апарат марковських ланцюгів не є продуктивним для задачі виведення структур моделей (через абстрактність поняття стану). Важливою віхою досліджень в потрібному напрямку стала робота [12], яка адаптувала класичну теорію марковських процесів до реалістичної проблематики каузального моделювання. Замість «унітарного» марковского процесу аналізується система підпроцесів, що взаємодіють. Нехай структура авторегресійного процесу невідома. Для спрощення приймемо, що всі зовнішні фактори (тобто змінні поза набором X , Y , Z , W ) є взаємно незалежними, і кожний з них впливає на одну спостережувану змінну. Тоді наївний спосіб застосувати концепцію каузальності (за Грейнджером) для тестування гіпотетичного каузального зв'язку tt XW →−1 зведеться до перевірки виконання формули ),|()|( 1__ −= ttttt WXpXp , (2) де = t_  121012101210210 ,,..,,,,,..,,,,,..,,,,..,, −−−−−−− ttttttt ZZZZYYYYXXXXWWW . Набір умов t_ охоплює все минуле рядів X , Y , Z , W , за виключенням 1−tW (попереднього стану підпроцесу W ). Зрозуміло, що виконати перевірку рівності у подібному форматі практично неможливо. Для надійної оцінки умовної ймовірності з такою складною умовою потрібно мати величезний обсяг даних, а власне обчислення буде дуже важким. Потрібен акуратний й ефективний апарат аналізу даних, а також апарат аналізу графової структури темпоральної моделі. Принципова вразливість концепції каузальності Грейнджера полягає в тому, що вона залишає невизначеним, який прогноз мається на увазі – пасивний чи активний (ефект втручання). В класичних («статичних») каузальних мережах успішно застосовується поняття умовної незалежності та відповідний конструктивний критерій d -сепарації [3, 4, 7]. Як перенести цей апарат в контекст векторних часових рядів, де маємо довгі паралельні серії змінних? Приміром, якщо поглянути на векторний авторегресійний процес, зображений на рис. 3, то зрозуміло, що всі ряди основних змінних ( X , Y , Z , W ) є взаємозалежними. Але ці ряди відіграють різну роль в системі каузальних впливів. Зокрема, очевидно, що ряд W не впливає на інші ряди, але безпосередньо залежить тільки від ряду X . Щоб аналізувати структуру каузальних зв'язків між компонентами процесу, необхідно розглядати умовну незалежність у відповідному часовому форматі. Для векторних часових рядів функція сепарації полягає у тому, щоб акуратно «перерізати» паралельні серії змінних у відповідних фазах. Тобто конструктивний темпоральний критерій сепарації має залучати змінні, що знаходяться на коректно обраному «часовому фронті». Умовну незалежність «фронтового» типу в динамічних моделях називають «локальна незалежність». Припустимо, що в рекурентному процесі немає моментальних (ізохронних) зв'язків (вигляду tt RV → ), і що максимальний лаг автокореляційних зв'язків (вигляду tjt VV →− ) дорівнює m . Нехай треба перевірити факт, що ряд змінних W не впливає на ряд X . Нехай відомо, що немає жодного «третього» ряду, який впливає паралельно на ряди X та W . Спочатку хочемо перевірити, що ряд W не впливає на ряд X з лагом 1. Для того, щоб отримати остаточну позитивну або негативну відповідь на це питання, треба аналізувати умовну залежність між tX та 1−tW за кондиціонування змінних 11,.., −−− mtt XX , 22 ,.., −−− mtt WW . Якщо ця умовна залежність встановлена, то зв'язок tt XW →−1 присутній, інакше – відсутній. Наступним кроком можна тестувати факт, що ряд W не впливає на ряд X з лагом 2. Для цього треба тестувати умовну залежність між tX та 2−tW , з використанням в умові відповідних минулих значень цих рядів. Якщо відомо, що зв'язок tt XW →−1 існує, то змінну 1−tW треба включати в умову вказаного тесту. Якщо цього не зробити, то умовна залежність між tX та 2−tW може існувати завдяки шляху ttt XWW →→ −− 12 , а не завдяки безпосередньому зв'язку tt XW →−2 з лагом 2. та Моделі і засоби систем баз даних та знань [Введите текст] основі інформації t . «Не-причина» не покращує прогнозу наслідку. Формально це виражається як рівність умовних розподілень: )|()\|( 11 ttttt YpXYp = ++ . У більш стандартній формі це записується як ),\|()\|( 11 ttttttt XXYpXYp = ++ . (1) Отже, «не-каузальність» за Грейнджером може бути формалізована як умовна незалежність прогнозу від «не-причини» за умови врахування причин (релевантної інформації). Далі, поняття каузальності (за Грейнджером) формально з'являється як констатація не виконання рівності (1), тобто як констатація порушення цієї умовної незалежності. Змістовно, каузальність змінної X для наслідку Y (за Грейнджером) означає, що X несе «незамінну» інформацію для прогнозу наслідку Y . Проблема в тому, що факт цієї «незамінності» важко встановити. Вся релевантна інформація t у світі практично недоступна, і навіть не можна бути впевненим, що вдалося знайти всі можливі спільні причини для X та Y . Тому неможливо надійно перевірити чинність рівняння (1). Припустимо, аналітик здійснив перевірку сурогату рівняння (1) з використанням неповної інформації t . Тоді, якщо встановлено, що сурогат рівності (1) виконується, то висновок про відсутність каузального зв'язку між X та Y буде коректним. Натомість якщо встановлено, що сурогат рівності (1) не виконується, то висновок про каузальний зв'язок між X та Y правдоподібно може бути некоректним. Отже, концепції каузальності та не-каузальності (за Грейнджером) – несиметричні. Повернемося до цього пункту згодом. А зараз коротко розглянемо роль апарату умовної незалежності в динамічних і каузальних моделях. Класичне визначення марковської властивості встановлено для марковських ланцюгів. Але апарат марковських ланцюгів не є продуктивним для задачі виведення структур моделей (через абстрактність поняття стану). Важливою віхою досліджень в потрібному напрямку стала робота [12], яка адаптувала класичну теорію марковських процесів до реалістичної проблематики каузального моделювання. Замість «унітарного» марковского процесу аналізується система підпроцесів, що взаємодіють. Нехай структура авторегресійного процесу невідома. Для спрощення приймемо, що всі зовнішні фактори (тобто змінні поза набором X , Y , Z , W ) є взаємно незалежними, і кожний з них впливає на одну спостережувану змінну. Тоді наївний спосіб застосувати концепцію каузальності (за Грейнджером) для тестування гіпотетичного каузального зв'язку tt XW →−1 зведеться до перевірки виконання формули ),|()|( 1__ −= ttttt WXpXp , (2) де = t_  121012101210210 ,,..,,,,,..,,,,,..,,,,..,, −−−−−−− ttttttt ZZZZYYYYXXXXWWW . Набір умов t_ охоплює все минуле рядів X , Y , Z , W , за виключенням 1−tW (попереднього стану підпроцесу W ). Зрозуміло, що виконати перевірку рівності у подібному форматі практично неможливо. Для надійної оцінки умовної ймовірності з такою складною умовою потрібно мати величезний обсяг даних, а власне обчислення буде дуже важким. Потрібен акуратний й ефективний апарат аналізу даних, а також апарат аналізу графової структури темпоральної моделі. Принципова вразливість концепції каузальності Грейнджера полягає в тому, що вона залишає невизначеним, який прогноз мається на увазі – пасивний чи активний (ефект втручання). В класичних («статичних») каузальних мережах успішно застосовується поняття умовної незалежності та відповідний конструктивний критерій d -сепарації [3, 4, 7]. Як перенести цей апарат в контекст векторних часових рядів, де маємо довгі паралельні серії змінних? Приміром, якщо поглянути на векторний авторегресійний процес, зображений на рис. 3, то зрозуміло, що всі ряди основних змінних ( X , Y , Z , W ) є взаємозалежними. Але ці ряди відіграють різну роль в системі каузальних впливів. Зокрема, очевидно, що ряд W не впливає на інші ряди, але безпосередньо залежить тільки від ряду X . Щоб аналізувати структуру каузальних зв'язків між компонентами процесу, необхідно розглядати умовну незалежність у відповідному часовому форматі. Для векторних часових рядів функція сепарації полягає у тому, щоб акуратно «перерізати» паралельні серії змінних у відповідних фазах. Тобто конструктивний темпоральний критерій сепарації має залучати змінні, що знаходяться на коректно обраному «часовому фронті». Умовну незалежність «фронтового» типу в динамічних моделях називають «локальна незалежність». Припустимо, що в рекурентному процесі немає моментальних (ізохронних) зв'язків (вигляду tt RV → ), і що максимальний лаг автокореляційних зв'язків (вигляду tjt VV →− ) дорівнює m . Нехай треба перевірити факт, що ряд змінних W не впливає на ряд X . Нехай відомо, що немає жодного «третього» ряду, який впливає паралельно на ряди X та W . Спочатку хочемо перевірити, що ряд W не впливає на ряд X з лагом 1. Для того, щоб отримати остаточну позитивну або негативну відповідь на це питання, треба аналізувати умовну залежність між tX та 1−tW за кондиціонування змінних 11,.., −−− mtt XX , 22 ,.., −−− mtt WW . Якщо ця умовна залежність встановлена, то зв'язок tt XW →−1 присутній, інакше – відсутній. Наступним кроком можна тестувати факт, що ряд W не впливає на ряд X з лагом 2. Для цього треба тестувати умовну залежність між tX та 2−tW , з використанням в умові відповідних минулих значень цих рядів. Якщо відомо, що зв'язок tt XW →−1 існує, то змінну 1−tW треба включати в умову вказаного тесту. Якщо цього не зробити, то умовна залежність між tX та 2−tW може існувати завдяки шляху ttt XWW →→ −− 12 , а не завдяки безпосередньому зв'язку tt XW →−2 з лагом 2. може існувати завдяки шляху Моделі і засоби систем баз даних та знань [Введите текст] основі інформації t . «Не-причина» не покращує прогнозу наслідку. Формально це виражається як рівність умовних розподілень: )|()\|( 11 ttttt YpXYp = ++ . У більш стандартній формі це записується як ),\|()\|( 11 ttttttt XXYpXYp = ++ . (1) Отже, «не-каузальність» за Грейнджером може бути формалізована як умовна незалежність прогнозу від «не-причини» за умови врахування причин (релевантної інформації). Далі, поняття каузальності (за Грейнджером) формально з'являється як констатація не виконання рівності (1), тобто як констатація порушення цієї умовної незалежності. Змістовно, каузальність змінної X для наслідку Y (за Грейнджером) означає, що X несе «незамінну» інформацію для прогнозу наслідку Y . Проблема в тому, що факт цієї «незамінності» важко встановити. Вся релевантна інформація t у світі практично недоступна, і навіть не можна бути впевненим, що вдалося знайти всі можливі спільні причини для X та Y . Тому неможливо надійно перевірити чинність рівняння (1). Припустимо, аналітик здійснив перевірку сурогату рівняння (1) з використанням неповної інформації t . Тоді, якщо встановлено, що сурогат рівності (1) виконується, то висновок про відсутність каузального зв'язку між X та Y буде коректним. Натомість якщо встановлено, що сурогат рівності (1) не виконується, то висновок про каузальний зв'язок між X та Y правдоподібно може бути некоректним. Отже, концепції каузальності та не-каузальності (за Грейнджером) – несиметричні. Повернемося до цього пункту згодом. А зараз коротко розглянемо роль апарату умовної незалежності в динамічних і каузальних моделях. Класичне визначення марковської властивості встановлено для марковських ланцюгів. Але апарат марковських ланцюгів не є продуктивним для задачі виведення структур моделей (через абстрактність поняття стану). Важливою віхою досліджень в потрібному напрямку стала робота [12], яка адаптувала класичну теорію марковських процесів до реалістичної проблематики каузального моделювання. Замість «унітарного» марковского процесу аналізується система підпроцесів, що взаємодіють. Нехай структура авторегресійного процесу невідома. Для спрощення приймемо, що всі зовнішні фактори (тобто змінні поза набором X , Y , Z , W ) є взаємно незалежними, і кожний з них впливає на одну спостережувану змінну. Тоді наївний спосіб застосувати концепцію каузальності (за Грейнджером) для тестування гіпотетичного каузального зв'язку tt XW →−1 зведеться до перевірки виконання формули ),|()|( 1__ −= ttttt WXpXp , (2) де = t_  121012101210210 ,,..,,,,,..,,,,,..,,,,..,, −−−−−−− ttttttt ZZZZYYYYXXXXWWW . Набір умов t_ охоплює все минуле рядів X , Y , Z , W , за виключенням 1−tW (попереднього стану підпроцесу W ). Зрозуміло, що виконати перевірку рівності у подібному форматі практично неможливо. Для надійної оцінки умовної ймовірності з такою складною умовою потрібно мати величезний обсяг даних, а власне обчислення буде дуже важким. Потрібен акуратний й ефективний апарат аналізу даних, а також апарат аналізу графової структури темпоральної моделі. Принципова вразливість концепції каузальності Грейнджера полягає в тому, що вона залишає невизначеним, який прогноз мається на увазі – пасивний чи активний (ефект втручання). В класичних («статичних») каузальних мережах успішно застосовується поняття умовної незалежності та відповідний конструктивний критерій d -сепарації [3, 4, 7]. Як перенести цей апарат в контекст векторних часових рядів, де маємо довгі паралельні серії змінних? Приміром, якщо поглянути на векторний авторегресійний процес, зображений на рис. 3, то зрозуміло, що всі ряди основних змінних ( X , Y , Z , W ) є взаємозалежними. Але ці ряди відіграють різну роль в системі каузальних впливів. Зокрема, очевидно, що ряд W не впливає на інші ряди, але безпосередньо залежить тільки від ряду X . Щоб аналізувати структуру каузальних зв'язків між компонентами процесу, необхідно розглядати умовну незалежність у відповідному часовому форматі. Для векторних часових рядів функція сепарації полягає у тому, щоб акуратно «перерізати» паралельні серії змінних у відповідних фазах. Тобто конструктивний темпоральний критерій сепарації має залучати змінні, що знаходяться на коректно обраному «часовому фронті». Умовну незалежність «фронтового» типу в динамічних моделях називають «локальна незалежність». Припустимо, що в рекурентному процесі немає моментальних (ізохронних) зв'язків (вигляду tt RV → ), і що максимальний лаг автокореляційних зв'язків (вигляду tjt VV →− ) дорівнює m . Нехай треба перевірити факт, що ряд змінних W не впливає на ряд X . Нехай відомо, що немає жодного «третього» ряду, який впливає паралельно на ряди X та W . Спочатку хочемо перевірити, що ряд W не впливає на ряд X з лагом 1. Для того, щоб отримати остаточну позитивну або негативну відповідь на це питання, треба аналізувати умовну залежність між tX та 1−tW за кондиціонування змінних 11,.., −−− mtt XX , 22 ,.., −−− mtt WW . Якщо ця умовна залежність встановлена, то зв'язок tt XW →−1 присутній, інакше – відсутній. Наступним кроком можна тестувати факт, що ряд W не впливає на ряд X з лагом 2. Для цього треба тестувати умовну залежність між tX та 2−tW , з використанням в умові відповідних минулих значень цих рядів. Якщо відомо, що зв'язок tt XW →−1 існує, то змінну 1−tW треба включати в умову вказаного тесту. Якщо цього не зробити, то умовна залежність між tX та 2−tW може існувати завдяки шляху ttt XWW →→ −− 12 , а не завдяки безпосередньому зв'язку tt XW →−2 з лагом 2. , а не завдяки безпосередньому зв’язку Моделі і засоби систем баз даних та знань [Введите текст] основі інформації t . «Не-причина» не покращує прогнозу наслідку. Формально це виражається як рівність умовних розподілень: )|()\|( 11 ttttt YpXYp = ++ . У більш стандартній формі це записується як ),\|()\|( 11 ttttttt XXYpXYp = ++ . (1) Отже, «не-каузальність» за Грейнджером може бути формалізована як умовна незалежність прогнозу від «не-причини» за умови врахування причин (релевантної інформації). Далі, поняття каузальності (за Грейнджером) формально з'являється як констатація не виконання рівності (1), тобто як констатація порушення цієї умовної незалежності. Змістовно, каузальність змінної X для наслідку Y (за Грейнджером) означає, що X несе «незамінну» інформацію для прогнозу наслідку Y . Проблема в тому, що факт цієї «незамінності» важко встановити. Вся релевантна інформація t у світі практично недоступна, і навіть не можна бути впевненим, що вдалося знайти всі можливі спільні причини для X та Y . Тому неможливо надійно перевірити чинність рівняння (1). Припустимо, аналітик здійснив перевірку сурогату рівняння (1) з використанням неповної інформації t . Тоді, якщо встановлено, що сурогат рівності (1) виконується, то висновок про відсутність каузального зв'язку між X та Y буде коректним. Натомість якщо встановлено, що сурогат рівності (1) не виконується, то висновок про каузальний зв'язок між X та Y правдоподібно може бути некоректним. Отже, концепції каузальності та не-каузальності (за Грейнджером) – несиметричні. Повернемося до цього пункту згодом. А зараз коротко розглянемо роль апарату умовної незалежності в динамічних і каузальних моделях. Класичне визначення марковської властивості встановлено для марковських ланцюгів. Але апарат марковських ланцюгів не є продуктивним для задачі виведення структур моделей (через абстрактність поняття стану). Важливою віхою досліджень в потрібному напрямку стала робота [12], яка адаптувала класичну теорію марковських процесів до реалістичної проблематики каузального моделювання. Замість «унітарного» марковского процесу аналізується система підпроцесів, що взаємодіють. Нехай структура авторегресійного процесу невідома. Для спрощення приймемо, що всі зовнішні фактори (тобто змінні поза набором X , Y , Z , W ) є взаємно незалежними, і кожний з них впливає на одну спостережувану змінну. Тоді наївний спосіб застосувати концепцію каузальності (за Грейнджером) для тестування гіпотетичного каузального зв'язку tt XW →−1 зведеться до перевірки виконання формули ),|()|( 1__ −= ttttt WXpXp , (2) де = t_  121012101210210 ,,..,,,,,..,,,,,..,,,,..,, −−−−−−− ttttttt ZZZZYYYYXXXXWWW . Набір умов t_ охоплює все минуле рядів X , Y , Z , W , за виключенням 1−tW (попереднього стану підпроцесу W ). Зрозуміло, що виконати перевірку рівності у подібному форматі практично неможливо. Для надійної оцінки умовної ймовірності з такою складною умовою потрібно мати величезний обсяг даних, а власне обчислення буде дуже важким. Потрібен акуратний й ефективний апарат аналізу даних, а також апарат аналізу графової структури темпоральної моделі. Принципова вразливість концепції каузальності Грейнджера полягає в тому, що вона залишає невизначеним, який прогноз мається на увазі – пасивний чи активний (ефект втручання). В класичних («статичних») каузальних мережах успішно застосовується поняття умовної незалежності та відповідний конструктивний критерій d -сепарації [3, 4, 7]. Як перенести цей апарат в контекст векторних часових рядів, де маємо довгі паралельні серії змінних? Приміром, якщо поглянути на векторний авторегресійний процес, зображений на рис. 3, то зрозуміло, що всі ряди основних змінних ( X , Y , Z , W ) є взаємозалежними. Але ці ряди відіграють різну роль в системі каузальних впливів. Зокрема, очевидно, що ряд W не впливає на інші ряди, але безпосередньо залежить тільки від ряду X . Щоб аналізувати структуру каузальних зв'язків між компонентами процесу, необхідно розглядати умовну незалежність у відповідному часовому форматі. Для векторних часових рядів функція сепарації полягає у тому, щоб акуратно «перерізати» паралельні серії змінних у відповідних фазах. Тобто конструктивний темпоральний критерій сепарації має залучати змінні, що знаходяться на коректно обраному «часовому фронті». Умовну незалежність «фронтового» типу в динамічних моделях називають «локальна незалежність». Припустимо, що в рекурентному процесі немає моментальних (ізохронних) зв'язків (вигляду tt RV → ), і що максимальний лаг автокореляційних зв'язків (вигляду tjt VV →− ) дорівнює m . Нехай треба перевірити факт, що ряд змінних W не впливає на ряд X . Нехай відомо, що немає жодного «третього» ряду, який впливає паралельно на ряди X та W . Спочатку хочемо перевірити, що ряд W не впливає на ряд X з лагом 1. Для того, щоб отримати остаточну позитивну або негативну відповідь на це питання, треба аналізувати умовну залежність між tX та 1−tW за кондиціонування змінних 11,.., −−− mtt XX , 22 ,.., −−− mtt WW . Якщо ця умовна залежність встановлена, то зв'язок tt XW →−1 присутній, інакше – відсутній. Наступним кроком можна тестувати факт, що ряд W не впливає на ряд X з лагом 2. Для цього треба тестувати умовну залежність між tX та 2−tW , з використанням в умові відповідних минулих значень цих рядів. Якщо відомо, що зв'язок tt XW →−1 існує, то змінну 1−tW треба включати в умову вказаного тесту. Якщо цього не зробити, то умовна залежність між tX та 2−tW може існувати завдяки шляху ttt XWW →→ −− 12 , а не завдяки безпосередньому зв'язку tt XW →−2 з лагом 2. з лагом 2. Тестування безпо- середніх зв’язків з великим лагом відкриває все більше можливостей для «опосередкованих» впливів. Отже, в умови тестів безпосереднього зв’язку необхідно включати не тільки спільне минуле, але й можливих посеред- ників. Але в процесі аналізу структури динамічного процесу доцільно уникати складних тестів. Процес аналізу має просуватися за принципом «від простих тестів до складніших». Конкретно для структури рекурентного процесу, показаного на рис. 3, той факт, що ряд W не впливає на ряд X (послідовно з лагами 1, 2, 3, ..), підтверджується тестами умовної незалежності між Моделі і засоби систем баз даних та знань Тестування безпосередніх зв'язків з великим лагом відкриває все більше можливостей для «опосередкованих» впливів. Отже, в умови тестів безпосереднього зв'язку необхідно включати не тільки спільне минуле, але й можливих посередників. Але в процесі аналізу структури динамічного процесу доцільно уникати складних тестів. Процес аналізу має просуватися за принципом «від простих тестів до складніших». Конкретно для структури рекурентного процесу, показаного на рис. 3, той факт, що ряд W не впливає на ряд X (послідовно з лагами 1, 2, 3, ..), підтверджується тестами умовної незалежності між tX , з одного боку, та (послідовно) 1−tW , 2−tW , 3−tW ,.. – з іншого, причому всі ці тести використовують як умову одну змінну 1−tX . Таким чином, для конкретної вказаної структури відсутність зв'язків впливу ряду W на ряд X (з різними лагами) ідентифікується тестами першого рангу. Звертаємо увагу на наступну особливість відношень в динамічних процесах. За кондиціонування змінної 1−tX змінна tX умовно незалежна від 1−tW . Натомість за кондиціонування змінної 1−tW змінна tW умовно залежна від 1−tX . (Ця залежність забезпечується зв'язком tt WX →−1 .) Маючи на увазі несиметричність вказаної конструкції, в літературі іноді кажуть, що локальна незалежність є несиметричною (на відміну від звичайної незалежності). Насправді вказана несиметричність не є властивістю відношення незалежності. Просто факти незалежності в часових рядах даних завжди виражаються через змінні з часовими прив'язками (індексами). Якщо маємо незалежність між kX та mY , то незалежність не обов'язково збережеться після обміну індексами. Обмін індексами у змінних означає перехід до змістовно іншого відношення. Вказана несиметричність є проявом несиметричності структури зв'язків між часовими рядами, а також проявом спрямованості процесів в один бік (від минулого до майбутнього). Щоб формалізувати техніку сепарації для динамічних моделей, необхідно обрати форму графової репрезентації динамічного процесу. Один варіант репрезентації фактично використано на рис. 3. Зручна і компактна форма графової репрезентації векторного авторегресійного процесу («базова динамічна мережа») створюється на основі «найближчого» горизонту довжини векторного ряду даних. Базова динамічна мережа виглядає як фрагмент багатовимірного ряду з набором безпосередніх зв'язків. Модель компактно презентує увесь довгий ряд (в згорнутому вигляді). Розмір моделі (її «часова глибина») визначається довжиною (глибиною) безпосереднього зв'язку з найбільшим часовим лагом. В лівій («ранній») частині моделі структура має додаткові «неявні» зв'язки, які є наслідком залежностей з минулого. (На рис. 3 вони показані пунктиром.) Це порушує візуальну регулярність структури, але не заважає аналізу. Просто треба пам'ятати, що в процесі аналізу зв'язків завжди треба розглядати праву (пізнішу) частину такої структури. Якщо для аналізу потрібна динамічна мережа з більшим горизонтом часу, то структура «нарощується», тобто з правого боку моделі додаються копії змінних для наступного такту з усіма копіями зв'язків (відображених суцільними лініями). У вищенаведеній аргументації та викладках суттєвими вважалися тільки зсуви часу (різниця між індексами), а абсолютні значення індексів часу розглядалися як умовні. Тобто за умовчанням вважалося, що проведений аналіз стосується всього векторного часового ряду цілком. Насправді це не завжди вірно, і необхідно розглянути питання стаціонарності та стабільності процесів. 4 Типи стаціонарності процесів і припущення для аналізу векторних часових рядів Виведення каузальної моделі (як й будь-якої статистичної моделі), а також її верифікація на основі даних, спирається на обґрунтування концептуально чіткої схеми обчислення статистик з даних. Для обчислення статистик треба виділити з даних «випадки» і гарантувати певні вимоги регулярності генерації даних. Найбільш відома форма регулярності генерації даних – схема I.I.D, – традиційно була сформульована для «статичних» даних (лівий долішній квадрант на рис. 1). Схема I.I.D може бути адекватною також у ситуації, коли маємо багато екземплярів популяції з довгим рядом даних для кожного екземпляру (четвертий квадрант на рис. 1). Маючи багато екземплярів довгих рядів даних, можна аналізувати навіть нестаціонарний динамічний процес, зокрема, процес, структура якого змінюється у часі. В такому разі для кожного такту (кроку) j процесу статистика збирається «вертикально», по одному запису (для такту j ) з кожного ряду даних. Проблеми обґрунтувань і припущень для статистичного аналізу виникають для типової ситуації, коли маємо один довгий (тривалий) ряд даних (правий верхній квадрант на рис. 1). Тоді доводиться узагальнювати дані з різних тактів одного процесу, а відтак, постають питання щодо стандартних припущень про статистичну вибірку даних (незалежність, ідентичність, однорідність, стаціонарність, стабільність тощо). Увесь часовий ряд даних відображає історію функціонування об'єкту (середовища). В реальності об'єкт може змінюватися й еволюціонувати. Для того, щоб відомі методи були спроможні вивести адекватну модель з даних, мають виконуватися обмеження на характер та швидкість змін поведінки об'єкту. Типова риса динамічного процесу – це міцні «короткі» автокореляційні зв'язки 1+→ tt XX . Втім, такі зв'язків не обов'язково присутні. Усталені в економетриці методи аналізу часових рядів (а також визначення стаціонарності) за умовчанням виходять з припущення про рівномірність повторення вимірювань даних у часі, а також про одночасність вимірювань компонентів вектору характеристик з одним індексом часу. Нехай векторний часовий ряд включає l паралельних рядів, тобто складається з набору l змінних ,...),,( ZYX . Одночасність вимірювань компонентів вектору характеристик означає, що значення кожної компоненти вимірюють в моменти часу з єдиного переліку ,...,2,1,0=t ∞. Отже, природним чином визначається вектор-стовпчик , з одного боку, та (послідовно) Моделі і засоби систем баз даних та знань Тестування безпосередніх зв'язків з великим лагом відкриває все більше можливостей для «опосередкованих» впливів. Отже, в умови тестів безпосереднього зв'язку необхідно включати не тільки спільне минуле, але й можливих посередників. Але в процесі аналізу структури динамічного процесу доцільно уникати складних тестів. Процес аналізу має просуватися за принципом «від простих тестів до складніших». Конкретно для структури рекурентного процесу, показаного на рис. 3, той факт, що ряд W не впливає на ряд X (послідовно з лагами 1, 2, 3, ..), підтверджується тестами умовної незалежності між tX , з одного боку, та (послідовно) 1−tW , 2−tW , 3−tW ,.. – з іншого, причому всі ці тести використовують як умову одну змінну 1−tX . Таким чином, для конкретної вказаної структури відсутність зв'язків впливу ряду W на ряд X (з різними лагами) ідентифікується тестами першого рангу. Звертаємо увагу на наступну особливість відношень в динамічних процесах. За кондиціонування змінної 1−tX змінна tX умовно незалежна від 1−tW . Натомість за кондиціонування змінної 1−tW змінна tW умовно залежна від 1−tX . (Ця залежність забезпечується зв'язком tt WX →−1 .) Маючи на увазі несиметричність вказаної конструкції, в літературі іноді кажуть, що локальна незалежність є несиметричною (на відміну від звичайної незалежності). Насправді вказана несиметричність не є властивістю відношення незалежності. Просто факти незалежності в часових рядах даних завжди виражаються через змінні з часовими прив'язками (індексами). Якщо маємо незалежність між kX та mY , то незалежність не обов'язково збережеться після обміну індексами. Обмін індексами у змінних означає перехід до змістовно іншого відношення. Вказана несиметричність є проявом несиметричності структури зв'язків між часовими рядами, а також проявом спрямованості процесів в один бік (від минулого до майбутнього). Щоб формалізувати техніку сепарації для динамічних моделей, необхідно обрати форму графової репрезентації динамічного процесу. Один варіант репрезентації фактично використано на рис. 3. Зручна і компактна форма графової репрезентації векторного авторегресійного процесу («базова динамічна мережа») створюється на основі «найближчого» горизонту довжини векторного ряду даних. Базова динамічна мережа виглядає як фрагмент багатовимірного ряду з набором безпосередніх зв'язків. Модель компактно презентує увесь довгий ряд (в згорнутому вигляді). Розмір моделі (її «часова глибина») визначається довжиною (глибиною) безпосереднього зв'язку з найбільшим часовим лагом. В лівій («ранній») частині моделі структура має додаткові «неявні» зв'язки, які є наслідком залежностей з минулого. (На рис. 3 вони показані пунктиром.) Це порушує візуальну регулярність структури, але не заважає аналізу. Просто треба пам'ятати, що в процесі аналізу зв'язків завжди треба розглядати праву (пізнішу) частину такої структури. Якщо для аналізу потрібна динамічна мережа з більшим горизонтом часу, то структура «нарощується», тобто з правого боку моделі додаються копії змінних для наступного такту з усіма копіями зв'язків (відображених суцільними лініями). У вищенаведеній аргументації та викладках суттєвими вважалися тільки зсуви часу (різниця між індексами), а абсолютні значення індексів часу розглядалися як умовні. Тобто за умовчанням вважалося, що проведений аналіз стосується всього векторного часового ряду цілком. Насправді це не завжди вірно, і необхідно розглянути питання стаціонарності та стабільності процесів. 4 Типи стаціонарності процесів і припущення для аналізу векторних часових рядів Виведення каузальної моделі (як й будь-якої статистичної моделі), а також її верифікація на основі даних, спирається на обґрунтування концептуально чіткої схеми обчислення статистик з даних. Для обчислення статистик треба виділити з даних «випадки» і гарантувати певні вимоги регулярності генерації даних. Найбільш відома форма регулярності генерації даних – схема I.I.D, – традиційно була сформульована для «статичних» даних (лівий долішній квадрант на рис. 1). Схема I.I.D може бути адекватною також у ситуації, коли маємо багато екземплярів популяції з довгим рядом даних для кожного екземпляру (четвертий квадрант на рис. 1). Маючи багато екземплярів довгих рядів даних, можна аналізувати навіть нестаціонарний динамічний процес, зокрема, процес, структура якого змінюється у часі. В такому разі для кожного такту (кроку) j процесу статистика збирається «вертикально», по одному запису (для такту j ) з кожного ряду даних. Проблеми обґрунтувань і припущень для статистичного аналізу виникають для типової ситуації, коли маємо один довгий (тривалий) ряд даних (правий верхній квадрант на рис. 1). Тоді доводиться узагальнювати дані з різних тактів одного процесу, а відтак, постають питання щодо стандартних припущень про статистичну вибірку даних (незалежність, ідентичність, однорідність, стаціонарність, стабільність тощо). Увесь часовий ряд даних відображає історію функціонування об'єкту (середовища). В реальності об'єкт може змінюватися й еволюціонувати. Для того, щоб відомі методи були спроможні вивести адекватну модель з даних, мають виконуватися обмеження на характер та швидкість змін поведінки об'єкту. Типова риса динамічного процесу – це міцні «короткі» автокореляційні зв'язки 1+→ tt XX . Втім, такі зв'язків не обов'язково присутні. Усталені в економетриці методи аналізу часових рядів (а також визначення стаціонарності) за умовчанням виходять з припущення про рівномірність повторення вимірювань даних у часі, а також про одночасність вимірювань компонентів вектору характеристик з одним індексом часу. Нехай векторний часовий ряд включає l паралельних рядів, тобто складається з набору l змінних ,...),,( ZYX . Одночасність вимірювань компонентів вектору характеристик означає, що значення кожної компоненти вимірюють в моменти часу з єдиного переліку ,...,2,1,0=t ∞. Отже, природним чином визначається вектор-стовпчик – з іншого, причому всі ці тести використовують як умову одну змінну Моделі і засоби систем баз даних та знань Тестування безпосередніх зв'язків з великим лагом відкриває все більше можливостей для «опосередкованих» впливів. Отже, в умови тестів безпосереднього зв'язку необхідно включати не тільки спільне минуле, але й можливих посередників. Але в процесі аналізу структури динамічного процесу доцільно уникати складних тестів. Процес аналізу має просуватися за принципом «від простих тестів до складніших». Конкретно для структури рекурентного процесу, показаного на рис. 3, той факт, що ряд W не впливає на ряд X (послідовно з лагами 1, 2, 3, ..), підтверджується тестами умовної незалежності між tX , з одного боку, та (послідовно) 1−tW , 2−tW , 3−tW ,.. – з іншого, причому всі ці тести використовують як умову одну змінну 1−tX . Таким чином, для конкретної вказаної структури відсутність зв'язків впливу ряду W на ряд X (з різними лагами) ідентифікується тестами першого рангу. Звертаємо увагу на наступну особливість відношень в динамічних процесах. За кондиціонування змінної 1−tX змінна tX умовно незалежна від 1−tW . Натомість за кондиціонування змінної 1−tW змінна tW умовно залежна від 1−tX . (Ця залежність забезпечується зв'язком tt WX →−1 .) Маючи на увазі несиметричність вказаної конструкції, в літературі іноді кажуть, що локальна незалежність є несиметричною (на відміну від звичайної незалежності). Насправді вказана несиметричність не є властивістю відношення незалежності. Просто факти незалежності в часових рядах даних завжди виражаються через змінні з часовими прив'язками (індексами). Якщо маємо незалежність між kX та mY , то незалежність не обов'язково збережеться після обміну індексами. Обмін індексами у змінних означає перехід до змістовно іншого відношення. Вказана несиметричність є проявом несиметричності структури зв'язків між часовими рядами, а також проявом спрямованості процесів в один бік (від минулого до майбутнього). Щоб формалізувати техніку сепарації для динамічних моделей, необхідно обрати форму графової репрезентації динамічного процесу. Один варіант репрезентації фактично використано на рис. 3. Зручна і компактна форма графової репрезентації векторного авторегресійного процесу («базова динамічна мережа») створюється на основі «найближчого» горизонту довжини векторного ряду даних. Базова динамічна мережа виглядає як фрагмент багатовимірного ряду з набором безпосередніх зв'язків. Модель компактно презентує увесь довгий ряд (в згорнутому вигляді). Розмір моделі (її «часова глибина») визначається довжиною (глибиною) безпосереднього зв'язку з найбільшим часовим лагом. В лівій («ранній») частині моделі структура має додаткові «неявні» зв'язки, які є наслідком залежностей з минулого. (На рис. 3 вони показані пунктиром.) Це порушує візуальну регулярність структури, але не заважає аналізу. Просто треба пам'ятати, що в процесі аналізу зв'язків завжди треба розглядати праву (пізнішу) частину такої структури. Якщо для аналізу потрібна динамічна мережа з більшим горизонтом часу, то структура «нарощується», тобто з правого боку моделі додаються копії змінних для наступного такту з усіма копіями зв'язків (відображених суцільними лініями). У вищенаведеній аргументації та викладках суттєвими вважалися тільки зсуви часу (різниця між індексами), а абсолютні значення індексів часу розглядалися як умовні. Тобто за умовчанням вважалося, що проведений аналіз стосується всього векторного часового ряду цілком. Насправді це не завжди вірно, і необхідно розглянути питання стаціонарності та стабільності процесів. 4 Типи стаціонарності процесів і припущення для аналізу векторних часових рядів Виведення каузальної моделі (як й будь-якої статистичної моделі), а також її верифікація на основі даних, спирається на обґрунтування концептуально чіткої схеми обчислення статистик з даних. Для обчислення статистик треба виділити з даних «випадки» і гарантувати певні вимоги регулярності генерації даних. Найбільш відома форма регулярності генерації даних – схема I.I.D, – традиційно була сформульована для «статичних» даних (лівий долішній квадрант на рис. 1). Схема I.I.D може бути адекватною також у ситуації, коли маємо багато екземплярів популяції з довгим рядом даних для кожного екземпляру (четвертий квадрант на рис. 1). Маючи багато екземплярів довгих рядів даних, можна аналізувати навіть нестаціонарний динамічний процес, зокрема, процес, структура якого змінюється у часі. В такому разі для кожного такту (кроку) j процесу статистика збирається «вертикально», по одному запису (для такту j ) з кожного ряду даних. Проблеми обґрунтувань і припущень для статистичного аналізу виникають для типової ситуації, коли маємо один довгий (тривалий) ряд даних (правий верхній квадрант на рис. 1). Тоді доводиться узагальнювати дані з різних тактів одного процесу, а відтак, постають питання щодо стандартних припущень про статистичну вибірку даних (незалежність, ідентичність, однорідність, стаціонарність, стабільність тощо). Увесь часовий ряд даних відображає історію функціонування об'єкту (середовища). В реальності об'єкт може змінюватися й еволюціонувати. Для того, щоб відомі методи були спроможні вивести адекватну модель з даних, мають виконуватися обмеження на характер та швидкість змін поведінки об'єкту. Типова риса динамічного процесу – це міцні «короткі» автокореляційні зв'язки 1+→ tt XX . Втім, такі зв'язків не обов'язково присутні. Усталені в економетриці методи аналізу часових рядів (а також визначення стаціонарності) за умовчанням виходять з припущення про рівномірність повторення вимірювань даних у часі, а також про одночасність вимірювань компонентів вектору характеристик з одним індексом часу. Нехай векторний часовий ряд включає l паралельних рядів, тобто складається з набору l змінних ,...),,( ZYX . Одночасність вимірювань компонентів вектору характеристик означає, що значення кожної компоненти вимірюють в моменти часу з єдиного переліку ,...,2,1,0=t ∞. Отже, природним чином визначається вектор-стовпчик . Таким чином, для конкретної вказаної структури відсутність зв’язків впливу ряду W на ряд X (з різними лагами) ідентифікується тестами першого рангу. Звертаємо увагу на наступну особливість відношень в дина- мічних процесах. За кондиціонування змінної Моделі і засоби систем баз даних та знань Тестування безпосередніх зв'язків з великим лагом відкриває все більше можливостей для «опосередкованих» впливів. Отже, в умови тестів безпосереднього зв'язку необхідно включати не тільки спільне минуле, але й можливих посередників. Але в процесі аналізу структури динамічного процесу доцільно уникати складних тестів. Процес аналізу має просуватися за принципом «від простих тестів до складніших». Конкретно для структури рекурентного процесу, показаного на рис. 3, той факт, що ряд W не впливає на ряд X (послідовно з лагами 1, 2, 3, ..), підтверджується тестами умовної незалежності між tX , з одного боку, та (послідовно) 1−tW , 2−tW , 3−tW ,.. – з іншого, причому всі ці тести використовують як умову одну змінну 1−tX . Таким чином, для конкретної вказаної структури відсутність зв'язків впливу ряду W на ряд X (з різними лагами) ідентифікується тестами першого рангу. Звертаємо увагу на наступну особливість відношень в динамічних процесах. За кондиціонування змінної 1−tX змінна tX умовно незалежна від 1−tW . Натомість за кондиціонування змінної 1−tW змінна tW умовно залежна від 1−tX . (Ця залежність забезпечується зв'язком tt WX →−1 .) Маючи на увазі несиметричність вказаної конструкції, в літературі іноді кажуть, що локальна незалежність є несиметричною (на відміну від звичайної незалежності). Насправді вказана несиметричність не є властивістю відношення незалежності. Просто факти незалежності в часових рядах даних завжди виражаються через змінні з часовими прив'язками (індексами). Якщо маємо незалежність між kX та mY , то незалежність не обов'язково збережеться після обміну індексами. Обмін індексами у змінних означає перехід до змістовно іншого відношення. Вказана несиметричність є проявом несиметричності структури зв'язків між часовими рядами, а також проявом спрямованості процесів в один бік (від минулого до майбутнього). Щоб формалізувати техніку сепарації для динамічних моделей, необхідно обрати форму графової репрезентації динамічного процесу. Один варіант репрезентації фактично використано на рис. 3. Зручна і компактна форма графової репрезентації векторного авторегресійного процесу («базова динамічна мережа») створюється на основі «найближчого» горизонту довжини векторного ряду даних. Базова динамічна мережа виглядає як фрагмент багатовимірного ряду з набором безпосередніх зв'язків. Модель компактно презентує увесь довгий ряд (в згорнутому вигляді). Розмір моделі (її «часова глибина») визначається довжиною (глибиною) безпосереднього зв'язку з найбільшим часовим лагом. В лівій («ранній») частині моделі структура має додаткові «неявні» зв'язки, які є наслідком залежностей з минулого. (На рис. 3 вони показані пунктиром.) Це порушує візуальну регулярність структури, але не заважає аналізу. Просто треба пам'ятати, що в процесі аналізу зв'язків завжди треба розглядати праву (пізнішу) частину такої структури. Якщо для аналізу потрібна динамічна мережа з більшим горизонтом часу, то структура «нарощується», тобто з правого боку моделі додаються копії змінних для наступного такту з усіма копіями зв'язків (відображених суцільними лініями). У вищенаведеній аргументації та викладках суттєвими вважалися тільки зсуви часу (різниця між індексами), а абсолютні значення індексів часу розглядалися як умовні. Тобто за умовчанням вважалося, що проведений аналіз стосується всього векторного часового ряду цілком. Насправді це не завжди вірно, і необхідно розглянути питання стаціонарності та стабільності процесів. 4 Типи стаціонарності процесів і припущення для аналізу векторних часових рядів Виведення каузальної моделі (як й будь-якої статистичної моделі), а також її верифікація на основі даних, спирається на обґрунтування концептуально чіткої схеми обчислення статистик з даних. Для обчислення статистик треба виділити з даних «випадки» і гарантувати певні вимоги регулярності генерації даних. Найбільш відома форма регулярності генерації даних – схема I.I.D, – традиційно була сформульована для «статичних» даних (лівий долішній квадрант на рис. 1). Схема I.I.D може бути адекватною також у ситуації, коли маємо багато екземплярів популяції з довгим рядом даних для кожного екземпляру (четвертий квадрант на рис. 1). Маючи багато екземплярів довгих рядів даних, можна аналізувати навіть нестаціонарний динамічний процес, зокрема, процес, структура якого змінюється у часі. В такому разі для кожного такту (кроку) j процесу статистика збирається «вертикально», по одному запису (для такту j ) з кожного ряду даних. Проблеми обґрунтувань і припущень для статистичного аналізу виникають для типової ситуації, коли маємо один довгий (тривалий) ряд даних (правий верхній квадрант на рис. 1). Тоді доводиться узагальнювати дані з різних тактів одного процесу, а відтак, постають питання щодо стандартних припущень про статистичну вибірку даних (незалежність, ідентичність, однорідність, стаціонарність, стабільність тощо). Увесь часовий ряд даних відображає історію функціонування об'єкту (середовища). В реальності об'єкт може змінюватися й еволюціонувати. Для того, щоб відомі методи були спроможні вивести адекватну модель з даних, мають виконуватися обмеження на характер та швидкість змін поведінки об'єкту. Типова риса динамічного процесу – це міцні «короткі» автокореляційні зв'язки 1+→ tt XX . Втім, такі зв'язків не обов'язково присутні. Усталені в економетриці методи аналізу часових рядів (а також визначення стаціонарності) за умовчанням виходять з припущення про рівномірність повторення вимірювань даних у часі, а також про одночасність вимірювань компонентів вектору характеристик з одним індексом часу. Нехай векторний часовий ряд включає l паралельних рядів, тобто складається з набору l змінних ,...),,( ZYX . Одночасність вимірювань компонентів вектору характеристик означає, що значення кожної компоненти вимірюють в моменти часу з єдиного переліку ,...,2,1,0=t ∞. Отже, природним чином визначається вектор-стовпчик змінна Моделі і засоби систем баз даних та знань Тестування безпосередніх зв'язків з великим лагом відкриває все більше можливостей для «опосередкованих» впливів. Отже, в умови тестів безпосереднього зв'язку необхідно включати не тільки спільне минуле, але й можливих посередників. Але в процесі аналізу структури динамічного процесу доцільно уникати складних тестів. Процес аналізу має просуватися за принципом «від простих тестів до складніших». Конкретно для структури рекурентного процесу, показаного на рис. 3, той факт, що ряд W не впливає на ряд X (послідовно з лагами 1, 2, 3, ..), підтверджується тестами умовної незалежності між tX , з одного боку, та (послідовно) 1−tW , 2−tW , 3−tW ,.. – з іншого, причому всі ці тести використовують як умову одну змінну 1−tX . Таким чином, для конкретної вказаної структури відсутність зв'язків впливу ряду W на ряд X (з різними лагами) ідентифікується тестами першого рангу. Звертаємо увагу на наступну особливість відношень в динамічних процесах. За кондиціонування змінної 1−tX змінна tX умовно незалежна від 1−tW . Натомість за кондиціонування змінної 1−tW змінна tW умовно залежна від 1−tX . (Ця залежність забезпечується зв'язком tt WX →−1 .) Маючи на увазі несиметричність вказаної конструкції, в літературі іноді кажуть, що локальна незалежність є несиметричною (на відміну від звичайної незалежності). Насправді вказана несиметричність не є властивістю відношення незалежності. Просто факти незалежності в часових рядах даних завжди виражаються через змінні з часовими прив'язками (індексами). Якщо маємо незалежність між kX та mY , то незалежність не обов'язково збережеться після обміну індексами. Обмін індексами у змінних означає перехід до змістовно іншого відношення. Вказана несиметричність є проявом несиметричності структури зв'язків між часовими рядами, а також проявом спрямованості процесів в один бік (від минулого до майбутнього). Щоб формалізувати техніку сепарації для динамічних моделей, необхідно обрати форму графової репрезентації динамічного процесу. Один варіант репрезентації фактично використано на рис. 3. Зручна і компактна форма графової репрезентації векторного авторегресійного процесу («базова динамічна мережа») створюється на основі «найближчого» горизонту довжини векторного ряду даних. Базова динамічна мережа виглядає як фрагмент багатовимірного ряду з набором безпосередніх зв'язків. Модель компактно презентує увесь довгий ряд (в згорнутому вигляді). Розмір моделі (її «часова глибина») визначається довжиною (глибиною) безпосереднього зв'язку з найбільшим часовим лагом. В лівій («ранній») частині моделі структура має додаткові «неявні» зв'язки, які є наслідком залежностей з минулого. (На рис. 3 вони показані пунктиром.) Це порушує візуальну регулярність структури, але не заважає аналізу. Просто треба пам'ятати, що в процесі аналізу зв'язків завжди треба розглядати праву (пізнішу) частину такої структури. Якщо для аналізу потрібна динамічна мережа з більшим горизонтом часу, то структура «нарощується», тобто з правого боку моделі додаються копії змінних для наступного такту з усіма копіями зв'язків (відображених суцільними лініями). У вищенаведеній аргументації та викладках суттєвими вважалися тільки зсуви часу (різниця між індексами), а абсолютні значення індексів часу розглядалися як умовні. Тобто за умовчанням вважалося, що проведений аналіз стосується всього векторного часового ряду цілком. Насправді це не завжди вірно, і необхідно розглянути питання стаціонарності та стабільності процесів. 4 Типи стаціонарності процесів і припущення для аналізу векторних часових рядів Виведення каузальної моделі (як й будь-якої статистичної моделі), а також її верифікація на основі даних, спирається на обґрунтування концептуально чіткої схеми обчислення статистик з даних. Для обчислення статистик треба виділити з даних «випадки» і гарантувати певні вимоги регулярності генерації даних. Найбільш відома форма регулярності генерації даних – схема I.I.D, – традиційно була сформульована для «статичних» даних (лівий долішній квадрант на рис. 1). Схема I.I.D може бути адекватною також у ситуації, коли маємо багато екземплярів популяції з довгим рядом даних для кожного екземпляру (четвертий квадрант на рис. 1). Маючи багато екземплярів довгих рядів даних, можна аналізувати навіть нестаціонарний динамічний процес, зокрема, процес, структура якого змінюється у часі. В такому разі для кожного такту (кроку) j процесу статистика збирається «вертикально», по одному запису (для такту j ) з кожного ряду даних. Проблеми обґрунтувань і припущень для статистичного аналізу виникають для типової ситуації, коли маємо один довгий (тривалий) ряд даних (правий верхній квадрант на рис. 1). Тоді доводиться узагальнювати дані з різних тактів одного процесу, а відтак, постають питання щодо стандартних припущень про статистичну вибірку даних (незалежність, ідентичність, однорідність, стаціонарність, стабільність тощо). Увесь часовий ряд даних відображає історію функціонування об'єкту (середовища). В реальності об'єкт може змінюватися й еволюціонувати. Для того, щоб відомі методи були спроможні вивести адекватну модель з даних, мають виконуватися обмеження на характер та швидкість змін поведінки об'єкту. Типова риса динамічного процесу – це міцні «короткі» автокореляційні зв'язки 1+→ tt XX . Втім, такі зв'язків не обов'язково присутні. Усталені в економетриці методи аналізу часових рядів (а також визначення стаціонарності) за умовчанням виходять з припущення про рівномірність повторення вимірювань даних у часі, а також про одночасність вимірювань компонентів вектору характеристик з одним індексом часу. Нехай векторний часовий ряд включає l паралельних рядів, тобто складається з набору l змінних ,...),,( ZYX . Одночасність вимірювань компонентів вектору характеристик означає, що значення кожної компоненти вимірюють в моменти часу з єдиного переліку ,...,2,1,0=t ∞. Отже, природним чином визначається вектор-стовпчик умовно незалежна від Моделі і засоби систем баз даних та знань Тестування безпосередніх зв'язків з великим лагом відкриває все більше можливостей для «опосередкованих» впливів. Отже, в умови тестів безпосереднього зв'язку необхідно включати не тільки спільне минуле, але й можливих посередників. Але в процесі аналізу структури динамічного процесу доцільно уникати складних тестів. Процес аналізу має просуватися за принципом «від простих тестів до складніших». Конкретно для структури рекурентного процесу, показаного на рис. 3, той факт, що ряд W не впливає на ряд X (послідовно з лагами 1, 2, 3, ..), підтверджується тестами умовної незалежності між tX , з одного боку, та (послідовно) 1−tW , 2−tW , 3−tW ,.. – з іншого, причому всі ці тести використовують як умову одну змінну 1−tX . Таким чином, для конкретної вказаної структури відсутність зв'язків впливу ряду W на ряд X (з різними лагами) ідентифікується тестами першого рангу. Звертаємо увагу на наступну особливість відношень в динамічних процесах. За кондиціонування змінної 1−tX змінна tX умовно незалежна від 1−tW . Натомість за кондиціонування змінної 1−tW змінна tW умовно залежна від 1−tX . (Ця залежність забезпечується зв'язком tt WX →−1 .) Маючи на увазі несиметричність вказаної конструкції, в літературі іноді кажуть, що локальна незалежність є несиметричною (на відміну від звичайної незалежності). Насправді вказана несиметричність не є властивістю відношення незалежності. Просто факти незалежності в часових рядах даних завжди виражаються через змінні з часовими прив'язками (індексами). Якщо маємо незалежність між kX та mY , то незалежність не обов'язково збережеться після обміну індексами. Обмін індексами у змінних означає перехід до змістовно іншого відношення. Вказана несиметричність є проявом несиметричності структури зв'язків між часовими рядами, а також проявом спрямованості процесів в один бік (від минулого до майбутнього). Щоб формалізувати техніку сепарації для динамічних моделей, необхідно обрати форму графової репрезентації динамічного процесу. Один варіант репрезентації фактично використано на рис. 3. Зручна і компактна форма графової репрезентації векторного авторегресійного процесу («базова динамічна мережа») створюється на основі «найближчого» горизонту довжини векторного ряду даних. Базова динамічна мережа виглядає як фрагмент багатовимірного ряду з набором безпосередніх зв'язків. Модель компактно презентує увесь довгий ряд (в згорнутому вигляді). Розмір моделі (її «часова глибина») визначається довжиною (глибиною) безпосереднього зв'язку з найбільшим часовим лагом. В лівій («ранній») частині моделі структура має додаткові «неявні» зв'язки, які є наслідком залежностей з минулого. (На рис. 3 вони показані пунктиром.) Це порушує візуальну регулярність структури, але не заважає аналізу. Просто треба пам'ятати, що в процесі аналізу зв'язків завжди треба розглядати праву (пізнішу) частину такої структури. Якщо для аналізу потрібна динамічна мережа з більшим горизонтом часу, то структура «нарощується», тобто з правого боку моделі додаються копії змінних для наступного такту з усіма копіями зв'язків (відображених суцільними лініями). У вищенаведеній аргументації та викладках суттєвими вважалися тільки зсуви часу (різниця між індексами), а абсолютні значення індексів часу розглядалися як умовні. Тобто за умовчанням вважалося, що проведений аналіз стосується всього векторного часового ряду цілком. Насправді це не завжди вірно, і необхідно розглянути питання стаціонарності та стабільності процесів. 4 Типи стаціонарності процесів і припущення для аналізу векторних часових рядів Виведення каузальної моделі (як й будь-якої статистичної моделі), а також її верифікація на основі даних, спирається на обґрунтування концептуально чіткої схеми обчислення статистик з даних. Для обчислення статистик треба виділити з даних «випадки» і гарантувати певні вимоги регулярності генерації даних. Найбільш відома форма регулярності генерації даних – схема I.I.D, – традиційно була сформульована для «статичних» даних (лівий долішній квадрант на рис. 1). Схема I.I.D може бути адекватною також у ситуації, коли маємо багато екземплярів популяції з довгим рядом даних для кожного екземпляру (четвертий квадрант на рис. 1). Маючи багато екземплярів довгих рядів даних, можна аналізувати навіть нестаціонарний динамічний процес, зокрема, процес, структура якого змінюється у часі. В такому разі для кожного такту (кроку) j процесу статистика збирається «вертикально», по одному запису (для такту j ) з кожного ряду даних. Проблеми обґрунтувань і припущень для статистичного аналізу виникають для типової ситуації, коли маємо один довгий (тривалий) ряд даних (правий верхній квадрант на рис. 1). Тоді доводиться узагальнювати дані з різних тактів одного процесу, а відтак, постають питання щодо стандартних припущень про статистичну вибірку даних (незалежність, ідентичність, однорідність, стаціонарність, стабільність тощо). Увесь часовий ряд даних відображає історію функціонування об'єкту (середовища). В реальності об'єкт може змінюватися й еволюціонувати. Для того, щоб відомі методи були спроможні вивести адекватну модель з даних, мають виконуватися обмеження на характер та швидкість змін поведінки об'єкту. Типова риса динамічного процесу – це міцні «короткі» автокореляційні зв'язки 1+→ tt XX . Втім, такі зв'язків не обов'язково присутні. Усталені в економетриці методи аналізу часових рядів (а також визначення стаціонарності) за умовчанням виходять з припущення про рівномірність повторення вимірювань даних у часі, а також про одночасність вимірювань компонентів вектору характеристик з одним індексом часу. Нехай векторний часовий ряд включає l паралельних рядів, тобто складається з набору l змінних ,...),,( ZYX . Одночасність вимірювань компонентів вектору характеристик означає, що значення кожної компоненти вимірюють в моменти часу з єдиного переліку ,...,2,1,0=t ∞. Отже, природним чином визначається вектор-стовпчик . Натомість за конди- ціонування змінної Моделі і засоби систем баз даних та знань Тестування безпосередніх зв'язків з великим лагом відкриває все більше можливостей для «опосередкованих» впливів. Отже, в умови тестів безпосереднього зв'язку необхідно включати не тільки спільне минуле, але й можливих посередників. Але в процесі аналізу структури динамічного процесу доцільно уникати складних тестів. Процес аналізу має просуватися за принципом «від простих тестів до складніших». Конкретно для структури рекурентного процесу, показаного на рис. 3, той факт, що ряд W не впливає на ряд X (послідовно з лагами 1, 2, 3, ..), підтверджується тестами умовної незалежності між tX , з одного боку, та (послідовно) 1−tW , 2−tW , 3−tW ,.. – з іншого, причому всі ці тести використовують як умову одну змінну 1−tX . Таким чином, для конкретної вказаної структури відсутність зв'язків впливу ряду W на ряд X (з різними лагами) ідентифікується тестами першого рангу. Звертаємо увагу на наступну особливість відношень в динамічних процесах. За кондиціонування змінної 1−tX змінна tX умовно незалежна від 1−tW . Натомість за кондиціонування змінної 1−tW змінна tW умовно залежна від 1−tX . (Ця залежність забезпечується зв'язком tt WX →−1 .) Маючи на увазі несиметричність вказаної конструкції, в літературі іноді кажуть, що локальна незалежність є несиметричною (на відміну від звичайної незалежності). Насправді вказана несиметричність не є властивістю відношення незалежності. Просто факти незалежності в часових рядах даних завжди виражаються через змінні з часовими прив'язками (індексами). Якщо маємо незалежність між kX та mY , то незалежність не обов'язково збережеться після обміну індексами. Обмін індексами у змінних означає перехід до змістовно іншого відношення. Вказана несиметричність є проявом несиметричності структури зв'язків між часовими рядами, а також проявом спрямованості процесів в один бік (від минулого до майбутнього). Щоб формалізувати техніку сепарації для динамічних моделей, необхідно обрати форму графової репрезентації динамічного процесу. Один варіант репрезентації фактично використано на рис. 3. Зручна і компактна форма графової репрезентації векторного авторегресійного процесу («базова динамічна мережа») створюється на основі «найближчого» горизонту довжини векторного ряду даних. Базова динамічна мережа виглядає як фрагмент багатовимірного ряду з набором безпосередніх зв'язків. Модель компактно презентує увесь довгий ряд (в згорнутому вигляді). Розмір моделі (її «часова глибина») визначається довжиною (глибиною) безпосереднього зв'язку з найбільшим часовим лагом. В лівій («ранній») частині моделі структура має додаткові «неявні» зв'язки, які є наслідком залежностей з минулого. (На рис. 3 вони показані пунктиром.) Це порушує візуальну регулярність структури, але не заважає аналізу. Просто треба пам'ятати, що в процесі аналізу зв'язків завжди треба розглядати праву (пізнішу) частину такої структури. Якщо для аналізу потрібна динамічна мережа з більшим горизонтом часу, то структура «нарощується», тобто з правого боку моделі додаються копії змінних для наступного такту з усіма копіями зв'язків (відображених суцільними лініями). У вищенаведеній аргументації та викладках суттєвими вважалися тільки зсуви часу (різниця між індексами), а абсолютні значення індексів часу розглядалися як умовні. Тобто за умовчанням вважалося, що проведений аналіз стосується всього векторного часового ряду цілком. Насправді це не завжди вірно, і необхідно розглянути питання стаціонарності та стабільності процесів. 4 Типи стаціонарності процесів і припущення для аналізу векторних часових рядів Виведення каузальної моделі (як й будь-якої статистичної моделі), а також її верифікація на основі даних, спирається на обґрунтування концептуально чіткої схеми обчислення статистик з даних. Для обчислення статистик треба виділити з даних «випадки» і гарантувати певні вимоги регулярності генерації даних. Найбільш відома форма регулярності генерації даних – схема I.I.D, – традиційно була сформульована для «статичних» даних (лівий долішній квадрант на рис. 1). Схема I.I.D може бути адекватною також у ситуації, коли маємо багато екземплярів популяції з довгим рядом даних для кожного екземпляру (четвертий квадрант на рис. 1). Маючи багато екземплярів довгих рядів даних, можна аналізувати навіть нестаціонарний динамічний процес, зокрема, процес, структура якого змінюється у часі. В такому разі для кожного такту (кроку) j процесу статистика збирається «вертикально», по одному запису (для такту j ) з кожного ряду даних. Проблеми обґрунтувань і припущень для статистичного аналізу виникають для типової ситуації, коли маємо один довгий (тривалий) ряд даних (правий верхній квадрант на рис. 1). Тоді доводиться узагальнювати дані з різних тактів одного процесу, а відтак, постають питання щодо стандартних припущень про статистичну вибірку даних (незалежність, ідентичність, однорідність, стаціонарність, стабільність тощо). Увесь часовий ряд даних відображає історію функціонування об'єкту (середовища). В реальності об'єкт може змінюватися й еволюціонувати. Для того, щоб відомі методи були спроможні вивести адекватну модель з даних, мають виконуватися обмеження на характер та швидкість змін поведінки об'єкту. Типова риса динамічного процесу – це міцні «короткі» автокореляційні зв'язки 1+→ tt XX . Втім, такі зв'язків не обов'язково присутні. Усталені в економетриці методи аналізу часових рядів (а також визначення стаціонарності) за умовчанням виходять з припущення про рівномірність повторення вимірювань даних у часі, а також про одночасність вимірювань компонентів вектору характеристик з одним індексом часу. Нехай векторний часовий ряд включає l паралельних рядів, тобто складається з набору l змінних ,...),,( ZYX . Одночасність вимірювань компонентів вектору характеристик означає, що значення кожної компоненти вимірюють в моменти часу з єдиного переліку ,...,2,1,0=t ∞. Отже, природним чином визначається вектор-стовпчик змінна Моделі і засоби систем баз даних та знань Тестування безпосередніх зв'язків з великим лагом відкриває все більше можливостей для «опосередкованих» впливів. Отже, в умови тестів безпосереднього зв'язку необхідно включати не тільки спільне минуле, але й можливих посередників. Але в процесі аналізу структури динамічного процесу доцільно уникати складних тестів. Процес аналізу має просуватися за принципом «від простих тестів до складніших». Конкретно для структури рекурентного процесу, показаного на рис. 3, той факт, що ряд W не впливає на ряд X (послідовно з лагами 1, 2, 3, ..), підтверджується тестами умовної незалежності між tX , з одного боку, та (послідовно) 1−tW , 2−tW , 3−tW ,.. – з іншого, причому всі ці тести використовують як умову одну змінну 1−tX . Таким чином, для конкретної вказаної структури відсутність зв'язків впливу ряду W на ряд X (з різними лагами) ідентифікується тестами першого рангу. Звертаємо увагу на наступну особливість відношень в динамічних процесах. За кондиціонування змінної 1−tX змінна tX умовно незалежна від 1−tW . Натомість за кондиціонування змінної 1−tW змінна tW умовно залежна від 1−tX . (Ця залежність забезпечується зв'язком tt WX →−1 .) Маючи на увазі несиметричність вказаної конструкції, в літературі іноді кажуть, що локальна незалежність є несиметричною (на відміну від звичайної незалежності). Насправді вказана несиметричність не є властивістю відношення незалежності. Просто факти незалежності в часових рядах даних завжди виражаються через змінні з часовими прив'язками (індексами). Якщо маємо незалежність між kX та mY , то незалежність не обов'язково збережеться після обміну індексами. Обмін індексами у змінних означає перехід до змістовно іншого відношення. Вказана несиметричність є проявом несиметричності структури зв'язків між часовими рядами, а також проявом спрямованості процесів в один бік (від минулого до майбутнього). Щоб формалізувати техніку сепарації для динамічних моделей, необхідно обрати форму графової репрезентації динамічного процесу. Один варіант репрезентації фактично використано на рис. 3. Зручна і компактна форма графової репрезентації векторного авторегресійного процесу («базова динамічна мережа») створюється на основі «найближчого» горизонту довжини векторного ряду даних. Базова динамічна мережа виглядає як фрагмент багатовимірного ряду з набором безпосередніх зв'язків. Модель компактно презентує увесь довгий ряд (в згорнутому вигляді). Розмір моделі (її «часова глибина») визначається довжиною (глибиною) безпосереднього зв'язку з найбільшим часовим лагом. В лівій («ранній») частині моделі структура має додаткові «неявні» зв'язки, які є наслідком залежностей з минулого. (На рис. 3 вони показані пунктиром.) Це порушує візуальну регулярність структури, але не заважає аналізу. Просто треба пам'ятати, що в процесі аналізу зв'язків завжди треба розглядати праву (пізнішу) частину такої структури. Якщо для аналізу потрібна динамічна мережа з більшим горизонтом часу, то структура «нарощується», тобто з правого боку моделі додаються копії змінних для наступного такту з усіма копіями зв'язків (відображених суцільними лініями). У вищенаведеній аргументації та викладках суттєвими вважалися тільки зсуви часу (різниця між індексами), а абсолютні значення індексів часу розглядалися як умовні. Тобто за умовчанням вважалося, що проведений аналіз стосується всього векторного часового ряду цілком. Насправді це не завжди вірно, і необхідно розглянути питання стаціонарності та стабільності процесів. 4 Типи стаціонарності процесів і припущення для аналізу векторних часових рядів Виведення каузальної моделі (як й будь-якої статистичної моделі), а також її верифікація на основі даних, спирається на обґрунтування концептуально чіткої схеми обчислення статистик з даних. Для обчислення статистик треба виділити з даних «випадки» і гарантувати певні вимоги регулярності генерації даних. Найбільш відома форма регулярності генерації даних – схема I.I.D, – традиційно була сформульована для «статичних» даних (лівий долішній квадрант на рис. 1). Схема I.I.D може бути адекватною також у ситуації, коли маємо багато екземплярів популяції з довгим рядом даних для кожного екземпляру (четвертий квадрант на рис. 1). Маючи багато екземплярів довгих рядів даних, можна аналізувати навіть нестаціонарний динамічний процес, зокрема, процес, структура якого змінюється у часі. В такому разі для кожного такту (кроку) j процесу статистика збирається «вертикально», по одному запису (для такту j ) з кожного ряду даних. Проблеми обґрунтувань і припущень для статистичного аналізу виникають для типової ситуації, коли маємо один довгий (тривалий) ряд даних (правий верхній квадрант на рис. 1). Тоді доводиться узагальнювати дані з різних тактів одного процесу, а відтак, постають питання щодо стандартних припущень про статистичну вибірку даних (незалежність, ідентичність, однорідність, стаціонарність, стабільність тощо). Увесь часовий ряд даних відображає історію функціонування об'єкту (середовища). В реальності об'єкт може змінюватися й еволюціонувати. Для того, щоб відомі методи були спроможні вивести адекватну модель з даних, мають виконуватися обмеження на характер та швидкість змін поведінки об'єкту. Типова риса динамічного процесу – це міцні «короткі» автокореляційні зв'язки 1+→ tt XX . Втім, такі зв'язків не обов'язково присутні. Усталені в економетриці методи аналізу часових рядів (а також визначення стаціонарності) за умовчанням виходять з припущення про рівномірність повторення вимірювань даних у часі, а також про одночасність вимірювань компонентів вектору характеристик з одним індексом часу. Нехай векторний часовий ряд включає l паралельних рядів, тобто складається з набору l змінних ,...),,( ZYX . Одночасність вимірювань компонентів вектору характеристик означає, що значення кожної компоненти вимірюють в моменти часу з єдиного переліку ,...,2,1,0=t ∞. Отже, природним чином визначається вектор-стовпчик умовно залежна від Моделі і засоби систем баз даних та знань Тестування безпосередніх зв'язків з великим лагом відкриває все більше можливостей для «опосередкованих» впливів. Отже, в умови тестів безпосереднього зв'язку необхідно включати не тільки спільне минуле, але й можливих посередників. Але в процесі аналізу структури динамічного процесу доцільно уникати складних тестів. Процес аналізу має просуватися за принципом «від простих тестів до складніших». Конкретно для структури рекурентного процесу, показаного на рис. 3, той факт, що ряд W не впливає на ряд X (послідовно з лагами 1, 2, 3, ..), підтверджується тестами умовної незалежності між tX , з одного боку, та (послідовно) 1−tW , 2−tW , 3−tW ,.. – з іншого, причому всі ці тести використовують як умову одну змінну 1−tX . Таким чином, для конкретної вказаної структури відсутність зв'язків впливу ряду W на ряд X (з різними лагами) ідентифікується тестами першого рангу. Звертаємо увагу на наступну особливість відношень в динамічних процесах. За кондиціонування змінної 1−tX змінна tX умовно незалежна від 1−tW . Натомість за кондиціонування змінної 1−tW змінна tW умовно залежна від 1−tX . (Ця залежність забезпечується зв'язком tt WX →−1 .) Маючи на увазі несиметричність вказаної конструкції, в літературі іноді кажуть, що локальна незалежність є несиметричною (на відміну від звичайної незалежності). Насправді вказана несиметричність не є властивістю відношення незалежності. Просто факти незалежності в часових рядах даних завжди виражаються через змінні з часовими прив'язками (індексами). Якщо маємо незалежність між kX та mY , то незалежність не обов'язково збережеться після обміну індексами. Обмін індексами у змінних означає перехід до змістовно іншого відношення. Вказана несиметричність є проявом несиметричності структури зв'язків між часовими рядами, а також проявом спрямованості процесів в один бік (від минулого до майбутнього). Щоб формалізувати техніку сепарації для динамічних моделей, необхідно обрати форму графової репрезентації динамічного процесу. Один варіант репрезентації фактично використано на рис. 3. Зручна і компактна форма графової репрезентації векторного авторегресійного процесу («базова динамічна мережа») створюється на основі «найближчого» горизонту довжини векторного ряду даних. Базова динамічна мережа виглядає як фрагмент багатовимірного ряду з набором безпосередніх зв'язків. Модель компактно презентує увесь довгий ряд (в згорнутому вигляді). Розмір моделі (її «часова глибина») визначається довжиною (глибиною) безпосереднього зв'язку з найбільшим часовим лагом. В лівій («ранній») частині моделі структура має додаткові «неявні» зв'язки, які є наслідком залежностей з минулого. (На рис. 3 вони показані пунктиром.) Це порушує візуальну регулярність структури, але не заважає аналізу. Просто треба пам'ятати, що в процесі аналізу зв'язків завжди треба розглядати праву (пізнішу) частину такої структури. Якщо для аналізу потрібна динамічна мережа з більшим горизонтом часу, то структура «нарощується», тобто з правого боку моделі додаються копії змінних для наступного такту з усіма копіями зв'язків (відображених суцільними лініями). У вищенаведеній аргументації та викладках суттєвими вважалися тільки зсуви часу (різниця між індексами), а абсолютні значення індексів часу розглядалися як умовні. Тобто за умовчанням вважалося, що проведений аналіз стосується всього векторного часового ряду цілком. Насправді це не завжди вірно, і необхідно розглянути питання стаціонарності та стабільності процесів. 4 Типи стаціонарності процесів і припущення для аналізу векторних часових рядів Виведення каузальної моделі (як й будь-якої статистичної моделі), а також її верифікація на основі даних, спирається на обґрунтування концептуально чіткої схеми обчислення статистик з даних. Для обчислення статистик треба виділити з даних «випадки» і гарантувати певні вимоги регулярності генерації даних. Найбільш відома форма регулярності генерації даних – схема I.I.D, – традиційно була сформульована для «статичних» даних (лівий долішній квадрант на рис. 1). Схема I.I.D може бути адекватною також у ситуації, коли маємо багато екземплярів популяції з довгим рядом даних для кожного екземпляру (четвертий квадрант на рис. 1). Маючи багато екземплярів довгих рядів даних, можна аналізувати навіть нестаціонарний динамічний процес, зокрема, процес, структура якого змінюється у часі. В такому разі для кожного такту (кроку) j процесу статистика збирається «вертикально», по одному запису (для такту j ) з кожного ряду даних. Проблеми обґрунтувань і припущень для статистичного аналізу виникають для типової ситуації, коли маємо один довгий (тривалий) ряд даних (правий верхній квадрант на рис. 1). Тоді доводиться узагальнювати дані з різних тактів одного процесу, а відтак, постають питання щодо стандартних припущень про статистичну вибірку даних (незалежність, ідентичність, однорідність, стаціонарність, стабільність тощо). Увесь часовий ряд даних відображає історію функціонування об'єкту (середовища). В реальності об'єкт може змінюватися й еволюціонувати. Для того, щоб відомі методи були спроможні вивести адекватну модель з даних, мають виконуватися обмеження на характер та швидкість змін поведінки об'єкту. Типова риса динамічного процесу – це міцні «короткі» автокореляційні зв'язки 1+→ tt XX . Втім, такі зв'язків не обов'язково присутні. Усталені в економетриці методи аналізу часових рядів (а також визначення стаціонарності) за умовчанням виходять з припущення про рівномірність повторення вимірювань даних у часі, а також про одночасність вимірювань компонентів вектору характеристик з одним індексом часу. Нехай векторний часовий ряд включає l паралельних рядів, тобто складається з набору l змінних ,...),,( ZYX . Одночасність вимірювань компонентів вектору характеристик означає, що значення кожної компоненти вимірюють в моменти часу з єдиного переліку ,...,2,1,0=t ∞. Отже, природним чином визначається вектор-стовпчик . (Ця залежність забезпечується зв’язком Моделі і засоби систем баз даних та знань Тестування безпосередніх зв'язків з великим лагом відкриває все більше можливостей для «опосередкованих» впливів. Отже, в умови тестів безпосереднього зв'язку необхідно включати не тільки спільне минуле, але й можливих посередників. Але в процесі аналізу структури динамічного процесу доцільно уникати складних тестів. Процес аналізу має просуватися за принципом «від простих тестів до складніших». Конкретно для структури рекурентного процесу, показаного на рис. 3, той факт, що ряд W не впливає на ряд X (послідовно з лагами 1, 2, 3, ..), підтверджується тестами умовної незалежності між tX , з одного боку, та (послідовно) 1−tW , 2−tW , 3−tW ,.. – з іншого, причому всі ці тести використовують як умову одну змінну 1−tX . Таким чином, для конкретної вказаної структури відсутність зв'язків впливу ряду W на ряд X (з різними лагами) ідентифікується тестами першого рангу. Звертаємо увагу на наступну особливість відношень в динамічних процесах. За кондиціонування змінної 1−tX змінна tX умовно незалежна від 1−tW . Натомість за кондиціонування змінної 1−tW змінна tW умовно залежна від 1−tX . (Ця залежність забезпечується зв'язком tt WX →−1 .) Маючи на увазі несиметричність вказаної конструкції, в літературі іноді кажуть, що локальна незалежність є несиметричною (на відміну від звичайної незалежності). Насправді вказана несиметричність не є властивістю відношення незалежності. Просто факти незалежності в часових рядах даних завжди виражаються через змінні з часовими прив'язками (індексами). Якщо маємо незалежність між kX та mY , то незалежність не обов'язково збережеться після обміну індексами. Обмін індексами у змінних означає перехід до змістовно іншого відношення. Вказана несиметричність є проявом несиметричності структури зв'язків між часовими рядами, а також проявом спрямованості процесів в один бік (від минулого до майбутнього). Щоб формалізувати техніку сепарації для динамічних моделей, необхідно обрати форму графової репрезентації динамічного процесу. Один варіант репрезентації фактично використано на рис. 3. Зручна і компактна форма графової репрезентації векторного авторегресійного процесу («базова динамічна мережа») створюється на основі «найближчого» горизонту довжини векторного ряду даних. Базова динамічна мережа виглядає як фрагмент багатовимірного ряду з набором безпосередніх зв'язків. Модель компактно презентує увесь довгий ряд (в згорнутому вигляді). Розмір моделі (її «часова глибина») визначається довжиною (глибиною) безпосереднього зв'язку з найбільшим часовим лагом. В лівій («ранній») частині моделі структура має додаткові «неявні» зв'язки, які є наслідком залежностей з минулого. (На рис. 3 вони показані пунктиром.) Це порушує візуальну регулярність структури, але не заважає аналізу. Просто треба пам'ятати, що в процесі аналізу зв'язків завжди треба розглядати праву (пізнішу) частину такої структури. Якщо для аналізу потрібна динамічна мережа з більшим горизонтом часу, то структура «нарощується», тобто з правого боку моделі додаються копії змінних для наступного такту з усіма копіями зв'язків (відображених суцільними лініями). У вищенаведеній аргументації та викладках суттєвими вважалися тільки зсуви часу (різниця між індексами), а абсолютні значення індексів часу розглядалися як умовні. Тобто за умовчанням вважалося, що проведений аналіз стосується всього векторного часового ряду цілком. Насправді це не завжди вірно, і необхідно розглянути питання стаціонарності та стабільності процесів. 4 Типи стаціонарності процесів і припущення для аналізу векторних часових рядів Виведення каузальної моделі (як й будь-якої статистичної моделі), а також її верифікація на основі даних, спирається на обґрунтування концептуально чіткої схеми обчислення статистик з даних. Для обчислення статистик треба виділити з даних «випадки» і гарантувати певні вимоги регулярності генерації даних. Найбільш відома форма регулярності генерації даних – схема I.I.D, – традиційно була сформульована для «статичних» даних (лівий долішній квадрант на рис. 1). Схема I.I.D може бути адекватною також у ситуації, коли маємо багато екземплярів популяції з довгим рядом даних для кожного екземпляру (четвертий квадрант на рис. 1). Маючи багато екземплярів довгих рядів даних, можна аналізувати навіть нестаціонарний динамічний процес, зокрема, процес, структура якого змінюється у часі. В такому разі для кожного такту (кроку) j процесу статистика збирається «вертикально», по одному запису (для такту j ) з кожного ряду даних. Проблеми обґрунтувань і припущень для статистичного аналізу виникають для типової ситуації, коли маємо один довгий (тривалий) ряд даних (правий верхній квадрант на рис. 1). Тоді доводиться узагальнювати дані з різних тактів одного процесу, а відтак, постають питання щодо стандартних припущень про статистичну вибірку даних (незалежність, ідентичність, однорідність, стаціонарність, стабільність тощо). Увесь часовий ряд даних відображає історію функціонування об'єкту (середовища). В реальності об'єкт може змінюватися й еволюціонувати. Для того, щоб відомі методи були спроможні вивести адекватну модель з даних, мають виконуватися обмеження на характер та швидкість змін поведінки об'єкту. Типова риса динамічного процесу – це міцні «короткі» автокореляційні зв'язки 1+→ tt XX . Втім, такі зв'язків не обов'язково присутні. Усталені в економетриці методи аналізу часових рядів (а також визначення стаціонарності) за умовчанням виходять з припущення про рівномірність повторення вимірювань даних у часі, а також про одночасність вимірювань компонентів вектору характеристик з одним індексом часу. Нехай векторний часовий ряд включає l паралельних рядів, тобто складається з набору l змінних ,...),,( ZYX . Одночасність вимірювань компонентів вектору характеристик означає, що значення кожної компоненти вимірюють в моменти часу з єдиного переліку ,...,2,1,0=t ∞. Отже, природним чином визначається вектор-стовпчик .) Маючи на увазі несиметричність вказаної конструкції, в літературі іноді кажуть, що локальна незалежність є несиметричною (на відміну від звичайної незалежності). Насправді вказана несиметричність не є властивістю відношення незалежності. Просто факти незалежності в часових рядах даних завжди виражаються через змінні з часовими прив’язками (індексами). Якщо маємо незалежність між Моделі і засоби систем баз даних та знань Тестування безпосередніх зв'язків з великим лагом відкриває все більше можливостей для «опосередкованих» впливів. Отже, в умови тестів безпосереднього зв'язку необхідно включати не тільки спільне минуле, але й можливих посередників. Але в процесі аналізу структури динамічного процесу доцільно уникати складних тестів. Процес аналізу має просуватися за принципом «від простих тестів до складніших». Конкретно для структури рекурентного процесу, показаного на рис. 3, той факт, що ряд W не впливає на ряд X (послідовно з лагами 1, 2, 3, ..), підтверджується тестами умовної незалежності між tX , з одного боку, та (послідовно) 1−tW , 2−tW , 3−tW ,.. – з іншого, причому всі ці тести використовують як умову одну змінну 1−tX . Таким чином, для конкретної вказаної структури відсутність зв'язків впливу ряду W на ряд X (з різними лагами) ідентифікується тестами першого рангу. Звертаємо увагу на наступну особливість відношень в динамічних процесах. За кондиціонування змінної 1−tX змінна tX умовно незалежна від 1−tW . Натомість за кондиціонування змінної 1−tW змінна tW умовно залежна від 1−tX . (Ця залежність забезпечується зв'язком tt WX →−1 .) Маючи на увазі несиметричність вказаної конструкції, в літературі іноді кажуть, що локальна незалежність є несиметричною (на відміну від звичайної незалежності). Насправді вказана несиметричність не є властивістю відношення незалежності. Просто факти незалежності в часових рядах даних завжди виражаються через змінні з часовими прив'язками (індексами). Якщо маємо незалежність між kX та mY , то незалежність не обов'язково збережеться після обміну індексами. Обмін індексами у змінних означає перехід до змістовно іншого відношення. Вказана несиметричність є проявом несиметричності структури зв'язків між часовими рядами, а також проявом спрямованості процесів в один бік (від минулого до майбутнього). Щоб формалізувати техніку сепарації для динамічних моделей, необхідно обрати форму графової репрезентації динамічного процесу. Один варіант репрезентації фактично використано на рис. 3. Зручна і компактна форма графової репрезентації векторного авторегресійного процесу («базова динамічна мережа») створюється на основі «найближчого» горизонту довжини векторного ряду даних. Базова динамічна мережа виглядає як фрагмент багатовимірного ряду з набором безпосередніх зв'язків. Модель компактно презентує увесь довгий ряд (в згорнутому вигляді). Розмір моделі (її «часова глибина») визначається довжиною (глибиною) безпосереднього зв'язку з найбільшим часовим лагом. В лівій («ранній») частині моделі структура має додаткові «неявні» зв'язки, які є наслідком залежностей з минулого. (На рис. 3 вони показані пунктиром.) Це порушує візуальну регулярність структури, але не заважає аналізу. Просто треба пам'ятати, що в процесі аналізу зв'язків завжди треба розглядати праву (пізнішу) частину такої структури. Якщо для аналізу потрібна динамічна мережа з більшим горизонтом часу, то структура «нарощується», тобто з правого боку моделі додаються копії змінних для наступного такту з усіма копіями зв'язків (відображених суцільними лініями). У вищенаведеній аргументації та викладках суттєвими вважалися тільки зсуви часу (різниця між індексами), а абсолютні значення індексів часу розглядалися як умовні. Тобто за умовчанням вважалося, що проведений аналіз стосується всього векторного часового ряду цілком. Насправді це не завжди вірно, і необхідно розглянути питання стаціонарності та стабільності процесів. 4 Типи стаціонарності процесів і припущення для аналізу векторних часових рядів Виведення каузальної моделі (як й будь-якої статистичної моделі), а також її верифікація на основі даних, спирається на обґрунтування концептуально чіткої схеми обчислення статистик з даних. Для обчислення статистик треба виділити з даних «випадки» і гарантувати певні вимоги регулярності генерації даних. Найбільш відома форма регулярності генерації даних – схема I.I.D, – традиційно була сформульована для «статичних» даних (лівий долішній квадрант на рис. 1). Схема I.I.D може бути адекватною також у ситуації, коли маємо багато екземплярів популяції з довгим рядом даних для кожного екземпляру (четвертий квадрант на рис. 1). Маючи багато екземплярів довгих рядів даних, можна аналізувати навіть нестаціонарний динамічний процес, зокрема, процес, структура якого змінюється у часі. В такому разі для кожного такту (кроку) j процесу статистика збирається «вертикально», по одному запису (для такту j ) з кожного ряду даних. Проблеми обґрунтувань і припущень для статистичного аналізу виникають для типової ситуації, коли маємо один довгий (тривалий) ряд даних (правий верхній квадрант на рис. 1). Тоді доводиться узагальнювати дані з різних тактів одного процесу, а відтак, постають питання щодо стандартних припущень про статистичну вибірку даних (незалежність, ідентичність, однорідність, стаціонарність, стабільність тощо). Увесь часовий ряд даних відображає історію функціонування об'єкту (середовища). В реальності об'єкт може змінюватися й еволюціонувати. Для того, щоб відомі методи були спроможні вивести адекватну модель з даних, мають виконуватися обмеження на характер та швидкість змін поведінки об'єкту. Типова риса динамічного процесу – це міцні «короткі» автокореляційні зв'язки 1+→ tt XX . Втім, такі зв'язків не обов'язково присутні. Усталені в економетриці методи аналізу часових рядів (а також визначення стаціонарності) за умовчанням виходять з припущення про рівномірність повторення вимірювань даних у часі, а також про одночасність вимірювань компонентів вектору характеристик з одним індексом часу. Нехай векторний часовий ряд включає l паралельних рядів, тобто складається з набору l змінних ,...),,( ZYX . Одночасність вимірювань компонентів вектору характеристик означає, що значення кожної компоненти вимірюють в моменти часу з єдиного переліку ,...,2,1,0=t ∞. Отже, природним чином визначається вектор-стовпчик , то незалежність не обов’язково збережеться після обміну індексами. Обмін індексами у змінних означає перехід до змістовно іншого відно- шення. Вказана несиметричність є проявом несиметричності структури зв’язків між часовими рядами, а також проявом спрямованості процесів в один бік (від минулого до майбутнього). 190 Моделі і засоби систем баз даних та знань Щоб формалізувати техніку сепарації для динамічних моделей, необхідно обрати форму графової репрезентації динамічного процесу. Один варіант репрезентації фактично використано на рис. 3. Зручна і компактна форма графової репрезентації векторного авторегресійного процесу («базова динамічна мережа») створюється на основі «найближчого» горизонту довжини векторного ряду даних. Базова динамічна мережа виглядає як фрагмент багатовимірного ряду з набором безпосередніх зв’язків. Модель компактно презентує увесь довгий ряд (в згорнутому вигляді). Розмір моделі (її «часова глибина») визначається довжиною (глиби- ною) безпосереднього зв’язку з найбільшим часовим лагом. В лівій («ранній») частині моделі структура має додаткові «неявні» зв’язки, які є наслідком залежностей з минулого. (На рис. 3 вони показані пунктиром.) Це порушує візуальну регулярність структури, але не заважає аналізу. Просто треба пам’ятати, що в процесі аналізу зв’язків завжди треба розглядати праву (пізнішу) частину такої структури. Якщо для аналізу потріб- на динамічна мережа з більшим горизонтом часу, то структура «нарощується», тобто з правого боку моделі додаються копії змінних для наступного такту з усіма копіями зв’язків (відображених суцільними лініями). У вищенаведеній аргументації та викладках суттєвими вважалися тільки зсуви часу (різниця між індексами), а абсолютні значення індексів часу розглядалися як умовні. Тобто за умовчанням вважалося, що проведений аналіз стосується всього векторного часового ряду цілком. Насправді це не завжди вірно, і необ- хідно розглянути питання стаціонарності та стабільності процесів. 4. Типи стаціонарності процесів і припущення для аналізу векторних часових рядів Виведення каузальної моделі (як й будь-якої статистичної моделі), а також її верифікація на основі даних, спирається на обґрунтування концептуально чіткої схеми обчислення статистик з даних. Для обчис- лення статистик треба виділити з даних «випадки» і гарантувати певні вимоги регулярності генерації даних. Найбільш відома форма регулярності генерації даних – схема I.I.D, – традиційно була сформульована для «статичних» даних (лівий долішній квадрант на рис. 1). Схема I.I.D може бути адекватною також у ситуації, коли маємо багато екземплярів популяції з довгим рядом даних для кожного екземпляру (четвертий квадрант на рис. 1). Маючи багато екземплярів довгих рядів даних, можна аналізувати навіть нестаціонарний дина- мічний процес, зокрема, процес, структура якого змінюється у часі. В такому разі для кожного такту (кроку) j процесу статистика збирається «вертикально», по одному запису (для такту j) з кожного ряду даних. Про- блеми обґрунтувань і припущень для статистичного аналізу виникають для типової ситуації, коли маємо один довгий (тривалий) ряд даних (правий верхній квадрант на рис. 1). Тоді доводиться узагальнювати дані з різних тактів одного процесу, а відтак, постають питання щодо стандартних припущень про статистичну вибірку даних (незалежність, ідентичність, однорідність, стаціонарність, стабільність тощо). Увесь часовий ряд даних відображає історію функціонування об’єкту (середовища). В реальності об’єкт може змінюватися й еволюціонувати. Для того, щоб відомі методи були спроможні вивести адекватну модель з даних, мають виконуватися обмеження на характер та швидкість змін поведінки об’єкту. Типова риса динамічного процесу – це міцні «короткі» автокореляційні зв’язки Моделі і засоби систем баз даних та знань Тестування безпосередніх зв'язків з великим лагом відкриває все більше можливостей для «опосередкованих» впливів. Отже, в умови тестів безпосереднього зв'язку необхідно включати не тільки спільне минуле, але й можливих посередників. Але в процесі аналізу структури динамічного процесу доцільно уникати складних тестів. Процес аналізу має просуватися за принципом «від простих тестів до складніших». Конкретно для структури рекурентного процесу, показаного на рис. 3, той факт, що ряд W не впливає на ряд X (послідовно з лагами 1, 2, 3, ..), підтверджується тестами умовної незалежності між tX , з одного боку, та (послідовно) 1−tW , 2−tW , 3−tW ,.. – з іншого, причому всі ці тести використовують як умову одну змінну 1−tX . Таким чином, для конкретної вказаної структури відсутність зв'язків впливу ряду W на ряд X (з різними лагами) ідентифікується тестами першого рангу. Звертаємо увагу на наступну особливість відношень в динамічних процесах. За кондиціонування змінної 1−tX змінна tX умовно незалежна від 1−tW . Натомість за кондиціонування змінної 1−tW змінна tW умовно залежна від 1−tX . (Ця залежність забезпечується зв'язком tt WX →−1 .) Маючи на увазі несиметричність вказаної конструкції, в літературі іноді кажуть, що локальна незалежність є несиметричною (на відміну від звичайної незалежності). Насправді вказана несиметричність не є властивістю відношення незалежності. Просто факти незалежності в часових рядах даних завжди виражаються через змінні з часовими прив'язками (індексами). Якщо маємо незалежність між kX та mY , то незалежність не обов'язково збережеться після обміну індексами. Обмін індексами у змінних означає перехід до змістовно іншого відношення. Вказана несиметричність є проявом несиметричності структури зв'язків між часовими рядами, а також проявом спрямованості процесів в один бік (від минулого до майбутнього). Щоб формалізувати техніку сепарації для динамічних моделей, необхідно обрати форму графової репрезентації динамічного процесу. Один варіант репрезентації фактично використано на рис. 3. Зручна і компактна форма графової репрезентації векторного авторегресійного процесу («базова динамічна мережа») створюється на основі «найближчого» горизонту довжини векторного ряду даних. Базова динамічна мережа виглядає як фрагмент багатовимірного ряду з набором безпосередніх зв'язків. Модель компактно презентує увесь довгий ряд (в згорнутому вигляді). Розмір моделі (її «часова глибина») визначається довжиною (глибиною) безпосереднього зв'язку з найбільшим часовим лагом. В лівій («ранній») частині моделі структура має додаткові «неявні» зв'язки, які є наслідком залежностей з минулого. (На рис. 3 вони показані пунктиром.) Це порушує візуальну регулярність структури, але не заважає аналізу. Просто треба пам'ятати, що в процесі аналізу зв'язків завжди треба розглядати праву (пізнішу) частину такої структури. Якщо для аналізу потрібна динамічна мережа з більшим горизонтом часу, то структура «нарощується», тобто з правого боку моделі додаються копії змінних для наступного такту з усіма копіями зв'язків (відображених суцільними лініями). У вищенаведеній аргументації та викладках суттєвими вважалися тільки зсуви часу (різниця між індексами), а абсолютні значення індексів часу розглядалися як умовні. Тобто за умовчанням вважалося, що проведений аналіз стосується всього векторного часового ряду цілком. Насправді це не завжди вірно, і необхідно розглянути питання стаціонарності та стабільності процесів. 4 Типи стаціонарності процесів і припущення для аналізу векторних часових рядів Виведення каузальної моделі (як й будь-якої статистичної моделі), а також її верифікація на основі даних, спирається на обґрунтування концептуально чіткої схеми обчислення статистик з даних. Для обчислення статистик треба виділити з даних «випадки» і гарантувати певні вимоги регулярності генерації даних. Найбільш відома форма регулярності генерації даних – схема I.I.D, – традиційно була сформульована для «статичних» даних (лівий долішній квадрант на рис. 1). Схема I.I.D може бути адекватною також у ситуації, коли маємо багато екземплярів популяції з довгим рядом даних для кожного екземпляру (четвертий квадрант на рис. 1). Маючи багато екземплярів довгих рядів даних, можна аналізувати навіть нестаціонарний динамічний процес, зокрема, процес, структура якого змінюється у часі. В такому разі для кожного такту (кроку) j процесу статистика збирається «вертикально», по одному запису (для такту j ) з кожного ряду даних. Проблеми обґрунтувань і припущень для статистичного аналізу виникають для типової ситуації, коли маємо один довгий (тривалий) ряд даних (правий верхній квадрант на рис. 1). Тоді доводиться узагальнювати дані з різних тактів одного процесу, а відтак, постають питання щодо стандартних припущень про статистичну вибірку даних (незалежність, ідентичність, однорідність, стаціонарність, стабільність тощо). Увесь часовий ряд даних відображає історію функціонування об'єкту (середовища). В реальності об'єкт може змінюватися й еволюціонувати. Для того, щоб відомі методи були спроможні вивести адекватну модель з даних, мають виконуватися обмеження на характер та швидкість змін поведінки об'єкту. Типова риса динамічного процесу – це міцні «короткі» автокореляційні зв'язки 1+→ tt XX . Втім, такі зв'язків не обов'язково присутні. Усталені в економетриці методи аналізу часових рядів (а також визначення стаціонарності) за умовчанням виходять з припущення про рівномірність повторення вимірювань даних у часі, а також про одночасність вимірювань компонентів вектору характеристик з одним індексом часу. Нехай векторний часовий ряд включає l паралельних рядів, тобто складається з набору l змінних ,...),,( ZYX . Одночасність вимірювань компонентів вектору характеристик означає, що значення кожної компоненти вимірюють в моменти часу з єдиного переліку ,...,2,1,0=t ∞. Отже, природним чином визначається вектор-стовпчик . Втім, такі зв’язків не обов’язково присутні. Усталені в економетриці методи аналізу часових рядів (а також визначення стаціонарності) за умов- чанням виходять з припущення про рівномірність повторення вимірювань даних у часі, а також про одно- часність вимірювань компонентів вектору характеристик з одним індексом часу. Нехай векторний часовий ряд включає l паралельних рядів, тобто складається з набору l змінних Моделі і засоби систем баз даних та знань Тестування безпосередніх зв'язків з великим лагом відкриває все більше можливостей для «опосередкованих» впливів. Отже, в умови тестів безпосереднього зв'язку необхідно включати не тільки спільне минуле, але й можливих посередників. Але в процесі аналізу структури динамічного процесу доцільно уникати складних тестів. Процес аналізу має просуватися за принципом «від простих тестів до складніших». Конкретно для структури рекурентного процесу, показаного на рис. 3, той факт, що ряд W не впливає на ряд X (послідовно з лагами 1, 2, 3, ..), підтверджується тестами умовної незалежності між tX , з одного боку, та (послідовно) 1−tW , 2−tW , 3−tW ,.. – з іншого, причому всі ці тести використовують як умову одну змінну 1−tX . Таким чином, для конкретної вказаної структури відсутність зв'язків впливу ряду W на ряд X (з різними лагами) ідентифікується тестами першого рангу. Звертаємо увагу на наступну особливість відношень в динамічних процесах. За кондиціонування змінної 1−tX змінна tX умовно незалежна від 1−tW . Натомість за кондиціонування змінної 1−tW змінна tW умовно залежна від 1−tX . (Ця залежність забезпечується зв'язком tt WX →−1 .) Маючи на увазі несиметричність вказаної конструкції, в літературі іноді кажуть, що локальна незалежність є несиметричною (на відміну від звичайної незалежності). Насправді вказана несиметричність не є властивістю відношення незалежності. Просто факти незалежності в часових рядах даних завжди виражаються через змінні з часовими прив'язками (індексами). Якщо маємо незалежність між kX та mY , то незалежність не обов'язково збережеться після обміну індексами. Обмін індексами у змінних означає перехід до змістовно іншого відношення. Вказана несиметричність є проявом несиметричності структури зв'язків між часовими рядами, а також проявом спрямованості процесів в один бік (від минулого до майбутнього). Щоб формалізувати техніку сепарації для динамічних моделей, необхідно обрати форму графової репрезентації динамічного процесу. Один варіант репрезентації фактично використано на рис. 3. Зручна і компактна форма графової репрезентації векторного авторегресійного процесу («базова динамічна мережа») створюється на основі «найближчого» горизонту довжини векторного ряду даних. Базова динамічна мережа виглядає як фрагмент багатовимірного ряду з набором безпосередніх зв'язків. Модель компактно презентує увесь довгий ряд (в згорнутому вигляді). Розмір моделі (її «часова глибина») визначається довжиною (глибиною) безпосереднього зв'язку з найбільшим часовим лагом. В лівій («ранній») частині моделі структура має додаткові «неявні» зв'язки, які є наслідком залежностей з минулого. (На рис. 3 вони показані пунктиром.) Це порушує візуальну регулярність структури, але не заважає аналізу. Просто треба пам'ятати, що в процесі аналізу зв'язків завжди треба розглядати праву (пізнішу) частину такої структури. Якщо для аналізу потрібна динамічна мережа з більшим горизонтом часу, то структура «нарощується», тобто з правого боку моделі додаються копії змінних для наступного такту з усіма копіями зв'язків (відображених суцільними лініями). У вищенаведеній аргументації та викладках суттєвими вважалися тільки зсуви часу (різниця між індексами), а абсолютні значення індексів часу розглядалися як умовні. Тобто за умовчанням вважалося, що проведений аналіз стосується всього векторного часового ряду цілком. Насправді це не завжди вірно, і необхідно розглянути питання стаціонарності та стабільності процесів. 4 Типи стаціонарності процесів і припущення для аналізу векторних часових рядів Виведення каузальної моделі (як й будь-якої статистичної моделі), а також її верифікація на основі даних, спирається на обґрунтування концептуально чіткої схеми обчислення статистик з даних. Для обчислення статистик треба виділити з даних «випадки» і гарантувати певні вимоги регулярності генерації даних. Найбільш відома форма регулярності генерації даних – схема I.I.D, – традиційно була сформульована для «статичних» даних (лівий долішній квадрант на рис. 1). Схема I.I.D може бути адекватною також у ситуації, коли маємо багато екземплярів популяції з довгим рядом даних для кожного екземпляру (четвертий квадрант на рис. 1). Маючи багато екземплярів довгих рядів даних, можна аналізувати навіть нестаціонарний динамічний процес, зокрема, процес, структура якого змінюється у часі. В такому разі для кожного такту (кроку) j процесу статистика збирається «вертикально», по одному запису (для такту j ) з кожного ряду даних. Проблеми обґрунтувань і припущень для статистичного аналізу виникають для типової ситуації, коли маємо один довгий (тривалий) ряд даних (правий верхній квадрант на рис. 1). Тоді доводиться узагальнювати дані з різних тактів одного процесу, а відтак, постають питання щодо стандартних припущень про статистичну вибірку даних (незалежність, ідентичність, однорідність, стаціонарність, стабільність тощо). Увесь часовий ряд даних відображає історію функціонування об'єкту (середовища). В реальності об'єкт може змінюватися й еволюціонувати. Для того, щоб відомі методи були спроможні вивести адекватну модель з даних, мають виконуватися обмеження на характер та швидкість змін поведінки об'єкту. Типова риса динамічного процесу – це міцні «короткі» автокореляційні зв'язки 1+→ tt XX . Втім, такі зв'язків не обов'язково присутні. Усталені в економетриці методи аналізу часових рядів (а також визначення стаціонарності) за умовчанням виходять з припущення про рівномірність повторення вимірювань даних у часі, а також про одночасність вимірювань компонентів вектору характеристик з одним індексом часу. Нехай векторний часовий ряд включає l паралельних рядів, тобто складається з набору l змінних ,...),,( ZYX . Одночасність вимірювань компонентів вектору характеристик означає, що значення кожної компоненти вимірюють в моменти часу з єдиного переліку ,...,2,1,0=t ∞. Отже, природним чином визначається вектор-стовпчик . Одночасність вимірю- вань компонентів вектору характеристик означає, що значення кожної компоненти вимірюють в моменти часу з єдиного переліку Моделі і засоби систем баз даних та знань Тестування безпосередніх зв'язків з великим лагом відкриває все більше можливостей для «опосередкованих» впливів. Отже, в умови тестів безпосереднього зв'язку необхідно включати не тільки спільне минуле, але й можливих посередників. Але в процесі аналізу структури динамічного процесу доцільно уникати складних тестів. Процес аналізу має просуватися за принципом «від простих тестів до складніших». Конкретно для структури рекурентного процесу, показаного на рис. 3, той факт, що ряд W не впливає на ряд X (послідовно з лагами 1, 2, 3, ..), підтверджується тестами умовної незалежності між tX , з одного боку, та (послідовно) 1−tW , 2−tW , 3−tW ,.. – з іншого, причому всі ці тести використовують як умову одну змінну 1−tX . Таким чином, для конкретної вказаної структури відсутність зв'язків впливу ряду W на ряд X (з різними лагами) ідентифікується тестами першого рангу. Звертаємо увагу на наступну особливість відношень в динамічних процесах. За кондиціонування змінної 1−tX змінна tX умовно незалежна від 1−tW . Натомість за кондиціонування змінної 1−tW змінна tW умовно залежна від 1−tX . (Ця залежність забезпечується зв'язком tt WX →−1 .) Маючи на увазі несиметричність вказаної конструкції, в літературі іноді кажуть, що локальна незалежність є несиметричною (на відміну від звичайної незалежності). Насправді вказана несиметричність не є властивістю відношення незалежності. Просто факти незалежності в часових рядах даних завжди виражаються через змінні з часовими прив'язками (індексами). Якщо маємо незалежність між kX та mY , то незалежність не обов'язково збережеться після обміну індексами. Обмін індексами у змінних означає перехід до змістовно іншого відношення. Вказана несиметричність є проявом несиметричності структури зв'язків між часовими рядами, а також проявом спрямованості процесів в один бік (від минулого до майбутнього). Щоб формалізувати техніку сепарації для динамічних моделей, необхідно обрати форму графової репрезентації динамічного процесу. Один варіант репрезентації фактично використано на рис. 3. Зручна і компактна форма графової репрезентації векторного авторегресійного процесу («базова динамічна мережа») створюється на основі «найближчого» горизонту довжини векторного ряду даних. Базова динамічна мережа виглядає як фрагмент багатовимірного ряду з набором безпосередніх зв'язків. Модель компактно презентує увесь довгий ряд (в згорнутому вигляді). Розмір моделі (її «часова глибина») визначається довжиною (глибиною) безпосереднього зв'язку з найбільшим часовим лагом. В лівій («ранній») частині моделі структура має додаткові «неявні» зв'язки, які є наслідком залежностей з минулого. (На рис. 3 вони показані пунктиром.) Це порушує візуальну регулярність структури, але не заважає аналізу. Просто треба пам'ятати, що в процесі аналізу зв'язків завжди треба розглядати праву (пізнішу) частину такої структури. Якщо для аналізу потрібна динамічна мережа з більшим горизонтом часу, то структура «нарощується», тобто з правого боку моделі додаються копії змінних для наступного такту з усіма копіями зв'язків (відображених суцільними лініями). У вищенаведеній аргументації та викладках суттєвими вважалися тільки зсуви часу (різниця між індексами), а абсолютні значення індексів часу розглядалися як умовні. Тобто за умовчанням вважалося, що проведений аналіз стосується всього векторного часового ряду цілком. Насправді це не завжди вірно, і необхідно розглянути питання стаціонарності та стабільності процесів. 4 Типи стаціонарності процесів і припущення для аналізу векторних часових рядів Виведення каузальної моделі (як й будь-якої статистичної моделі), а також її верифікація на основі даних, спирається на обґрунтування концептуально чіткої схеми обчислення статистик з даних. Для обчислення статистик треба виділити з даних «випадки» і гарантувати певні вимоги регулярності генерації даних. Найбільш відома форма регулярності генерації даних – схема I.I.D, – традиційно була сформульована для «статичних» даних (лівий долішній квадрант на рис. 1). Схема I.I.D може бути адекватною також у ситуації, коли маємо багато екземплярів популяції з довгим рядом даних для кожного екземпляру (четвертий квадрант на рис. 1). Маючи багато екземплярів довгих рядів даних, можна аналізувати навіть нестаціонарний динамічний процес, зокрема, процес, структура якого змінюється у часі. В такому разі для кожного такту (кроку) j процесу статистика збирається «вертикально», по одному запису (для такту j ) з кожного ряду даних. Проблеми обґрунтувань і припущень для статистичного аналізу виникають для типової ситуації, коли маємо один довгий (тривалий) ряд даних (правий верхній квадрант на рис. 1). Тоді доводиться узагальнювати дані з різних тактів одного процесу, а відтак, постають питання щодо стандартних припущень про статистичну вибірку даних (незалежність, ідентичність, однорідність, стаціонарність, стабільність тощо). Увесь часовий ряд даних відображає історію функціонування об'єкту (середовища). В реальності об'єкт може змінюватися й еволюціонувати. Для того, щоб відомі методи були спроможні вивести адекватну модель з даних, мають виконуватися обмеження на характер та швидкість змін поведінки об'єкту. Типова риса динамічного процесу – це міцні «короткі» автокореляційні зв'язки 1+→ tt XX . Втім, такі зв'язків не обов'язково присутні. Усталені в економетриці методи аналізу часових рядів (а також визначення стаціонарності) за умовчанням виходять з припущення про рівномірність повторення вимірювань даних у часі, а також про одночасність вимірювань компонентів вектору характеристик з одним індексом часу. Нехай векторний часовий ряд включає l паралельних рядів, тобто складається з набору l змінних ,...),,( ZYX . Одночасність вимірювань компонентів вектору характеристик означає, що значення кожної компоненти вимірюють в моменти часу з єдиного переліку ,...,2,1,0=t ∞. Отже, природним чином визначається вектор-стовпчик Отже, природним чином визначається вектор-стовпчик Моделі і засоби систем баз даних та знань [Введите текст] ,...),,( ttt ZYX значень, виміряних в один і той самий момент t . Можна позначити вектор-стовпчик ,...),,( ttt ZYX через tS й назвати його станом процесу у момент t . Але, в принципі, не є обов'язковим, щоб всі змінні з одного інтервалу часу (кроку) вимірювались строго в один і той самий момент. Можлива ситуація, коли існують деякі «зсуви» між моментами вимірювань «квазі-одночасних» змінних. Проте такі зсуви мають бути фіксованими, інакше дані з нерегулярною схемою вимірювань будуть породжувати помилки, зміщення і викривлення. Про зсув між моментами вимірювання різних змінних має бути відомо аналітику, бо ця інформація важлива для каузального виведення (це темпоральний порядок, який треба врахувати). Також за умовчанням в усталених методах аналізу часових рядів прийнято, що всі інтервали часу між моментами вимірювання всіх змінних – однакові. Але, взагалі кажучи, не обов'язково виконувати всі вимірювання через фіксовані інтервали часу. Проте варіативність інтервалів часу призведе, зокрема, до розмивання функції автоковаріації, і взагалі, буде породжувати ілюзію нестаціонарності. Стаціонарність – традиційне припущення в аналізі часових рядів. Багато методів аналізу спираються на це припущення. Реальні обставини й потреби розширити сфери застосувань методів змушують аналітиків послабити вимоги стаціонарності, але в таких межах, щоб не втратити спроможності вивести адекватну модель з даних. Переглянемо відомі форми статистичної стаціонарності динамічного процесу та часових рядів даних. Строга стаціонарність (векторного) часового ряду означає, що імовірнісна поведінка значень часового ряду не змінюється з просуванням у часі, тобто сумісний розподіл ймовірностей значень часового ряду є незмінним (ідентичним) для довільного зсуву індексів часу [9–11]. Внаслідок строгої стаціонарності, зокрема, автокореляційна функція залежить тільки від різниці індексів часу (від часового лагу) і не залежить від абсолютного часу. Слаба стаціонарність (векторного) часового ряду означає, що: 1) математичні очікування значень ряду є константні, тобто не залежать від часу; 2) кожна коваріація залежить тільки від різниці індексів часу (від часового лагу) і не залежить від абсолютного часу. Назвемо деякі нетрадиційні форми стаціонарності динамічного процесу. «Перехідна» стаціонарність означає, що умовний розподіл ймовірностей значень часового ряду є незмінним (стабільним) у часі, тобто ( ),..,| 21 −− tttp SSS не залежить від t . В аналізі часових рядів (за умовчанням) прийнято припущення про регулярну структуру зв'язків протягом всього часу спостереження. (Це забезпечує обчислення коректних статистик.) «Структурна» стаціонарність чи регулярність означає незмінність набору зв'язків у часі. Найпростіший варіант структурної регулярності – елементарна регулярність, повторюваність всіх зв'язків на кожному такті (кроці) всього процесу. Тобто якщо є зв'язок 1+→ ii YX , то він присутній для всіх тактів ,...,2,1,0=i ∞. Можливі й інші трактовки структурної регулярності (наприклад, повторення зв'язків з періодом два чи більше тактів). Зазначимо, що часовий ряд може мати тренд навіть за умови, що чинні «перехідна» стаціонарність й структурна стаціонарність. Наявність тренду створює проблеми для багатьох методів виведення моделі [19]. Один із способів обійти або послабити проблему полягає у трансформації даних. Аналізуються не самі оригінальні дані, а відповідні різниці. Наприклад, переходять до змінних 1−−= ttt XXX , завдяки чому умовний розподіл ймовірностей значень ,..)|( 1− tt YXp або ,..)|( 1− tt YXp може виявитися стабільним. Нарешті, зауважимо, що коли динамічний процес об'єктивно генерується системою диференціальних рівнянь, поведінка процесу може бути квазі-хаотичною (для таких процесів рекурсивні моделі не придатні). Якщо всі інтервали часу між моментами вимірювання даних – однакові, то час можна відображати цілими індексами Ni ,...,2,1,0= . Стан процесу в такті i відображається вектором-стовпчиком =iS ,...),,( iii ZYX . Для утворення статистик, необхідних для виведення моделі, треба спиратися на певну регулярність структури. Нехай маємо найпростіший варіант структурної регулярності, коли період повторення зв'язків – одиниця. Тоді елементарний випадок статистичної вибірки – це зріз векторного ряду даних для одного з індексів часу i . Він включає вектор-стовпчик iS та кілька векторів-стовпчиків з меншими значеннями індексів часу, відповідно до розміру лагу. Тобто елементарний «випадок» вибірки виглядає як < iS , 1−iS , 2−iS ,.., −iS >. Величина  має дорівнювати найбільшому часовому лагу безпосередніх зв'язків процесу. Якщо довжина ряду даних дорівнює N , то отримаємо −N повноформатних «випадків» вибірки. 4 Виведення каузальних динамічних моделей і роль припущень Коротко розглянемо особливості виведення динамічної моделі з векторних часових рядів даних методами, основаними на незалежності [14, 15, 19–22]. Вибір цих методів дозволяє чітко висвітлити суть проблем і роль припущень. Базовими операціями цих методів є тестування умовної незалежності. Методи, основані на незалежності, не є ізольованими від традиційних методів. Зокрема, можна провести паралелі між цими методами та методами регресійного аналізу. Дійсно (за певних стандартних умов) є еквівалентність між тестуванням умовної незалежності та тестуванням значущості змінної як регресора. Якщо, приміром, змінна X умовно незалежна від Y за умови на Z , то регресія Y на ( X , Z ) має дати незначущий коефіцієнт для регресора X . Задача виведення динамічної каузальної моделі відрізняється від аналогічної «статичної» задачі низкою особливостей. Перша – це заданий темпоральний порядок змінних. Друга – це зазвичай збільшена кількість значень, виміряних в один і той самий момент t. Можна позначити вектор-стовпчик Моделі і засоби систем баз даних та знань [Введите текст] ,...),,( ttt ZYX значень, виміряних в один і той самий момент t . Можна позначити вектор-стовпчик ,...),,( ttt ZYX через tS й назвати його станом процесу у момент t . Але, в принципі, не є обов'язковим, щоб всі змінні з одного інтервалу часу (кроку) вимірювались строго в один і той самий момент. Можлива ситуація, коли існують деякі «зсуви» між моментами вимірювань «квазі-одночасних» змінних. Проте такі зсуви мають бути фіксованими, інакше дані з нерегулярною схемою вимірювань будуть породжувати помилки, зміщення і викривлення. Про зсув між моментами вимірювання різних змінних має бути відомо аналітику, бо ця інформація важлива для каузального виведення (це темпоральний порядок, який треба врахувати). Також за умовчанням в усталених методах аналізу часових рядів прийнято, що всі інтервали часу між моментами вимірювання всіх змінних – однакові. Але, взагалі кажучи, не обов'язково виконувати всі вимірювання через фіксовані інтервали часу. Проте варіативність інтервалів часу призведе, зокрема, до розмивання функції автоковаріації, і взагалі, буде породжувати ілюзію нестаціонарності. Стаціонарність – традиційне припущення в аналізі часових рядів. Багато методів аналізу спираються на це припущення. Реальні обставини й потреби розширити сфери застосувань методів змушують аналітиків послабити вимоги стаціонарності, але в таких межах, щоб не втратити спроможності вивести адекватну модель з даних. Переглянемо відомі форми статистичної стаціонарності динамічного процесу та часових рядів даних. Строга стаціонарність (векторного) часового ряду означає, що імовірнісна поведінка значень часового ряду не змінюється з просуванням у часі, тобто сумісний розподіл ймовірностей значень часового ряду є незмінним (ідентичним) для довільного зсуву індексів часу [9–11]. Внаслідок строгої стаціонарності, зокрема, автокореляційна функція залежить тільки від різниці індексів часу (від часового лагу) і не залежить від абсолютного часу. Слаба стаціонарність (векторного) часового ряду означає, що: 1) математичні очікування значень ряду є константні, тобто не залежать від часу; 2) кожна коваріація залежить тільки від різниці індексів часу (від часового лагу) і не залежить від абсолютного часу. Назвемо деякі нетрадиційні форми стаціонарності динамічного процесу. «Перехідна» стаціонарність означає, що умовний розподіл ймовірностей значень часового ряду є незмінним (стабільним) у часі, тобто ( ),..,| 21 −− tttp SSS не залежить від t . В аналізі часових рядів (за умовчанням) прийнято припущення про регулярну структуру зв'язків протягом всього часу спостереження. (Це забезпечує обчислення коректних статистик.) «Структурна» стаціонарність чи регулярність означає незмінність набору зв'язків у часі. Найпростіший варіант структурної регулярності – елементарна регулярність, повторюваність всіх зв'язків на кожному такті (кроці) всього процесу. Тобто якщо є зв'язок 1+→ ii YX , то він присутній для всіх тактів ,...,2,1,0=i ∞. Можливі й інші трактовки структурної регулярності (наприклад, повторення зв'язків з періодом два чи більше тактів). Зазначимо, що часовий ряд може мати тренд навіть за умови, що чинні «перехідна» стаціонарність й структурна стаціонарність. Наявність тренду створює проблеми для багатьох методів виведення моделі [19]. Один із способів обійти або послабити проблему полягає у трансформації даних. Аналізуються не самі оригінальні дані, а відповідні різниці. Наприклад, переходять до змінних 1−−= ttt XXX , завдяки чому умовний розподіл ймовірностей значень ,..)|( 1− tt YXp або ,..)|( 1− tt YXp може виявитися стабільним. Нарешті, зауважимо, що коли динамічний процес об'єктивно генерується системою диференціальних рівнянь, поведінка процесу може бути квазі-хаотичною (для таких процесів рекурсивні моделі не придатні). Якщо всі інтервали часу між моментами вимірювання даних – однакові, то час можна відображати цілими індексами Ni ,...,2,1,0= . Стан процесу в такті i відображається вектором-стовпчиком =iS ,...),,( iii ZYX . Для утворення статистик, необхідних для виведення моделі, треба спиратися на певну регулярність структури. Нехай маємо найпростіший варіант структурної регулярності, коли період повторення зв'язків – одиниця. Тоді елементарний випадок статистичної вибірки – це зріз векторного ряду даних для одного з індексів часу i . Він включає вектор-стовпчик iS та кілька векторів-стовпчиків з меншими значеннями індексів часу, відповідно до розміру лагу. Тобто елементарний «випадок» вибірки виглядає як < iS , 1−iS , 2−iS ,.., −iS >. Величина  має дорівнювати найбільшому часовому лагу безпосередніх зв'язків процесу. Якщо довжина ряду даних дорівнює N , то отримаємо −N повноформатних «випадків» вибірки. 4 Виведення каузальних динамічних моделей і роль припущень Коротко розглянемо особливості виведення динамічної моделі з векторних часових рядів даних методами, основаними на незалежності [14, 15, 19–22]. Вибір цих методів дозволяє чітко висвітлити суть проблем і роль припущень. Базовими операціями цих методів є тестування умовної незалежності. Методи, основані на незалежності, не є ізольованими від традиційних методів. Зокрема, можна провести паралелі між цими методами та методами регресійного аналізу. Дійсно (за певних стандартних умов) є еквівалентність між тестуванням умовної незалежності та тестуванням значущості змінної як регресора. Якщо, приміром, змінна X умовно незалежна від Y за умови на Z , то регресія Y на ( X , Z ) має дати незначущий коефіцієнт для регресора X . Задача виведення динамічної каузальної моделі відрізняється від аналогічної «статичної» задачі низкою особливостей. Перша – це заданий темпоральний порядок змінних. Друга – це зазвичай збільшена кількість через Моделі і засоби систем баз даних та знань [Введите текст] ,...),,( ttt ZYX значень, виміряних в один і той самий момент t . Можна позначити вектор-стовпчик ,...),,( ttt ZYX через tS й назвати його станом процесу у момент t . Але, в принципі, не є обов'язковим, щоб всі змінні з одного інтервалу часу (кроку) вимірювались строго в один і той самий момент. Можлива ситуація, коли існують деякі «зсуви» між моментами вимірювань «квазі-одночасних» змінних. Проте такі зсуви мають бути фіксованими, інакше дані з нерегулярною схемою вимірювань будуть породжувати помилки, зміщення і викривлення. Про зсув між моментами вимірювання різних змінних має бути відомо аналітику, бо ця інформація важлива для каузального виведення (це темпоральний порядок, який треба врахувати). Також за умовчанням в усталених методах аналізу часових рядів прийнято, що всі інтервали часу між моментами вимірювання всіх змінних – однакові. Але, взагалі кажучи, не обов'язково виконувати всі вимірювання через фіксовані інтервали часу. Проте варіативність інтервалів часу призведе, зокрема, до розмивання функції автоковаріації, і взагалі, буде породжувати ілюзію нестаціонарності. Стаціонарність – традиційне припущення в аналізі часових рядів. Багато методів аналізу спираються на це припущення. Реальні обставини й потреби розширити сфери застосувань методів змушують аналітиків послабити вимоги стаціонарності, але в таких межах, щоб не втратити спроможності вивести адекватну модель з даних. Переглянемо відомі форми статистичної стаціонарності динамічного процесу та часових рядів даних. Строга стаціонарність (векторного) часового ряду означає, що імовірнісна поведінка значень часового ряду не змінюється з просуванням у часі, тобто сумісний розподіл ймовірностей значень часового ряду є незмінним (ідентичним) для довільного зсуву індексів часу [9–11]. Внаслідок строгої стаціонарності, зокрема, автокореляційна функція залежить тільки від різниці індексів часу (від часового лагу) і не залежить від абсолютного часу. Слаба стаціонарність (векторного) часового ряду означає, що: 1) математичні очікування значень ряду є константні, тобто не залежать від часу; 2) кожна коваріація залежить тільки від різниці індексів часу (від часового лагу) і не залежить від абсолютного часу. Назвемо деякі нетрадиційні форми стаціонарності динамічного процесу. «Перехідна» стаціонарність означає, що умовний розподіл ймовірностей значень часового ряду є незмінним (стабільним) у часі, тобто ( ),..,| 21 −− tttp SSS не залежить від t . В аналізі часових рядів (за умовчанням) прийнято припущення про регулярну структуру зв'язків протягом всього часу спостереження. (Це забезпечує обчислення коректних статистик.) «Структурна» стаціонарність чи регулярність означає незмінність набору зв'язків у часі. Найпростіший варіант структурної регулярності – елементарна регулярність, повторюваність всіх зв'язків на кожному такті (кроці) всього процесу. Тобто якщо є зв'язок 1+→ ii YX , то він присутній для всіх тактів ,...,2,1,0=i ∞. Можливі й інші трактовки структурної регулярності (наприклад, повторення зв'язків з періодом два чи більше тактів). Зазначимо, що часовий ряд може мати тренд навіть за умови, що чинні «перехідна» стаціонарність й структурна стаціонарність. Наявність тренду створює проблеми для багатьох методів виведення моделі [19]. Один із способів обійти або послабити проблему полягає у трансформації даних. Аналізуються не самі оригінальні дані, а відповідні різниці. Наприклад, переходять до змінних 1−−= ttt XXX , завдяки чому умовний розподіл ймовірностей значень ,..)|( 1− tt YXp або ,..)|( 1− tt YXp може виявитися стабільним. Нарешті, зауважимо, що коли динамічний процес об'єктивно генерується системою диференціальних рівнянь, поведінка процесу може бути квазі-хаотичною (для таких процесів рекурсивні моделі не придатні). Якщо всі інтервали часу між моментами вимірювання даних – однакові, то час можна відображати цілими індексами Ni ,...,2,1,0= . Стан процесу в такті i відображається вектором-стовпчиком =iS ,...),,( iii ZYX . Для утворення статистик, необхідних для виведення моделі, треба спиратися на певну регулярність структури. Нехай маємо найпростіший варіант структурної регулярності, коли період повторення зв'язків – одиниця. Тоді елементарний випадок статистичної вибірки – це зріз векторного ряду даних для одного з індексів часу i . Він включає вектор-стовпчик iS та кілька векторів-стовпчиків з меншими значеннями індексів часу, відповідно до розміру лагу. Тобто елементарний «випадок» вибірки виглядає як < iS , 1−iS , 2−iS ,.., −iS >. Величина  має дорівнювати найбільшому часовому лагу безпосередніх зв'язків процесу. Якщо довжина ряду даних дорівнює N , то отримаємо −N повноформатних «випадків» вибірки. 4 Виведення каузальних динамічних моделей і роль припущень Коротко розглянемо особливості виведення динамічної моделі з векторних часових рядів даних методами, основаними на незалежності [14, 15, 19–22]. Вибір цих методів дозволяє чітко висвітлити суть проблем і роль припущень. Базовими операціями цих методів є тестування умовної незалежності. Методи, основані на незалежності, не є ізольованими від традиційних методів. Зокрема, можна провести паралелі між цими методами та методами регресійного аналізу. Дійсно (за певних стандартних умов) є еквівалентність між тестуванням умовної незалежності та тестуванням значущості змінної як регресора. Якщо, приміром, змінна X умовно незалежна від Y за умови на Z , то регресія Y на ( X , Z ) має дати незначущий коефіцієнт для регресора X . Задача виведення динамічної каузальної моделі відрізняється від аналогічної «статичної» задачі низкою особливостей. Перша – це заданий темпоральний порядок змінних. Друга – це зазвичай збільшена кількість й назвати його станом процесу у момент t. Але, в принципі, не є обов’язковим, щоб всі змінні з одного інтер- валу часу (кроку) вимірювались строго в один і той самий момент. Можлива ситуація, коли існують деякі «зсуви» між моментами вимірювань «квазі-одночасних» змінних. Проте такі зсуви мають бути фіксовани- ми, інакше дані з нерегулярною схемою вимірювань будуть породжувати помилки, зміщення і викривлен- ня. Про зсув між моментами вимірювання різних змінних має бути відомо аналітику, бо ця інформація важ- лива для каузального виведення (це темпоральний порядок, який треба врахувати). Також за умовчанням в усталених методах аналізу часових рядів прийнято, що всі інтервали часу між моментами вимірювання всіх змінних – однакові. Але, взагалі кажучи, не обов’язково виконувати всі вимірювання через фіксовані інтервали часу. Проте варіативність інтервалів часу призведе, зокрема, до розмивання функції автокова- ріації, і взагалі, буде породжувати ілюзію нестаціонарності. Стаціонарність – традиційне припущення в аналізі часових рядів. Багато методів аналізу спираються на це припущення. Реальні обставини й потреби розширити сфери застосувань методів змушують аналітиків послабити вимоги стаціонарності, але в таких межах, щоб не втратити спроможності вивести адекватну модель з даних. Переглянемо відомі форми статистичної стаціонарності динамічного процесу та часових рядів да- них. Строга стаціонарність (векторного) часового ряду означає, що імовірнісна поведінка значень ча- сового ряду не змінюється з просуванням у часі, тобто сумісний розподіл ймовірностей значень часового ряду є незмінним (ідентичним) для довільного зсуву індексів часу [9–11]. Внаслідок строгої стаціонар- ності, зокрема, автокореляційна функція залежить тільки від різниці індексів часу (від часового лагу) і не залежить від абсолютного часу. Слаба стаціонарність (векторного) часового ряду означає, що: 1) мате- матичні очікування значень ряду є константні, тобто не залежать від часу; 2) кожна коваріація залежить тільки від різниці індексів часу (від часового лагу) і не залежить від абсолютного часу. 191 Моделі і засоби систем баз даних та знань Назвемо деякі нетрадиційні форми стаціонарності динамічного процесу. «Перехідна» стаціонар- ність означає, що умовний розподіл ймовірностей значень часового ряду є незмінним (стабільним) у часі, тобто Моделі і засоби систем баз даних та знань [Введите текст] ,...),,( ttt ZYX значень, виміряних в один і той самий момент t . Можна позначити вектор-стовпчик ,...),,( ttt ZYX через tS й назвати його станом процесу у момент t . Але, в принципі, не є обов'язковим, щоб всі змінні з одного інтервалу часу (кроку) вимірювались строго в один і той самий момент. Можлива ситуація, коли існують деякі «зсуви» між моментами вимірювань «квазі-одночасних» змінних. Проте такі зсуви мають бути фіксованими, інакше дані з нерегулярною схемою вимірювань будуть породжувати помилки, зміщення і викривлення. Про зсув між моментами вимірювання різних змінних має бути відомо аналітику, бо ця інформація важлива для каузального виведення (це темпоральний порядок, який треба врахувати). Також за умовчанням в усталених методах аналізу часових рядів прийнято, що всі інтервали часу між моментами вимірювання всіх змінних – однакові. Але, взагалі кажучи, не обов'язково виконувати всі вимірювання через фіксовані інтервали часу. Проте варіативність інтервалів часу призведе, зокрема, до розмивання функції автоковаріації, і взагалі, буде породжувати ілюзію нестаціонарності. Стаціонарність – традиційне припущення в аналізі часових рядів. Багато методів аналізу спираються на це припущення. Реальні обставини й потреби розширити сфери застосувань методів змушують аналітиків послабити вимоги стаціонарності, але в таких межах, щоб не втратити спроможності вивести адекватну модель з даних. Переглянемо відомі форми статистичної стаціонарності динамічного процесу та часових рядів даних. Строга стаціонарність (векторного) часового ряду означає, що імовірнісна поведінка значень часового ряду не змінюється з просуванням у часі, тобто сумісний розподіл ймовірностей значень часового ряду є незмінним (ідентичним) для довільного зсуву індексів часу [9–11]. Внаслідок строгої стаціонарності, зокрема, автокореляційна функція залежить тільки від різниці індексів часу (від часового лагу) і не залежить від абсолютного часу. Слаба стаціонарність (векторного) часового ряду означає, що: 1) математичні очікування значень ряду є константні, тобто не залежать від часу; 2) кожна коваріація залежить тільки від різниці індексів часу (від часового лагу) і не залежить від абсолютного часу. Назвемо деякі нетрадиційні форми стаціонарності динамічного процесу. «Перехідна» стаціонарність означає, що умовний розподіл ймовірностей значень часового ряду є незмінним (стабільним) у часі, тобто ( ),..,| 21 −− tttp SSS не залежить від t . В аналізі часових рядів (за умовчанням) прийнято припущення про регулярну структуру зв'язків протягом всього часу спостереження. (Це забезпечує обчислення коректних статистик.) «Структурна» стаціонарність чи регулярність означає незмінність набору зв'язків у часі. Найпростіший варіант структурної регулярності – елементарна регулярність, повторюваність всіх зв'язків на кожному такті (кроці) всього процесу. Тобто якщо є зв'язок 1+→ ii YX , то він присутній для всіх тактів ,...,2,1,0=i ∞. Можливі й інші трактовки структурної регулярності (наприклад, повторення зв'язків з періодом два чи більше тактів). Зазначимо, що часовий ряд може мати тренд навіть за умови, що чинні «перехідна» стаціонарність й структурна стаціонарність. Наявність тренду створює проблеми для багатьох методів виведення моделі [19]. Один із способів обійти або послабити проблему полягає у трансформації даних. Аналізуються не самі оригінальні дані, а відповідні різниці. Наприклад, переходять до змінних 1−−= ttt XXX , завдяки чому умовний розподіл ймовірностей значень ,..)|( 1− tt YXp або ,..)|( 1− tt YXp може виявитися стабільним. Нарешті, зауважимо, що коли динамічний процес об'єктивно генерується системою диференціальних рівнянь, поведінка процесу може бути квазі-хаотичною (для таких процесів рекурсивні моделі не придатні). Якщо всі інтервали часу між моментами вимірювання даних – однакові, то час можна відображати цілими індексами Ni ,...,2,1,0= . Стан процесу в такті i відображається вектором-стовпчиком =iS ,...),,( iii ZYX . Для утворення статистик, необхідних для виведення моделі, треба спиратися на певну регулярність структури. Нехай маємо найпростіший варіант структурної регулярності, коли період повторення зв'язків – одиниця. Тоді елементарний випадок статистичної вибірки – це зріз векторного ряду даних для одного з індексів часу i . Він включає вектор-стовпчик iS та кілька векторів-стовпчиків з меншими значеннями індексів часу, відповідно до розміру лагу. Тобто елементарний «випадок» вибірки виглядає як < iS , 1−iS , 2−iS ,.., −iS >. Величина  має дорівнювати найбільшому часовому лагу безпосередніх зв'язків процесу. Якщо довжина ряду даних дорівнює N , то отримаємо −N повноформатних «випадків» вибірки. 4 Виведення каузальних динамічних моделей і роль припущень Коротко розглянемо особливості виведення динамічної моделі з векторних часових рядів даних методами, основаними на незалежності [14, 15, 19–22]. Вибір цих методів дозволяє чітко висвітлити суть проблем і роль припущень. Базовими операціями цих методів є тестування умовної незалежності. Методи, основані на незалежності, не є ізольованими від традиційних методів. Зокрема, можна провести паралелі між цими методами та методами регресійного аналізу. Дійсно (за певних стандартних умов) є еквівалентність між тестуванням умовної незалежності та тестуванням значущості змінної як регресора. Якщо, приміром, змінна X умовно незалежна від Y за умови на Z , то регресія Y на ( X , Z ) має дати незначущий коефіцієнт для регресора X . Задача виведення динамічної каузальної моделі відрізняється від аналогічної «статичної» задачі низкою особливостей. Перша – це заданий темпоральний порядок змінних. Друга – це зазвичай збільшена кількість не залежить від t. В аналізі часових рядів (за умовчанням) прийнято припущення про регулярну структуру зв’язків протягом всього часу спостереження. (Це забезпечує обчислення корек- тних статистик.) «Структурна» стаціонарність чи регулярність означає незмінність набору зв’язків у часі. Найпростіший варіант структурної регулярності – елементарна регулярність, повторюваність всіх зв’язків на кожному такті (кроці) всього процесу. Тобто якщо є зв’язок Моделі і засоби систем баз даних та знань [Введите текст] ,...),,( ttt ZYX значень, виміряних в один і той самий момент t . Можна позначити вектор-стовпчик ,...),,( ttt ZYX через tS й назвати його станом процесу у момент t . Але, в принципі, не є обов'язковим, щоб всі змінні з одного інтервалу часу (кроку) вимірювались строго в один і той самий момент. Можлива ситуація, коли існують деякі «зсуви» між моментами вимірювань «квазі-одночасних» змінних. Проте такі зсуви мають бути фіксованими, інакше дані з нерегулярною схемою вимірювань будуть породжувати помилки, зміщення і викривлення. Про зсув між моментами вимірювання різних змінних має бути відомо аналітику, бо ця інформація важлива для каузального виведення (це темпоральний порядок, який треба врахувати). Також за умовчанням в усталених методах аналізу часових рядів прийнято, що всі інтервали часу між моментами вимірювання всіх змінних – однакові. Але, взагалі кажучи, не обов'язково виконувати всі вимірювання через фіксовані інтервали часу. Проте варіативність інтервалів часу призведе, зокрема, до розмивання функції автоковаріації, і взагалі, буде породжувати ілюзію нестаціонарності. Стаціонарність – традиційне припущення в аналізі часових рядів. Багато методів аналізу спираються на це припущення. Реальні обставини й потреби розширити сфери застосувань методів змушують аналітиків послабити вимоги стаціонарності, але в таких межах, щоб не втратити спроможності вивести адекватну модель з даних. Переглянемо відомі форми статистичної стаціонарності динамічного процесу та часових рядів даних. Строга стаціонарність (векторного) часового ряду означає, що імовірнісна поведінка значень часового ряду не змінюється з просуванням у часі, тобто сумісний розподіл ймовірностей значень часового ряду є незмінним (ідентичним) для довільного зсуву індексів часу [9–11]. Внаслідок строгої стаціонарності, зокрема, автокореляційна функція залежить тільки від різниці індексів часу (від часового лагу) і не залежить від абсолютного часу. Слаба стаціонарність (векторного) часового ряду означає, що: 1) математичні очікування значень ряду є константні, тобто не залежать від часу; 2) кожна коваріація залежить тільки від різниці індексів часу (від часового лагу) і не залежить від абсолютного часу. Назвемо деякі нетрадиційні форми стаціонарності динамічного процесу. «Перехідна» стаціонарність означає, що умовний розподіл ймовірностей значень часового ряду є незмінним (стабільним) у часі, тобто ( ),..,| 21 −− tttp SSS не залежить від t . В аналізі часових рядів (за умовчанням) прийнято припущення про регулярну структуру зв'язків протягом всього часу спостереження. (Це забезпечує обчислення коректних статистик.) «Структурна» стаціонарність чи регулярність означає незмінність набору зв'язків у часі. Найпростіший варіант структурної регулярності – елементарна регулярність, повторюваність всіх зв'язків на кожному такті (кроці) всього процесу. Тобто якщо є зв'язок 1+→ ii YX , то він присутній для всіх тактів ,...,2,1,0=i ∞. Можливі й інші трактовки структурної регулярності (наприклад, повторення зв'язків з періодом два чи більше тактів). Зазначимо, що часовий ряд може мати тренд навіть за умови, що чинні «перехідна» стаціонарність й структурна стаціонарність. Наявність тренду створює проблеми для багатьох методів виведення моделі [19]. Один із способів обійти або послабити проблему полягає у трансформації даних. Аналізуються не самі оригінальні дані, а відповідні різниці. Наприклад, переходять до змінних 1−−= ttt XXX , завдяки чому умовний розподіл ймовірностей значень ,..)|( 1− tt YXp або ,..)|( 1− tt YXp може виявитися стабільним. Нарешті, зауважимо, що коли динамічний процес об'єктивно генерується системою диференціальних рівнянь, поведінка процесу може бути квазі-хаотичною (для таких процесів рекурсивні моделі не придатні). Якщо всі інтервали часу між моментами вимірювання даних – однакові, то час можна відображати цілими індексами Ni ,...,2,1,0= . Стан процесу в такті i відображається вектором-стовпчиком =iS ,...),,( iii ZYX . Для утворення статистик, необхідних для виведення моделі, треба спиратися на певну регулярність структури. Нехай маємо найпростіший варіант структурної регулярності, коли період повторення зв'язків – одиниця. Тоді елементарний випадок статистичної вибірки – це зріз векторного ряду даних для одного з індексів часу i . Він включає вектор-стовпчик iS та кілька векторів-стовпчиків з меншими значеннями індексів часу, відповідно до розміру лагу. Тобто елементарний «випадок» вибірки виглядає як < iS , 1−iS , 2−iS ,.., −iS >. Величина  має дорівнювати найбільшому часовому лагу безпосередніх зв'язків процесу. Якщо довжина ряду даних дорівнює N , то отримаємо −N повноформатних «випадків» вибірки. 4 Виведення каузальних динамічних моделей і роль припущень Коротко розглянемо особливості виведення динамічної моделі з векторних часових рядів даних методами, основаними на незалежності [14, 15, 19–22]. Вибір цих методів дозволяє чітко висвітлити суть проблем і роль припущень. Базовими операціями цих методів є тестування умовної незалежності. Методи, основані на незалежності, не є ізольованими від традиційних методів. Зокрема, можна провести паралелі між цими методами та методами регресійного аналізу. Дійсно (за певних стандартних умов) є еквівалентність між тестуванням умовної незалежності та тестуванням значущості змінної як регресора. Якщо, приміром, змінна X умовно незалежна від Y за умови на Z , то регресія Y на ( X , Z ) має дати незначущий коефіцієнт для регресора X . Задача виведення динамічної каузальної моделі відрізняється від аналогічної «статичної» задачі низкою особливостей. Перша – це заданий темпоральний порядок змінних. Друга – це зазвичай збільшена кількість , то він присутній для всіх тактів Моделі і засоби систем баз даних та знань [Введите текст] ,...),,( ttt ZYX значень, виміряних в один і той самий момент t . Можна позначити вектор-стовпчик ,...),,( ttt ZYX через tS й назвати його станом процесу у момент t . Але, в принципі, не є обов'язковим, щоб всі змінні з одного інтервалу часу (кроку) вимірювались строго в один і той самий момент. Можлива ситуація, коли існують деякі «зсуви» між моментами вимірювань «квазі-одночасних» змінних. Проте такі зсуви мають бути фіксованими, інакше дані з нерегулярною схемою вимірювань будуть породжувати помилки, зміщення і викривлення. Про зсув між моментами вимірювання різних змінних має бути відомо аналітику, бо ця інформація важлива для каузального виведення (це темпоральний порядок, який треба врахувати). Також за умовчанням в усталених методах аналізу часових рядів прийнято, що всі інтервали часу між моментами вимірювання всіх змінних – однакові. Але, взагалі кажучи, не обов'язково виконувати всі вимірювання через фіксовані інтервали часу. Проте варіативність інтервалів часу призведе, зокрема, до розмивання функції автоковаріації, і взагалі, буде породжувати ілюзію нестаціонарності. Стаціонарність – традиційне припущення в аналізі часових рядів. Багато методів аналізу спираються на це припущення. Реальні обставини й потреби розширити сфери застосувань методів змушують аналітиків послабити вимоги стаціонарності, але в таких межах, щоб не втратити спроможності вивести адекватну модель з даних. Переглянемо відомі форми статистичної стаціонарності динамічного процесу та часових рядів даних. Строга стаціонарність (векторного) часового ряду означає, що імовірнісна поведінка значень часового ряду не змінюється з просуванням у часі, тобто сумісний розподіл ймовірностей значень часового ряду є незмінним (ідентичним) для довільного зсуву індексів часу [9–11]. Внаслідок строгої стаціонарності, зокрема, автокореляційна функція залежить тільки від різниці індексів часу (від часового лагу) і не залежить від абсолютного часу. Слаба стаціонарність (векторного) часового ряду означає, що: 1) математичні очікування значень ряду є константні, тобто не залежать від часу; 2) кожна коваріація залежить тільки від різниці індексів часу (від часового лагу) і не залежить від абсолютного часу. Назвемо деякі нетрадиційні форми стаціонарності динамічного процесу. «Перехідна» стаціонарність означає, що умовний розподіл ймовірностей значень часового ряду є незмінним (стабільним) у часі, тобто ( ),..,| 21 −− tttp SSS не залежить від t . В аналізі часових рядів (за умовчанням) прийнято припущення про регулярну структуру зв'язків протягом всього часу спостереження. (Це забезпечує обчислення коректних статистик.) «Структурна» стаціонарність чи регулярність означає незмінність набору зв'язків у часі. Найпростіший варіант структурної регулярності – елементарна регулярність, повторюваність всіх зв'язків на кожному такті (кроці) всього процесу. Тобто якщо є зв'язок 1+→ ii YX , то він присутній для всіх тактів ,...,2,1,0=i ∞. Можливі й інші трактовки структурної регулярності (наприклад, повторення зв'язків з періодом два чи більше тактів). Зазначимо, що часовий ряд може мати тренд навіть за умови, що чинні «перехідна» стаціонарність й структурна стаціонарність. Наявність тренду створює проблеми для багатьох методів виведення моделі [19]. Один із способів обійти або послабити проблему полягає у трансформації даних. Аналізуються не самі оригінальні дані, а відповідні різниці. Наприклад, переходять до змінних 1−−= ttt XXX , завдяки чому умовний розподіл ймовірностей значень ,..)|( 1− tt YXp або ,..)|( 1− tt YXp може виявитися стабільним. Нарешті, зауважимо, що коли динамічний процес об'єктивно генерується системою диференціальних рівнянь, поведінка процесу може бути квазі-хаотичною (для таких процесів рекурсивні моделі не придатні). Якщо всі інтервали часу між моментами вимірювання даних – однакові, то час можна відображати цілими індексами Ni ,...,2,1,0= . Стан процесу в такті i відображається вектором-стовпчиком =iS ,...),,( iii ZYX . Для утворення статистик, необхідних для виведення моделі, треба спиратися на певну регулярність структури. Нехай маємо найпростіший варіант структурної регулярності, коли період повторення зв'язків – одиниця. Тоді елементарний випадок статистичної вибірки – це зріз векторного ряду даних для одного з індексів часу i . Він включає вектор-стовпчик iS та кілька векторів-стовпчиків з меншими значеннями індексів часу, відповідно до розміру лагу. Тобто елементарний «випадок» вибірки виглядає як < iS , 1−iS , 2−iS ,.., −iS >. Величина  має дорівнювати найбільшому часовому лагу безпосередніх зв'язків процесу. Якщо довжина ряду даних дорівнює N , то отримаємо −N повноформатних «випадків» вибірки. 4 Виведення каузальних динамічних моделей і роль припущень Коротко розглянемо особливості виведення динамічної моделі з векторних часових рядів даних методами, основаними на незалежності [14, 15, 19–22]. Вибір цих методів дозволяє чітко висвітлити суть проблем і роль припущень. Базовими операціями цих методів є тестування умовної незалежності. Методи, основані на незалежності, не є ізольованими від традиційних методів. Зокрема, можна провести паралелі між цими методами та методами регресійного аналізу. Дійсно (за певних стандартних умов) є еквівалентність між тестуванням умовної незалежності та тестуванням значущості змінної як регресора. Якщо, приміром, змінна X умовно незалежна від Y за умови на Z , то регресія Y на ( X , Z ) має дати незначущий коефіцієнт для регресора X . Задача виведення динамічної каузальної моделі відрізняється від аналогічної «статичної» задачі низкою особливостей. Перша – це заданий темпоральний порядок змінних. Друга – це зазвичай збільшена кількість Можливі й інші трактовки структурної регулярності (наприклад, повторення зв’язків з періо- дом два чи більше тактів). Зазначимо, що часовий ряд може мати тренд навіть за умови, що чинні «пере- хідна» стаціонарність й структурна стаціонарність. Наявність тренду створює проблеми для багатьох мето- дів виведення моделі [19]. Один із способів обійти або послабити проблему полягає у трансформації даних. Аналізуються не самі оригінальні дані, а відповідні різниці. Наприклад, переходять до змінних Моделі і засоби систем баз даних та знань [Введите текст] ,...),,( ttt ZYX значень, виміряних в один і той самий момент t . Можна позначити вектор-стовпчик ,...),,( ttt ZYX через tS й назвати його станом процесу у момент t . Але, в принципі, не є обов'язковим, щоб всі змінні з одного інтервалу часу (кроку) вимірювались строго в один і той самий момент. Можлива ситуація, коли існують деякі «зсуви» між моментами вимірювань «квазі-одночасних» змінних. Проте такі зсуви мають бути фіксованими, інакше дані з нерегулярною схемою вимірювань будуть породжувати помилки, зміщення і викривлення. Про зсув між моментами вимірювання різних змінних має бути відомо аналітику, бо ця інформація важлива для каузального виведення (це темпоральний порядок, який треба врахувати). Також за умовчанням в усталених методах аналізу часових рядів прийнято, що всі інтервали часу між моментами вимірювання всіх змінних – однакові. Але, взагалі кажучи, не обов'язково виконувати всі вимірювання через фіксовані інтервали часу. Проте варіативність інтервалів часу призведе, зокрема, до розмивання функції автоковаріації, і взагалі, буде породжувати ілюзію нестаціонарності. Стаціонарність – традиційне припущення в аналізі часових рядів. Багато методів аналізу спираються на це припущення. Реальні обставини й потреби розширити сфери застосувань методів змушують аналітиків послабити вимоги стаціонарності, але в таких межах, щоб не втратити спроможності вивести адекватну модель з даних. Переглянемо відомі форми статистичної стаціонарності динамічного процесу та часових рядів даних. Строга стаціонарність (векторного) часового ряду означає, що імовірнісна поведінка значень часового ряду не змінюється з просуванням у часі, тобто сумісний розподіл ймовірностей значень часового ряду є незмінним (ідентичним) для довільного зсуву індексів часу [9–11]. Внаслідок строгої стаціонарності, зокрема, автокореляційна функція залежить тільки від різниці індексів часу (від часового лагу) і не залежить від абсолютного часу. Слаба стаціонарність (векторного) часового ряду означає, що: 1) математичні очікування значень ряду є константні, тобто не залежать від часу; 2) кожна коваріація залежить тільки від різниці індексів часу (від часового лагу) і не залежить від абсолютного часу. Назвемо деякі нетрадиційні форми стаціонарності динамічного процесу. «Перехідна» стаціонарність означає, що умовний розподіл ймовірностей значень часового ряду є незмінним (стабільним) у часі, тобто ( ),..,| 21 −− tttp SSS не залежить від t . В аналізі часових рядів (за умовчанням) прийнято припущення про регулярну структуру зв'язків протягом всього часу спостереження. (Це забезпечує обчислення коректних статистик.) «Структурна» стаціонарність чи регулярність означає незмінність набору зв'язків у часі. Найпростіший варіант структурної регулярності – елементарна регулярність, повторюваність всіх зв'язків на кожному такті (кроці) всього процесу. Тобто якщо є зв'язок 1+→ ii YX , то він присутній для всіх тактів ,...,2,1,0=i ∞. Можливі й інші трактовки структурної регулярності (наприклад, повторення зв'язків з періодом два чи більше тактів). Зазначимо, що часовий ряд може мати тренд навіть за умови, що чинні «перехідна» стаціонарність й структурна стаціонарність. Наявність тренду створює проблеми для багатьох методів виведення моделі [19]. Один із способів обійти або послабити проблему полягає у трансформації даних. Аналізуються не самі оригінальні дані, а відповідні різниці. Наприклад, переходять до змінних 1−−= ttt XXX , завдяки чому умовний розподіл ймовірностей значень ,..)|( 1− tt YXp або ,..)|( 1− tt YXp може виявитися стабільним. Нарешті, зауважимо, що коли динамічний процес об'єктивно генерується системою диференціальних рівнянь, поведінка процесу може бути квазі-хаотичною (для таких процесів рекурсивні моделі не придатні). Якщо всі інтервали часу між моментами вимірювання даних – однакові, то час можна відображати цілими індексами Ni ,...,2,1,0= . Стан процесу в такті i відображається вектором-стовпчиком =iS ,...),,( iii ZYX . Для утворення статистик, необхідних для виведення моделі, треба спиратися на певну регулярність структури. Нехай маємо найпростіший варіант структурної регулярності, коли період повторення зв'язків – одиниця. Тоді елементарний випадок статистичної вибірки – це зріз векторного ряду даних для одного з індексів часу i . Він включає вектор-стовпчик iS та кілька векторів-стовпчиків з меншими значеннями індексів часу, відповідно до розміру лагу. Тобто елементарний «випадок» вибірки виглядає як < iS , 1−iS , 2−iS ,.., −iS >. Величина  має дорівнювати найбільшому часовому лагу безпосередніх зв'язків процесу. Якщо довжина ряду даних дорівнює N , то отримаємо −N повноформатних «випадків» вибірки. 4 Виведення каузальних динамічних моделей і роль припущень Коротко розглянемо особливості виведення динамічної моделі з векторних часових рядів даних методами, основаними на незалежності [14, 15, 19–22]. Вибір цих методів дозволяє чітко висвітлити суть проблем і роль припущень. Базовими операціями цих методів є тестування умовної незалежності. Методи, основані на незалежності, не є ізольованими від традиційних методів. Зокрема, можна провести паралелі між цими методами та методами регресійного аналізу. Дійсно (за певних стандартних умов) є еквівалентність між тестуванням умовної незалежності та тестуванням значущості змінної як регресора. Якщо, приміром, змінна X умовно незалежна від Y за умови на Z , то регресія Y на ( X , Z ) має дати незначущий коефіцієнт для регресора X . Задача виведення динамічної каузальної моделі відрізняється від аналогічної «статичної» задачі низкою особливостей. Перша – це заданий темпоральний порядок змінних. Друга – це зазвичай збільшена кількість , завдяки чому умовний розподіл ймовірностей значень Моделі і засоби систем баз даних та знань [Введите текст] ,...),,( ttt ZYX значень, виміряних в один і той самий момент t . Можна позначити вектор-стовпчик ,...),,( ttt ZYX через tS й назвати його станом процесу у момент t . Але, в принципі, не є обов'язковим, щоб всі змінні з одного інтервалу часу (кроку) вимірювались строго в один і той самий момент. Можлива ситуація, коли існують деякі «зсуви» між моментами вимірювань «квазі-одночасних» змінних. Проте такі зсуви мають бути фіксованими, інакше дані з нерегулярною схемою вимірювань будуть породжувати помилки, зміщення і викривлення. Про зсув між моментами вимірювання різних змінних має бути відомо аналітику, бо ця інформація важлива для каузального виведення (це темпоральний порядок, який треба врахувати). Також за умовчанням в усталених методах аналізу часових рядів прийнято, що всі інтервали часу між моментами вимірювання всіх змінних – однакові. Але, взагалі кажучи, не обов'язково виконувати всі вимірювання через фіксовані інтервали часу. Проте варіативність інтервалів часу призведе, зокрема, до розмивання функції автоковаріації, і взагалі, буде породжувати ілюзію нестаціонарності. Стаціонарність – традиційне припущення в аналізі часових рядів. Багато методів аналізу спираються на це припущення. Реальні обставини й потреби розширити сфери застосувань методів змушують аналітиків послабити вимоги стаціонарності, але в таких межах, щоб не втратити спроможності вивести адекватну модель з даних. Переглянемо відомі форми статистичної стаціонарності динамічного процесу та часових рядів даних. Строга стаціонарність (векторного) часового ряду означає, що імовірнісна поведінка значень часового ряду не змінюється з просуванням у часі, тобто сумісний розподіл ймовірностей значень часового ряду є незмінним (ідентичним) для довільного зсуву індексів часу [9–11]. Внаслідок строгої стаціонарності, зокрема, автокореляційна функція залежить тільки від різниці індексів часу (від часового лагу) і не залежить від абсолютного часу. Слаба стаціонарність (векторного) часового ряду означає, що: 1) математичні очікування значень ряду є константні, тобто не залежать від часу; 2) кожна коваріація залежить тільки від різниці індексів часу (від часового лагу) і не залежить від абсолютного часу. Назвемо деякі нетрадиційні форми стаціонарності динамічного процесу. «Перехідна» стаціонарність означає, що умовний розподіл ймовірностей значень часового ряду є незмінним (стабільним) у часі, тобто ( ),..,| 21 −− tttp SSS не залежить від t . В аналізі часових рядів (за умовчанням) прийнято припущення про регулярну структуру зв'язків протягом всього часу спостереження. (Це забезпечує обчислення коректних статистик.) «Структурна» стаціонарність чи регулярність означає незмінність набору зв'язків у часі. Найпростіший варіант структурної регулярності – елементарна регулярність, повторюваність всіх зв'язків на кожному такті (кроці) всього процесу. Тобто якщо є зв'язок 1+→ ii YX , то він присутній для всіх тактів ,...,2,1,0=i ∞. Можливі й інші трактовки структурної регулярності (наприклад, повторення зв'язків з періодом два чи більше тактів). Зазначимо, що часовий ряд може мати тренд навіть за умови, що чинні «перехідна» стаціонарність й структурна стаціонарність. Наявність тренду створює проблеми для багатьох методів виведення моделі [19]. Один із способів обійти або послабити проблему полягає у трансформації даних. Аналізуються не самі оригінальні дані, а відповідні різниці. Наприклад, переходять до змінних 1−−= ttt XXX , завдяки чому умовний розподіл ймовірностей значень ,..)|( 1− tt YXp або ,..)|( 1− tt YXp може виявитися стабільним. Нарешті, зауважимо, що коли динамічний процес об'єктивно генерується системою диференціальних рівнянь, поведінка процесу може бути квазі-хаотичною (для таких процесів рекурсивні моделі не придатні). Якщо всі інтервали часу між моментами вимірювання даних – однакові, то час можна відображати цілими індексами Ni ,...,2,1,0= . Стан процесу в такті i відображається вектором-стовпчиком =iS ,...),,( iii ZYX . Для утворення статистик, необхідних для виведення моделі, треба спиратися на певну регулярність структури. Нехай маємо найпростіший варіант структурної регулярності, коли період повторення зв'язків – одиниця. Тоді елементарний випадок статистичної вибірки – це зріз векторного ряду даних для одного з індексів часу i . Він включає вектор-стовпчик iS та кілька векторів-стовпчиків з меншими значеннями індексів часу, відповідно до розміру лагу. Тобто елементарний «випадок» вибірки виглядає як < iS , 1−iS , 2−iS ,.., −iS >. Величина  має дорівнювати найбільшому часовому лагу безпосередніх зв'язків процесу. Якщо довжина ряду даних дорівнює N , то отримаємо −N повноформатних «випадків» вибірки. 4 Виведення каузальних динамічних моделей і роль припущень Коротко розглянемо особливості виведення динамічної моделі з векторних часових рядів даних методами, основаними на незалежності [14, 15, 19–22]. Вибір цих методів дозволяє чітко висвітлити суть проблем і роль припущень. Базовими операціями цих методів є тестування умовної незалежності. Методи, основані на незалежності, не є ізольованими від традиційних методів. Зокрема, можна провести паралелі між цими методами та методами регресійного аналізу. Дійсно (за певних стандартних умов) є еквівалентність між тестуванням умовної незалежності та тестуванням значущості змінної як регресора. Якщо, приміром, змінна X умовно незалежна від Y за умови на Z , то регресія Y на ( X , Z ) має дати незначущий коефіцієнт для регресора X . Задача виведення динамічної каузальної моделі відрізняється від аналогічної «статичної» задачі низкою особливостей. Перша – це заданий темпоральний порядок змінних. Друга – це зазвичай збільшена кількість може виявитися ста- більним. Нарешті, зауважимо, що коли динамічний процес об’єктивно генерується системою диференціальних рівнянь, поведінка процесу може бути квазі-хаотичною (для таких процесів рекурсивні моделі не придатні). Якщо всі інтервали часу між моментами вимірювання даних – однакові, то час можна відображати цілими індексами Моделі і засоби систем баз даних та знань [Введите текст] ,...),,( ttt ZYX значень, виміряних в один і той самий момент t . Можна позначити вектор-стовпчик ,...),,( ttt ZYX через tS й назвати його станом процесу у момент t . Але, в принципі, не є обов'язковим, щоб всі змінні з одного інтервалу часу (кроку) вимірювались строго в один і той самий момент. Можлива ситуація, коли існують деякі «зсуви» між моментами вимірювань «квазі-одночасних» змінних. Проте такі зсуви мають бути фіксованими, інакше дані з нерегулярною схемою вимірювань будуть породжувати помилки, зміщення і викривлення. Про зсув між моментами вимірювання різних змінних має бути відомо аналітику, бо ця інформація важлива для каузального виведення (це темпоральний порядок, який треба врахувати). Також за умовчанням в усталених методах аналізу часових рядів прийнято, що всі інтервали часу між моментами вимірювання всіх змінних – однакові. Але, взагалі кажучи, не обов'язково виконувати всі вимірювання через фіксовані інтервали часу. Проте варіативність інтервалів часу призведе, зокрема, до розмивання функції автоковаріації, і взагалі, буде породжувати ілюзію нестаціонарності. Стаціонарність – традиційне припущення в аналізі часових рядів. Багато методів аналізу спираються на це припущення. Реальні обставини й потреби розширити сфери застосувань методів змушують аналітиків послабити вимоги стаціонарності, але в таких межах, щоб не втратити спроможності вивести адекватну модель з даних. Переглянемо відомі форми статистичної стаціонарності динамічного процесу та часових рядів даних. Строга стаціонарність (векторного) часового ряду означає, що імовірнісна поведінка значень часового ряду не змінюється з просуванням у часі, тобто сумісний розподіл ймовірностей значень часового ряду є незмінним (ідентичним) для довільного зсуву індексів часу [9–11]. Внаслідок строгої стаціонарності, зокрема, автокореляційна функція залежить тільки від різниці індексів часу (від часового лагу) і не залежить від абсолютного часу. Слаба стаціонарність (векторного) часового ряду означає, що: 1) математичні очікування значень ряду є константні, тобто не залежать від часу; 2) кожна коваріація залежить тільки від різниці індексів часу (від часового лагу) і не залежить від абсолютного часу. Назвемо деякі нетрадиційні форми стаціонарності динамічного процесу. «Перехідна» стаціонарність означає, що умовний розподіл ймовірностей значень часового ряду є незмінним (стабільним) у часі, тобто ( ),..,| 21 −− tttp SSS не залежить від t . В аналізі часових рядів (за умовчанням) прийнято припущення про регулярну структуру зв'язків протягом всього часу спостереження. (Це забезпечує обчислення коректних статистик.) «Структурна» стаціонарність чи регулярність означає незмінність набору зв'язків у часі. Найпростіший варіант структурної регулярності – елементарна регулярність, повторюваність всіх зв'язків на кожному такті (кроці) всього процесу. Тобто якщо є зв'язок 1+→ ii YX , то він присутній для всіх тактів ,...,2,1,0=i ∞. Можливі й інші трактовки структурної регулярності (наприклад, повторення зв'язків з періодом два чи більше тактів). Зазначимо, що часовий ряд може мати тренд навіть за умови, що чинні «перехідна» стаціонарність й структурна стаціонарність. Наявність тренду створює проблеми для багатьох методів виведення моделі [19]. Один із способів обійти або послабити проблему полягає у трансформації даних. Аналізуються не самі оригінальні дані, а відповідні різниці. Наприклад, переходять до змінних 1−−= ttt XXX , завдяки чому умовний розподіл ймовірностей значень ,..)|( 1− tt YXp або ,..)|( 1− tt YXp може виявитися стабільним. Нарешті, зауважимо, що коли динамічний процес об'єктивно генерується системою диференціальних рівнянь, поведінка процесу може бути квазі-хаотичною (для таких процесів рекурсивні моделі не придатні). Якщо всі інтервали часу між моментами вимірювання даних – однакові, то час можна відображати цілими індексами Ni ,...,2,1,0= . Стан процесу в такті i відображається вектором-стовпчиком =iS ,...),,( iii ZYX . Для утворення статистик, необхідних для виведення моделі, треба спиратися на певну регулярність структури. Нехай маємо найпростіший варіант структурної регулярності, коли період повторення зв'язків – одиниця. Тоді елементарний випадок статистичної вибірки – це зріз векторного ряду даних для одного з індексів часу i . Він включає вектор-стовпчик iS та кілька векторів-стовпчиків з меншими значеннями індексів часу, відповідно до розміру лагу. Тобто елементарний «випадок» вибірки виглядає як < iS , 1−iS , 2−iS ,.., −iS >. Величина  має дорівнювати найбільшому часовому лагу безпосередніх зв'язків процесу. Якщо довжина ряду даних дорівнює N , то отримаємо −N повноформатних «випадків» вибірки. 4 Виведення каузальних динамічних моделей і роль припущень Коротко розглянемо особливості виведення динамічної моделі з векторних часових рядів даних методами, основаними на незалежності [14, 15, 19–22]. Вибір цих методів дозволяє чітко висвітлити суть проблем і роль припущень. Базовими операціями цих методів є тестування умовної незалежності. Методи, основані на незалежності, не є ізольованими від традиційних методів. Зокрема, можна провести паралелі між цими методами та методами регресійного аналізу. Дійсно (за певних стандартних умов) є еквівалентність між тестуванням умовної незалежності та тестуванням значущості змінної як регресора. Якщо, приміром, змінна X умовно незалежна від Y за умови на Z , то регресія Y на ( X , Z ) має дати незначущий коефіцієнт для регресора X . Задача виведення динамічної каузальної моделі відрізняється від аналогічної «статичної» задачі низкою особливостей. Перша – це заданий темпоральний порядок змінних. Друга – це зазвичай збільшена кількість . Стан процесу в такті i відображається вектором-стовпчиком Моделі і засоби систем баз даних та знань [Введите текст] ,...),,( ttt ZYX значень, виміряних в один і той самий момент t . Можна позначити вектор-стовпчик ,...),,( ttt ZYX через tS й назвати його станом процесу у момент t . Але, в принципі, не є обов'язковим, щоб всі змінні з одного інтервалу часу (кроку) вимірювались строго в один і той самий момент. Можлива ситуація, коли існують деякі «зсуви» між моментами вимірювань «квазі-одночасних» змінних. Проте такі зсуви мають бути фіксованими, інакше дані з нерегулярною схемою вимірювань будуть породжувати помилки, зміщення і викривлення. Про зсув між моментами вимірювання різних змінних має бути відомо аналітику, бо ця інформація важлива для каузального виведення (це темпоральний порядок, який треба врахувати). Також за умовчанням в усталених методах аналізу часових рядів прийнято, що всі інтервали часу між моментами вимірювання всіх змінних – однакові. Але, взагалі кажучи, не обов'язково виконувати всі вимірювання через фіксовані інтервали часу. Проте варіативність інтервалів часу призведе, зокрема, до розмивання функції автоковаріації, і взагалі, буде породжувати ілюзію нестаціонарності. Стаціонарність – традиційне припущення в аналізі часових рядів. Багато методів аналізу спираються на це припущення. Реальні обставини й потреби розширити сфери застосувань методів змушують аналітиків послабити вимоги стаціонарності, але в таких межах, щоб не втратити спроможності вивести адекватну модель з даних. Переглянемо відомі форми статистичної стаціонарності динамічного процесу та часових рядів даних. Строга стаціонарність (векторного) часового ряду означає, що імовірнісна поведінка значень часового ряду не змінюється з просуванням у часі, тобто сумісний розподіл ймовірностей значень часового ряду є незмінним (ідентичним) для довільного зсуву індексів часу [9–11]. Внаслідок строгої стаціонарності, зокрема, автокореляційна функція залежить тільки від різниці індексів часу (від часового лагу) і не залежить від абсолютного часу. Слаба стаціонарність (векторного) часового ряду означає, що: 1) математичні очікування значень ряду є константні, тобто не залежать від часу; 2) кожна коваріація залежить тільки від різниці індексів часу (від часового лагу) і не залежить від абсолютного часу. Назвемо деякі нетрадиційні форми стаціонарності динамічного процесу. «Перехідна» стаціонарність означає, що умовний розподіл ймовірностей значень часового ряду є незмінним (стабільним) у часі, тобто ( ),..,| 21 −− tttp SSS не залежить від t . В аналізі часових рядів (за умовчанням) прийнято припущення про регулярну структуру зв'язків протягом всього часу спостереження. (Це забезпечує обчислення коректних статистик.) «Структурна» стаціонарність чи регулярність означає незмінність набору зв'язків у часі. Найпростіший варіант структурної регулярності – елементарна регулярність, повторюваність всіх зв'язків на кожному такті (кроці) всього процесу. Тобто якщо є зв'язок 1+→ ii YX , то він присутній для всіх тактів ,...,2,1,0=i ∞. Можливі й інші трактовки структурної регулярності (наприклад, повторення зв'язків з періодом два чи більше тактів). Зазначимо, що часовий ряд може мати тренд навіть за умови, що чинні «перехідна» стаціонарність й структурна стаціонарність. Наявність тренду створює проблеми для багатьох методів виведення моделі [19]. Один із способів обійти або послабити проблему полягає у трансформації даних. Аналізуються не самі оригінальні дані, а відповідні різниці. Наприклад, переходять до змінних 1−−= ttt XXX , завдяки чому умовний розподіл ймовірностей значень ,..)|( 1− tt YXp або ,..)|( 1− tt YXp може виявитися стабільним. Нарешті, зауважимо, що коли динамічний процес об'єктивно генерується системою диференціальних рівнянь, поведінка процесу може бути квазі-хаотичною (для таких процесів рекурсивні моделі не придатні). Якщо всі інтервали часу між моментами вимірювання даних – однакові, то час можна відображати цілими індексами Ni ,...,2,1,0= . Стан процесу в такті i відображається вектором-стовпчиком =iS ,...),,( iii ZYX . Для утворення статистик, необхідних для виведення моделі, треба спиратися на певну регулярність структури. Нехай маємо найпростіший варіант структурної регулярності, коли період повторення зв'язків – одиниця. Тоді елементарний випадок статистичної вибірки – це зріз векторного ряду даних для одного з індексів часу i . Він включає вектор-стовпчик iS та кілька векторів-стовпчиків з меншими значеннями індексів часу, відповідно до розміру лагу. Тобто елементарний «випадок» вибірки виглядає як < iS , 1−iS , 2−iS ,.., −iS >. Величина  має дорівнювати найбільшому часовому лагу безпосередніх зв'язків процесу. Якщо довжина ряду даних дорівнює N , то отримаємо −N повноформатних «випадків» вибірки. 4 Виведення каузальних динамічних моделей і роль припущень Коротко розглянемо особливості виведення динамічної моделі з векторних часових рядів даних методами, основаними на незалежності [14, 15, 19–22]. Вибір цих методів дозволяє чітко висвітлити суть проблем і роль припущень. Базовими операціями цих методів є тестування умовної незалежності. Методи, основані на незалежності, не є ізольованими від традиційних методів. Зокрема, можна провести паралелі між цими методами та методами регресійного аналізу. Дійсно (за певних стандартних умов) є еквівалентність між тестуванням умовної незалежності та тестуванням значущості змінної як регресора. Якщо, приміром, змінна X умовно незалежна від Y за умови на Z , то регресія Y на ( X , Z ) має дати незначущий коефіцієнт для регресора X . Задача виведення динамічної каузальної моделі відрізняється від аналогічної «статичної» задачі низкою особливостей. Перша – це заданий темпоральний порядок змінних. Друга – це зазвичай збільшена кількість . Для утворення статистик, необхідних для виведення моделі, треба спиратися на певну регулярність структури. Нехай маємо найпростіший варіант структурної регулярності, коли період повторення зв’язків – одиниця. Тоді елементарний випадок статистичної вибірки – це зріз векторного ряду даних для одного з індексів часу i. Він включає вектор-стовпчик Моделі і засоби систем баз даних та знань [Введите текст] ,...),,( ttt ZYX значень, виміряних в один і той самий момент t . Можна позначити вектор-стовпчик ,...),,( ttt ZYX через tS й назвати його станом процесу у момент t . Але, в принципі, не є обов'язковим, щоб всі змінні з одного інтервалу часу (кроку) вимірювались строго в один і той самий момент. Можлива ситуація, коли існують деякі «зсуви» між моментами вимірювань «квазі-одночасних» змінних. Проте такі зсуви мають бути фіксованими, інакше дані з нерегулярною схемою вимірювань будуть породжувати помилки, зміщення і викривлення. Про зсув між моментами вимірювання різних змінних має бути відомо аналітику, бо ця інформація важлива для каузального виведення (це темпоральний порядок, який треба врахувати). Також за умовчанням в усталених методах аналізу часових рядів прийнято, що всі інтервали часу між моментами вимірювання всіх змінних – однакові. Але, взагалі кажучи, не обов'язково виконувати всі вимірювання через фіксовані інтервали часу. Проте варіативність інтервалів часу призведе, зокрема, до розмивання функції автоковаріації, і взагалі, буде породжувати ілюзію нестаціонарності. Стаціонарність – традиційне припущення в аналізі часових рядів. Багато методів аналізу спираються на це припущення. Реальні обставини й потреби розширити сфери застосувань методів змушують аналітиків послабити вимоги стаціонарності, але в таких межах, щоб не втратити спроможності вивести адекватну модель з даних. Переглянемо відомі форми статистичної стаціонарності динамічного процесу та часових рядів даних. Строга стаціонарність (векторного) часового ряду означає, що імовірнісна поведінка значень часового ряду не змінюється з просуванням у часі, тобто сумісний розподіл ймовірностей значень часового ряду є незмінним (ідентичним) для довільного зсуву індексів часу [9–11]. Внаслідок строгої стаціонарності, зокрема, автокореляційна функція залежить тільки від різниці індексів часу (від часового лагу) і не залежить від абсолютного часу. Слаба стаціонарність (векторного) часового ряду означає, що: 1) математичні очікування значень ряду є константні, тобто не залежать від часу; 2) кожна коваріація залежить тільки від різниці індексів часу (від часового лагу) і не залежить від абсолютного часу. Назвемо деякі нетрадиційні форми стаціонарності динамічного процесу. «Перехідна» стаціонарність означає, що умовний розподіл ймовірностей значень часового ряду є незмінним (стабільним) у часі, тобто ( ),..,| 21 −− tttp SSS не залежить від t . В аналізі часових рядів (за умовчанням) прийнято припущення про регулярну структуру зв'язків протягом всього часу спостереження. (Це забезпечує обчислення коректних статистик.) «Структурна» стаціонарність чи регулярність означає незмінність набору зв'язків у часі. Найпростіший варіант структурної регулярності – елементарна регулярність, повторюваність всіх зв'язків на кожному такті (кроці) всього процесу. Тобто якщо є зв'язок 1+→ ii YX , то він присутній для всіх тактів ,...,2,1,0=i ∞. Можливі й інші трактовки структурної регулярності (наприклад, повторення зв'язків з періодом два чи більше тактів). Зазначимо, що часовий ряд може мати тренд навіть за умови, що чинні «перехідна» стаціонарність й структурна стаціонарність. Наявність тренду створює проблеми для багатьох методів виведення моделі [19]. Один із способів обійти або послабити проблему полягає у трансформації даних. Аналізуються не самі оригінальні дані, а відповідні різниці. Наприклад, переходять до змінних 1−−= ttt XXX , завдяки чому умовний розподіл ймовірностей значень ,..)|( 1− tt YXp або ,..)|( 1− tt YXp може виявитися стабільним. Нарешті, зауважимо, що коли динамічний процес об'єктивно генерується системою диференціальних рівнянь, поведінка процесу може бути квазі-хаотичною (для таких процесів рекурсивні моделі не придатні). Якщо всі інтервали часу між моментами вимірювання даних – однакові, то час можна відображати цілими індексами Ni ,...,2,1,0= . Стан процесу в такті i відображається вектором-стовпчиком =iS ,...),,( iii ZYX . Для утворення статистик, необхідних для виведення моделі, треба спиратися на певну регулярність структури. Нехай маємо найпростіший варіант структурної регулярності, коли період повторення зв'язків – одиниця. Тоді елементарний випадок статистичної вибірки – це зріз векторного ряду даних для одного з індексів часу i . Він включає вектор-стовпчик iS та кілька векторів-стовпчиків з меншими значеннями індексів часу, відповідно до розміру лагу. Тобто елементарний «випадок» вибірки виглядає як < iS , 1−iS , 2−iS ,.., −iS >. Величина  має дорівнювати найбільшому часовому лагу безпосередніх зв'язків процесу. Якщо довжина ряду даних дорівнює N , то отримаємо −N повноформатних «випадків» вибірки. 4 Виведення каузальних динамічних моделей і роль припущень Коротко розглянемо особливості виведення динамічної моделі з векторних часових рядів даних методами, основаними на незалежності [14, 15, 19–22]. Вибір цих методів дозволяє чітко висвітлити суть проблем і роль припущень. Базовими операціями цих методів є тестування умовної незалежності. Методи, основані на незалежності, не є ізольованими від традиційних методів. Зокрема, можна провести паралелі між цими методами та методами регресійного аналізу. Дійсно (за певних стандартних умов) є еквівалентність між тестуванням умовної незалежності та тестуванням значущості змінної як регресора. Якщо, приміром, змінна X умовно незалежна від Y за умови на Z , то регресія Y на ( X , Z ) має дати незначущий коефіцієнт для регресора X . Задача виведення динамічної каузальної моделі відрізняється від аналогічної «статичної» задачі низкою особливостей. Перша – це заданий темпоральний порядок змінних. Друга – це зазвичай збільшена кількість та кілька векторів-стовпчиків з меншими значеннями індексів часу, відповідно до розміру лагу. Тобто елементарний «випадок» вибірки виглядає як Моделі і засоби систем баз даних та знань [Введите текст] ,...),,( ttt ZYX значень, виміряних в один і той самий момент t . Можна позначити вектор-стовпчик ,...),,( ttt ZYX через tS й назвати його станом процесу у момент t . Але, в принципі, не є обов'язковим, щоб всі змінні з одного інтервалу часу (кроку) вимірювались строго в один і той самий момент. Можлива ситуація, коли існують деякі «зсуви» між моментами вимірювань «квазі-одночасних» змінних. Проте такі зсуви мають бути фіксованими, інакше дані з нерегулярною схемою вимірювань будуть породжувати помилки, зміщення і викривлення. Про зсув між моментами вимірювання різних змінних має бути відомо аналітику, бо ця інформація важлива для каузального виведення (це темпоральний порядок, який треба врахувати). Також за умовчанням в усталених методах аналізу часових рядів прийнято, що всі інтервали часу між моментами вимірювання всіх змінних – однакові. Але, взагалі кажучи, не обов'язково виконувати всі вимірювання через фіксовані інтервали часу. Проте варіативність інтервалів часу призведе, зокрема, до розмивання функції автоковаріації, і взагалі, буде породжувати ілюзію нестаціонарності. Стаціонарність – традиційне припущення в аналізі часових рядів. Багато методів аналізу спираються на це припущення. Реальні обставини й потреби розширити сфери застосувань методів змушують аналітиків послабити вимоги стаціонарності, але в таких межах, щоб не втратити спроможності вивести адекватну модель з даних. Переглянемо відомі форми статистичної стаціонарності динамічного процесу та часових рядів даних. Строга стаціонарність (векторного) часового ряду означає, що імовірнісна поведінка значень часового ряду не змінюється з просуванням у часі, тобто сумісний розподіл ймовірностей значень часового ряду є незмінним (ідентичним) для довільного зсуву індексів часу [9–11]. Внаслідок строгої стаціонарності, зокрема, автокореляційна функція залежить тільки від різниці індексів часу (від часового лагу) і не залежить від абсолютного часу. Слаба стаціонарність (векторного) часового ряду означає, що: 1) математичні очікування значень ряду є константні, тобто не залежать від часу; 2) кожна коваріація залежить тільки від різниці індексів часу (від часового лагу) і не залежить від абсолютного часу. Назвемо деякі нетрадиційні форми стаціонарності динамічного процесу. «Перехідна» стаціонарність означає, що умовний розподіл ймовірностей значень часового ряду є незмінним (стабільним) у часі, тобто ( ),..,| 21 −− tttp SSS не залежить від t . В аналізі часових рядів (за умовчанням) прийнято припущення про регулярну структуру зв'язків протягом всього часу спостереження. (Це забезпечує обчислення коректних статистик.) «Структурна» стаціонарність чи регулярність означає незмінність набору зв'язків у часі. Найпростіший варіант структурної регулярності – елементарна регулярність, повторюваність всіх зв'язків на кожному такті (кроці) всього процесу. Тобто якщо є зв'язок 1+→ ii YX , то він присутній для всіх тактів ,...,2,1,0=i ∞. Можливі й інші трактовки структурної регулярності (наприклад, повторення зв'язків з періодом два чи більше тактів). Зазначимо, що часовий ряд може мати тренд навіть за умови, що чинні «перехідна» стаціонарність й структурна стаціонарність. Наявність тренду створює проблеми для багатьох методів виведення моделі [19]. Один із способів обійти або послабити проблему полягає у трансформації даних. Аналізуються не самі оригінальні дані, а відповідні різниці. Наприклад, переходять до змінних 1−−= ttt XXX , завдяки чому умовний розподіл ймовірностей значень ,..)|( 1− tt YXp або ,..)|( 1− tt YXp може виявитися стабільним. Нарешті, зауважимо, що коли динамічний процес об'єктивно генерується системою диференціальних рівнянь, поведінка процесу може бути квазі-хаотичною (для таких процесів рекурсивні моделі не придатні). Якщо всі інтервали часу між моментами вимірювання даних – однакові, то час можна відображати цілими індексами Ni ,...,2,1,0= . Стан процесу в такті i відображається вектором-стовпчиком =iS ,...),,( iii ZYX . Для утворення статистик, необхідних для виведення моделі, треба спиратися на певну регулярність структури. Нехай маємо найпростіший варіант структурної регулярності, коли період повторення зв'язків – одиниця. Тоді елементарний випадок статистичної вибірки – це зріз векторного ряду даних для одного з індексів часу i . Він включає вектор-стовпчик iS та кілька векторів-стовпчиків з меншими значеннями індексів часу, відповідно до розміру лагу. Тобто елементарний «випадок» вибірки виглядає як < iS , 1−iS , 2−iS ,.., −iS >. Величина  має дорівнювати найбільшому часовому лагу безпосередніх зв'язків процесу. Якщо довжина ряду даних дорівнює N , то отримаємо −N повноформатних «випадків» вибірки. 4 Виведення каузальних динамічних моделей і роль припущень Коротко розглянемо особливості виведення динамічної моделі з векторних часових рядів даних методами, основаними на незалежності [14, 15, 19–22]. Вибір цих методів дозволяє чітко висвітлити суть проблем і роль припущень. Базовими операціями цих методів є тестування умовної незалежності. Методи, основані на незалежності, не є ізольованими від традиційних методів. Зокрема, можна провести паралелі між цими методами та методами регресійного аналізу. Дійсно (за певних стандартних умов) є еквівалентність між тестуванням умовної незалежності та тестуванням значущості змінної як регресора. Якщо, приміром, змінна X умовно незалежна від Y за умови на Z , то регресія Y на ( X , Z ) має дати незначущий коефіцієнт для регресора X . Задача виведення динамічної каузальної моделі відрізняється від аналогічної «статичної» задачі низкою особливостей. Перша – це заданий темпоральний порядок змінних. Друга – це зазвичай збільшена кількість Величина Моделі і засоби систем баз даних та знань [Введите текст] ,...),,( ttt ZYX значень, виміряних в один і той самий момент t . Можна позначити вектор-стовпчик ,...),,( ttt ZYX через tS й назвати його станом процесу у момент t . Але, в принципі, не є обов'язковим, щоб всі змінні з одного інтервалу часу (кроку) вимірювались строго в один і той самий момент. Можлива ситуація, коли існують деякі «зсуви» між моментами вимірювань «квазі-одночасних» змінних. Проте такі зсуви мають бути фіксованими, інакше дані з нерегулярною схемою вимірювань будуть породжувати помилки, зміщення і викривлення. Про зсув між моментами вимірювання різних змінних має бути відомо аналітику, бо ця інформація важлива для каузального виведення (це темпоральний порядок, який треба врахувати). Також за умовчанням в усталених методах аналізу часових рядів прийнято, що всі інтервали часу між моментами вимірювання всіх змінних – однакові. Але, взагалі кажучи, не обов'язково виконувати всі вимірювання через фіксовані інтервали часу. Проте варіативність інтервалів часу призведе, зокрема, до розмивання функції автоковаріації, і взагалі, буде породжувати ілюзію нестаціонарності. Стаціонарність – традиційне припущення в аналізі часових рядів. Багато методів аналізу спираються на це припущення. Реальні обставини й потреби розширити сфери застосувань методів змушують аналітиків послабити вимоги стаціонарності, але в таких межах, щоб не втратити спроможності вивести адекватну модель з даних. Переглянемо відомі форми статистичної стаціонарності динамічного процесу та часових рядів даних. Строга стаціонарність (векторного) часового ряду означає, що імовірнісна поведінка значень часового ряду не змінюється з просуванням у часі, тобто сумісний розподіл ймовірностей значень часового ряду є незмінним (ідентичним) для довільного зсуву індексів часу [9–11]. Внаслідок строгої стаціонарності, зокрема, автокореляційна функція залежить тільки від різниці індексів часу (від часового лагу) і не залежить від абсолютного часу. Слаба стаціонарність (векторного) часового ряду означає, що: 1) математичні очікування значень ряду є константні, тобто не залежать від часу; 2) кожна коваріація залежить тільки від різниці індексів часу (від часового лагу) і не залежить від абсолютного часу. Назвемо деякі нетрадиційні форми стаціонарності динамічного процесу. «Перехідна» стаціонарність означає, що умовний розподіл ймовірностей значень часового ряду є незмінним (стабільним) у часі, тобто ( ),..,| 21 −− tttp SSS не залежить від t . В аналізі часових рядів (за умовчанням) прийнято припущення про регулярну структуру зв'язків протягом всього часу спостереження. (Це забезпечує обчислення коректних статистик.) «Структурна» стаціонарність чи регулярність означає незмінність набору зв'язків у часі. Найпростіший варіант структурної регулярності – елементарна регулярність, повторюваність всіх зв'язків на кожному такті (кроці) всього процесу. Тобто якщо є зв'язок 1+→ ii YX , то він присутній для всіх тактів ,...,2,1,0=i ∞. Можливі й інші трактовки структурної регулярності (наприклад, повторення зв'язків з періодом два чи більше тактів). Зазначимо, що часовий ряд може мати тренд навіть за умови, що чинні «перехідна» стаціонарність й структурна стаціонарність. Наявність тренду створює проблеми для багатьох методів виведення моделі [19]. Один із способів обійти або послабити проблему полягає у трансформації даних. Аналізуються не самі оригінальні дані, а відповідні різниці. Наприклад, переходять до змінних 1−−= ttt XXX , завдяки чому умовний розподіл ймовірностей значень ,..)|( 1− tt YXp або ,..)|( 1− tt YXp може виявитися стабільним. Нарешті, зауважимо, що коли динамічний процес об'єктивно генерується системою диференціальних рівнянь, поведінка процесу може бути квазі-хаотичною (для таких процесів рекурсивні моделі не придатні). Якщо всі інтервали часу між моментами вимірювання даних – однакові, то час можна відображати цілими індексами Ni ,...,2,1,0= . Стан процесу в такті i відображається вектором-стовпчиком =iS ,...),,( iii ZYX . Для утворення статистик, необхідних для виведення моделі, треба спиратися на певну регулярність структури. Нехай маємо найпростіший варіант структурної регулярності, коли період повторення зв'язків – одиниця. Тоді елементарний випадок статистичної вибірки – це зріз векторного ряду даних для одного з індексів часу i . Він включає вектор-стовпчик iS та кілька векторів-стовпчиків з меншими значеннями індексів часу, відповідно до розміру лагу. Тобто елементарний «випадок» вибірки виглядає як < iS , 1−iS , 2−iS ,.., −iS >. Величина  має дорівнювати найбільшому часовому лагу безпосередніх зв'язків процесу. Якщо довжина ряду даних дорівнює N , то отримаємо −N повноформатних «випадків» вибірки. 4 Виведення каузальних динамічних моделей і роль припущень Коротко розглянемо особливості виведення динамічної моделі з векторних часових рядів даних методами, основаними на незалежності [14, 15, 19–22]. Вибір цих методів дозволяє чітко висвітлити суть проблем і роль припущень. Базовими операціями цих методів є тестування умовної незалежності. Методи, основані на незалежності, не є ізольованими від традиційних методів. Зокрема, можна провести паралелі між цими методами та методами регресійного аналізу. Дійсно (за певних стандартних умов) є еквівалентність між тестуванням умовної незалежності та тестуванням значущості змінної як регресора. Якщо, приміром, змінна X умовно незалежна від Y за умови на Z , то регресія Y на ( X , Z ) має дати незначущий коефіцієнт для регресора X . Задача виведення динамічної каузальної моделі відрізняється від аналогічної «статичної» задачі низкою особливостей. Перша – це заданий темпоральний порядок змінних. Друга – це зазвичай збільшена кількість має до- рівнювати найбільшому часовому лагу безпосередніх зв’язків процесу. Якщо довжина ряду даних дорівнює N, то отримаємо Моделі і засоби систем баз даних та знань [Введите текст] ,...),,( ttt ZYX значень, виміряних в один і той самий момент t . Можна позначити вектор-стовпчик ,...),,( ttt ZYX через tS й назвати його станом процесу у момент t . Але, в принципі, не є обов'язковим, щоб всі змінні з одного інтервалу часу (кроку) вимірювались строго в один і той самий момент. Можлива ситуація, коли існують деякі «зсуви» між моментами вимірювань «квазі-одночасних» змінних. Проте такі зсуви мають бути фіксованими, інакше дані з нерегулярною схемою вимірювань будуть породжувати помилки, зміщення і викривлення. Про зсув між моментами вимірювання різних змінних має бути відомо аналітику, бо ця інформація важлива для каузального виведення (це темпоральний порядок, який треба врахувати). Також за умовчанням в усталених методах аналізу часових рядів прийнято, що всі інтервали часу між моментами вимірювання всіх змінних – однакові. Але, взагалі кажучи, не обов'язково виконувати всі вимірювання через фіксовані інтервали часу. Проте варіативність інтервалів часу призведе, зокрема, до розмивання функції автоковаріації, і взагалі, буде породжувати ілюзію нестаціонарності. Стаціонарність – традиційне припущення в аналізі часових рядів. Багато методів аналізу спираються на це припущення. Реальні обставини й потреби розширити сфери застосувань методів змушують аналітиків послабити вимоги стаціонарності, але в таких межах, щоб не втратити спроможності вивести адекватну модель з даних. Переглянемо відомі форми статистичної стаціонарності динамічного процесу та часових рядів даних. Строга стаціонарність (векторного) часового ряду означає, що імовірнісна поведінка значень часового ряду не змінюється з просуванням у часі, тобто сумісний розподіл ймовірностей значень часового ряду є незмінним (ідентичним) для довільного зсуву індексів часу [9–11]. Внаслідок строгої стаціонарності, зокрема, автокореляційна функція залежить тільки від різниці індексів часу (від часового лагу) і не залежить від абсолютного часу. Слаба стаціонарність (векторного) часового ряду означає, що: 1) математичні очікування значень ряду є константні, тобто не залежать від часу; 2) кожна коваріація залежить тільки від різниці індексів часу (від часового лагу) і не залежить від абсолютного часу. Назвемо деякі нетрадиційні форми стаціонарності динамічного процесу. «Перехідна» стаціонарність означає, що умовний розподіл ймовірностей значень часового ряду є незмінним (стабільним) у часі, тобто ( ),..,| 21 −− tttp SSS не залежить від t . В аналізі часових рядів (за умовчанням) прийнято припущення про регулярну структуру зв'язків протягом всього часу спостереження. (Це забезпечує обчислення коректних статистик.) «Структурна» стаціонарність чи регулярність означає незмінність набору зв'язків у часі. Найпростіший варіант структурної регулярності – елементарна регулярність, повторюваність всіх зв'язків на кожному такті (кроці) всього процесу. Тобто якщо є зв'язок 1+→ ii YX , то він присутній для всіх тактів ,...,2,1,0=i ∞. Можливі й інші трактовки структурної регулярності (наприклад, повторення зв'язків з періодом два чи більше тактів). Зазначимо, що часовий ряд може мати тренд навіть за умови, що чинні «перехідна» стаціонарність й структурна стаціонарність. Наявність тренду створює проблеми для багатьох методів виведення моделі [19]. Один із способів обійти або послабити проблему полягає у трансформації даних. Аналізуються не самі оригінальні дані, а відповідні різниці. Наприклад, переходять до змінних 1−−= ttt XXX , завдяки чому умовний розподіл ймовірностей значень ,..)|( 1− tt YXp або ,..)|( 1− tt YXp може виявитися стабільним. Нарешті, зауважимо, що коли динамічний процес об'єктивно генерується системою диференціальних рівнянь, поведінка процесу може бути квазі-хаотичною (для таких процесів рекурсивні моделі не придатні). Якщо всі інтервали часу між моментами вимірювання даних – однакові, то час можна відображати цілими індексами Ni ,...,2,1,0= . Стан процесу в такті i відображається вектором-стовпчиком =iS ,...),,( iii ZYX . Для утворення статистик, необхідних для виведення моделі, треба спиратися на певну регулярність структури. Нехай маємо найпростіший варіант структурної регулярності, коли період повторення зв'язків – одиниця. Тоді елементарний випадок статистичної вибірки – це зріз векторного ряду даних для одного з індексів часу i . Він включає вектор-стовпчик iS та кілька векторів-стовпчиків з меншими значеннями індексів часу, відповідно до розміру лагу. Тобто елементарний «випадок» вибірки виглядає як < iS , 1−iS , 2−iS ,.., −iS >. Величина  має дорівнювати найбільшому часовому лагу безпосередніх зв'язків процесу. Якщо довжина ряду даних дорівнює N , то отримаємо −N повноформатних «випадків» вибірки. 4 Виведення каузальних динамічних моделей і роль припущень Коротко розглянемо особливості виведення динамічної моделі з векторних часових рядів даних методами, основаними на незалежності [14, 15, 19–22]. Вибір цих методів дозволяє чітко висвітлити суть проблем і роль припущень. Базовими операціями цих методів є тестування умовної незалежності. Методи, основані на незалежності, не є ізольованими від традиційних методів. Зокрема, можна провести паралелі між цими методами та методами регресійного аналізу. Дійсно (за певних стандартних умов) є еквівалентність між тестуванням умовної незалежності та тестуванням значущості змінної як регресора. Якщо, приміром, змінна X умовно незалежна від Y за умови на Z , то регресія Y на ( X , Z ) має дати незначущий коефіцієнт для регресора X . Задача виведення динамічної каузальної моделі відрізняється від аналогічної «статичної» задачі низкою особливостей. Перша – це заданий темпоральний порядок змінних. Друга – це зазвичай збільшена кількість повноформатних «випадків» вибірки. 5. Виведення каузальних динамічних моделей і роль припущень Коротко розглянемо особливості виведення динамічної моделі з векторних часових рядів даних мето- дами, основаними на незалежності [14, 15, 19–22]. Вибір цих методів дозволяє чітко висвітлити суть проблем і роль припущень. Базовими операціями цих методів є тестування умовної незалежності. Методи, основані на незалежності, не є ізольованими від традиційних методів. Зокрема, можна провести паралелі між цими метода- ми та методами регресійного аналізу. Дійсно (за певних стандартних умов) є еквівалентність між тестуванням умовної незалежності та тестуванням значущості змінної як регресора. Якщо, приміром, змінна X умовно не- залежна від Y за умови на Z, то регресія Y на (X, Z) має дати незначущий коефіцієнт для регресора X. Задача виведення динамічної каузальної моделі відрізняється від аналогічної «статичної» задачі низкою особливостей. Перша – це заданий темпоральний порядок змінних. Друга – це зазвичай збільшена кількість змінних, а відтак, і зв’язків (автокореляційних та крос-кореляційних). Але зростання складності стримується іншою особливістю задачі – стандартними припущеннями про регулярність системи зв’язків. Припущення про регулярність зв’язків доповнюється припущенням про стабільність кількісних характеристик (сили зв’язків). Знання темпорального порядку змінних дозволяє впорядкувати виведення динамічних каузальних мереж (по- рівняно з звичайними мережами), спрощує пошук сепараторів та допомагає визначенню орієнтацій ребер. Ро- зумно спочатку ідентифікувати «короткі» зв’язки (з малим лагом); це спростить пошук довгих зв’язків. Відкри- ваються можливості оптимізувати тактику пошуку сепараторів, тобто умов для тестів незалежності. Якщо найбільший лаг післядії (довжина зв’язків) – невідомий, виникає проблема, якої немає при виведенні «статичної» каузальної мережі. По-суті, в такому разі невідомим стає розмір («часова глибина») моделі. В такій ситуації треба вирішувати, коли припинити аналіз вглиб і зафіксувати розмір моделі. Просте практичне рішення – перед запуском алгоритму виведення директивно встановити максимальний лаг (вказати цифру). Більш адаптивне рішення (яке має певне теоретичне виправдання) полягає в тому, що при досягненні певних ознак «насичення» моделі робиться висновок, що знайдено справжній розмір моделі. Відтак, наро- щування моделі треба припинити. Такою ознакою «насичення» моделі є той факт, що після аналізу зв’язків чергової довжини k (найбільшої на цей момент) з’ясувалося, що зв’язки такої глибини відсутні. Вказана озна- ка в багатьох випадках виправдана, але не завжди гарантує досягнення повної глибини автентичної моделі. Така ознака дійсно свідчить про відсутність зв’язки з лагом більше k тільки за припущення регулярності структури та за умов, що всі ряди мають достатньо сильні короткі автокореляційні зв’язки (вигляду Моделі і засоби систем баз даних та знань змінних, а відтак, і зв'язків (автокореляційних та крос-кореляційних). Але зростання складності стримується іншою особливістю задачі – стандартними припущеннями про регулярність системи зв'язків. Припущення про регулярність зв'язків доповнюється припущенням про стабільність кількісних характеристик (сили зв'язків). Знання темпорального порядку змінних дозволяє впорядкувати виведення динамічних каузальних мереж (порівняно з звичайними мережами), спрощує пошук сепараторів та допомагає визначенню орієнтацій ребер. Розумно спочатку ідентифікувати «короткі» зв'язки (з малим лагом); це спростить пошук довгих зв'язків. Відкриваються можливості оптимізувати тактику пошуку сепараторів, тобто умов для тестів незалежності. Якщо найбільший лаг післядії (довжина зв'язків) – невідомий, виникає проблема, якої немає при виведенні «статичної» каузальної мережі. По-суті, в такому разі невідомим стає розмір («часова глибина») моделі. В такій ситуації треба вирішувати, коли припинити аналіз вглиб і зафіксувати розмір моделі. Просте практичне рішення – перед запуском алгоритму виведення директивно встановити максимальний лаг (вказати цифру). Більш адаптивне рішення (яке має певне теоретичне виправдання) полягає в тому, що при досягненні певних ознак «насичення» моделі робиться висновок, що знайдено справжній розмір моделі. Відтак, нарощування моделі треба припинити. Такою ознакою «насичення» моделі є той факт, що після аналізу зв'язків чергової довжини k (найбільшої на цей момент) з'ясувалося, що зв'язки такої глибини відсутні. Вказана ознака в багатьох випадках виправдана, але не завжди гарантує досягнення повної глибини автентичної моделі. Така ознака дійсно свідчить про відсутність зв'язки з лагом більше k тільки за припущення регулярності структури та за умов, що всі ряди мають достатньо сильні короткі автокореляційні зв'язки (вигляду ii XX →−1 ). Короткі автокореляційні зв'язки присутні у більшості реальних процесів, але не можна гарантувати, що вони є скрізь. Припущення елементарної структурної регулярності може не виконуватися. Регулярність зв'язків може мати іншу форму – як періодичне повторення зв'язків. Тобто якщо є зв'язок ii YX →−1 , то також є зв'язок  ++− → ii YX 1 . Згорнута репрезентація такої моделі має «довжину»  + , де  – довжина зв'язку з найбільшим лагом, а  – довжина періоду повторення зв'язків. Якщо розмір періоду повторення зв'язків невідомий, задача виведення моделі радикально ускладнюється. Треба багатократно переглядати схему обчислення статистик. Зв'язки з великим часовим лагом є джерелом проблем. Давайте поглянемо на існування таких зв'язків з точки зору фізичного сенсу і здорового глузду. Пояснення, що далеке минуле безпосередньо впливає на сучасне – непереконливе й неправдоподібне. Адже, строго кажучи, минулого вже не існує. Втім, цей парадокс легко розв'язується. Треба припустити, що існують ланцюги не спостережуваних змінних, через посередництво яких минуле передало інформацію і змогло здійснити вплив на змінні поточного часу. Ідентифікація ребра моделі – це виявлення безпосереднього («лаг-специфічного») зв'язку. Для ідентифікація кожного ребра доводиться виконати багато тестів умовної незалежності (знайти сепаратор). В ході пошуку сепаратора для пари iY , kiX − треба відразу відкинути всі змінні jV з індексами часу ij  . Першочергові кандидати у сепараторний набор – це змінні, можливо-суміжні до iY або kiX − , й найближчі до них. Назвемо кілька запропонованих алгоритмів виведення моделі з багатовимірних часових рядів даних. Алгоритми SVAR-FCI та SVAR-GFCI [22] є результатом адаптації методу FCI до часових рядів з прихованими змінними. Ці алгоритми припускають існування ізохронних зв'язків, але без утворення циклонів. (Циклони не утворюються, якщо впливи протягом одного інтервалу вимірювання не встигають оббігти цикл й повернутися до стартової змінної.) Алгоритм Regime-PCMCI відрізняється додатковими можливостями; він автоматично шукає фрагменти векторного ряду, які відповідають різним режимам функціонування процесу [13]. Характер (орієнтацію) деяких ребер розпізнати неможливо, особливо якщо припускаються приховані спільні причини. В таких обставинах алгоритм виведення моделі оперує кількома формами опису ребер. Ребро вигляду ZV → є каузальним. Біорієнтоване ребро WQ  показує, що існує деяка прихована змінна U , яка впливає рівночасно (паралельно) на Q та W . Ребро вигляду YX − відображає ситуацію, коли каузальний характер цього зв'язку зовсім не визначений. Ребро з частково визначеною орієнтацією ZV → резервує два варіанти (біорієнтоване, каузальне). Після ідентифікації присутності ребер моделі алгоритм переходить до етапу орієнтації ребер. Якщо змінна X йде у часі раніше, ніж Y , позначаємо це YX  . Чинне правило «фізичного сенсу»: якщо відомо, що YX  , і маємо ребро YX − , то орієнтуй YX → . Втім, замість того, щоб вставляти в алгоритм подібне правило, простіше вже на етапі виявлення безпосередніх зв'язків відразу ставити ребра вигляду YX → . Отже, при виведенні моделі з даних часових рядів всі ребра відразу отримують вістря на передньому кінці. Тому деякі стандартні правила орієнтації [6, 7], розроблені для статичних каузальних мереж, стають непотрібними. Повний набір правил працює для орієнтації ізохронних ребер. Але тут розглядаємо випадок, коли ізохронних ребра немає. Розглянемо тільки перші два правила орієнтації ребер – 0 та 1 . Оскільки завдяки відомому темпоральному порядку змінних всі ребра відразу отримують вістря ( BA → ), створюються умови для застосування правила орієнтації ребер 1 . Тому на перший погляд може здатися, що немає необхідності застосовувати правило орієнтації ребер 0 . Проте це хибна думка. Правило 0 забезпечує також розпізнавання «вістря» на задньому кінці ребер. Тим самим правило 0 розпізнає біорієнтовані ребра, а отже, виключає можливість, що цей зв'язок є каузальним. Для ситуації відомого темпорального порядку змінних правило орієнтації ребер 1 формулюється наступним чином ). Короткі автокореляційні зв’язки присутні у більшості реальних процесів, але не можна гарантувати, що вони є скрізь. Припущення елементарної структурної регулярності може не виконуватися. Регулярність зв’язків може мати іншу форму – як періодичне повторення зв’язків. Тобто якщо є зв’язок Моделі і засоби систем баз даних та знань змінних, а відтак, і зв'язків (автокореляційних та крос-кореляційних). Але зростання складності стримується іншою особливістю задачі – стандартними припущеннями про регулярність системи зв'язків. Припущення про регулярність зв'язків доповнюється припущенням про стабільність кількісних характеристик (сили зв'язків). Знання темпорального порядку змінних дозволяє впорядкувати виведення динамічних каузальних мереж (порівняно з звичайними мережами), спрощує пошук сепараторів та допомагає визначенню орієнтацій ребер. Розумно спочатку ідентифікувати «короткі» зв'язки (з малим лагом); це спростить пошук довгих зв'язків. Відкриваються можливості оптимізувати тактику пошуку сепараторів, тобто умов для тестів незалежності. Якщо найбільший лаг післядії (довжина зв'язків) – невідомий, виникає проблема, якої немає при виведенні «статичної» каузальної мережі. По-суті, в такому разі невідомим стає розмір («часова глибина») моделі. В такій ситуації треба вирішувати, коли припинити аналіз вглиб і зафіксувати розмір моделі. Просте практичне рішення – перед запуском алгоритму виведення директивно встановити максимальний лаг (вказати цифру). Більш адаптивне рішення (яке має певне теоретичне виправдання) полягає в тому, що при досягненні певних ознак «насичення» моделі робиться висновок, що знайдено справжній розмір моделі. Відтак, нарощування моделі треба припинити. Такою ознакою «насичення» моделі є той факт, що після аналізу зв'язків чергової довжини k (найбільшої на цей момент) з'ясувалося, що зв'язки такої глибини відсутні. Вказана ознака в багатьох випадках виправдана, але не завжди гарантує досягнення повної глибини автентичної моделі. Така ознака дійсно свідчить про відсутність зв'язки з лагом більше k тільки за припущення регулярності структури та за умов, що всі ряди мають достатньо сильні короткі автокореляційні зв'язки (вигляду ii XX →−1 ). Короткі автокореляційні зв'язки присутні у більшості реальних процесів, але не можна гарантувати, що вони є скрізь. Припущення елементарної структурної регулярності може не виконуватися. Регулярність зв'язків може мати іншу форму – як періодичне повторення зв'язків. Тобто якщо є зв'язок ii YX →−1 , то також є зв'язок  ++− → ii YX 1 . Згорнута репрезентація такої моделі має «довжину»  + , де  – довжина зв'язку з найбільшим лагом, а  – довжина періоду повторення зв'язків. Якщо розмір періоду повторення зв'язків невідомий, задача виведення моделі радикально ускладнюється. Треба багатократно переглядати схему обчислення статистик. Зв'язки з великим часовим лагом є джерелом проблем. Давайте поглянемо на існування таких зв'язків з точки зору фізичного сенсу і здорового глузду. Пояснення, що далеке минуле безпосередньо впливає на сучасне – непереконливе й неправдоподібне. Адже, строго кажучи, минулого вже не існує. Втім, цей парадокс легко розв'язується. Треба припустити, що існують ланцюги не спостережуваних змінних, через посередництво яких минуле передало інформацію і змогло здійснити вплив на змінні поточного часу. Ідентифікація ребра моделі – це виявлення безпосереднього («лаг-специфічного») зв'язку. Для ідентифікація кожного ребра доводиться виконати багато тестів умовної незалежності (знайти сепаратор). В ході пошуку сепаратора для пари iY , kiX − треба відразу відкинути всі змінні jV з індексами часу ij  . Першочергові кандидати у сепараторний набор – це змінні, можливо-суміжні до iY або kiX − , й найближчі до них. Назвемо кілька запропонованих алгоритмів виведення моделі з багатовимірних часових рядів даних. Алгоритми SVAR-FCI та SVAR-GFCI [22] є результатом адаптації методу FCI до часових рядів з прихованими змінними. Ці алгоритми припускають існування ізохронних зв'язків, але без утворення циклонів. (Циклони не утворюються, якщо впливи протягом одного інтервалу вимірювання не встигають оббігти цикл й повернутися до стартової змінної.) Алгоритм Regime-PCMCI відрізняється додатковими можливостями; він автоматично шукає фрагменти векторного ряду, які відповідають різним режимам функціонування процесу [13]. Характер (орієнтацію) деяких ребер розпізнати неможливо, особливо якщо припускаються приховані спільні причини. В таких обставинах алгоритм виведення моделі оперує кількома формами опису ребер. Ребро вигляду ZV → є каузальним. Біорієнтоване ребро WQ  показує, що існує деяка прихована змінна U , яка впливає рівночасно (паралельно) на Q та W . Ребро вигляду YX − відображає ситуацію, коли каузальний характер цього зв'язку зовсім не визначений. Ребро з частково визначеною орієнтацією ZV → резервує два варіанти (біорієнтоване, каузальне). Після ідентифікації присутності ребер моделі алгоритм переходить до етапу орієнтації ребер. Якщо змінна X йде у часі раніше, ніж Y , позначаємо це YX  . Чинне правило «фізичного сенсу»: якщо відомо, що YX  , і маємо ребро YX − , то орієнтуй YX → . Втім, замість того, щоб вставляти в алгоритм подібне правило, простіше вже на етапі виявлення безпосередніх зв'язків відразу ставити ребра вигляду YX → . Отже, при виведенні моделі з даних часових рядів всі ребра відразу отримують вістря на передньому кінці. Тому деякі стандартні правила орієнтації [6, 7], розроблені для статичних каузальних мереж, стають непотрібними. Повний набір правил працює для орієнтації ізохронних ребер. Але тут розглядаємо випадок, коли ізохронних ребра немає. Розглянемо тільки перші два правила орієнтації ребер – 0 та 1 . Оскільки завдяки відомому темпоральному порядку змінних всі ребра відразу отримують вістря ( BA → ), створюються умови для застосування правила орієнтації ребер 1 . Тому на перший погляд може здатися, що немає необхідності застосовувати правило орієнтації ребер 0 . Проте це хибна думка. Правило 0 забезпечує також розпізнавання «вістря» на задньому кінці ребер. Тим самим правило 0 розпізнає біорієнтовані ребра, а отже, виключає можливість, що цей зв'язок є каузальним. Для ситуації відомого темпорального порядку змінних правило орієнтації ребер 1 формулюється наступним чином , то також є зв’язок Моделі і засоби систем баз даних та знань змінних, а відтак, і зв'язків (автокореляційних та крос-кореляційних). Але зростання складності стримується іншою особливістю задачі – стандартними припущеннями про регулярність системи зв'язків. Припущення про регулярність зв'язків доповнюється припущенням про стабільність кількісних характеристик (сили зв'язків). Знання темпорального порядку змінних дозволяє впорядкувати виведення динамічних каузальних мереж (порівняно з звичайними мережами), спрощує пошук сепараторів та допомагає визначенню орієнтацій ребер. Розумно спочатку ідентифікувати «короткі» зв'язки (з малим лагом); це спростить пошук довгих зв'язків. Відкриваються можливості оптимізувати тактику пошуку сепараторів, тобто умов для тестів незалежності. Якщо найбільший лаг післядії (довжина зв'язків) – невідомий, виникає проблема, якої немає при виведенні «статичної» каузальної мережі. По-суті, в такому разі невідомим стає розмір («часова глибина») моделі. В такій ситуації треба вирішувати, коли припинити аналіз вглиб і зафіксувати розмір моделі. Просте практичне рішення – перед запуском алгоритму виведення директивно встановити максимальний лаг (вказати цифру). Більш адаптивне рішення (яке має певне теоретичне виправдання) полягає в тому, що при досягненні певних ознак «насичення» моделі робиться висновок, що знайдено справжній розмір моделі. Відтак, нарощування моделі треба припинити. Такою ознакою «насичення» моделі є той факт, що після аналізу зв'язків чергової довжини k (найбільшої на цей момент) з'ясувалося, що зв'язки такої глибини відсутні. Вказана ознака в багатьох випадках виправдана, але не завжди гарантує досягнення повної глибини автентичної моделі. Така ознака дійсно свідчить про відсутність зв'язки з лагом більше k тільки за припущення регулярності структури та за умов, що всі ряди мають достатньо сильні короткі автокореляційні зв'язки (вигляду ii XX →−1 ). Короткі автокореляційні зв'язки присутні у більшості реальних процесів, але не можна гарантувати, що вони є скрізь. Припущення елементарної структурної регулярності може не виконуватися. Регулярність зв'язків може мати іншу форму – як періодичне повторення зв'язків. Тобто якщо є зв'язок ii YX →−1 , то також є зв'язок  ++− → ii YX 1 . Згорнута репрезентація такої моделі має «довжину»  + , де  – довжина зв'язку з найбільшим лагом, а  – довжина періоду повторення зв'язків. Якщо розмір періоду повторення зв'язків невідомий, задача виведення моделі радикально ускладнюється. Треба багатократно переглядати схему обчислення статистик. Зв'язки з великим часовим лагом є джерелом проблем. Давайте поглянемо на існування таких зв'язків з точки зору фізичного сенсу і здорового глузду. Пояснення, що далеке минуле безпосередньо впливає на сучасне – непереконливе й неправдоподібне. Адже, строго кажучи, минулого вже не існує. Втім, цей парадокс легко розв'язується. Треба припустити, що існують ланцюги не спостережуваних змінних, через посередництво яких минуле передало інформацію і змогло здійснити вплив на змінні поточного часу. Ідентифікація ребра моделі – це виявлення безпосереднього («лаг-специфічного») зв'язку. Для ідентифікація кожного ребра доводиться виконати багато тестів умовної незалежності (знайти сепаратор). В ході пошуку сепаратора для пари iY , kiX − треба відразу відкинути всі змінні jV з індексами часу ij  . Першочергові кандидати у сепараторний набор – це змінні, можливо-суміжні до iY або kiX − , й найближчі до них. Назвемо кілька запропонованих алгоритмів виведення моделі з багатовимірних часових рядів даних. Алгоритми SVAR-FCI та SVAR-GFCI [22] є результатом адаптації методу FCI до часових рядів з прихованими змінними. Ці алгоритми припускають існування ізохронних зв'язків, але без утворення циклонів. (Циклони не утворюються, якщо впливи протягом одного інтервалу вимірювання не встигають оббігти цикл й повернутися до стартової змінної.) Алгоритм Regime-PCMCI відрізняється додатковими можливостями; він автоматично шукає фрагменти векторного ряду, які відповідають різним режимам функціонування процесу [13]. Характер (орієнтацію) деяких ребер розпізнати неможливо, особливо якщо припускаються приховані спільні причини. В таких обставинах алгоритм виведення моделі оперує кількома формами опису ребер. Ребро вигляду ZV → є каузальним. Біорієнтоване ребро WQ  показує, що існує деяка прихована змінна U , яка впливає рівночасно (паралельно) на Q та W . Ребро вигляду YX − відображає ситуацію, коли каузальний характер цього зв'язку зовсім не визначений. Ребро з частково визначеною орієнтацією ZV → резервує два варіанти (біорієнтоване, каузальне). Після ідентифікації присутності ребер моделі алгоритм переходить до етапу орієнтації ребер. Якщо змінна X йде у часі раніше, ніж Y , позначаємо це YX  . Чинне правило «фізичного сенсу»: якщо відомо, що YX  , і маємо ребро YX − , то орієнтуй YX → . Втім, замість того, щоб вставляти в алгоритм подібне правило, простіше вже на етапі виявлення безпосередніх зв'язків відразу ставити ребра вигляду YX → . Отже, при виведенні моделі з даних часових рядів всі ребра відразу отримують вістря на передньому кінці. Тому деякі стандартні правила орієнтації [6, 7], розроблені для статичних каузальних мереж, стають непотрібними. Повний набір правил працює для орієнтації ізохронних ребер. Але тут розглядаємо випадок, коли ізохронних ребра немає. Розглянемо тільки перші два правила орієнтації ребер – 0 та 1 . Оскільки завдяки відомому темпоральному порядку змінних всі ребра відразу отримують вістря ( BA → ), створюються умови для застосування правила орієнтації ребер 1 . Тому на перший погляд може здатися, що немає необхідності застосовувати правило орієнтації ребер 0 . Проте це хибна думка. Правило 0 забезпечує також розпізнавання «вістря» на задньому кінці ребер. Тим самим правило 0 розпізнає біорієнтовані ребра, а отже, виключає можливість, що цей зв'язок є каузальним. Для ситуації відомого темпорального порядку змінних правило орієнтації ребер 1 формулюється наступним чином . Згорнута репрезентація такої моделі має «довжину» Моделі і засоби систем баз даних та знань змінних, а відтак, і зв'язків (автокореляційних та крос-кореляційних). Але зростання складності стримується іншою особливістю задачі – стандартними припущеннями про регулярність системи зв'язків. Припущення про регулярність зв'язків доповнюється припущенням про стабільність кількісних характеристик (сили зв'язків). Знання темпорального порядку змінних дозволяє впорядкувати виведення динамічних каузальних мереж (порівняно з звичайними мережами), спрощує пошук сепараторів та допомагає визначенню орієнтацій ребер. Розумно спочатку ідентифікувати «короткі» зв'язки (з малим лагом); це спростить пошук довгих зв'язків. Відкриваються можливості оптимізувати тактику пошуку сепараторів, тобто умов для тестів незалежності. Якщо найбільший лаг післядії (довжина зв'язків) – невідомий, виникає проблема, якої немає при виведенні «статичної» каузальної мережі. По-суті, в такому разі невідомим стає розмір («часова глибина») моделі. В такій ситуації треба вирішувати, коли припинити аналіз вглиб і зафіксувати розмір моделі. Просте практичне рішення – перед запуском алгоритму виведення директивно встановити максимальний лаг (вказати цифру). Більш адаптивне рішення (яке має певне теоретичне виправдання) полягає в тому, що при досягненні певних ознак «насичення» моделі робиться висновок, що знайдено справжній розмір моделі. Відтак, нарощування моделі треба припинити. Такою ознакою «насичення» моделі є той факт, що після аналізу зв'язків чергової довжини k (найбільшої на цей момент) з'ясувалося, що зв'язки такої глибини відсутні. Вказана ознака в багатьох випадках виправдана, але не завжди гарантує досягнення повної глибини автентичної моделі. Така ознака дійсно свідчить про відсутність зв'язки з лагом більше k тільки за припущення регулярності структури та за умов, що всі ряди мають достатньо сильні короткі автокореляційні зв'язки (вигляду ii XX →−1 ). Короткі автокореляційні зв'язки присутні у більшості реальних процесів, але не можна гарантувати, що вони є скрізь. Припущення елементарної структурної регулярності може не виконуватися. Регулярність зв'язків може мати іншу форму – як періодичне повторення зв'язків. Тобто якщо є зв'язок ii YX →−1 , то також є зв'язок  ++− → ii YX 1 . Згорнута репрезентація такої моделі має «довжину»  + , де  – довжина зв'язку з найбільшим лагом, а  – довжина періоду повторення зв'язків. Якщо розмір періоду повторення зв'язків невідомий, задача виведення моделі радикально ускладнюється. Треба багатократно переглядати схему обчислення статистик. Зв'язки з великим часовим лагом є джерелом проблем. Давайте поглянемо на існування таких зв'язків з точки зору фізичного сенсу і здорового глузду. Пояснення, що далеке минуле безпосередньо впливає на сучасне – непереконливе й неправдоподібне. Адже, строго кажучи, минулого вже не існує. Втім, цей парадокс легко розв'язується. Треба припустити, що існують ланцюги не спостережуваних змінних, через посередництво яких минуле передало інформацію і змогло здійснити вплив на змінні поточного часу. Ідентифікація ребра моделі – це виявлення безпосереднього («лаг-специфічного») зв'язку. Для ідентифікація кожного ребра доводиться виконати багато тестів умовної незалежності (знайти сепаратор). В ході пошуку сепаратора для пари iY , kiX − треба відразу відкинути всі змінні jV з індексами часу ij  . Першочергові кандидати у сепараторний набор – це змінні, можливо-суміжні до iY або kiX − , й найближчі до них. Назвемо кілька запропонованих алгоритмів виведення моделі з багатовимірних часових рядів даних. Алгоритми SVAR-FCI та SVAR-GFCI [22] є результатом адаптації методу FCI до часових рядів з прихованими змінними. Ці алгоритми припускають існування ізохронних зв'язків, але без утворення циклонів. (Циклони не утворюються, якщо впливи протягом одного інтервалу вимірювання не встигають оббігти цикл й повернутися до стартової змінної.) Алгоритм Regime-PCMCI відрізняється додатковими можливостями; він автоматично шукає фрагменти векторного ряду, які відповідають різним режимам функціонування процесу [13]. Характер (орієнтацію) деяких ребер розпізнати неможливо, особливо якщо припускаються приховані спільні причини. В таких обставинах алгоритм виведення моделі оперує кількома формами опису ребер. Ребро вигляду ZV → є каузальним. Біорієнтоване ребро WQ  показує, що існує деяка прихована змінна U , яка впливає рівночасно (паралельно) на Q та W . Ребро вигляду YX − відображає ситуацію, коли каузальний характер цього зв'язку зовсім не визначений. Ребро з частково визначеною орієнтацією ZV → резервує два варіанти (біорієнтоване, каузальне). Після ідентифікації присутності ребер моделі алгоритм переходить до етапу орієнтації ребер. Якщо змінна X йде у часі раніше, ніж Y , позначаємо це YX  . Чинне правило «фізичного сенсу»: якщо відомо, що YX  , і маємо ребро YX − , то орієнтуй YX → . Втім, замість того, щоб вставляти в алгоритм подібне правило, простіше вже на етапі виявлення безпосередніх зв'язків відразу ставити ребра вигляду YX → . Отже, при виведенні моделі з даних часових рядів всі ребра відразу отримують вістря на передньому кінці. Тому деякі стандартні правила орієнтації [6, 7], розроблені для статичних каузальних мереж, стають непотрібними. Повний набір правил працює для орієнтації ізохронних ребер. Але тут розглядаємо випадок, коли ізохронних ребра немає. Розглянемо тільки перші два правила орієнтації ребер – 0 та 1 . Оскільки завдяки відомому темпоральному порядку змінних всі ребра відразу отримують вістря ( BA → ), створюються умови для застосування правила орієнтації ребер 1 . Тому на перший погляд може здатися, що немає необхідності застосовувати правило орієнтації ребер 0 . Проте це хибна думка. Правило 0 забезпечує також розпізнавання «вістря» на задньому кінці ребер. Тим самим правило 0 розпізнає біорієнтовані ребра, а отже, виключає можливість, що цей зв'язок є каузальним. Для ситуації відомого темпорального порядку змінних правило орієнтації ребер 1 формулюється наступним чином – довжина зв’язку з найбільшим лагом, а Моделі і засоби систем баз даних та знань змінних, а відтак, і зв'язків (автокореляційних та крос-кореляційних). Але зростання складності стримується іншою особливістю задачі – стандартними припущеннями про регулярність системи зв'язків. Припущення про регулярність зв'язків доповнюється припущенням про стабільність кількісних характеристик (сили зв'язків). Знання темпорального порядку змінних дозволяє впорядкувати виведення динамічних каузальних мереж (порівняно з звичайними мережами), спрощує пошук сепараторів та допомагає визначенню орієнтацій ребер. Розумно спочатку ідентифікувати «короткі» зв'язки (з малим лагом); це спростить пошук довгих зв'язків. Відкриваються можливості оптимізувати тактику пошуку сепараторів, тобто умов для тестів незалежності. Якщо найбільший лаг післядії (довжина зв'язків) – невідомий, виникає проблема, якої немає при виведенні «статичної» каузальної мережі. По-суті, в такому разі невідомим стає розмір («часова глибина») моделі. В такій ситуації треба вирішувати, коли припинити аналіз вглиб і зафіксувати розмір моделі. Просте практичне рішення – перед запуском алгоритму виведення директивно встановити максимальний лаг (вказати цифру). Більш адаптивне рішення (яке має певне теоретичне виправдання) полягає в тому, що при досягненні певних ознак «насичення» моделі робиться висновок, що знайдено справжній розмір моделі. Відтак, нарощування моделі треба припинити. Такою ознакою «насичення» моделі є той факт, що після аналізу зв'язків чергової довжини k (найбільшої на цей момент) з'ясувалося, що зв'язки такої глибини відсутні. Вказана ознака в багатьох випадках виправдана, але не завжди гарантує досягнення повної глибини автентичної моделі. Така ознака дійсно свідчить про відсутність зв'язки з лагом більше k тільки за припущення регулярності структури та за умов, що всі ряди мають достатньо сильні короткі автокореляційні зв'язки (вигляду ii XX →−1 ). Короткі автокореляційні зв'язки присутні у більшості реальних процесів, але не можна гарантувати, що вони є скрізь. Припущення елементарної структурної регулярності може не виконуватися. Регулярність зв'язків може мати іншу форму – як періодичне повторення зв'язків. Тобто якщо є зв'язок ii YX →−1 , то також є зв'язок  ++− → ii YX 1 . Згорнута репрезентація такої моделі має «довжину»  + , де  – довжина зв'язку з найбільшим лагом, а  – довжина періоду повторення зв'язків. Якщо розмір періоду повторення зв'язків невідомий, задача виведення моделі радикально ускладнюється. Треба багатократно переглядати схему обчислення статистик. Зв'язки з великим часовим лагом є джерелом проблем. Давайте поглянемо на існування таких зв'язків з точки зору фізичного сенсу і здорового глузду. Пояснення, що далеке минуле безпосередньо впливає на сучасне – непереконливе й неправдоподібне. Адже, строго кажучи, минулого вже не існує. Втім, цей парадокс легко розв'язується. Треба припустити, що існують ланцюги не спостережуваних змінних, через посередництво яких минуле передало інформацію і змогло здійснити вплив на змінні поточного часу. Ідентифікація ребра моделі – це виявлення безпосереднього («лаг-специфічного») зв'язку. Для ідентифікація кожного ребра доводиться виконати багато тестів умовної незалежності (знайти сепаратор). В ході пошуку сепаратора для пари iY , kiX − треба відразу відкинути всі змінні jV з індексами часу ij  . Першочергові кандидати у сепараторний набор – це змінні, можливо-суміжні до iY або kiX − , й найближчі до них. Назвемо кілька запропонованих алгоритмів виведення моделі з багатовимірних часових рядів даних. Алгоритми SVAR-FCI та SVAR-GFCI [22] є результатом адаптації методу FCI до часових рядів з прихованими змінними. Ці алгоритми припускають існування ізохронних зв'язків, але без утворення циклонів. (Циклони не утворюються, якщо впливи протягом одного інтервалу вимірювання не встигають оббігти цикл й повернутися до стартової змінної.) Алгоритм Regime-PCMCI відрізняється додатковими можливостями; він автоматично шукає фрагменти векторного ряду, які відповідають різним режимам функціонування процесу [13]. Характер (орієнтацію) деяких ребер розпізнати неможливо, особливо якщо припускаються приховані спільні причини. В таких обставинах алгоритм виведення моделі оперує кількома формами опису ребер. Ребро вигляду ZV → є каузальним. Біорієнтоване ребро WQ  показує, що існує деяка прихована змінна U , яка впливає рівночасно (паралельно) на Q та W . Ребро вигляду YX − відображає ситуацію, коли каузальний характер цього зв'язку зовсім не визначений. Ребро з частково визначеною орієнтацією ZV → резервує два варіанти (біорієнтоване, каузальне). Після ідентифікації присутності ребер моделі алгоритм переходить до етапу орієнтації ребер. Якщо змінна X йде у часі раніше, ніж Y , позначаємо це YX  . Чинне правило «фізичного сенсу»: якщо відомо, що YX  , і маємо ребро YX − , то орієнтуй YX → . Втім, замість того, щоб вставляти в алгоритм подібне правило, простіше вже на етапі виявлення безпосередніх зв'язків відразу ставити ребра вигляду YX → . Отже, при виведенні моделі з даних часових рядів всі ребра відразу отримують вістря на передньому кінці. Тому деякі стандартні правила орієнтації [6, 7], розроблені для статичних каузальних мереж, стають непотрібними. Повний набір правил працює для орієнтації ізохронних ребер. Але тут розглядаємо випадок, коли ізохронних ребра немає. Розглянемо тільки перші два правила орієнтації ребер – 0 та 1 . Оскільки завдяки відомому темпоральному порядку змінних всі ребра відразу отримують вістря ( BA → ), створюються умови для застосування правила орієнтації ребер 1 . Тому на перший погляд може здатися, що немає необхідності застосовувати правило орієнтації ребер 0 . Проте це хибна думка. Правило 0 забезпечує також розпізнавання «вістря» на задньому кінці ребер. Тим самим правило 0 розпізнає біорієнтовані ребра, а отже, виключає можливість, що цей зв'язок є каузальним. Для ситуації відомого темпорального порядку змінних правило орієнтації ребер 1 формулюється наступним чином – довжина періоду повторення зв’язків. Якщо розмір періоду повторення зв’язків невідомий, задача виведення моделі радикально ускладнюється. Треба багатократно переглядати схему обчислення статистик. Зв’язки з великим часовим лагом є джерелом проблем. Давайте поглянемо на існування таких зв’язків з точки зору фізичного сенсу і здорового глузду. Пояснення, що далеке минуле безпосередньо впливає на сучас- не – непереконливе й неправдоподібне. Адже, строго кажучи, минулого вже не існує. Втім, цей парадокс легко 192 Моделі і засоби систем баз даних та знань розв’язується. Треба припустити, що існують ланцюги не спостережуваних змінних, через посередництво яких минуле передало інформацію і змогло здійснити вплив на змінні поточного часу. Ідентифікація ребра моделі – це виявлення безпосереднього («лаг-специфічного») зв’язку. Для іден- тифікація кожного ребра доводиться виконати багато тестів умовної незалежності (знайти сепаратор). В ході пошуку сепаратора для пари Моделі і засоби систем баз даних та знань змінних, а відтак, і зв'язків (автокореляційних та крос-кореляційних). Але зростання складності стримується іншою особливістю задачі – стандартними припущеннями про регулярність системи зв'язків. Припущення про регулярність зв'язків доповнюється припущенням про стабільність кількісних характеристик (сили зв'язків). Знання темпорального порядку змінних дозволяє впорядкувати виведення динамічних каузальних мереж (порівняно з звичайними мережами), спрощує пошук сепараторів та допомагає визначенню орієнтацій ребер. Розумно спочатку ідентифікувати «короткі» зв'язки (з малим лагом); це спростить пошук довгих зв'язків. Відкриваються можливості оптимізувати тактику пошуку сепараторів, тобто умов для тестів незалежності. Якщо найбільший лаг післядії (довжина зв'язків) – невідомий, виникає проблема, якої немає при виведенні «статичної» каузальної мережі. По-суті, в такому разі невідомим стає розмір («часова глибина») моделі. В такій ситуації треба вирішувати, коли припинити аналіз вглиб і зафіксувати розмір моделі. Просте практичне рішення – перед запуском алгоритму виведення директивно встановити максимальний лаг (вказати цифру). Більш адаптивне рішення (яке має певне теоретичне виправдання) полягає в тому, що при досягненні певних ознак «насичення» моделі робиться висновок, що знайдено справжній розмір моделі. Відтак, нарощування моделі треба припинити. Такою ознакою «насичення» моделі є той факт, що після аналізу зв'язків чергової довжини k (найбільшої на цей момент) з'ясувалося, що зв'язки такої глибини відсутні. Вказана ознака в багатьох випадках виправдана, але не завжди гарантує досягнення повної глибини автентичної моделі. Така ознака дійсно свідчить про відсутність зв'язки з лагом більше k тільки за припущення регулярності структури та за умов, що всі ряди мають достатньо сильні короткі автокореляційні зв'язки (вигляду ii XX →−1 ). Короткі автокореляційні зв'язки присутні у більшості реальних процесів, але не можна гарантувати, що вони є скрізь. Припущення елементарної структурної регулярності може не виконуватися. Регулярність зв'язків може мати іншу форму – як періодичне повторення зв'язків. Тобто якщо є зв'язок ii YX →−1 , то також є зв'язок  ++− → ii YX 1 . Згорнута репрезентація такої моделі має «довжину»  + , де  – довжина зв'язку з найбільшим лагом, а  – довжина періоду повторення зв'язків. Якщо розмір періоду повторення зв'язків невідомий, задача виведення моделі радикально ускладнюється. Треба багатократно переглядати схему обчислення статистик. Зв'язки з великим часовим лагом є джерелом проблем. Давайте поглянемо на існування таких зв'язків з точки зору фізичного сенсу і здорового глузду. Пояснення, що далеке минуле безпосередньо впливає на сучасне – непереконливе й неправдоподібне. Адже, строго кажучи, минулого вже не існує. Втім, цей парадокс легко розв'язується. Треба припустити, що існують ланцюги не спостережуваних змінних, через посередництво яких минуле передало інформацію і змогло здійснити вплив на змінні поточного часу. Ідентифікація ребра моделі – це виявлення безпосереднього («лаг-специфічного») зв'язку. Для ідентифікація кожного ребра доводиться виконати багато тестів умовної незалежності (знайти сепаратор). В ході пошуку сепаратора для пари iY , kiX − треба відразу відкинути всі змінні jV з індексами часу ij  . Першочергові кандидати у сепараторний набор – це змінні, можливо-суміжні до iY або kiX − , й найближчі до них. Назвемо кілька запропонованих алгоритмів виведення моделі з багатовимірних часових рядів даних. Алгоритми SVAR-FCI та SVAR-GFCI [22] є результатом адаптації методу FCI до часових рядів з прихованими змінними. Ці алгоритми припускають існування ізохронних зв'язків, але без утворення циклонів. (Циклони не утворюються, якщо впливи протягом одного інтервалу вимірювання не встигають оббігти цикл й повернутися до стартової змінної.) Алгоритм Regime-PCMCI відрізняється додатковими можливостями; він автоматично шукає фрагменти векторного ряду, які відповідають різним режимам функціонування процесу [13]. Характер (орієнтацію) деяких ребер розпізнати неможливо, особливо якщо припускаються приховані спільні причини. В таких обставинах алгоритм виведення моделі оперує кількома формами опису ребер. Ребро вигляду ZV → є каузальним. Біорієнтоване ребро WQ  показує, що існує деяка прихована змінна U , яка впливає рівночасно (паралельно) на Q та W . Ребро вигляду YX − відображає ситуацію, коли каузальний характер цього зв'язку зовсім не визначений. Ребро з частково визначеною орієнтацією ZV → резервує два варіанти (біорієнтоване, каузальне). Після ідентифікації присутності ребер моделі алгоритм переходить до етапу орієнтації ребер. Якщо змінна X йде у часі раніше, ніж Y , позначаємо це YX  . Чинне правило «фізичного сенсу»: якщо відомо, що YX  , і маємо ребро YX − , то орієнтуй YX → . Втім, замість того, щоб вставляти в алгоритм подібне правило, простіше вже на етапі виявлення безпосередніх зв'язків відразу ставити ребра вигляду YX → . Отже, при виведенні моделі з даних часових рядів всі ребра відразу отримують вістря на передньому кінці. Тому деякі стандартні правила орієнтації [6, 7], розроблені для статичних каузальних мереж, стають непотрібними. Повний набір правил працює для орієнтації ізохронних ребер. Але тут розглядаємо випадок, коли ізохронних ребра немає. Розглянемо тільки перші два правила орієнтації ребер – 0 та 1 . Оскільки завдяки відомому темпоральному порядку змінних всі ребра відразу отримують вістря ( BA → ), створюються умови для застосування правила орієнтації ребер 1 . Тому на перший погляд може здатися, що немає необхідності застосовувати правило орієнтації ребер 0 . Проте це хибна думка. Правило 0 забезпечує також розпізнавання «вістря» на задньому кінці ребер. Тим самим правило 0 розпізнає біорієнтовані ребра, а отже, виключає можливість, що цей зв'язок є каузальним. Для ситуації відомого темпорального порядку змінних правило орієнтації ребер 1 формулюється наступним чином треба відразу відкинути всі змінні Моделі і засоби систем баз даних та знань змінних, а відтак, і зв'язків (автокореляційних та крос-кореляційних). Але зростання складності стримується іншою особливістю задачі – стандартними припущеннями про регулярність системи зв'язків. Припущення про регулярність зв'язків доповнюється припущенням про стабільність кількісних характеристик (сили зв'язків). Знання темпорального порядку змінних дозволяє впорядкувати виведення динамічних каузальних мереж (порівняно з звичайними мережами), спрощує пошук сепараторів та допомагає визначенню орієнтацій ребер. Розумно спочатку ідентифікувати «короткі» зв'язки (з малим лагом); це спростить пошук довгих зв'язків. Відкриваються можливості оптимізувати тактику пошуку сепараторів, тобто умов для тестів незалежності. Якщо найбільший лаг післядії (довжина зв'язків) – невідомий, виникає проблема, якої немає при виведенні «статичної» каузальної мережі. По-суті, в такому разі невідомим стає розмір («часова глибина») моделі. В такій ситуації треба вирішувати, коли припинити аналіз вглиб і зафіксувати розмір моделі. Просте практичне рішення – перед запуском алгоритму виведення директивно встановити максимальний лаг (вказати цифру). Більш адаптивне рішення (яке має певне теоретичне виправдання) полягає в тому, що при досягненні певних ознак «насичення» моделі робиться висновок, що знайдено справжній розмір моделі. Відтак, нарощування моделі треба припинити. Такою ознакою «насичення» моделі є той факт, що після аналізу зв'язків чергової довжини k (найбільшої на цей момент) з'ясувалося, що зв'язки такої глибини відсутні. Вказана ознака в багатьох випадках виправдана, але не завжди гарантує досягнення повної глибини автентичної моделі. Така ознака дійсно свідчить про відсутність зв'язки з лагом більше k тільки за припущення регулярності структури та за умов, що всі ряди мають достатньо сильні короткі автокореляційні зв'язки (вигляду ii XX →−1 ). Короткі автокореляційні зв'язки присутні у більшості реальних процесів, але не можна гарантувати, що вони є скрізь. Припущення елементарної структурної регулярності може не виконуватися. Регулярність зв'язків може мати іншу форму – як періодичне повторення зв'язків. Тобто якщо є зв'язок ii YX →−1 , то також є зв'язок  ++− → ii YX 1 . Згорнута репрезентація такої моделі має «довжину»  + , де  – довжина зв'язку з найбільшим лагом, а  – довжина періоду повторення зв'язків. Якщо розмір періоду повторення зв'язків невідомий, задача виведення моделі радикально ускладнюється. Треба багатократно переглядати схему обчислення статистик. Зв'язки з великим часовим лагом є джерелом проблем. Давайте поглянемо на існування таких зв'язків з точки зору фізичного сенсу і здорового глузду. Пояснення, що далеке минуле безпосередньо впливає на сучасне – непереконливе й неправдоподібне. Адже, строго кажучи, минулого вже не існує. Втім, цей парадокс легко розв'язується. Треба припустити, що існують ланцюги не спостережуваних змінних, через посередництво яких минуле передало інформацію і змогло здійснити вплив на змінні поточного часу. Ідентифікація ребра моделі – це виявлення безпосереднього («лаг-специфічного») зв'язку. Для ідентифікація кожного ребра доводиться виконати багато тестів умовної незалежності (знайти сепаратор). В ході пошуку сепаратора для пари iY , kiX − треба відразу відкинути всі змінні jV з індексами часу ij  . Першочергові кандидати у сепараторний набор – це змінні, можливо-суміжні до iY або kiX − , й найближчі до них. Назвемо кілька запропонованих алгоритмів виведення моделі з багатовимірних часових рядів даних. Алгоритми SVAR-FCI та SVAR-GFCI [22] є результатом адаптації методу FCI до часових рядів з прихованими змінними. Ці алгоритми припускають існування ізохронних зв'язків, але без утворення циклонів. (Циклони не утворюються, якщо впливи протягом одного інтервалу вимірювання не встигають оббігти цикл й повернутися до стартової змінної.) Алгоритм Regime-PCMCI відрізняється додатковими можливостями; він автоматично шукає фрагменти векторного ряду, які відповідають різним режимам функціонування процесу [13]. Характер (орієнтацію) деяких ребер розпізнати неможливо, особливо якщо припускаються приховані спільні причини. В таких обставинах алгоритм виведення моделі оперує кількома формами опису ребер. Ребро вигляду ZV → є каузальним. Біорієнтоване ребро WQ  показує, що існує деяка прихована змінна U , яка впливає рівночасно (паралельно) на Q та W . Ребро вигляду YX − відображає ситуацію, коли каузальний характер цього зв'язку зовсім не визначений. Ребро з частково визначеною орієнтацією ZV → резервує два варіанти (біорієнтоване, каузальне). Після ідентифікації присутності ребер моделі алгоритм переходить до етапу орієнтації ребер. Якщо змінна X йде у часі раніше, ніж Y , позначаємо це YX  . Чинне правило «фізичного сенсу»: якщо відомо, що YX  , і маємо ребро YX − , то орієнтуй YX → . Втім, замість того, щоб вставляти в алгоритм подібне правило, простіше вже на етапі виявлення безпосередніх зв'язків відразу ставити ребра вигляду YX → . Отже, при виведенні моделі з даних часових рядів всі ребра відразу отримують вістря на передньому кінці. Тому деякі стандартні правила орієнтації [6, 7], розроблені для статичних каузальних мереж, стають непотрібними. Повний набір правил працює для орієнтації ізохронних ребер. Але тут розглядаємо випадок, коли ізохронних ребра немає. Розглянемо тільки перші два правила орієнтації ребер – 0 та 1 . Оскільки завдяки відомому темпоральному порядку змінних всі ребра відразу отримують вістря ( BA → ), створюються умови для застосування правила орієнтації ребер 1 . Тому на перший погляд може здатися, що немає необхідності застосовувати правило орієнтації ребер 0 . Проте це хибна думка. Правило 0 забезпечує також розпізнавання «вістря» на задньому кінці ребер. Тим самим правило 0 розпізнає біорієнтовані ребра, а отже, виключає можливість, що цей зв'язок є каузальним. Для ситуації відомого темпорального порядку змінних правило орієнтації ребер 1 формулюється наступним чином з індексами часу Моделі і засоби систем баз даних та знань змінних, а відтак, і зв'язків (автокореляційних та крос-кореляційних). Але зростання складності стримується іншою особливістю задачі – стандартними припущеннями про регулярність системи зв'язків. Припущення про регулярність зв'язків доповнюється припущенням про стабільність кількісних характеристик (сили зв'язків). Знання темпорального порядку змінних дозволяє впорядкувати виведення динамічних каузальних мереж (порівняно з звичайними мережами), спрощує пошук сепараторів та допомагає визначенню орієнтацій ребер. Розумно спочатку ідентифікувати «короткі» зв'язки (з малим лагом); це спростить пошук довгих зв'язків. Відкриваються можливості оптимізувати тактику пошуку сепараторів, тобто умов для тестів незалежності. Якщо найбільший лаг післядії (довжина зв'язків) – невідомий, виникає проблема, якої немає при виведенні «статичної» каузальної мережі. По-суті, в такому разі невідомим стає розмір («часова глибина») моделі. В такій ситуації треба вирішувати, коли припинити аналіз вглиб і зафіксувати розмір моделі. Просте практичне рішення – перед запуском алгоритму виведення директивно встановити максимальний лаг (вказати цифру). Більш адаптивне рішення (яке має певне теоретичне виправдання) полягає в тому, що при досягненні певних ознак «насичення» моделі робиться висновок, що знайдено справжній розмір моделі. Відтак, нарощування моделі треба припинити. Такою ознакою «насичення» моделі є той факт, що після аналізу зв'язків чергової довжини k (найбільшої на цей момент) з'ясувалося, що зв'язки такої глибини відсутні. Вказана ознака в багатьох випадках виправдана, але не завжди гарантує досягнення повної глибини автентичної моделі. Така ознака дійсно свідчить про відсутність зв'язки з лагом більше k тільки за припущення регулярності структури та за умов, що всі ряди мають достатньо сильні короткі автокореляційні зв'язки (вигляду ii XX →−1 ). Короткі автокореляційні зв'язки присутні у більшості реальних процесів, але не можна гарантувати, що вони є скрізь. Припущення елементарної структурної регулярності може не виконуватися. Регулярність зв'язків може мати іншу форму – як періодичне повторення зв'язків. Тобто якщо є зв'язок ii YX →−1 , то також є зв'язок  ++− → ii YX 1 . Згорнута репрезентація такої моделі має «довжину»  + , де  – довжина зв'язку з найбільшим лагом, а  – довжина періоду повторення зв'язків. Якщо розмір періоду повторення зв'язків невідомий, задача виведення моделі радикально ускладнюється. Треба багатократно переглядати схему обчислення статистик. Зв'язки з великим часовим лагом є джерелом проблем. Давайте поглянемо на існування таких зв'язків з точки зору фізичного сенсу і здорового глузду. Пояснення, що далеке минуле безпосередньо впливає на сучасне – непереконливе й неправдоподібне. Адже, строго кажучи, минулого вже не існує. Втім, цей парадокс легко розв'язується. Треба припустити, що існують ланцюги не спостережуваних змінних, через посередництво яких минуле передало інформацію і змогло здійснити вплив на змінні поточного часу. Ідентифікація ребра моделі – це виявлення безпосереднього («лаг-специфічного») зв'язку. Для ідентифікація кожного ребра доводиться виконати багато тестів умовної незалежності (знайти сепаратор). В ході пошуку сепаратора для пари iY , kiX − треба відразу відкинути всі змінні jV з індексами часу ij  . Першочергові кандидати у сепараторний набор – це змінні, можливо-суміжні до iY або kiX − , й найближчі до них. Назвемо кілька запропонованих алгоритмів виведення моделі з багатовимірних часових рядів даних. Алгоритми SVAR-FCI та SVAR-GFCI [22] є результатом адаптації методу FCI до часових рядів з прихованими змінними. Ці алгоритми припускають існування ізохронних зв'язків, але без утворення циклонів. (Циклони не утворюються, якщо впливи протягом одного інтервалу вимірювання не встигають оббігти цикл й повернутися до стартової змінної.) Алгоритм Regime-PCMCI відрізняється додатковими можливостями; він автоматично шукає фрагменти векторного ряду, які відповідають різним режимам функціонування процесу [13]. Характер (орієнтацію) деяких ребер розпізнати неможливо, особливо якщо припускаються приховані спільні причини. В таких обставинах алгоритм виведення моделі оперує кількома формами опису ребер. Ребро вигляду ZV → є каузальним. Біорієнтоване ребро WQ  показує, що існує деяка прихована змінна U , яка впливає рівночасно (паралельно) на Q та W . Ребро вигляду YX − відображає ситуацію, коли каузальний характер цього зв'язку зовсім не визначений. Ребро з частково визначеною орієнтацією ZV → резервує два варіанти (біорієнтоване, каузальне). Після ідентифікації присутності ребер моделі алгоритм переходить до етапу орієнтації ребер. Якщо змінна X йде у часі раніше, ніж Y , позначаємо це YX  . Чинне правило «фізичного сенсу»: якщо відомо, що YX  , і маємо ребро YX − , то орієнтуй YX → . Втім, замість того, щоб вставляти в алгоритм подібне правило, простіше вже на етапі виявлення безпосередніх зв'язків відразу ставити ребра вигляду YX → . Отже, при виведенні моделі з даних часових рядів всі ребра відразу отримують вістря на передньому кінці. Тому деякі стандартні правила орієнтації [6, 7], розроблені для статичних каузальних мереж, стають непотрібними. Повний набір правил працює для орієнтації ізохронних ребер. Але тут розглядаємо випадок, коли ізохронних ребра немає. Розглянемо тільки перші два правила орієнтації ребер – 0 та 1 . Оскільки завдяки відомому темпоральному порядку змінних всі ребра відразу отримують вістря ( BA → ), створюються умови для застосування правила орієнтації ребер 1 . Тому на перший погляд може здатися, що немає необхідності застосовувати правило орієнтації ребер 0 . Проте це хибна думка. Правило 0 забезпечує також розпізнавання «вістря» на задньому кінці ребер. Тим самим правило 0 розпізнає біорієнтовані ребра, а отже, виключає можливість, що цей зв'язок є каузальним. Для ситуації відомого темпорального порядку змінних правило орієнтації ребер 1 формулюється наступним чином . Першочергові кандидати у сепараторний набор – це змінні, можливо-суміжні до Моделі і засоби систем баз даних та знань змінних, а відтак, і зв'язків (автокореляційних та крос-кореляційних). Але зростання складності стримується іншою особливістю задачі – стандартними припущеннями про регулярність системи зв'язків. Припущення про регулярність зв'язків доповнюється припущенням про стабільність кількісних характеристик (сили зв'язків). Знання темпорального порядку змінних дозволяє впорядкувати виведення динамічних каузальних мереж (порівняно з звичайними мережами), спрощує пошук сепараторів та допомагає визначенню орієнтацій ребер. Розумно спочатку ідентифікувати «короткі» зв'язки (з малим лагом); це спростить пошук довгих зв'язків. Відкриваються можливості оптимізувати тактику пошуку сепараторів, тобто умов для тестів незалежності. Якщо найбільший лаг післядії (довжина зв'язків) – невідомий, виникає проблема, якої немає при виведенні «статичної» каузальної мережі. По-суті, в такому разі невідомим стає розмір («часова глибина») моделі. В такій ситуації треба вирішувати, коли припинити аналіз вглиб і зафіксувати розмір моделі. Просте практичне рішення – перед запуском алгоритму виведення директивно встановити максимальний лаг (вказати цифру). Більш адаптивне рішення (яке має певне теоретичне виправдання) полягає в тому, що при досягненні певних ознак «насичення» моделі робиться висновок, що знайдено справжній розмір моделі. Відтак, нарощування моделі треба припинити. Такою ознакою «насичення» моделі є той факт, що після аналізу зв'язків чергової довжини k (найбільшої на цей момент) з'ясувалося, що зв'язки такої глибини відсутні. Вказана ознака в багатьох випадках виправдана, але не завжди гарантує досягнення повної глибини автентичної моделі. Така ознака дійсно свідчить про відсутність зв'язки з лагом більше k тільки за припущення регулярності структури та за умов, що всі ряди мають достатньо сильні короткі автокореляційні зв'язки (вигляду ii XX →−1 ). Короткі автокореляційні зв'язки присутні у більшості реальних процесів, але не можна гарантувати, що вони є скрізь. Припущення елементарної структурної регулярності може не виконуватися. Регулярність зв'язків може мати іншу форму – як періодичне повторення зв'язків. Тобто якщо є зв'язок ii YX →−1 , то також є зв'язок  ++− → ii YX 1 . Згорнута репрезентація такої моделі має «довжину»  + , де  – довжина зв'язку з найбільшим лагом, а  – довжина періоду повторення зв'язків. Якщо розмір періоду повторення зв'язків невідомий, задача виведення моделі радикально ускладнюється. Треба багатократно переглядати схему обчислення статистик. Зв'язки з великим часовим лагом є джерелом проблем. Давайте поглянемо на існування таких зв'язків з точки зору фізичного сенсу і здорового глузду. Пояснення, що далеке минуле безпосередньо впливає на сучасне – непереконливе й неправдоподібне. Адже, строго кажучи, минулого вже не існує. Втім, цей парадокс легко розв'язується. Треба припустити, що існують ланцюги не спостережуваних змінних, через посередництво яких минуле передало інформацію і змогло здійснити вплив на змінні поточного часу. Ідентифікація ребра моделі – це виявлення безпосереднього («лаг-специфічного») зв'язку. Для ідентифікація кожного ребра доводиться виконати багато тестів умовної незалежності (знайти сепаратор). В ході пошуку сепаратора для пари iY , kiX − треба відразу відкинути всі змінні jV з індексами часу ij  . Першочергові кандидати у сепараторний набор – це змінні, можливо-суміжні до iY або kiX − , й найближчі до них. Назвемо кілька запропонованих алгоритмів виведення моделі з багатовимірних часових рядів даних. Алгоритми SVAR-FCI та SVAR-GFCI [22] є результатом адаптації методу FCI до часових рядів з прихованими змінними. Ці алгоритми припускають існування ізохронних зв'язків, але без утворення циклонів. (Циклони не утворюються, якщо впливи протягом одного інтервалу вимірювання не встигають оббігти цикл й повернутися до стартової змінної.) Алгоритм Regime-PCMCI відрізняється додатковими можливостями; він автоматично шукає фрагменти векторного ряду, які відповідають різним режимам функціонування процесу [13]. Характер (орієнтацію) деяких ребер розпізнати неможливо, особливо якщо припускаються приховані спільні причини. В таких обставинах алгоритм виведення моделі оперує кількома формами опису ребер. Ребро вигляду ZV → є каузальним. Біорієнтоване ребро WQ  показує, що існує деяка прихована змінна U , яка впливає рівночасно (паралельно) на Q та W . Ребро вигляду YX − відображає ситуацію, коли каузальний характер цього зв'язку зовсім не визначений. Ребро з частково визначеною орієнтацією ZV → резервує два варіанти (біорієнтоване, каузальне). Після ідентифікації присутності ребер моделі алгоритм переходить до етапу орієнтації ребер. Якщо змінна X йде у часі раніше, ніж Y , позначаємо це YX  . Чинне правило «фізичного сенсу»: якщо відомо, що YX  , і маємо ребро YX − , то орієнтуй YX → . Втім, замість того, щоб вставляти в алгоритм подібне правило, простіше вже на етапі виявлення безпосередніх зв'язків відразу ставити ребра вигляду YX → . Отже, при виведенні моделі з даних часових рядів всі ребра відразу отримують вістря на передньому кінці. Тому деякі стандартні правила орієнтації [6, 7], розроблені для статичних каузальних мереж, стають непотрібними. Повний набір правил працює для орієнтації ізохронних ребер. Але тут розглядаємо випадок, коли ізохронних ребра немає. Розглянемо тільки перші два правила орієнтації ребер – 0 та 1 . Оскільки завдяки відомому темпоральному порядку змінних всі ребра відразу отримують вістря ( BA → ), створюються умови для застосування правила орієнтації ребер 1 . Тому на перший погляд може здатися, що немає необхідності застосовувати правило орієнтації ребер 0 . Проте це хибна думка. Правило 0 забезпечує також розпізнавання «вістря» на задньому кінці ребер. Тим самим правило 0 розпізнає біорієнтовані ребра, а отже, виключає можливість, що цей зв'язок є каузальним. Для ситуації відомого темпорального порядку змінних правило орієнтації ребер 1 формулюється наступним чином , й найближчі до них. Назвемо кілька запропонованих алгоритмів виведення моделі з багатовимірних часових рядів даних. Алгоритми SVAR- FCI та SVAR-GFCI [22] є результатом адаптації методу FCI до часових рядів з прихованими змінними. Ці ал- горитми припускають існування ізохронних зв’язків, але без утворення циклонів. (Циклони не утворюються, якщо впливи протягом одного інтервалу вимірювання не встигають оббігти цикл й повернутися до стартової змінної.) Алгоритм Regime-PCMCI відрізняється додатковими можливостями; він автоматично шукає фрагмен- ти векторного ряду, які відповідають різним режимам функціонування процесу [13]. Характер (орієнтацію) деяких ребер розпізнати неможливо, особливо якщо припускаються прихова- ні спільні причини. В таких обставинах алгоритм виведення моделі оперує кількома формами опису ребер. Ребро вигляду Моделі і засоби систем баз даних та знань змінних, а відтак, і зв'язків (автокореляційних та крос-кореляційних). Але зростання складності стримується іншою особливістю задачі – стандартними припущеннями про регулярність системи зв'язків. Припущення про регулярність зв'язків доповнюється припущенням про стабільність кількісних характеристик (сили зв'язків). Знання темпорального порядку змінних дозволяє впорядкувати виведення динамічних каузальних мереж (порівняно з звичайними мережами), спрощує пошук сепараторів та допомагає визначенню орієнтацій ребер. Розумно спочатку ідентифікувати «короткі» зв'язки (з малим лагом); це спростить пошук довгих зв'язків. Відкриваються можливості оптимізувати тактику пошуку сепараторів, тобто умов для тестів незалежності. Якщо найбільший лаг післядії (довжина зв'язків) – невідомий, виникає проблема, якої немає при виведенні «статичної» каузальної мережі. По-суті, в такому разі невідомим стає розмір («часова глибина») моделі. В такій ситуації треба вирішувати, коли припинити аналіз вглиб і зафіксувати розмір моделі. Просте практичне рішення – перед запуском алгоритму виведення директивно встановити максимальний лаг (вказати цифру). Більш адаптивне рішення (яке має певне теоретичне виправдання) полягає в тому, що при досягненні певних ознак «насичення» моделі робиться висновок, що знайдено справжній розмір моделі. Відтак, нарощування моделі треба припинити. Такою ознакою «насичення» моделі є той факт, що після аналізу зв'язків чергової довжини k (найбільшої на цей момент) з'ясувалося, що зв'язки такої глибини відсутні. Вказана ознака в багатьох випадках виправдана, але не завжди гарантує досягнення повної глибини автентичної моделі. Така ознака дійсно свідчить про відсутність зв'язки з лагом більше k тільки за припущення регулярності структури та за умов, що всі ряди мають достатньо сильні короткі автокореляційні зв'язки (вигляду ii XX →−1 ). Короткі автокореляційні зв'язки присутні у більшості реальних процесів, але не можна гарантувати, що вони є скрізь. Припущення елементарної структурної регулярності може не виконуватися. Регулярність зв'язків може мати іншу форму – як періодичне повторення зв'язків. Тобто якщо є зв'язок ii YX →−1 , то також є зв'язок  ++− → ii YX 1 . Згорнута репрезентація такої моделі має «довжину»  + , де  – довжина зв'язку з найбільшим лагом, а  – довжина періоду повторення зв'язків. Якщо розмір періоду повторення зв'язків невідомий, задача виведення моделі радикально ускладнюється. Треба багатократно переглядати схему обчислення статистик. Зв'язки з великим часовим лагом є джерелом проблем. Давайте поглянемо на існування таких зв'язків з точки зору фізичного сенсу і здорового глузду. Пояснення, що далеке минуле безпосередньо впливає на сучасне – непереконливе й неправдоподібне. Адже, строго кажучи, минулого вже не існує. Втім, цей парадокс легко розв'язується. Треба припустити, що існують ланцюги не спостережуваних змінних, через посередництво яких минуле передало інформацію і змогло здійснити вплив на змінні поточного часу. Ідентифікація ребра моделі – це виявлення безпосереднього («лаг-специфічного») зв'язку. Для ідентифікація кожного ребра доводиться виконати багато тестів умовної незалежності (знайти сепаратор). В ході пошуку сепаратора для пари iY , kiX − треба відразу відкинути всі змінні jV з індексами часу ij  . Першочергові кандидати у сепараторний набор – це змінні, можливо-суміжні до iY або kiX − , й найближчі до них. Назвемо кілька запропонованих алгоритмів виведення моделі з багатовимірних часових рядів даних. Алгоритми SVAR-FCI та SVAR-GFCI [22] є результатом адаптації методу FCI до часових рядів з прихованими змінними. Ці алгоритми припускають існування ізохронних зв'язків, але без утворення циклонів. (Циклони не утворюються, якщо впливи протягом одного інтервалу вимірювання не встигають оббігти цикл й повернутися до стартової змінної.) Алгоритм Regime-PCMCI відрізняється додатковими можливостями; він автоматично шукає фрагменти векторного ряду, які відповідають різним режимам функціонування процесу [13]. Характер (орієнтацію) деяких ребер розпізнати неможливо, особливо якщо припускаються приховані спільні причини. В таких обставинах алгоритм виведення моделі оперує кількома формами опису ребер. Ребро вигляду ZV → є каузальним. Біорієнтоване ребро WQ  показує, що існує деяка прихована змінна U , яка впливає рівночасно (паралельно) на Q та W . Ребро вигляду YX − відображає ситуацію, коли каузальний характер цього зв'язку зовсім не визначений. Ребро з частково визначеною орієнтацією ZV → резервує два варіанти (біорієнтоване, каузальне). Після ідентифікації присутності ребер моделі алгоритм переходить до етапу орієнтації ребер. Якщо змінна X йде у часі раніше, ніж Y , позначаємо це YX  . Чинне правило «фізичного сенсу»: якщо відомо, що YX  , і маємо ребро YX − , то орієнтуй YX → . Втім, замість того, щоб вставляти в алгоритм подібне правило, простіше вже на етапі виявлення безпосередніх зв'язків відразу ставити ребра вигляду YX → . Отже, при виведенні моделі з даних часових рядів всі ребра відразу отримують вістря на передньому кінці. Тому деякі стандартні правила орієнтації [6, 7], розроблені для статичних каузальних мереж, стають непотрібними. Повний набір правил працює для орієнтації ізохронних ребер. Але тут розглядаємо випадок, коли ізохронних ребра немає. Розглянемо тільки перші два правила орієнтації ребер – 0 та 1 . Оскільки завдяки відомому темпоральному порядку змінних всі ребра відразу отримують вістря ( BA → ), створюються умови для застосування правила орієнтації ребер 1 . Тому на перший погляд може здатися, що немає необхідності застосовувати правило орієнтації ребер 0 . Проте це хибна думка. Правило 0 забезпечує також розпізнавання «вістря» на задньому кінці ребер. Тим самим правило 0 розпізнає біорієнтовані ребра, а отже, виключає можливість, що цей зв'язок є каузальним. Для ситуації відомого темпорального порядку змінних правило орієнтації ребер 1 формулюється наступним чином є каузальним. Біорієнтоване ребро Моделі і засоби систем баз даних та знань змінних, а відтак, і зв'язків (автокореляційних та крос-кореляційних). Але зростання складності стримується іншою особливістю задачі – стандартними припущеннями про регулярність системи зв'язків. Припущення про регулярність зв'язків доповнюється припущенням про стабільність кількісних характеристик (сили зв'язків). Знання темпорального порядку змінних дозволяє впорядкувати виведення динамічних каузальних мереж (порівняно з звичайними мережами), спрощує пошук сепараторів та допомагає визначенню орієнтацій ребер. Розумно спочатку ідентифікувати «короткі» зв'язки (з малим лагом); це спростить пошук довгих зв'язків. Відкриваються можливості оптимізувати тактику пошуку сепараторів, тобто умов для тестів незалежності. Якщо найбільший лаг післядії (довжина зв'язків) – невідомий, виникає проблема, якої немає при виведенні «статичної» каузальної мережі. По-суті, в такому разі невідомим стає розмір («часова глибина») моделі. В такій ситуації треба вирішувати, коли припинити аналіз вглиб і зафіксувати розмір моделі. Просте практичне рішення – перед запуском алгоритму виведення директивно встановити максимальний лаг (вказати цифру). Більш адаптивне рішення (яке має певне теоретичне виправдання) полягає в тому, що при досягненні певних ознак «насичення» моделі робиться висновок, що знайдено справжній розмір моделі. Відтак, нарощування моделі треба припинити. Такою ознакою «насичення» моделі є той факт, що після аналізу зв'язків чергової довжини k (найбільшої на цей момент) з'ясувалося, що зв'язки такої глибини відсутні. Вказана ознака в багатьох випадках виправдана, але не завжди гарантує досягнення повної глибини автентичної моделі. Така ознака дійсно свідчить про відсутність зв'язки з лагом більше k тільки за припущення регулярності структури та за умов, що всі ряди мають достатньо сильні короткі автокореляційні зв'язки (вигляду ii XX →−1 ). Короткі автокореляційні зв'язки присутні у більшості реальних процесів, але не можна гарантувати, що вони є скрізь. Припущення елементарної структурної регулярності може не виконуватися. Регулярність зв'язків може мати іншу форму – як періодичне повторення зв'язків. Тобто якщо є зв'язок ii YX →−1 , то також є зв'язок  ++− → ii YX 1 . Згорнута репрезентація такої моделі має «довжину»  + , де  – довжина зв'язку з найбільшим лагом, а  – довжина періоду повторення зв'язків. Якщо розмір періоду повторення зв'язків невідомий, задача виведення моделі радикально ускладнюється. Треба багатократно переглядати схему обчислення статистик. Зв'язки з великим часовим лагом є джерелом проблем. Давайте поглянемо на існування таких зв'язків з точки зору фізичного сенсу і здорового глузду. Пояснення, що далеке минуле безпосередньо впливає на сучасне – непереконливе й неправдоподібне. Адже, строго кажучи, минулого вже не існує. Втім, цей парадокс легко розв'язується. Треба припустити, що існують ланцюги не спостережуваних змінних, через посередництво яких минуле передало інформацію і змогло здійснити вплив на змінні поточного часу. Ідентифікація ребра моделі – це виявлення безпосереднього («лаг-специфічного») зв'язку. Для ідентифікація кожного ребра доводиться виконати багато тестів умовної незалежності (знайти сепаратор). В ході пошуку сепаратора для пари iY , kiX − треба відразу відкинути всі змінні jV з індексами часу ij  . Першочергові кандидати у сепараторний набор – це змінні, можливо-суміжні до iY або kiX − , й найближчі до них. Назвемо кілька запропонованих алгоритмів виведення моделі з багатовимірних часових рядів даних. Алгоритми SVAR-FCI та SVAR-GFCI [22] є результатом адаптації методу FCI до часових рядів з прихованими змінними. Ці алгоритми припускають існування ізохронних зв'язків, але без утворення циклонів. (Циклони не утворюються, якщо впливи протягом одного інтервалу вимірювання не встигають оббігти цикл й повернутися до стартової змінної.) Алгоритм Regime-PCMCI відрізняється додатковими можливостями; він автоматично шукає фрагменти векторного ряду, які відповідають різним режимам функціонування процесу [13]. Характер (орієнтацію) деяких ребер розпізнати неможливо, особливо якщо припускаються приховані спільні причини. В таких обставинах алгоритм виведення моделі оперує кількома формами опису ребер. Ребро вигляду ZV → є каузальним. Біорієнтоване ребро WQ  показує, що існує деяка прихована змінна U , яка впливає рівночасно (паралельно) на Q та W . Ребро вигляду YX − відображає ситуацію, коли каузальний характер цього зв'язку зовсім не визначений. Ребро з частково визначеною орієнтацією ZV → резервує два варіанти (біорієнтоване, каузальне). Після ідентифікації присутності ребер моделі алгоритм переходить до етапу орієнтації ребер. Якщо змінна X йде у часі раніше, ніж Y , позначаємо це YX  . Чинне правило «фізичного сенсу»: якщо відомо, що YX  , і маємо ребро YX − , то орієнтуй YX → . Втім, замість того, щоб вставляти в алгоритм подібне правило, простіше вже на етапі виявлення безпосередніх зв'язків відразу ставити ребра вигляду YX → . Отже, при виведенні моделі з даних часових рядів всі ребра відразу отримують вістря на передньому кінці. Тому деякі стандартні правила орієнтації [6, 7], розроблені для статичних каузальних мереж, стають непотрібними. Повний набір правил працює для орієнтації ізохронних ребер. Але тут розглядаємо випадок, коли ізохронних ребра немає. Розглянемо тільки перші два правила орієнтації ребер – 0 та 1 . Оскільки завдяки відомому темпоральному порядку змінних всі ребра відразу отримують вістря ( BA → ), створюються умови для застосування правила орієнтації ребер 1 . Тому на перший погляд може здатися, що немає необхідності застосовувати правило орієнтації ребер 0 . Проте це хибна думка. Правило 0 забезпечує також розпізнавання «вістря» на задньому кінці ребер. Тим самим правило 0 розпізнає біорієнтовані ребра, а отже, виключає можливість, що цей зв'язок є каузальним. Для ситуації відомого темпорального порядку змінних правило орієнтації ребер 1 формулюється наступним чином показує, що існує деяка прихована змінна U, яка впливає рівночасно (паралельно) на Моделі і засоби систем баз даних та знань змінних, а відтак, і зв'язків (автокореляційних та крос-кореляційних). Але зростання складності стримується іншою особливістю задачі – стандартними припущеннями про регулярність системи зв'язків. Припущення про регулярність зв'язків доповнюється припущенням про стабільність кількісних характеристик (сили зв'язків). Знання темпорального порядку змінних дозволяє впорядкувати виведення динамічних каузальних мереж (порівняно з звичайними мережами), спрощує пошук сепараторів та допомагає визначенню орієнтацій ребер. Розумно спочатку ідентифікувати «короткі» зв'язки (з малим лагом); це спростить пошук довгих зв'язків. Відкриваються можливості оптимізувати тактику пошуку сепараторів, тобто умов для тестів незалежності. Якщо найбільший лаг післядії (довжина зв'язків) – невідомий, виникає проблема, якої немає при виведенні «статичної» каузальної мережі. По-суті, в такому разі невідомим стає розмір («часова глибина») моделі. В такій ситуації треба вирішувати, коли припинити аналіз вглиб і зафіксувати розмір моделі. Просте практичне рішення – перед запуском алгоритму виведення директивно встановити максимальний лаг (вказати цифру). Більш адаптивне рішення (яке має певне теоретичне виправдання) полягає в тому, що при досягненні певних ознак «насичення» моделі робиться висновок, що знайдено справжній розмір моделі. Відтак, нарощування моделі треба припинити. Такою ознакою «насичення» моделі є той факт, що після аналізу зв'язків чергової довжини k (найбільшої на цей момент) з'ясувалося, що зв'язки такої глибини відсутні. Вказана ознака в багатьох випадках виправдана, але не завжди гарантує досягнення повної глибини автентичної моделі. Така ознака дійсно свідчить про відсутність зв'язки з лагом більше k тільки за припущення регулярності структури та за умов, що всі ряди мають достатньо сильні короткі автокореляційні зв'язки (вигляду ii XX →−1 ). Короткі автокореляційні зв'язки присутні у більшості реальних процесів, але не можна гарантувати, що вони є скрізь. Припущення елементарної структурної регулярності може не виконуватися. Регулярність зв'язків може мати іншу форму – як періодичне повторення зв'язків. Тобто якщо є зв'язок ii YX →−1 , то також є зв'язок  ++− → ii YX 1 . Згорнута репрезентація такої моделі має «довжину»  + , де  – довжина зв'язку з найбільшим лагом, а  – довжина періоду повторення зв'язків. Якщо розмір періоду повторення зв'язків невідомий, задача виведення моделі радикально ускладнюється. Треба багатократно переглядати схему обчислення статистик. Зв'язки з великим часовим лагом є джерелом проблем. Давайте поглянемо на існування таких зв'язків з точки зору фізичного сенсу і здорового глузду. Пояснення, що далеке минуле безпосередньо впливає на сучасне – непереконливе й неправдоподібне. Адже, строго кажучи, минулого вже не існує. Втім, цей парадокс легко розв'язується. Треба припустити, що існують ланцюги не спостережуваних змінних, через посередництво яких минуле передало інформацію і змогло здійснити вплив на змінні поточного часу. Ідентифікація ребра моделі – це виявлення безпосереднього («лаг-специфічного») зв'язку. Для ідентифікація кожного ребра доводиться виконати багато тестів умовної незалежності (знайти сепаратор). В ході пошуку сепаратора для пари iY , kiX − треба відразу відкинути всі змінні jV з індексами часу ij  . Першочергові кандидати у сепараторний набор – це змінні, можливо-суміжні до iY або kiX − , й найближчі до них. Назвемо кілька запропонованих алгоритмів виведення моделі з багатовимірних часових рядів даних. Алгоритми SVAR-FCI та SVAR-GFCI [22] є результатом адаптації методу FCI до часових рядів з прихованими змінними. Ці алгоритми припускають існування ізохронних зв'язків, але без утворення циклонів. (Циклони не утворюються, якщо впливи протягом одного інтервалу вимірювання не встигають оббігти цикл й повернутися до стартової змінної.) Алгоритм Regime-PCMCI відрізняється додатковими можливостями; він автоматично шукає фрагменти векторного ряду, які відповідають різним режимам функціонування процесу [13]. Характер (орієнтацію) деяких ребер розпізнати неможливо, особливо якщо припускаються приховані спільні причини. В таких обставинах алгоритм виведення моделі оперує кількома формами опису ребер. Ребро вигляду ZV → є каузальним. Біорієнтоване ребро WQ  показує, що існує деяка прихована змінна U , яка впливає рівночасно (паралельно) на Q та W . Ребро вигляду YX − відображає ситуацію, коли каузальний характер цього зв'язку зовсім не визначений. Ребро з частково визначеною орієнтацією ZV → резервує два варіанти (біорієнтоване, каузальне). Після ідентифікації присутності ребер моделі алгоритм переходить до етапу орієнтації ребер. Якщо змінна X йде у часі раніше, ніж Y , позначаємо це YX  . Чинне правило «фізичного сенсу»: якщо відомо, що YX  , і маємо ребро YX − , то орієнтуй YX → . Втім, замість того, щоб вставляти в алгоритм подібне правило, простіше вже на етапі виявлення безпосередніх зв'язків відразу ставити ребра вигляду YX → . Отже, при виведенні моделі з даних часових рядів всі ребра відразу отримують вістря на передньому кінці. Тому деякі стандартні правила орієнтації [6, 7], розроблені для статичних каузальних мереж, стають непотрібними. Повний набір правил працює для орієнтації ізохронних ребер. Але тут розглядаємо випадок, коли ізохронних ребра немає. Розглянемо тільки перші два правила орієнтації ребер – 0 та 1 . Оскільки завдяки відомому темпоральному порядку змінних всі ребра відразу отримують вістря ( BA → ), створюються умови для застосування правила орієнтації ребер 1 . Тому на перший погляд може здатися, що немає необхідності застосовувати правило орієнтації ребер 0 . Проте це хибна думка. Правило 0 забезпечує також розпізнавання «вістря» на задньому кінці ребер. Тим самим правило 0 розпізнає біорієнтовані ребра, а отже, виключає можливість, що цей зв'язок є каузальним. Для ситуації відомого темпорального порядку змінних правило орієнтації ребер 1 формулюється наступним чином . Ребро вигляду Моделі і засоби систем баз даних та знань змінних, а відтак, і зв'язків (автокореляційних та крос-кореляційних). Але зростання складності стримується іншою особливістю задачі – стандартними припущеннями про регулярність системи зв'язків. Припущення про регулярність зв'язків доповнюється припущенням про стабільність кількісних характеристик (сили зв'язків). Знання темпорального порядку змінних дозволяє впорядкувати виведення динамічних каузальних мереж (порівняно з звичайними мережами), спрощує пошук сепараторів та допомагає визначенню орієнтацій ребер. Розумно спочатку ідентифікувати «короткі» зв'язки (з малим лагом); це спростить пошук довгих зв'язків. Відкриваються можливості оптимізувати тактику пошуку сепараторів, тобто умов для тестів незалежності. Якщо найбільший лаг післядії (довжина зв'язків) – невідомий, виникає проблема, якої немає при виведенні «статичної» каузальної мережі. По-суті, в такому разі невідомим стає розмір («часова глибина») моделі. В такій ситуації треба вирішувати, коли припинити аналіз вглиб і зафіксувати розмір моделі. Просте практичне рішення – перед запуском алгоритму виведення директивно встановити максимальний лаг (вказати цифру). Більш адаптивне рішення (яке має певне теоретичне виправдання) полягає в тому, що при досягненні певних ознак «насичення» моделі робиться висновок, що знайдено справжній розмір моделі. Відтак, нарощування моделі треба припинити. Такою ознакою «насичення» моделі є той факт, що після аналізу зв'язків чергової довжини k (найбільшої на цей момент) з'ясувалося, що зв'язки такої глибини відсутні. Вказана ознака в багатьох випадках виправдана, але не завжди гарантує досягнення повної глибини автентичної моделі. Така ознака дійсно свідчить про відсутність зв'язки з лагом більше k тільки за припущення регулярності структури та за умов, що всі ряди мають достатньо сильні короткі автокореляційні зв'язки (вигляду ii XX →−1 ). Короткі автокореляційні зв'язки присутні у більшості реальних процесів, але не можна гарантувати, що вони є скрізь. Припущення елементарної структурної регулярності може не виконуватися. Регулярність зв'язків може мати іншу форму – як періодичне повторення зв'язків. Тобто якщо є зв'язок ii YX →−1 , то також є зв'язок  ++− → ii YX 1 . Згорнута репрезентація такої моделі має «довжину»  + , де  – довжина зв'язку з найбільшим лагом, а  – довжина періоду повторення зв'язків. Якщо розмір періоду повторення зв'язків невідомий, задача виведення моделі радикально ускладнюється. Треба багатократно переглядати схему обчислення статистик. Зв'язки з великим часовим лагом є джерелом проблем. Давайте поглянемо на існування таких зв'язків з точки зору фізичного сенсу і здорового глузду. Пояснення, що далеке минуле безпосередньо впливає на сучасне – непереконливе й неправдоподібне. Адже, строго кажучи, минулого вже не існує. Втім, цей парадокс легко розв'язується. Треба припустити, що існують ланцюги не спостережуваних змінних, через посередництво яких минуле передало інформацію і змогло здійснити вплив на змінні поточного часу. Ідентифікація ребра моделі – це виявлення безпосереднього («лаг-специфічного») зв'язку. Для ідентифікація кожного ребра доводиться виконати багато тестів умовної незалежності (знайти сепаратор). В ході пошуку сепаратора для пари iY , kiX − треба відразу відкинути всі змінні jV з індексами часу ij  . Першочергові кандидати у сепараторний набор – це змінні, можливо-суміжні до iY або kiX − , й найближчі до них. Назвемо кілька запропонованих алгоритмів виведення моделі з багатовимірних часових рядів даних. Алгоритми SVAR-FCI та SVAR-GFCI [22] є результатом адаптації методу FCI до часових рядів з прихованими змінними. Ці алгоритми припускають існування ізохронних зв'язків, але без утворення циклонів. (Циклони не утворюються, якщо впливи протягом одного інтервалу вимірювання не встигають оббігти цикл й повернутися до стартової змінної.) Алгоритм Regime-PCMCI відрізняється додатковими можливостями; він автоматично шукає фрагменти векторного ряду, які відповідають різним режимам функціонування процесу [13]. Характер (орієнтацію) деяких ребер розпізнати неможливо, особливо якщо припускаються приховані спільні причини. В таких обставинах алгоритм виведення моделі оперує кількома формами опису ребер. Ребро вигляду ZV → є каузальним. Біорієнтоване ребро WQ  показує, що існує деяка прихована змінна U , яка впливає рівночасно (паралельно) на Q та W . Ребро вигляду YX − відображає ситуацію, коли каузальний характер цього зв'язку зовсім не визначений. Ребро з частково визначеною орієнтацією ZV → резервує два варіанти (біорієнтоване, каузальне). Після ідентифікації присутності ребер моделі алгоритм переходить до етапу орієнтації ребер. Якщо змінна X йде у часі раніше, ніж Y , позначаємо це YX  . Чинне правило «фізичного сенсу»: якщо відомо, що YX  , і маємо ребро YX − , то орієнтуй YX → . Втім, замість того, щоб вставляти в алгоритм подібне правило, простіше вже на етапі виявлення безпосередніх зв'язків відразу ставити ребра вигляду YX → . Отже, при виведенні моделі з даних часових рядів всі ребра відразу отримують вістря на передньому кінці. Тому деякі стандартні правила орієнтації [6, 7], розроблені для статичних каузальних мереж, стають непотрібними. Повний набір правил працює для орієнтації ізохронних ребер. Але тут розглядаємо випадок, коли ізохронних ребра немає. Розглянемо тільки перші два правила орієнтації ребер – 0 та 1 . Оскільки завдяки відомому темпоральному порядку змінних всі ребра відразу отримують вістря ( BA → ), створюються умови для застосування правила орієнтації ребер 1 . Тому на перший погляд може здатися, що немає необхідності застосовувати правило орієнтації ребер 0 . Проте це хибна думка. Правило 0 забезпечує також розпізнавання «вістря» на задньому кінці ребер. Тим самим правило 0 розпізнає біорієнтовані ребра, а отже, виключає можливість, що цей зв'язок є каузальним. Для ситуації відомого темпорального порядку змінних правило орієнтації ребер 1 формулюється наступним чином відображає ситуацію, коли ка- узальний характер цього зв’язку зовсім не визначений. Ребро з частково визначеною орієнтацією Моделі і засоби систем баз даних та знань змінних, а відтак, і зв'язків (автокореляційних та крос-кореляційних). Але зростання складності стримується іншою особливістю задачі – стандартними припущеннями про регулярність системи зв'язків. Припущення про регулярність зв'язків доповнюється припущенням про стабільність кількісних характеристик (сили зв'язків). Знання темпорального порядку змінних дозволяє впорядкувати виведення динамічних каузальних мереж (порівняно з звичайними мережами), спрощує пошук сепараторів та допомагає визначенню орієнтацій ребер. Розумно спочатку ідентифікувати «короткі» зв'язки (з малим лагом); це спростить пошук довгих зв'язків. Відкриваються можливості оптимізувати тактику пошуку сепараторів, тобто умов для тестів незалежності. Якщо найбільший лаг післядії (довжина зв'язків) – невідомий, виникає проблема, якої немає при виведенні «статичної» каузальної мережі. По-суті, в такому разі невідомим стає розмір («часова глибина») моделі. В такій ситуації треба вирішувати, коли припинити аналіз вглиб і зафіксувати розмір моделі. Просте практичне рішення – перед запуском алгоритму виведення директивно встановити максимальний лаг (вказати цифру). Більш адаптивне рішення (яке має певне теоретичне виправдання) полягає в тому, що при досягненні певних ознак «насичення» моделі робиться висновок, що знайдено справжній розмір моделі. Відтак, нарощування моделі треба припинити. Такою ознакою «насичення» моделі є той факт, що після аналізу зв'язків чергової довжини k (найбільшої на цей момент) з'ясувалося, що зв'язки такої глибини відсутні. Вказана ознака в багатьох випадках виправдана, але не завжди гарантує досягнення повної глибини автентичної моделі. Така ознака дійсно свідчить про відсутність зв'язки з лагом більше k тільки за припущення регулярності структури та за умов, що всі ряди мають достатньо сильні короткі автокореляційні зв'язки (вигляду ii XX →−1 ). Короткі автокореляційні зв'язки присутні у більшості реальних процесів, але не можна гарантувати, що вони є скрізь. Припущення елементарної структурної регулярності може не виконуватися. Регулярність зв'язків може мати іншу форму – як періодичне повторення зв'язків. Тобто якщо є зв'язок ii YX →−1 , то також є зв'язок  ++− → ii YX 1 . Згорнута репрезентація такої моделі має «довжину»  + , де  – довжина зв'язку з найбільшим лагом, а  – довжина періоду повторення зв'язків. Якщо розмір періоду повторення зв'язків невідомий, задача виведення моделі радикально ускладнюється. Треба багатократно переглядати схему обчислення статистик. Зв'язки з великим часовим лагом є джерелом проблем. Давайте поглянемо на існування таких зв'язків з точки зору фізичного сенсу і здорового глузду. Пояснення, що далеке минуле безпосередньо впливає на сучасне – непереконливе й неправдоподібне. Адже, строго кажучи, минулого вже не існує. Втім, цей парадокс легко розв'язується. Треба припустити, що існують ланцюги не спостережуваних змінних, через посередництво яких минуле передало інформацію і змогло здійснити вплив на змінні поточного часу. Ідентифікація ребра моделі – це виявлення безпосереднього («лаг-специфічного») зв'язку. Для ідентифікація кожного ребра доводиться виконати багато тестів умовної незалежності (знайти сепаратор). В ході пошуку сепаратора для пари iY , kiX − треба відразу відкинути всі змінні jV з індексами часу ij  . Першочергові кандидати у сепараторний набор – це змінні, можливо-суміжні до iY або kiX − , й найближчі до них. Назвемо кілька запропонованих алгоритмів виведення моделі з багатовимірних часових рядів даних. Алгоритми SVAR-FCI та SVAR-GFCI [22] є результатом адаптації методу FCI до часових рядів з прихованими змінними. Ці алгоритми припускають існування ізохронних зв'язків, але без утворення циклонів. (Циклони не утворюються, якщо впливи протягом одного інтервалу вимірювання не встигають оббігти цикл й повернутися до стартової змінної.) Алгоритм Regime-PCMCI відрізняється додатковими можливостями; він автоматично шукає фрагменти векторного ряду, які відповідають різним режимам функціонування процесу [13]. Характер (орієнтацію) деяких ребер розпізнати неможливо, особливо якщо припускаються приховані спільні причини. В таких обставинах алгоритм виведення моделі оперує кількома формами опису ребер. Ребро вигляду ZV → є каузальним. Біорієнтоване ребро WQ  показує, що існує деяка прихована змінна U , яка впливає рівночасно (паралельно) на Q та W . Ребро вигляду YX − відображає ситуацію, коли каузальний характер цього зв'язку зовсім не визначений. Ребро з частково визначеною орієнтацією ZV → резервує два варіанти (біорієнтоване, каузальне). Після ідентифікації присутності ребер моделі алгоритм переходить до етапу орієнтації ребер. Якщо змінна X йде у часі раніше, ніж Y , позначаємо це YX  . Чинне правило «фізичного сенсу»: якщо відомо, що YX  , і маємо ребро YX − , то орієнтуй YX → . Втім, замість того, щоб вставляти в алгоритм подібне правило, простіше вже на етапі виявлення безпосередніх зв'язків відразу ставити ребра вигляду YX → . Отже, при виведенні моделі з даних часових рядів всі ребра відразу отримують вістря на передньому кінці. Тому деякі стандартні правила орієнтації [6, 7], розроблені для статичних каузальних мереж, стають непотрібними. Повний набір правил працює для орієнтації ізохронних ребер. Але тут розглядаємо випадок, коли ізохронних ребра немає. Розглянемо тільки перші два правила орієнтації ребер – 0 та 1 . Оскільки завдяки відомому темпоральному порядку змінних всі ребра відразу отримують вістря ( BA → ), створюються умови для застосування правила орієнтації ребер 1 . Тому на перший погляд може здатися, що немає необхідності застосовувати правило орієнтації ребер 0 . Проте це хибна думка. Правило 0 забезпечує також розпізнавання «вістря» на задньому кінці ребер. Тим самим правило 0 розпізнає біорієнтовані ребра, а отже, виключає можливість, що цей зв'язок є каузальним. Для ситуації відомого темпорального порядку змінних правило орієнтації ребер 1 формулюється наступним чином резервує два варіанти (біорієнтоване, каузальне). Після ідентифікації присутності ребер моделі алго- ритм переходить до етапу орієнтації ребер. Якщо змінна X йде у часі раніше, ніж Y, позначаємо це Моделі і засоби систем баз даних та знань змінних, а відтак, і зв'язків (автокореляційних та крос-кореляційних). Але зростання складності стримується іншою особливістю задачі – стандартними припущеннями про регулярність системи зв'язків. Припущення про регулярність зв'язків доповнюється припущенням про стабільність кількісних характеристик (сили зв'язків). Знання темпорального порядку змінних дозволяє впорядкувати виведення динамічних каузальних мереж (порівняно з звичайними мережами), спрощує пошук сепараторів та допомагає визначенню орієнтацій ребер. Розумно спочатку ідентифікувати «короткі» зв'язки (з малим лагом); це спростить пошук довгих зв'язків. Відкриваються можливості оптимізувати тактику пошуку сепараторів, тобто умов для тестів незалежності. Якщо найбільший лаг післядії (довжина зв'язків) – невідомий, виникає проблема, якої немає при виведенні «статичної» каузальної мережі. По-суті, в такому разі невідомим стає розмір («часова глибина») моделі. В такій ситуації треба вирішувати, коли припинити аналіз вглиб і зафіксувати розмір моделі. Просте практичне рішення – перед запуском алгоритму виведення директивно встановити максимальний лаг (вказати цифру). Більш адаптивне рішення (яке має певне теоретичне виправдання) полягає в тому, що при досягненні певних ознак «насичення» моделі робиться висновок, що знайдено справжній розмір моделі. Відтак, нарощування моделі треба припинити. Такою ознакою «насичення» моделі є той факт, що після аналізу зв'язків чергової довжини k (найбільшої на цей момент) з'ясувалося, що зв'язки такої глибини відсутні. Вказана ознака в багатьох випадках виправдана, але не завжди гарантує досягнення повної глибини автентичної моделі. Така ознака дійсно свідчить про відсутність зв'язки з лагом більше k тільки за припущення регулярності структури та за умов, що всі ряди мають достатньо сильні короткі автокореляційні зв'язки (вигляду ii XX →−1 ). Короткі автокореляційні зв'язки присутні у більшості реальних процесів, але не можна гарантувати, що вони є скрізь. Припущення елементарної структурної регулярності може не виконуватися. Регулярність зв'язків може мати іншу форму – як періодичне повторення зв'язків. Тобто якщо є зв'язок ii YX →−1 , то також є зв'язок  ++− → ii YX 1 . Згорнута репрезентація такої моделі має «довжину»  + , де  – довжина зв'язку з найбільшим лагом, а  – довжина періоду повторення зв'язків. Якщо розмір періоду повторення зв'язків невідомий, задача виведення моделі радикально ускладнюється. Треба багатократно переглядати схему обчислення статистик. Зв'язки з великим часовим лагом є джерелом проблем. Давайте поглянемо на існування таких зв'язків з точки зору фізичного сенсу і здорового глузду. Пояснення, що далеке минуле безпосередньо впливає на сучасне – непереконливе й неправдоподібне. Адже, строго кажучи, минулого вже не існує. Втім, цей парадокс легко розв'язується. Треба припустити, що існують ланцюги не спостережуваних змінних, через посередництво яких минуле передало інформацію і змогло здійснити вплив на змінні поточного часу. Ідентифікація ребра моделі – це виявлення безпосереднього («лаг-специфічного») зв'язку. Для ідентифікація кожного ребра доводиться виконати багато тестів умовної незалежності (знайти сепаратор). В ході пошуку сепаратора для пари iY , kiX − треба відразу відкинути всі змінні jV з індексами часу ij  . Першочергові кандидати у сепараторний набор – це змінні, можливо-суміжні до iY або kiX − , й найближчі до них. Назвемо кілька запропонованих алгоритмів виведення моделі з багатовимірних часових рядів даних. Алгоритми SVAR-FCI та SVAR-GFCI [22] є результатом адаптації методу FCI до часових рядів з прихованими змінними. Ці алгоритми припускають існування ізохронних зв'язків, але без утворення циклонів. (Циклони не утворюються, якщо впливи протягом одного інтервалу вимірювання не встигають оббігти цикл й повернутися до стартової змінної.) Алгоритм Regime-PCMCI відрізняється додатковими можливостями; він автоматично шукає фрагменти векторного ряду, які відповідають різним режимам функціонування процесу [13]. Характер (орієнтацію) деяких ребер розпізнати неможливо, особливо якщо припускаються приховані спільні причини. В таких обставинах алгоритм виведення моделі оперує кількома формами опису ребер. Ребро вигляду ZV → є каузальним. Біорієнтоване ребро WQ  показує, що існує деяка прихована змінна U , яка впливає рівночасно (паралельно) на Q та W . Ребро вигляду YX − відображає ситуацію, коли каузальний характер цього зв'язку зовсім не визначений. Ребро з частково визначеною орієнтацією ZV → резервує два варіанти (біорієнтоване, каузальне). Після ідентифікації присутності ребер моделі алгоритм переходить до етапу орієнтації ребер. Якщо змінна X йде у часі раніше, ніж Y , позначаємо це YX  . Чинне правило «фізичного сенсу»: якщо відомо, що YX  , і маємо ребро YX − , то орієнтуй YX → . Втім, замість того, щоб вставляти в алгоритм подібне правило, простіше вже на етапі виявлення безпосередніх зв'язків відразу ставити ребра вигляду YX → . Отже, при виведенні моделі з даних часових рядів всі ребра відразу отримують вістря на передньому кінці. Тому деякі стандартні правила орієнтації [6, 7], розроблені для статичних каузальних мереж, стають непотрібними. Повний набір правил працює для орієнтації ізохронних ребер. Але тут розглядаємо випадок, коли ізохронних ребра немає. Розглянемо тільки перші два правила орієнтації ребер – 0 та 1 . Оскільки завдяки відомому темпоральному порядку змінних всі ребра відразу отримують вістря ( BA → ), створюються умови для застосування правила орієнтації ребер 1 . Тому на перший погляд може здатися, що немає необхідності застосовувати правило орієнтації ребер 0 . Проте це хибна думка. Правило 0 забезпечує також розпізнавання «вістря» на задньому кінці ребер. Тим самим правило 0 розпізнає біорієнтовані ребра, а отже, виключає можливість, що цей зв'язок є каузальним. Для ситуації відомого темпорального порядку змінних правило орієнтації ребер 1 формулюється наступним чином . Чинне правило «фізичного сенсу»: якщо відомо, що Моделі і засоби систем баз даних та знань змінних, а відтак, і зв'язків (автокореляційних та крос-кореляційних). Але зростання складності стримується іншою особливістю задачі – стандартними припущеннями про регулярність системи зв'язків. Припущення про регулярність зв'язків доповнюється припущенням про стабільність кількісних характеристик (сили зв'язків). Знання темпорального порядку змінних дозволяє впорядкувати виведення динамічних каузальних мереж (порівняно з звичайними мережами), спрощує пошук сепараторів та допомагає визначенню орієнтацій ребер. Розумно спочатку ідентифікувати «короткі» зв'язки (з малим лагом); це спростить пошук довгих зв'язків. Відкриваються можливості оптимізувати тактику пошуку сепараторів, тобто умов для тестів незалежності. Якщо найбільший лаг післядії (довжина зв'язків) – невідомий, виникає проблема, якої немає при виведенні «статичної» каузальної мережі. По-суті, в такому разі невідомим стає розмір («часова глибина») моделі. В такій ситуації треба вирішувати, коли припинити аналіз вглиб і зафіксувати розмір моделі. Просте практичне рішення – перед запуском алгоритму виведення директивно встановити максимальний лаг (вказати цифру). Більш адаптивне рішення (яке має певне теоретичне виправдання) полягає в тому, що при досягненні певних ознак «насичення» моделі робиться висновок, що знайдено справжній розмір моделі. Відтак, нарощування моделі треба припинити. Такою ознакою «насичення» моделі є той факт, що після аналізу зв'язків чергової довжини k (найбільшої на цей момент) з'ясувалося, що зв'язки такої глибини відсутні. Вказана ознака в багатьох випадках виправдана, але не завжди гарантує досягнення повної глибини автентичної моделі. Така ознака дійсно свідчить про відсутність зв'язки з лагом більше k тільки за припущення регулярності структури та за умов, що всі ряди мають достатньо сильні короткі автокореляційні зв'язки (вигляду ii XX →−1 ). Короткі автокореляційні зв'язки присутні у більшості реальних процесів, але не можна гарантувати, що вони є скрізь. Припущення елементарної структурної регулярності може не виконуватися. Регулярність зв'язків може мати іншу форму – як періодичне повторення зв'язків. Тобто якщо є зв'язок ii YX →−1 , то також є зв'язок  ++− → ii YX 1 . Згорнута репрезентація такої моделі має «довжину»  + , де  – довжина зв'язку з найбільшим лагом, а  – довжина періоду повторення зв'язків. Якщо розмір періоду повторення зв'язків невідомий, задача виведення моделі радикально ускладнюється. Треба багатократно переглядати схему обчислення статистик. Зв'язки з великим часовим лагом є джерелом проблем. Давайте поглянемо на існування таких зв'язків з точки зору фізичного сенсу і здорового глузду. Пояснення, що далеке минуле безпосередньо впливає на сучасне – непереконливе й неправдоподібне. Адже, строго кажучи, минулого вже не існує. Втім, цей парадокс легко розв'язується. Треба припустити, що існують ланцюги не спостережуваних змінних, через посередництво яких минуле передало інформацію і змогло здійснити вплив на змінні поточного часу. Ідентифікація ребра моделі – це виявлення безпосереднього («лаг-специфічного») зв'язку. Для ідентифікація кожного ребра доводиться виконати багато тестів умовної незалежності (знайти сепаратор). В ході пошуку сепаратора для пари iY , kiX − треба відразу відкинути всі змінні jV з індексами часу ij  . Першочергові кандидати у сепараторний набор – це змінні, можливо-суміжні до iY або kiX − , й найближчі до них. Назвемо кілька запропонованих алгоритмів виведення моделі з багатовимірних часових рядів даних. Алгоритми SVAR-FCI та SVAR-GFCI [22] є результатом адаптації методу FCI до часових рядів з прихованими змінними. Ці алгоритми припускають існування ізохронних зв'язків, але без утворення циклонів. (Циклони не утворюються, якщо впливи протягом одного інтервалу вимірювання не встигають оббігти цикл й повернутися до стартової змінної.) Алгоритм Regime-PCMCI відрізняється додатковими можливостями; він автоматично шукає фрагменти векторного ряду, які відповідають різним режимам функціонування процесу [13]. Характер (орієнтацію) деяких ребер розпізнати неможливо, особливо якщо припускаються приховані спільні причини. В таких обставинах алгоритм виведення моделі оперує кількома формами опису ребер. Ребро вигляду ZV → є каузальним. Біорієнтоване ребро WQ  показує, що існує деяка прихована змінна U , яка впливає рівночасно (паралельно) на Q та W . Ребро вигляду YX − відображає ситуацію, коли каузальний характер цього зв'язку зовсім не визначений. Ребро з частково визначеною орієнтацією ZV → резервує два варіанти (біорієнтоване, каузальне). Після ідентифікації присутності ребер моделі алгоритм переходить до етапу орієнтації ребер. Якщо змінна X йде у часі раніше, ніж Y , позначаємо це YX  . Чинне правило «фізичного сенсу»: якщо відомо, що YX  , і маємо ребро YX − , то орієнтуй YX → . Втім, замість того, щоб вставляти в алгоритм подібне правило, простіше вже на етапі виявлення безпосередніх зв'язків відразу ставити ребра вигляду YX → . Отже, при виведенні моделі з даних часових рядів всі ребра відразу отримують вістря на передньому кінці. Тому деякі стандартні правила орієнтації [6, 7], розроблені для статичних каузальних мереж, стають непотрібними. Повний набір правил працює для орієнтації ізохронних ребер. Але тут розглядаємо випадок, коли ізохронних ребра немає. Розглянемо тільки перші два правила орієнтації ребер – 0 та 1 . Оскільки завдяки відомому темпоральному порядку змінних всі ребра відразу отримують вістря ( BA → ), створюються умови для застосування правила орієнтації ребер 1 . Тому на перший погляд може здатися, що немає необхідності застосовувати правило орієнтації ребер 0 . Проте це хибна думка. Правило 0 забезпечує також розпізнавання «вістря» на задньому кінці ребер. Тим самим правило 0 розпізнає біорієнтовані ребра, а отже, виключає можливість, що цей зв'язок є каузальним. Для ситуації відомого темпорального порядку змінних правило орієнтації ребер 1 формулюється наступним чином , і маємо ребро Моделі і засоби систем баз даних та знань змінних, а відтак, і зв'язків (автокореляційних та крос-кореляційних). Але зростання складності стримується іншою особливістю задачі – стандартними припущеннями про регулярність системи зв'язків. Припущення про регулярність зв'язків доповнюється припущенням про стабільність кількісних характеристик (сили зв'язків). Знання темпорального порядку змінних дозволяє впорядкувати виведення динамічних каузальних мереж (порівняно з звичайними мережами), спрощує пошук сепараторів та допомагає визначенню орієнтацій ребер. Розумно спочатку ідентифікувати «короткі» зв'язки (з малим лагом); це спростить пошук довгих зв'язків. Відкриваються можливості оптимізувати тактику пошуку сепараторів, тобто умов для тестів незалежності. Якщо найбільший лаг післядії (довжина зв'язків) – невідомий, виникає проблема, якої немає при виведенні «статичної» каузальної мережі. По-суті, в такому разі невідомим стає розмір («часова глибина») моделі. В такій ситуації треба вирішувати, коли припинити аналіз вглиб і зафіксувати розмір моделі. Просте практичне рішення – перед запуском алгоритму виведення директивно встановити максимальний лаг (вказати цифру). Більш адаптивне рішення (яке має певне теоретичне виправдання) полягає в тому, що при досягненні певних ознак «насичення» моделі робиться висновок, що знайдено справжній розмір моделі. Відтак, нарощування моделі треба припинити. Такою ознакою «насичення» моделі є той факт, що після аналізу зв'язків чергової довжини k (найбільшої на цей момент) з'ясувалося, що зв'язки такої глибини відсутні. Вказана ознака в багатьох випадках виправдана, але не завжди гарантує досягнення повної глибини автентичної моделі. Така ознака дійсно свідчить про відсутність зв'язки з лагом більше k тільки за припущення регулярності структури та за умов, що всі ряди мають достатньо сильні короткі автокореляційні зв'язки (вигляду ii XX →−1 ). Короткі автокореляційні зв'язки присутні у більшості реальних процесів, але не можна гарантувати, що вони є скрізь. Припущення елементарної структурної регулярності може не виконуватися. Регулярність зв'язків може мати іншу форму – як періодичне повторення зв'язків. Тобто якщо є зв'язок ii YX →−1 , то також є зв'язок  ++− → ii YX 1 . Згорнута репрезентація такої моделі має «довжину»  + , де  – довжина зв'язку з найбільшим лагом, а  – довжина періоду повторення зв'язків. Якщо розмір періоду повторення зв'язків невідомий, задача виведення моделі радикально ускладнюється. Треба багатократно переглядати схему обчислення статистик. Зв'язки з великим часовим лагом є джерелом проблем. Давайте поглянемо на існування таких зв'язків з точки зору фізичного сенсу і здорового глузду. Пояснення, що далеке минуле безпосередньо впливає на сучасне – непереконливе й неправдоподібне. Адже, строго кажучи, минулого вже не існує. Втім, цей парадокс легко розв'язується. Треба припустити, що існують ланцюги не спостережуваних змінних, через посередництво яких минуле передало інформацію і змогло здійснити вплив на змінні поточного часу. Ідентифікація ребра моделі – це виявлення безпосереднього («лаг-специфічного») зв'язку. Для ідентифікація кожного ребра доводиться виконати багато тестів умовної незалежності (знайти сепаратор). В ході пошуку сепаратора для пари iY , kiX − треба відразу відкинути всі змінні jV з індексами часу ij  . Першочергові кандидати у сепараторний набор – це змінні, можливо-суміжні до iY або kiX − , й найближчі до них. Назвемо кілька запропонованих алгоритмів виведення моделі з багатовимірних часових рядів даних. Алгоритми SVAR-FCI та SVAR-GFCI [22] є результатом адаптації методу FCI до часових рядів з прихованими змінними. Ці алгоритми припускають існування ізохронних зв'язків, але без утворення циклонів. (Циклони не утворюються, якщо впливи протягом одного інтервалу вимірювання не встигають оббігти цикл й повернутися до стартової змінної.) Алгоритм Regime-PCMCI відрізняється додатковими можливостями; він автоматично шукає фрагменти векторного ряду, які відповідають різним режимам функціонування процесу [13]. Характер (орієнтацію) деяких ребер розпізнати неможливо, особливо якщо припускаються приховані спільні причини. В таких обставинах алгоритм виведення моделі оперує кількома формами опису ребер. Ребро вигляду ZV → є каузальним. Біорієнтоване ребро WQ  показує, що існує деяка прихована змінна U , яка впливає рівночасно (паралельно) на Q та W . Ребро вигляду YX − відображає ситуацію, коли каузальний характер цього зв'язку зовсім не визначений. Ребро з частково визначеною орієнтацією ZV → резервує два варіанти (біорієнтоване, каузальне). Після ідентифікації присутності ребер моделі алгоритм переходить до етапу орієнтації ребер. Якщо змінна X йде у часі раніше, ніж Y , позначаємо це YX  . Чинне правило «фізичного сенсу»: якщо відомо, що YX  , і маємо ребро YX − , то орієнтуй YX → . Втім, замість того, щоб вставляти в алгоритм подібне правило, простіше вже на етапі виявлення безпосередніх зв'язків відразу ставити ребра вигляду YX → . Отже, при виведенні моделі з даних часових рядів всі ребра відразу отримують вістря на передньому кінці. Тому деякі стандартні правила орієнтації [6, 7], розроблені для статичних каузальних мереж, стають непотрібними. Повний набір правил працює для орієнтації ізохронних ребер. Але тут розглядаємо випадок, коли ізохронних ребра немає. Розглянемо тільки перші два правила орієнтації ребер – 0 та 1 . Оскільки завдяки відомому темпоральному порядку змінних всі ребра відразу отримують вістря ( BA → ), створюються умови для застосування правила орієнтації ребер 1 . Тому на перший погляд може здатися, що немає необхідності застосовувати правило орієнтації ребер 0 . Проте це хибна думка. Правило 0 забезпечує також розпізнавання «вістря» на задньому кінці ребер. Тим самим правило 0 розпізнає біорієнтовані ребра, а отже, виключає можливість, що цей зв'язок є каузальним. Для ситуації відомого темпорального порядку змінних правило орієнтації ребер 1 формулюється наступним чином , то орієнтуй Моделі і засоби систем баз даних та знань змінних, а відтак, і зв'язків (автокореляційних та крос-кореляційних). Але зростання складності стримується іншою особливістю задачі – стандартними припущеннями про регулярність системи зв'язків. Припущення про регулярність зв'язків доповнюється припущенням про стабільність кількісних характеристик (сили зв'язків). Знання темпорального порядку змінних дозволяє впорядкувати виведення динамічних каузальних мереж (порівняно з звичайними мережами), спрощує пошук сепараторів та допомагає визначенню орієнтацій ребер. Розумно спочатку ідентифікувати «короткі» зв'язки (з малим лагом); це спростить пошук довгих зв'язків. Відкриваються можливості оптимізувати тактику пошуку сепараторів, тобто умов для тестів незалежності. Якщо найбільший лаг післядії (довжина зв'язків) – невідомий, виникає проблема, якої немає при виведенні «статичної» каузальної мережі. По-суті, в такому разі невідомим стає розмір («часова глибина») моделі. В такій ситуації треба вирішувати, коли припинити аналіз вглиб і зафіксувати розмір моделі. Просте практичне рішення – перед запуском алгоритму виведення директивно встановити максимальний лаг (вказати цифру). Більш адаптивне рішення (яке має певне теоретичне виправдання) полягає в тому, що при досягненні певних ознак «насичення» моделі робиться висновок, що знайдено справжній розмір моделі. Відтак, нарощування моделі треба припинити. Такою ознакою «насичення» моделі є той факт, що після аналізу зв'язків чергової довжини k (найбільшої на цей момент) з'ясувалося, що зв'язки такої глибини відсутні. Вказана ознака в багатьох випадках виправдана, але не завжди гарантує досягнення повної глибини автентичної моделі. Така ознака дійсно свідчить про відсутність зв'язки з лагом більше k тільки за припущення регулярності структури та за умов, що всі ряди мають достатньо сильні короткі автокореляційні зв'язки (вигляду ii XX →−1 ). Короткі автокореляційні зв'язки присутні у більшості реальних процесів, але не можна гарантувати, що вони є скрізь. Припущення елементарної структурної регулярності може не виконуватися. Регулярність зв'язків може мати іншу форму – як періодичне повторення зв'язків. Тобто якщо є зв'язок ii YX →−1 , то також є зв'язок  ++− → ii YX 1 . Згорнута репрезентація такої моделі має «довжину»  + , де  – довжина зв'язку з найбільшим лагом, а  – довжина періоду повторення зв'язків. Якщо розмір періоду повторення зв'язків невідомий, задача виведення моделі радикально ускладнюється. Треба багатократно переглядати схему обчислення статистик. Зв'язки з великим часовим лагом є джерелом проблем. Давайте поглянемо на існування таких зв'язків з точки зору фізичного сенсу і здорового глузду. Пояснення, що далеке минуле безпосередньо впливає на сучасне – непереконливе й неправдоподібне. Адже, строго кажучи, минулого вже не існує. Втім, цей парадокс легко розв'язується. Треба припустити, що існують ланцюги не спостережуваних змінних, через посередництво яких минуле передало інформацію і змогло здійснити вплив на змінні поточного часу. Ідентифікація ребра моделі – це виявлення безпосереднього («лаг-специфічного») зв'язку. Для ідентифікація кожного ребра доводиться виконати багато тестів умовної незалежності (знайти сепаратор). В ході пошуку сепаратора для пари iY , kiX − треба відразу відкинути всі змінні jV з індексами часу ij  . Першочергові кандидати у сепараторний набор – це змінні, можливо-суміжні до iY або kiX − , й найближчі до них. Назвемо кілька запропонованих алгоритмів виведення моделі з багатовимірних часових рядів даних. Алгоритми SVAR-FCI та SVAR-GFCI [22] є результатом адаптації методу FCI до часових рядів з прихованими змінними. Ці алгоритми припускають існування ізохронних зв'язків, але без утворення циклонів. (Циклони не утворюються, якщо впливи протягом одного інтервалу вимірювання не встигають оббігти цикл й повернутися до стартової змінної.) Алгоритм Regime-PCMCI відрізняється додатковими можливостями; він автоматично шукає фрагменти векторного ряду, які відповідають різним режимам функціонування процесу [13]. Характер (орієнтацію) деяких ребер розпізнати неможливо, особливо якщо припускаються приховані спільні причини. В таких обставинах алгоритм виведення моделі оперує кількома формами опису ребер. Ребро вигляду ZV → є каузальним. Біорієнтоване ребро WQ  показує, що існує деяка прихована змінна U , яка впливає рівночасно (паралельно) на Q та W . Ребро вигляду YX − відображає ситуацію, коли каузальний характер цього зв'язку зовсім не визначений. Ребро з частково визначеною орієнтацією ZV → резервує два варіанти (біорієнтоване, каузальне). Після ідентифікації присутності ребер моделі алгоритм переходить до етапу орієнтації ребер. Якщо змінна X йде у часі раніше, ніж Y , позначаємо це YX  . Чинне правило «фізичного сенсу»: якщо відомо, що YX  , і маємо ребро YX − , то орієнтуй YX → . Втім, замість того, щоб вставляти в алгоритм подібне правило, простіше вже на етапі виявлення безпосередніх зв'язків відразу ставити ребра вигляду YX → . Отже, при виведенні моделі з даних часових рядів всі ребра відразу отримують вістря на передньому кінці. Тому деякі стандартні правила орієнтації [6, 7], розроблені для статичних каузальних мереж, стають непотрібними. Повний набір правил працює для орієнтації ізохронних ребер. Але тут розглядаємо випадок, коли ізохронних ребра немає. Розглянемо тільки перші два правила орієнтації ребер – 0 та 1 . Оскільки завдяки відомому темпоральному порядку змінних всі ребра відразу отримують вістря ( BA → ), створюються умови для застосування правила орієнтації ребер 1 . Тому на перший погляд може здатися, що немає необхідності застосовувати правило орієнтації ребер 0 . Проте це хибна думка. Правило 0 забезпечує також розпізнавання «вістря» на задньому кінці ребер. Тим самим правило 0 розпізнає біорієнтовані ребра, а отже, виключає можливість, що цей зв'язок є каузальним. Для ситуації відомого темпорального порядку змінних правило орієнтації ребер 1 формулюється наступним чином . Втім, за- мість того, щоб вставляти в алгоритм подібне правило, простіше вже на етапі виявлення безпосередніх зв’язків відразу ставити ребра вигляду Моделі і засоби систем баз даних та знань змінних, а відтак, і зв'язків (автокореляційних та крос-кореляційних). Але зростання складності стримується іншою особливістю задачі – стандартними припущеннями про регулярність системи зв'язків. Припущення про регулярність зв'язків доповнюється припущенням про стабільність кількісних характеристик (сили зв'язків). Знання темпорального порядку змінних дозволяє впорядкувати виведення динамічних каузальних мереж (порівняно з звичайними мережами), спрощує пошук сепараторів та допомагає визначенню орієнтацій ребер. Розумно спочатку ідентифікувати «короткі» зв'язки (з малим лагом); це спростить пошук довгих зв'язків. Відкриваються можливості оптимізувати тактику пошуку сепараторів, тобто умов для тестів незалежності. Якщо найбільший лаг післядії (довжина зв'язків) – невідомий, виникає проблема, якої немає при виведенні «статичної» каузальної мережі. По-суті, в такому разі невідомим стає розмір («часова глибина») моделі. В такій ситуації треба вирішувати, коли припинити аналіз вглиб і зафіксувати розмір моделі. Просте практичне рішення – перед запуском алгоритму виведення директивно встановити максимальний лаг (вказати цифру). Більш адаптивне рішення (яке має певне теоретичне виправдання) полягає в тому, що при досягненні певних ознак «насичення» моделі робиться висновок, що знайдено справжній розмір моделі. Відтак, нарощування моделі треба припинити. Такою ознакою «насичення» моделі є той факт, що після аналізу зв'язків чергової довжини k (найбільшої на цей момент) з'ясувалося, що зв'язки такої глибини відсутні. Вказана ознака в багатьох випадках виправдана, але не завжди гарантує досягнення повної глибини автентичної моделі. Така ознака дійсно свідчить про відсутність зв'язки з лагом більше k тільки за припущення регулярності структури та за умов, що всі ряди мають достатньо сильні короткі автокореляційні зв'язки (вигляду ii XX →−1 ). Короткі автокореляційні зв'язки присутні у більшості реальних процесів, але не можна гарантувати, що вони є скрізь. Припущення елементарної структурної регулярності може не виконуватися. Регулярність зв'язків може мати іншу форму – як періодичне повторення зв'язків. Тобто якщо є зв'язок ii YX →−1 , то також є зв'язок  ++− → ii YX 1 . Згорнута репрезентація такої моделі має «довжину»  + , де  – довжина зв'язку з найбільшим лагом, а  – довжина періоду повторення зв'язків. Якщо розмір періоду повторення зв'язків невідомий, задача виведення моделі радикально ускладнюється. Треба багатократно переглядати схему обчислення статистик. Зв'язки з великим часовим лагом є джерелом проблем. Давайте поглянемо на існування таких зв'язків з точки зору фізичного сенсу і здорового глузду. Пояснення, що далеке минуле безпосередньо впливає на сучасне – непереконливе й неправдоподібне. Адже, строго кажучи, минулого вже не існує. Втім, цей парадокс легко розв'язується. Треба припустити, що існують ланцюги не спостережуваних змінних, через посередництво яких минуле передало інформацію і змогло здійснити вплив на змінні поточного часу. Ідентифікація ребра моделі – це виявлення безпосереднього («лаг-специфічного») зв'язку. Для ідентифікація кожного ребра доводиться виконати багато тестів умовної незалежності (знайти сепаратор). В ході пошуку сепаратора для пари iY , kiX − треба відразу відкинути всі змінні jV з індексами часу ij  . Першочергові кандидати у сепараторний набор – це змінні, можливо-суміжні до iY або kiX − , й найближчі до них. Назвемо кілька запропонованих алгоритмів виведення моделі з багатовимірних часових рядів даних. Алгоритми SVAR-FCI та SVAR-GFCI [22] є результатом адаптації методу FCI до часових рядів з прихованими змінними. Ці алгоритми припускають існування ізохронних зв'язків, але без утворення циклонів. (Циклони не утворюються, якщо впливи протягом одного інтервалу вимірювання не встигають оббігти цикл й повернутися до стартової змінної.) Алгоритм Regime-PCMCI відрізняється додатковими можливостями; він автоматично шукає фрагменти векторного ряду, які відповідають різним режимам функціонування процесу [13]. Характер (орієнтацію) деяких ребер розпізнати неможливо, особливо якщо припускаються приховані спільні причини. В таких обставинах алгоритм виведення моделі оперує кількома формами опису ребер. Ребро вигляду ZV → є каузальним. Біорієнтоване ребро WQ  показує, що існує деяка прихована змінна U , яка впливає рівночасно (паралельно) на Q та W . Ребро вигляду YX − відображає ситуацію, коли каузальний характер цього зв'язку зовсім не визначений. Ребро з частково визначеною орієнтацією ZV → резервує два варіанти (біорієнтоване, каузальне). Після ідентифікації присутності ребер моделі алгоритм переходить до етапу орієнтації ребер. Якщо змінна X йде у часі раніше, ніж Y , позначаємо це YX  . Чинне правило «фізичного сенсу»: якщо відомо, що YX  , і маємо ребро YX − , то орієнтуй YX → . Втім, замість того, щоб вставляти в алгоритм подібне правило, простіше вже на етапі виявлення безпосередніх зв'язків відразу ставити ребра вигляду YX → . Отже, при виведенні моделі з даних часових рядів всі ребра відразу отримують вістря на передньому кінці. Тому деякі стандартні правила орієнтації [6, 7], розроблені для статичних каузальних мереж, стають непотрібними. Повний набір правил працює для орієнтації ізохронних ребер. Але тут розглядаємо випадок, коли ізохронних ребра немає. Розглянемо тільки перші два правила орієнтації ребер – 0 та 1 . Оскільки завдяки відомому темпоральному порядку змінних всі ребра відразу отримують вістря ( BA → ), створюються умови для застосування правила орієнтації ребер 1 . Тому на перший погляд може здатися, що немає необхідності застосовувати правило орієнтації ребер 0 . Проте це хибна думка. Правило 0 забезпечує також розпізнавання «вістря» на задньому кінці ребер. Тим самим правило 0 розпізнає біорієнтовані ребра, а отже, виключає можливість, що цей зв'язок є каузальним. Для ситуації відомого темпорального порядку змінних правило орієнтації ребер 1 формулюється наступним чином . Отже, при виведенні моделі з даних часових рядів всі ребра відразу отримують вістря на передньому кінці. Тому деякі стандартні правила орієнтації [6, 7], розроблені для статич- них каузальних мереж, стають непотрібними. Повний набір правил працює для орієнтації ізохронних ребер. Але тут розглядаємо випадок, коли ізохронних ребра немає. Розглянемо тільки перші два правила орієнтації ребер – Моделі і засоби систем баз даних та знань змінних, а відтак, і зв'язків (автокореляційних та крос-кореляційних). Але зростання складності стримується іншою особливістю задачі – стандартними припущеннями про регулярність системи зв'язків. Припущення про регулярність зв'язків доповнюється припущенням про стабільність кількісних характеристик (сили зв'язків). Знання темпорального порядку змінних дозволяє впорядкувати виведення динамічних каузальних мереж (порівняно з звичайними мережами), спрощує пошук сепараторів та допомагає визначенню орієнтацій ребер. Розумно спочатку ідентифікувати «короткі» зв'язки (з малим лагом); це спростить пошук довгих зв'язків. Відкриваються можливості оптимізувати тактику пошуку сепараторів, тобто умов для тестів незалежності. Якщо найбільший лаг післядії (довжина зв'язків) – невідомий, виникає проблема, якої немає при виведенні «статичної» каузальної мережі. По-суті, в такому разі невідомим стає розмір («часова глибина») моделі. В такій ситуації треба вирішувати, коли припинити аналіз вглиб і зафіксувати розмір моделі. Просте практичне рішення – перед запуском алгоритму виведення директивно встановити максимальний лаг (вказати цифру). Більш адаптивне рішення (яке має певне теоретичне виправдання) полягає в тому, що при досягненні певних ознак «насичення» моделі робиться висновок, що знайдено справжній розмір моделі. Відтак, нарощування моделі треба припинити. Такою ознакою «насичення» моделі є той факт, що після аналізу зв'язків чергової довжини k (найбільшої на цей момент) з'ясувалося, що зв'язки такої глибини відсутні. Вказана ознака в багатьох випадках виправдана, але не завжди гарантує досягнення повної глибини автентичної моделі. Така ознака дійсно свідчить про відсутність зв'язки з лагом більше k тільки за припущення регулярності структури та за умов, що всі ряди мають достатньо сильні короткі автокореляційні зв'язки (вигляду ii XX →−1 ). Короткі автокореляційні зв'язки присутні у більшості реальних процесів, але не можна гарантувати, що вони є скрізь. Припущення елементарної структурної регулярності може не виконуватися. Регулярність зв'язків може мати іншу форму – як періодичне повторення зв'язків. Тобто якщо є зв'язок ii YX →−1 , то також є зв'язок  ++− → ii YX 1 . Згорнута репрезентація такої моделі має «довжину»  + , де  – довжина зв'язку з найбільшим лагом, а  – довжина періоду повторення зв'язків. Якщо розмір періоду повторення зв'язків невідомий, задача виведення моделі радикально ускладнюється. Треба багатократно переглядати схему обчислення статистик. Зв'язки з великим часовим лагом є джерелом проблем. Давайте поглянемо на існування таких зв'язків з точки зору фізичного сенсу і здорового глузду. Пояснення, що далеке минуле безпосередньо впливає на сучасне – непереконливе й неправдоподібне. Адже, строго кажучи, минулого вже не існує. Втім, цей парадокс легко розв'язується. Треба припустити, що існують ланцюги не спостережуваних змінних, через посередництво яких минуле передало інформацію і змогло здійснити вплив на змінні поточного часу. Ідентифікація ребра моделі – це виявлення безпосереднього («лаг-специфічного») зв'язку. Для ідентифікація кожного ребра доводиться виконати багато тестів умовної незалежності (знайти сепаратор). В ході пошуку сепаратора для пари iY , kiX − треба відразу відкинути всі змінні jV з індексами часу ij  . Першочергові кандидати у сепараторний набор – це змінні, можливо-суміжні до iY або kiX − , й найближчі до них. Назвемо кілька запропонованих алгоритмів виведення моделі з багатовимірних часових рядів даних. Алгоритми SVAR-FCI та SVAR-GFCI [22] є результатом адаптації методу FCI до часових рядів з прихованими змінними. Ці алгоритми припускають існування ізохронних зв'язків, але без утворення циклонів. (Циклони не утворюються, якщо впливи протягом одного інтервалу вимірювання не встигають оббігти цикл й повернутися до стартової змінної.) Алгоритм Regime-PCMCI відрізняється додатковими можливостями; він автоматично шукає фрагменти векторного ряду, які відповідають різним режимам функціонування процесу [13]. Характер (орієнтацію) деяких ребер розпізнати неможливо, особливо якщо припускаються приховані спільні причини. В таких обставинах алгоритм виведення моделі оперує кількома формами опису ребер. Ребро вигляду ZV → є каузальним. Біорієнтоване ребро WQ  показує, що існує деяка прихована змінна U , яка впливає рівночасно (паралельно) на Q та W . Ребро вигляду YX − відображає ситуацію, коли каузальний характер цього зв'язку зовсім не визначений. Ребро з частково визначеною орієнтацією ZV → резервує два варіанти (біорієнтоване, каузальне). Після ідентифікації присутності ребер моделі алгоритм переходить до етапу орієнтації ребер. Якщо змінна X йде у часі раніше, ніж Y , позначаємо це YX  . Чинне правило «фізичного сенсу»: якщо відомо, що YX  , і маємо ребро YX − , то орієнтуй YX → . Втім, замість того, щоб вставляти в алгоритм подібне правило, простіше вже на етапі виявлення безпосередніх зв'язків відразу ставити ребра вигляду YX → . Отже, при виведенні моделі з даних часових рядів всі ребра відразу отримують вістря на передньому кінці. Тому деякі стандартні правила орієнтації [6, 7], розроблені для статичних каузальних мереж, стають непотрібними. Повний набір правил працює для орієнтації ізохронних ребер. Але тут розглядаємо випадок, коли ізохронних ребра немає. Розглянемо тільки перші два правила орієнтації ребер – 0 та 1 . Оскільки завдяки відомому темпоральному порядку змінних всі ребра відразу отримують вістря ( BA → ), створюються умови для застосування правила орієнтації ребер 1 . Тому на перший погляд може здатися, що немає необхідності застосовувати правило орієнтації ребер 0 . Проте це хибна думка. Правило 0 забезпечує також розпізнавання «вістря» на задньому кінці ребер. Тим самим правило 0 розпізнає біорієнтовані ребра, а отже, виключає можливість, що цей зв'язок є каузальним. Для ситуації відомого темпорального порядку змінних правило орієнтації ребер 1 формулюється наступним чином . Оскільки завдяки відомому темпоральному порядку змінних всі ребра відразу отримують вістря ( Моделі і засоби систем баз даних та знань змінних, а відтак, і зв'язків (автокореляційних та крос-кореляційних). Але зростання складності стримується іншою особливістю задачі – стандартними припущеннями про регулярність системи зв'язків. Припущення про регулярність зв'язків доповнюється припущенням про стабільність кількісних характеристик (сили зв'язків). Знання темпорального порядку змінних дозволяє впорядкувати виведення динамічних каузальних мереж (порівняно з звичайними мережами), спрощує пошук сепараторів та допомагає визначенню орієнтацій ребер. Розумно спочатку ідентифікувати «короткі» зв'язки (з малим лагом); це спростить пошук довгих зв'язків. Відкриваються можливості оптимізувати тактику пошуку сепараторів, тобто умов для тестів незалежності. Якщо найбільший лаг післядії (довжина зв'язків) – невідомий, виникає проблема, якої немає при виведенні «статичної» каузальної мережі. По-суті, в такому разі невідомим стає розмір («часова глибина») моделі. В такій ситуації треба вирішувати, коли припинити аналіз вглиб і зафіксувати розмір моделі. Просте практичне рішення – перед запуском алгоритму виведення директивно встановити максимальний лаг (вказати цифру). Більш адаптивне рішення (яке має певне теоретичне виправдання) полягає в тому, що при досягненні певних ознак «насичення» моделі робиться висновок, що знайдено справжній розмір моделі. Відтак, нарощування моделі треба припинити. Такою ознакою «насичення» моделі є той факт, що після аналізу зв'язків чергової довжини k (найбільшої на цей момент) з'ясувалося, що зв'язки такої глибини відсутні. Вказана ознака в багатьох випадках виправдана, але не завжди гарантує досягнення повної глибини автентичної моделі. Така ознака дійсно свідчить про відсутність зв'язки з лагом більше k тільки за припущення регулярності структури та за умов, що всі ряди мають достатньо сильні короткі автокореляційні зв'язки (вигляду ii XX →−1 ). Короткі автокореляційні зв'язки присутні у більшості реальних процесів, але не можна гарантувати, що вони є скрізь. Припущення елементарної структурної регулярності може не виконуватися. Регулярність зв'язків може мати іншу форму – як періодичне повторення зв'язків. Тобто якщо є зв'язок ii YX →−1 , то також є зв'язок  ++− → ii YX 1 . Згорнута репрезентація такої моделі має «довжину»  + , де  – довжина зв'язку з найбільшим лагом, а  – довжина періоду повторення зв'язків. Якщо розмір періоду повторення зв'язків невідомий, задача виведення моделі радикально ускладнюється. Треба багатократно переглядати схему обчислення статистик. Зв'язки з великим часовим лагом є джерелом проблем. Давайте поглянемо на існування таких зв'язків з точки зору фізичного сенсу і здорового глузду. Пояснення, що далеке минуле безпосередньо впливає на сучасне – непереконливе й неправдоподібне. Адже, строго кажучи, минулого вже не існує. Втім, цей парадокс легко розв'язується. Треба припустити, що існують ланцюги не спостережуваних змінних, через посередництво яких минуле передало інформацію і змогло здійснити вплив на змінні поточного часу. Ідентифікація ребра моделі – це виявлення безпосереднього («лаг-специфічного») зв'язку. Для ідентифікація кожного ребра доводиться виконати багато тестів умовної незалежності (знайти сепаратор). В ході пошуку сепаратора для пари iY , kiX − треба відразу відкинути всі змінні jV з індексами часу ij  . Першочергові кандидати у сепараторний набор – це змінні, можливо-суміжні до iY або kiX − , й найближчі до них. Назвемо кілька запропонованих алгоритмів виведення моделі з багатовимірних часових рядів даних. Алгоритми SVAR-FCI та SVAR-GFCI [22] є результатом адаптації методу FCI до часових рядів з прихованими змінними. Ці алгоритми припускають існування ізохронних зв'язків, але без утворення циклонів. (Циклони не утворюються, якщо впливи протягом одного інтервалу вимірювання не встигають оббігти цикл й повернутися до стартової змінної.) Алгоритм Regime-PCMCI відрізняється додатковими можливостями; він автоматично шукає фрагменти векторного ряду, які відповідають різним режимам функціонування процесу [13]. Характер (орієнтацію) деяких ребер розпізнати неможливо, особливо якщо припускаються приховані спільні причини. В таких обставинах алгоритм виведення моделі оперує кількома формами опису ребер. Ребро вигляду ZV → є каузальним. Біорієнтоване ребро WQ  показує, що існує деяка прихована змінна U , яка впливає рівночасно (паралельно) на Q та W . Ребро вигляду YX − відображає ситуацію, коли каузальний характер цього зв'язку зовсім не визначений. Ребро з частково визначеною орієнтацією ZV → резервує два варіанти (біорієнтоване, каузальне). Після ідентифікації присутності ребер моделі алгоритм переходить до етапу орієнтації ребер. Якщо змінна X йде у часі раніше, ніж Y , позначаємо це YX  . Чинне правило «фізичного сенсу»: якщо відомо, що YX  , і маємо ребро YX − , то орієнтуй YX → . Втім, замість того, щоб вставляти в алгоритм подібне правило, простіше вже на етапі виявлення безпосередніх зв'язків відразу ставити ребра вигляду YX → . Отже, при виведенні моделі з даних часових рядів всі ребра відразу отримують вістря на передньому кінці. Тому деякі стандартні правила орієнтації [6, 7], розроблені для статичних каузальних мереж, стають непотрібними. Повний набір правил працює для орієнтації ізохронних ребер. Але тут розглядаємо випадок, коли ізохронних ребра немає. Розглянемо тільки перші два правила орієнтації ребер – 0 та 1 . Оскільки завдяки відомому темпоральному порядку змінних всі ребра відразу отримують вістря ( BA → ), створюються умови для застосування правила орієнтації ребер 1 . Тому на перший погляд може здатися, що немає необхідності застосовувати правило орієнтації ребер 0 . Проте це хибна думка. Правило 0 забезпечує також розпізнавання «вістря» на задньому кінці ребер. Тим самим правило 0 розпізнає біорієнтовані ребра, а отже, виключає можливість, що цей зв'язок є каузальним. Для ситуації відомого темпорального порядку змінних правило орієнтації ребер 1 формулюється наступним чином ), створюються умови для застосування правила орієнтації ребер Моделі і засоби систем баз даних та знань змінних, а відтак, і зв'язків (автокореляційних та крос-кореляційних). Але зростання складності стримується іншою особливістю задачі – стандартними припущеннями про регулярність системи зв'язків. Припущення про регулярність зв'язків доповнюється припущенням про стабільність кількісних характеристик (сили зв'язків). Знання темпорального порядку змінних дозволяє впорядкувати виведення динамічних каузальних мереж (порівняно з звичайними мережами), спрощує пошук сепараторів та допомагає визначенню орієнтацій ребер. Розумно спочатку ідентифікувати «короткі» зв'язки (з малим лагом); це спростить пошук довгих зв'язків. Відкриваються можливості оптимізувати тактику пошуку сепараторів, тобто умов для тестів незалежності. Якщо найбільший лаг післядії (довжина зв'язків) – невідомий, виникає проблема, якої немає при виведенні «статичної» каузальної мережі. По-суті, в такому разі невідомим стає розмір («часова глибина») моделі. В такій ситуації треба вирішувати, коли припинити аналіз вглиб і зафіксувати розмір моделі. Просте практичне рішення – перед запуском алгоритму виведення директивно встановити максимальний лаг (вказати цифру). Більш адаптивне рішення (яке має певне теоретичне виправдання) полягає в тому, що при досягненні певних ознак «насичення» моделі робиться висновок, що знайдено справжній розмір моделі. Відтак, нарощування моделі треба припинити. Такою ознакою «насичення» моделі є той факт, що після аналізу зв'язків чергової довжини k (найбільшої на цей момент) з'ясувалося, що зв'язки такої глибини відсутні. Вказана ознака в багатьох випадках виправдана, але не завжди гарантує досягнення повної глибини автентичної моделі. Така ознака дійсно свідчить про відсутність зв'язки з лагом більше k тільки за припущення регулярності структури та за умов, що всі ряди мають достатньо сильні короткі автокореляційні зв'язки (вигляду ii XX →−1 ). Короткі автокореляційні зв'язки присутні у більшості реальних процесів, але не можна гарантувати, що вони є скрізь. Припущення елементарної структурної регулярності може не виконуватися. Регулярність зв'язків може мати іншу форму – як періодичне повторення зв'язків. Тобто якщо є зв'язок ii YX →−1 , то також є зв'язок  ++− → ii YX 1 . Згорнута репрезентація такої моделі має «довжину»  + , де  – довжина зв'язку з найбільшим лагом, а  – довжина періоду повторення зв'язків. Якщо розмір періоду повторення зв'язків невідомий, задача виведення моделі радикально ускладнюється. Треба багатократно переглядати схему обчислення статистик. Зв'язки з великим часовим лагом є джерелом проблем. Давайте поглянемо на існування таких зв'язків з точки зору фізичного сенсу і здорового глузду. Пояснення, що далеке минуле безпосередньо впливає на сучасне – непереконливе й неправдоподібне. Адже, строго кажучи, минулого вже не існує. Втім, цей парадокс легко розв'язується. Треба припустити, що існують ланцюги не спостережуваних змінних, через посередництво яких минуле передало інформацію і змогло здійснити вплив на змінні поточного часу. Ідентифікація ребра моделі – це виявлення безпосереднього («лаг-специфічного») зв'язку. Для ідентифікація кожного ребра доводиться виконати багато тестів умовної незалежності (знайти сепаратор). В ході пошуку сепаратора для пари iY , kiX − треба відразу відкинути всі змінні jV з індексами часу ij  . Першочергові кандидати у сепараторний набор – це змінні, можливо-суміжні до iY або kiX − , й найближчі до них. Назвемо кілька запропонованих алгоритмів виведення моделі з багатовимірних часових рядів даних. Алгоритми SVAR-FCI та SVAR-GFCI [22] є результатом адаптації методу FCI до часових рядів з прихованими змінними. Ці алгоритми припускають існування ізохронних зв'язків, але без утворення циклонів. (Циклони не утворюються, якщо впливи протягом одного інтервалу вимірювання не встигають оббігти цикл й повернутися до стартової змінної.) Алгоритм Regime-PCMCI відрізняється додатковими можливостями; він автоматично шукає фрагменти векторного ряду, які відповідають різним режимам функціонування процесу [13]. Характер (орієнтацію) деяких ребер розпізнати неможливо, особливо якщо припускаються приховані спільні причини. В таких обставинах алгоритм виведення моделі оперує кількома формами опису ребер. Ребро вигляду ZV → є каузальним. Біорієнтоване ребро WQ  показує, що існує деяка прихована змінна U , яка впливає рівночасно (паралельно) на Q та W . Ребро вигляду YX − відображає ситуацію, коли каузальний характер цього зв'язку зовсім не визначений. Ребро з частково визначеною орієнтацією ZV → резервує два варіанти (біорієнтоване, каузальне). Після ідентифікації присутності ребер моделі алгоритм переходить до етапу орієнтації ребер. Якщо змінна X йде у часі раніше, ніж Y , позначаємо це YX  . Чинне правило «фізичного сенсу»: якщо відомо, що YX  , і маємо ребро YX − , то орієнтуй YX → . Втім, замість того, щоб вставляти в алгоритм подібне правило, простіше вже на етапі виявлення безпосередніх зв'язків відразу ставити ребра вигляду YX → . Отже, при виведенні моделі з даних часових рядів всі ребра відразу отримують вістря на передньому кінці. Тому деякі стандартні правила орієнтації [6, 7], розроблені для статичних каузальних мереж, стають непотрібними. Повний набір правил працює для орієнтації ізохронних ребер. Але тут розглядаємо випадок, коли ізохронних ребра немає. Розглянемо тільки перші два правила орієнтації ребер – 0 та 1 . Оскільки завдяки відомому темпоральному порядку змінних всі ребра відразу отримують вістря ( BA → ), створюються умови для застосування правила орієнтації ребер 1 . Тому на перший погляд може здатися, що немає необхідності застосовувати правило орієнтації ребер 0 . Проте це хибна думка. Правило 0 забезпечує також розпізнавання «вістря» на задньому кінці ребер. Тим самим правило 0 розпізнає біорієнтовані ребра, а отже, виключає можливість, що цей зв'язок є каузальним. Для ситуації відомого темпорального порядку змінних правило орієнтації ребер 1 формулюється наступним чином . Тому на перший погляд може здатися, що немає необхідності застосовувати правило орієнтації ребер Моделі і засоби систем баз даних та знань змінних, а відтак, і зв'язків (автокореляційних та крос-кореляційних). Але зростання складності стримується іншою особливістю задачі – стандартними припущеннями про регулярність системи зв'язків. Припущення про регулярність зв'язків доповнюється припущенням про стабільність кількісних характеристик (сили зв'язків). Знання темпорального порядку змінних дозволяє впорядкувати виведення динамічних каузальних мереж (порівняно з звичайними мережами), спрощує пошук сепараторів та допомагає визначенню орієнтацій ребер. Розумно спочатку ідентифікувати «короткі» зв'язки (з малим лагом); це спростить пошук довгих зв'язків. Відкриваються можливості оптимізувати тактику пошуку сепараторів, тобто умов для тестів незалежності. Якщо найбільший лаг післядії (довжина зв'язків) – невідомий, виникає проблема, якої немає при виведенні «статичної» каузальної мережі. По-суті, в такому разі невідомим стає розмір («часова глибина») моделі. В такій ситуації треба вирішувати, коли припинити аналіз вглиб і зафіксувати розмір моделі. Просте практичне рішення – перед запуском алгоритму виведення директивно встановити максимальний лаг (вказати цифру). Більш адаптивне рішення (яке має певне теоретичне виправдання) полягає в тому, що при досягненні певних ознак «насичення» моделі робиться висновок, що знайдено справжній розмір моделі. Відтак, нарощування моделі треба припинити. Такою ознакою «насичення» моделі є той факт, що після аналізу зв'язків чергової довжини k (найбільшої на цей момент) з'ясувалося, що зв'язки такої глибини відсутні. Вказана ознака в багатьох випадках виправдана, але не завжди гарантує досягнення повної глибини автентичної моделі. Така ознака дійсно свідчить про відсутність зв'язки з лагом більше k тільки за припущення регулярності структури та за умов, що всі ряди мають достатньо сильні короткі автокореляційні зв'язки (вигляду ii XX →−1 ). Короткі автокореляційні зв'язки присутні у більшості реальних процесів, але не можна гарантувати, що вони є скрізь. Припущення елементарної структурної регулярності може не виконуватися. Регулярність зв'язків може мати іншу форму – як періодичне повторення зв'язків. Тобто якщо є зв'язок ii YX →−1 , то також є зв'язок  ++− → ii YX 1 . Згорнута репрезентація такої моделі має «довжину»  + , де  – довжина зв'язку з найбільшим лагом, а  – довжина періоду повторення зв'язків. Якщо розмір періоду повторення зв'язків невідомий, задача виведення моделі радикально ускладнюється. Треба багатократно переглядати схему обчислення статистик. Зв'язки з великим часовим лагом є джерелом проблем. Давайте поглянемо на існування таких зв'язків з точки зору фізичного сенсу і здорового глузду. Пояснення, що далеке минуле безпосередньо впливає на сучасне – непереконливе й неправдоподібне. Адже, строго кажучи, минулого вже не існує. Втім, цей парадокс легко розв'язується. Треба припустити, що існують ланцюги не спостережуваних змінних, через посередництво яких минуле передало інформацію і змогло здійснити вплив на змінні поточного часу. Ідентифікація ребра моделі – це виявлення безпосереднього («лаг-специфічного») зв'язку. Для ідентифікація кожного ребра доводиться виконати багато тестів умовної незалежності (знайти сепаратор). В ході пошуку сепаратора для пари iY , kiX − треба відразу відкинути всі змінні jV з індексами часу ij  . Першочергові кандидати у сепараторний набор – це змінні, можливо-суміжні до iY або kiX − , й найближчі до них. Назвемо кілька запропонованих алгоритмів виведення моделі з багатовимірних часових рядів даних. Алгоритми SVAR-FCI та SVAR-GFCI [22] є результатом адаптації методу FCI до часових рядів з прихованими змінними. Ці алгоритми припускають існування ізохронних зв'язків, але без утворення циклонів. (Циклони не утворюються, якщо впливи протягом одного інтервалу вимірювання не встигають оббігти цикл й повернутися до стартової змінної.) Алгоритм Regime-PCMCI відрізняється додатковими можливостями; він автоматично шукає фрагменти векторного ряду, які відповідають різним режимам функціонування процесу [13]. Характер (орієнтацію) деяких ребер розпізнати неможливо, особливо якщо припускаються приховані спільні причини. В таких обставинах алгоритм виведення моделі оперує кількома формами опису ребер. Ребро вигляду ZV → є каузальним. Біорієнтоване ребро WQ  показує, що існує деяка прихована змінна U , яка впливає рівночасно (паралельно) на Q та W . Ребро вигляду YX − відображає ситуацію, коли каузальний характер цього зв'язку зовсім не визначений. Ребро з частково визначеною орієнтацією ZV → резервує два варіанти (біорієнтоване, каузальне). Після ідентифікації присутності ребер моделі алгоритм переходить до етапу орієнтації ребер. Якщо змінна X йде у часі раніше, ніж Y , позначаємо це YX  . Чинне правило «фізичного сенсу»: якщо відомо, що YX  , і маємо ребро YX − , то орієнтуй YX → . Втім, замість того, щоб вставляти в алгоритм подібне правило, простіше вже на етапі виявлення безпосередніх зв'язків відразу ставити ребра вигляду YX → . Отже, при виведенні моделі з даних часових рядів всі ребра відразу отримують вістря на передньому кінці. Тому деякі стандартні правила орієнтації [6, 7], розроблені для статичних каузальних мереж, стають непотрібними. Повний набір правил працює для орієнтації ізохронних ребер. Але тут розглядаємо випадок, коли ізохронних ребра немає. Розглянемо тільки перші два правила орієнтації ребер – 0 та 1 . Оскільки завдяки відомому темпоральному порядку змінних всі ребра відразу отримують вістря ( BA → ), створюються умови для застосування правила орієнтації ребер 1 . Тому на перший погляд може здатися, що немає необхідності застосовувати правило орієнтації ребер 0 . Проте це хибна думка. Правило 0 забезпечує також розпізнавання «вістря» на задньому кінці ребер. Тим самим правило 0 розпізнає біорієнтовані ребра, а отже, виключає можливість, що цей зв'язок є каузальним. Для ситуації відомого темпорального порядку змінних правило орієнтації ребер 1 формулюється наступним чином . Проте це хибна думка. Пра- вило Моделі і засоби систем баз даних та знань змінних, а відтак, і зв'язків (автокореляційних та крос-кореляційних). Але зростання складності стримується іншою особливістю задачі – стандартними припущеннями про регулярність системи зв'язків. Припущення про регулярність зв'язків доповнюється припущенням про стабільність кількісних характеристик (сили зв'язків). Знання темпорального порядку змінних дозволяє впорядкувати виведення динамічних каузальних мереж (порівняно з звичайними мережами), спрощує пошук сепараторів та допомагає визначенню орієнтацій ребер. Розумно спочатку ідентифікувати «короткі» зв'язки (з малим лагом); це спростить пошук довгих зв'язків. Відкриваються можливості оптимізувати тактику пошуку сепараторів, тобто умов для тестів незалежності. Якщо найбільший лаг післядії (довжина зв'язків) – невідомий, виникає проблема, якої немає при виведенні «статичної» каузальної мережі. По-суті, в такому разі невідомим стає розмір («часова глибина») моделі. В такій ситуації треба вирішувати, коли припинити аналіз вглиб і зафіксувати розмір моделі. Просте практичне рішення – перед запуском алгоритму виведення директивно встановити максимальний лаг (вказати цифру). Більш адаптивне рішення (яке має певне теоретичне виправдання) полягає в тому, що при досягненні певних ознак «насичення» моделі робиться висновок, що знайдено справжній розмір моделі. Відтак, нарощування моделі треба припинити. Такою ознакою «насичення» моделі є той факт, що після аналізу зв'язків чергової довжини k (найбільшої на цей момент) з'ясувалося, що зв'язки такої глибини відсутні. Вказана ознака в багатьох випадках виправдана, але не завжди гарантує досягнення повної глибини автентичної моделі. Така ознака дійсно свідчить про відсутність зв'язки з лагом більше k тільки за припущення регулярності структури та за умов, що всі ряди мають достатньо сильні короткі автокореляційні зв'язки (вигляду ii XX →−1 ). Короткі автокореляційні зв'язки присутні у більшості реальних процесів, але не можна гарантувати, що вони є скрізь. Припущення елементарної структурної регулярності може не виконуватися. Регулярність зв'язків може мати іншу форму – як періодичне повторення зв'язків. Тобто якщо є зв'язок ii YX →−1 , то також є зв'язок  ++− → ii YX 1 . Згорнута репрезентація такої моделі має «довжину»  + , де  – довжина зв'язку з найбільшим лагом, а  – довжина періоду повторення зв'язків. Якщо розмір періоду повторення зв'язків невідомий, задача виведення моделі радикально ускладнюється. Треба багатократно переглядати схему обчислення статистик. Зв'язки з великим часовим лагом є джерелом проблем. Давайте поглянемо на існування таких зв'язків з точки зору фізичного сенсу і здорового глузду. Пояснення, що далеке минуле безпосередньо впливає на сучасне – непереконливе й неправдоподібне. Адже, строго кажучи, минулого вже не існує. Втім, цей парадокс легко розв'язується. Треба припустити, що існують ланцюги не спостережуваних змінних, через посередництво яких минуле передало інформацію і змогло здійснити вплив на змінні поточного часу. Ідентифікація ребра моделі – це виявлення безпосереднього («лаг-специфічного») зв'язку. Для ідентифікація кожного ребра доводиться виконати багато тестів умовної незалежності (знайти сепаратор). В ході пошуку сепаратора для пари iY , kiX − треба відразу відкинути всі змінні jV з індексами часу ij  . Першочергові кандидати у сепараторний набор – це змінні, можливо-суміжні до iY або kiX − , й найближчі до них. Назвемо кілька запропонованих алгоритмів виведення моделі з багатовимірних часових рядів даних. Алгоритми SVAR-FCI та SVAR-GFCI [22] є результатом адаптації методу FCI до часових рядів з прихованими змінними. Ці алгоритми припускають існування ізохронних зв'язків, але без утворення циклонів. (Циклони не утворюються, якщо впливи протягом одного інтервалу вимірювання не встигають оббігти цикл й повернутися до стартової змінної.) Алгоритм Regime-PCMCI відрізняється додатковими можливостями; він автоматично шукає фрагменти векторного ряду, які відповідають різним режимам функціонування процесу [13]. Характер (орієнтацію) деяких ребер розпізнати неможливо, особливо якщо припускаються приховані спільні причини. В таких обставинах алгоритм виведення моделі оперує кількома формами опису ребер. Ребро вигляду ZV → є каузальним. Біорієнтоване ребро WQ  показує, що існує деяка прихована змінна U , яка впливає рівночасно (паралельно) на Q та W . Ребро вигляду YX − відображає ситуацію, коли каузальний характер цього зв'язку зовсім не визначений. Ребро з частково визначеною орієнтацією ZV → резервує два варіанти (біорієнтоване, каузальне). Після ідентифікації присутності ребер моделі алгоритм переходить до етапу орієнтації ребер. Якщо змінна X йде у часі раніше, ніж Y , позначаємо це YX  . Чинне правило «фізичного сенсу»: якщо відомо, що YX  , і маємо ребро YX − , то орієнтуй YX → . Втім, замість того, щоб вставляти в алгоритм подібне правило, простіше вже на етапі виявлення безпосередніх зв'язків відразу ставити ребра вигляду YX → . Отже, при виведенні моделі з даних часових рядів всі ребра відразу отримують вістря на передньому кінці. Тому деякі стандартні правила орієнтації [6, 7], розроблені для статичних каузальних мереж, стають непотрібними. Повний набір правил працює для орієнтації ізохронних ребер. Але тут розглядаємо випадок, коли ізохронних ребра немає. Розглянемо тільки перші два правила орієнтації ребер – 0 та 1 . Оскільки завдяки відомому темпоральному порядку змінних всі ребра відразу отримують вістря ( BA → ), створюються умови для застосування правила орієнтації ребер 1 . Тому на перший погляд може здатися, що немає необхідності застосовувати правило орієнтації ребер 0 . Проте це хибна думка. Правило 0 забезпечує також розпізнавання «вістря» на задньому кінці ребер. Тим самим правило 0 розпізнає біорієнтовані ребра, а отже, виключає можливість, що цей зв'язок є каузальним. Для ситуації відомого темпорального порядку змінних правило орієнтації ребер 1 формулюється наступним чином забезпечує також розпізнавання «вістря» на задньому кінці ребер. Тим самим правило Моделі і засоби систем баз даних та знань змінних, а відтак, і зв'язків (автокореляційних та крос-кореляційних). Але зростання складності стримується іншою особливістю задачі – стандартними припущеннями про регулярність системи зв'язків. Припущення про регулярність зв'язків доповнюється припущенням про стабільність кількісних характеристик (сили зв'язків). Знання темпорального порядку змінних дозволяє впорядкувати виведення динамічних каузальних мереж (порівняно з звичайними мережами), спрощує пошук сепараторів та допомагає визначенню орієнтацій ребер. Розумно спочатку ідентифікувати «короткі» зв'язки (з малим лагом); це спростить пошук довгих зв'язків. Відкриваються можливості оптимізувати тактику пошуку сепараторів, тобто умов для тестів незалежності. Якщо найбільший лаг післядії (довжина зв'язків) – невідомий, виникає проблема, якої немає при виведенні «статичної» каузальної мережі. По-суті, в такому разі невідомим стає розмір («часова глибина») моделі. В такій ситуації треба вирішувати, коли припинити аналіз вглиб і зафіксувати розмір моделі. Просте практичне рішення – перед запуском алгоритму виведення директивно встановити максимальний лаг (вказати цифру). Більш адаптивне рішення (яке має певне теоретичне виправдання) полягає в тому, що при досягненні певних ознак «насичення» моделі робиться висновок, що знайдено справжній розмір моделі. Відтак, нарощування моделі треба припинити. Такою ознакою «насичення» моделі є той факт, що після аналізу зв'язків чергової довжини k (найбільшої на цей момент) з'ясувалося, що зв'язки такої глибини відсутні. Вказана ознака в багатьох випадках виправдана, але не завжди гарантує досягнення повної глибини автентичної моделі. Така ознака дійсно свідчить про відсутність зв'язки з лагом більше k тільки за припущення регулярності структури та за умов, що всі ряди мають достатньо сильні короткі автокореляційні зв'язки (вигляду ii XX →−1 ). Короткі автокореляційні зв'язки присутні у більшості реальних процесів, але не можна гарантувати, що вони є скрізь. Припущення елементарної структурної регулярності може не виконуватися. Регулярність зв'язків може мати іншу форму – як періодичне повторення зв'язків. Тобто якщо є зв'язок ii YX →−1 , то також є зв'язок  ++− → ii YX 1 . Згорнута репрезентація такої моделі має «довжину»  + , де  – довжина зв'язку з найбільшим лагом, а  – довжина періоду повторення зв'язків. Якщо розмір періоду повторення зв'язків невідомий, задача виведення моделі радикально ускладнюється. Треба багатократно переглядати схему обчислення статистик. Зв'язки з великим часовим лагом є джерелом проблем. Давайте поглянемо на існування таких зв'язків з точки зору фізичного сенсу і здорового глузду. Пояснення, що далеке минуле безпосередньо впливає на сучасне – непереконливе й неправдоподібне. Адже, строго кажучи, минулого вже не існує. Втім, цей парадокс легко розв'язується. Треба припустити, що існують ланцюги не спостережуваних змінних, через посередництво яких минуле передало інформацію і змогло здійснити вплив на змінні поточного часу. Ідентифікація ребра моделі – це виявлення безпосереднього («лаг-специфічного») зв'язку. Для ідентифікація кожного ребра доводиться виконати багато тестів умовної незалежності (знайти сепаратор). В ході пошуку сепаратора для пари iY , kiX − треба відразу відкинути всі змінні jV з індексами часу ij  . Першочергові кандидати у сепараторний набор – це змінні, можливо-суміжні до iY або kiX − , й найближчі до них. Назвемо кілька запропонованих алгоритмів виведення моделі з багатовимірних часових рядів даних. Алгоритми SVAR-FCI та SVAR-GFCI [22] є результатом адаптації методу FCI до часових рядів з прихованими змінними. Ці алгоритми припускають існування ізохронних зв'язків, але без утворення циклонів. (Циклони не утворюються, якщо впливи протягом одного інтервалу вимірювання не встигають оббігти цикл й повернутися до стартової змінної.) Алгоритм Regime-PCMCI відрізняється додатковими можливостями; він автоматично шукає фрагменти векторного ряду, які відповідають різним режимам функціонування процесу [13]. Характер (орієнтацію) деяких ребер розпізнати неможливо, особливо якщо припускаються приховані спільні причини. В таких обставинах алгоритм виведення моделі оперує кількома формами опису ребер. Ребро вигляду ZV → є каузальним. Біорієнтоване ребро WQ  показує, що існує деяка прихована змінна U , яка впливає рівночасно (паралельно) на Q та W . Ребро вигляду YX − відображає ситуацію, коли каузальний характер цього зв'язку зовсім не визначений. Ребро з частково визначеною орієнтацією ZV → резервує два варіанти (біорієнтоване, каузальне). Після ідентифікації присутності ребер моделі алгоритм переходить до етапу орієнтації ребер. Якщо змінна X йде у часі раніше, ніж Y , позначаємо це YX  . Чинне правило «фізичного сенсу»: якщо відомо, що YX  , і маємо ребро YX − , то орієнтуй YX → . Втім, замість того, щоб вставляти в алгоритм подібне правило, простіше вже на етапі виявлення безпосередніх зв'язків відразу ставити ребра вигляду YX → . Отже, при виведенні моделі з даних часових рядів всі ребра відразу отримують вістря на передньому кінці. Тому деякі стандартні правила орієнтації [6, 7], розроблені для статичних каузальних мереж, стають непотрібними. Повний набір правил працює для орієнтації ізохронних ребер. Але тут розглядаємо випадок, коли ізохронних ребра немає. Розглянемо тільки перші два правила орієнтації ребер – 0 та 1 . Оскільки завдяки відомому темпоральному порядку змінних всі ребра відразу отримують вістря ( BA → ), створюються умови для застосування правила орієнтації ребер 1 . Тому на перший погляд може здатися, що немає необхідності застосовувати правило орієнтації ребер 0 . Проте це хибна думка. Правило 0 забезпечує також розпізнавання «вістря» на задньому кінці ребер. Тим самим правило 0 розпізнає біорієнтовані ребра, а отже, виключає можливість, що цей зв'язок є каузальним. Для ситуації відомого темпорального порядку змінних правило орієнтації ребер 1 формулюється наступним чином розпізнає біорієнтовані ребра, а отже, виключає можливість, що цей зв’язок є каузальним. Для ситуації відомого темпорального порядку змінних правило орієнтації ребер Моделі і засоби систем баз даних та знань змінних, а відтак, і зв'язків (автокореляційних та крос-кореляційних). Але зростання складності стримується іншою особливістю задачі – стандартними припущеннями про регулярність системи зв'язків. Припущення про регулярність зв'язків доповнюється припущенням про стабільність кількісних характеристик (сили зв'язків). Знання темпорального порядку змінних дозволяє впорядкувати виведення динамічних каузальних мереж (порівняно з звичайними мережами), спрощує пошук сепараторів та допомагає визначенню орієнтацій ребер. Розумно спочатку ідентифікувати «короткі» зв'язки (з малим лагом); це спростить пошук довгих зв'язків. Відкриваються можливості оптимізувати тактику пошуку сепараторів, тобто умов для тестів незалежності. Якщо найбільший лаг післядії (довжина зв'язків) – невідомий, виникає проблема, якої немає при виведенні «статичної» каузальної мережі. По-суті, в такому разі невідомим стає розмір («часова глибина») моделі. В такій ситуації треба вирішувати, коли припинити аналіз вглиб і зафіксувати розмір моделі. Просте практичне рішення – перед запуском алгоритму виведення директивно встановити максимальний лаг (вказати цифру). Більш адаптивне рішення (яке має певне теоретичне виправдання) полягає в тому, що при досягненні певних ознак «насичення» моделі робиться висновок, що знайдено справжній розмір моделі. Відтак, нарощування моделі треба припинити. Такою ознакою «насичення» моделі є той факт, що після аналізу зв'язків чергової довжини k (найбільшої на цей момент) з'ясувалося, що зв'язки такої глибини відсутні. Вказана ознака в багатьох випадках виправдана, але не завжди гарантує досягнення повної глибини автентичної моделі. Така ознака дійсно свідчить про відсутність зв'язки з лагом більше k тільки за припущення регулярності структури та за умов, що всі ряди мають достатньо сильні короткі автокореляційні зв'язки (вигляду ii XX →−1 ). Короткі автокореляційні зв'язки присутні у більшості реальних процесів, але не можна гарантувати, що вони є скрізь. Припущення елементарної структурної регулярності може не виконуватися. Регулярність зв'язків може мати іншу форму – як періодичне повторення зв'язків. Тобто якщо є зв'язок ii YX →−1 , то також є зв'язок  ++− → ii YX 1 . Згорнута репрезентація такої моделі має «довжину»  + , де  – довжина зв'язку з найбільшим лагом, а  – довжина періоду повторення зв'язків. Якщо розмір періоду повторення зв'язків невідомий, задача виведення моделі радикально ускладнюється. Треба багатократно переглядати схему обчислення статистик. Зв'язки з великим часовим лагом є джерелом проблем. Давайте поглянемо на існування таких зв'язків з точки зору фізичного сенсу і здорового глузду. Пояснення, що далеке минуле безпосередньо впливає на сучасне – непереконливе й неправдоподібне. Адже, строго кажучи, минулого вже не існує. Втім, цей парадокс легко розв'язується. Треба припустити, що існують ланцюги не спостережуваних змінних, через посередництво яких минуле передало інформацію і змогло здійснити вплив на змінні поточного часу. Ідентифікація ребра моделі – це виявлення безпосереднього («лаг-специфічного») зв'язку. Для ідентифікація кожного ребра доводиться виконати багато тестів умовної незалежності (знайти сепаратор). В ході пошуку сепаратора для пари iY , kiX − треба відразу відкинути всі змінні jV з індексами часу ij  . Першочергові кандидати у сепараторний набор – це змінні, можливо-суміжні до iY або kiX − , й найближчі до них. Назвемо кілька запропонованих алгоритмів виведення моделі з багатовимірних часових рядів даних. Алгоритми SVAR-FCI та SVAR-GFCI [22] є результатом адаптації методу FCI до часових рядів з прихованими змінними. Ці алгоритми припускають існування ізохронних зв'язків, але без утворення циклонів. (Циклони не утворюються, якщо впливи протягом одного інтервалу вимірювання не встигають оббігти цикл й повернутися до стартової змінної.) Алгоритм Regime-PCMCI відрізняється додатковими можливостями; він автоматично шукає фрагменти векторного ряду, які відповідають різним режимам функціонування процесу [13]. Характер (орієнтацію) деяких ребер розпізнати неможливо, особливо якщо припускаються приховані спільні причини. В таких обставинах алгоритм виведення моделі оперує кількома формами опису ребер. Ребро вигляду ZV → є каузальним. Біорієнтоване ребро WQ  показує, що існує деяка прихована змінна U , яка впливає рівночасно (паралельно) на Q та W . Ребро вигляду YX − відображає ситуацію, коли каузальний характер цього зв'язку зовсім не визначений. Ребро з частково визначеною орієнтацією ZV → резервує два варіанти (біорієнтоване, каузальне). Після ідентифікації присутності ребер моделі алгоритм переходить до етапу орієнтації ребер. Якщо змінна X йде у часі раніше, ніж Y , позначаємо це YX  . Чинне правило «фізичного сенсу»: якщо відомо, що YX  , і маємо ребро YX − , то орієнтуй YX → . Втім, замість того, щоб вставляти в алгоритм подібне правило, простіше вже на етапі виявлення безпосередніх зв'язків відразу ставити ребра вигляду YX → . Отже, при виведенні моделі з даних часових рядів всі ребра відразу отримують вістря на передньому кінці. Тому деякі стандартні правила орієнтації [6, 7], розроблені для статичних каузальних мереж, стають непотрібними. Повний набір правил працює для орієнтації ізохронних ребер. Але тут розглядаємо випадок, коли ізохронних ребра немає. Розглянемо тільки перші два правила орієнтації ребер – 0 та 1 . Оскільки завдяки відомому темпоральному порядку змінних всі ребра відразу отримують вістря ( BA → ), створюються умови для застосування правила орієнтації ребер 1 . Тому на перший погляд може здатися, що немає необхідності застосовувати правило орієнтації ребер 0 . Проте це хибна думка. Правило 0 забезпечує також розпізнавання «вістря» на задньому кінці ребер. Тим самим правило 0 розпізнає біорієнтовані ребра, а отже, виключає можливість, що цей зв'язок є каузальним. Для ситуації відомого темпорального порядку змінних правило орієнтації ребер 1 формулюється наступним чином формулюється на- ступним чином Моделі і засоби систем баз даних та знань [Введите текст] QYX →→  & ),(Sepmin QXY   QYX →→ , (3) де ),(Sepmin QX – це мінімальний сепаратор для пари змінних X , Q . Позначка кінця ребра «» означає, що цей кінець ребра залишається не специфікованим і може бути довільним. Для ілюстрації виведення в умовах спільних прихованих причин розглянемо генеративну модель, показану на рис. 4,а. В цій структурі приховані причини ie – взаємонезалежні. (У наведеній структурі кожна ie впливає відразу на дві спостережувані змінні. Це є відхиленням від стандартних припущень.) Маючи достатньо даних, типові алгоритми виведуть модель, показану на рис. 4,в. Біорієнтовані ребра виводяться завдяки правилу 0 . Модель адекватна. Проблем не виникло, оскільки приховані спільні причини ie не займають позицій конфаундерів для каузальних зв'язків [7]. Повертаємося до фізичного пояснення впливів з великим часовим лагом. Ясно, що існують механізми, які передають вплив минулого через посередників (приховані змінні). Змінні, що є першоджерелом впливу, можуть бути організовані як динамічний автокорельований процес. Тому можна припустити, що і посередники впливу також організовані як автокорельований процес. Отже, можна очікувати, що існують приховані автокорельовані часові ряди, які взаємодіють з іншими підпроцесами. Такі часові ряди можуть створити ілюзію зв'язків з нескінченно-довгим часовим лагом. Це підриває тестування марковських властивостей як принцип виведення моделі. Покажемо можливі наслідки існування прихованих часових рядів. Розглянемо екстремально спрощену структуру моделі (рис. 4,б) з наступними особливостями. Прихований часовий ряд iU – автономний, тобто не зазнає впливів від спостережуваної частини моделі. Немає безпосередніх зв'язків між спостережуваними змінними iX . Спочатку уявімо ідеалізовану постановку задачі виведення моделі, коли всі факти незалежності строго випливають з фактів d-сепарації. Тоді всі змінні ряду iX – взаємозалежні, і немає жодної умовні незалежності в рамках спостережуваної моделі. Як наслідок, алгоритм виведе повнозв'язану (насичену) структуру, частково показану на рис. 4,г. Всі ребра мають вигляд ji XX → . Глибина моделі буде визначена технічними обмеженнями алгоритму. Тепер уявімо виведення такої моделі з реалістичних даних. В ході виведення можуть відбутися різні сценарії, пов'язані з тим, що певні непрямі залежності (через ланцюги) поведуть себе як слабкі. Якщо будуть виявлені факти безумовної незалежності, то (завдяки правилу 0 ) в моделі з'являться біорієнтовані ребра, зокрема, ii XX −1 . Якщо алгоритм знайде факти умовної незалежності, то правило 1 виведе каузальні ребра (і це буде грубою помилкою). 5 Виявлення каузальних відношень в даних і каузальність за Грейнджером Навіть в умовах прихованих причин апарат каузальних мереж (за певних відомих обставин) забезпечує виведення каузальних ребер, які свідчать про каузальні відношення [3, 4, 6, 7]. Натомість концепція каузальності К.Грейнджера розрахована на ситуацію повної спостережуваності світу (приховані змінні, які Рис. 4. Ілюстрація виведення каузальних моделей в умовах прихованих змінних та прихованих часових рядів; (а) та (б) – генеративні моделі; (в) та (г) – виведені моделі. а X(t-3) X(t-2) e(t-2) e(t-1) e(t) X(t-1) X(t) e(t-3) б X(t-2) X(t-1) X(t) X(t-2) U(t-3) U(t-2) U(t-1) U(t) в X(t-3) X(t-2) X(t-1) X(t) г X (3) де Моделі і засоби систем баз даних та знань [Введите текст] QYX →→  & ),(Sepmin QXY   QYX →→ , (3) де ),(Sepmin QX – це мінімальний сепаратор для пари змінних X , Q . Позначка кінця ребра «» означає, що цей кінець ребра залишається не специфікованим і може бути довільним. Для ілюстрації виведення в умовах спільних прихованих причин розглянемо генеративну модель, показану на рис. 4,а. В цій структурі приховані причини ie – взаємонезалежні. (У наведеній структурі кожна ie впливає відразу на дві спостережувані змінні. Це є відхиленням від стандартних припущень.) Маючи достатньо даних, типові алгоритми виведуть модель, показану на рис. 4,в. Біорієнтовані ребра виводяться завдяки правилу 0 . Модель адекватна. Проблем не виникло, оскільки приховані спільні причини ie не займають позицій конфаундерів для каузальних зв'язків [7]. Повертаємося до фізичного пояснення впливів з великим часовим лагом. Ясно, що існують механізми, які передають вплив минулого через посередників (приховані змінні). Змінні, що є першоджерелом впливу, можуть бути організовані як динамічний автокорельований процес. Тому можна припустити, що і посередники впливу також організовані як автокорельований процес. Отже, можна очікувати, що існують приховані автокорельовані часові ряди, які взаємодіють з іншими підпроцесами. Такі часові ряди можуть створити ілюзію зв'язків з нескінченно-довгим часовим лагом. Це підриває тестування марковських властивостей як принцип виведення моделі. Покажемо можливі наслідки існування прихованих часових рядів. Розглянемо екстремально спрощену структуру моделі (рис. 4,б) з наступними особливостями. Прихований часовий ряд iU – автономний, тобто не зазнає впливів від спостережуваної частини моделі. Немає безпосередніх зв'язків між спостережуваними змінними iX . Спочатку уявімо ідеалізовану постановку задачі виведення моделі, коли всі факти незалежності строго випливають з фактів d-сепарації. Тоді всі змінні ряду iX – взаємозалежні, і немає жодної умовні незалежності в рамках спостережуваної моделі. Як наслідок, алгоритм виведе повнозв'язану (насичену) структуру, частково показану на рис. 4,г. Всі ребра мають вигляд ji XX → . Глибина моделі буде визначена технічними обмеженнями алгоритму. Тепер уявімо виведення такої моделі з реалістичних даних. В ході виведення можуть відбутися різні сценарії, пов'язані з тим, що певні непрямі залежності (через ланцюги) поведуть себе як слабкі. Якщо будуть виявлені факти безумовної незалежності, то (завдяки правилу 0 ) в моделі з'являться біорієнтовані ребра, зокрема, ii XX −1 . Якщо алгоритм знайде факти умовної незалежності, то правило 1 виведе каузальні ребра (і це буде грубою помилкою). 5 Виявлення каузальних відношень в даних і каузальність за Грейнджером Навіть в умовах прихованих причин апарат каузальних мереж (за певних відомих обставин) забезпечує виведення каузальних ребер, які свідчать про каузальні відношення [3, 4, 6, 7]. Натомість концепція каузальності К.Грейнджера розрахована на ситуацію повної спостережуваності світу (приховані змінні, які Рис. 4. Ілюстрація виведення каузальних моделей в умовах прихованих змінних та прихованих часових рядів; (а) та (б) – генеративні моделі; (в) та (г) – виведені моделі. а X(t-3) X(t-2) e(t-2) e(t-1) e(t) X(t-1) X(t) e(t-3) б X(t-2) X(t-1) X(t) X(t-2) U(t-3) U(t-2) U(t-1) U(t) в X(t-3) X(t-2) X(t-1) X(t) г X – це мінімальний сепаратор для пари змінних Моделі і засоби систем баз даних та знань [Введите текст] QYX →→  & ),(Sepmin QXY   QYX →→ , (3) де ),(Sepmin QX – це мінімальний сепаратор для пари змінних X , Q . Позначка кінця ребра «» означає, що цей кінець ребра залишається не специфікованим і може бути довільним. Для ілюстрації виведення в умовах спільних прихованих причин розглянемо генеративну модель, показану на рис. 4,а. В цій структурі приховані причини ie – взаємонезалежні. (У наведеній структурі кожна ie впливає відразу на дві спостережувані змінні. Це є відхиленням від стандартних припущень.) Маючи достатньо даних, типові алгоритми виведуть модель, показану на рис. 4,в. Біорієнтовані ребра виводяться завдяки правилу 0 . Модель адекватна. Проблем не виникло, оскільки приховані спільні причини ie не займають позицій конфаундерів для каузальних зв'язків [7]. Повертаємося до фізичного пояснення впливів з великим часовим лагом. Ясно, що існують механізми, які передають вплив минулого через посередників (приховані змінні). Змінні, що є першоджерелом впливу, можуть бути організовані як динамічний автокорельований процес. Тому можна припустити, що і посередники впливу також організовані як автокорельований процес. Отже, можна очікувати, що існують приховані автокорельовані часові ряди, які взаємодіють з іншими підпроцесами. Такі часові ряди можуть створити ілюзію зв'язків з нескінченно-довгим часовим лагом. Це підриває тестування марковських властивостей як принцип виведення моделі. Покажемо можливі наслідки існування прихованих часових рядів. Розглянемо екстремально спрощену структуру моделі (рис. 4,б) з наступними особливостями. Прихований часовий ряд iU – автономний, тобто не зазнає впливів від спостережуваної частини моделі. Немає безпосередніх зв'язків між спостережуваними змінними iX . Спочатку уявімо ідеалізовану постановку задачі виведення моделі, коли всі факти незалежності строго випливають з фактів d-сепарації. Тоді всі змінні ряду iX – взаємозалежні, і немає жодної умовні незалежності в рамках спостережуваної моделі. Як наслідок, алгоритм виведе повнозв'язану (насичену) структуру, частково показану на рис. 4,г. Всі ребра мають вигляд ji XX → . Глибина моделі буде визначена технічними обмеженнями алгоритму. Тепер уявімо виведення такої моделі з реалістичних даних. В ході виведення можуть відбутися різні сценарії, пов'язані з тим, що певні непрямі залежності (через ланцюги) поведуть себе як слабкі. Якщо будуть виявлені факти безумовної незалежності, то (завдяки правилу 0 ) в моделі з'являться біорієнтовані ребра, зокрема, ii XX −1 . Якщо алгоритм знайде факти умовної незалежності, то правило 1 виведе каузальні ребра (і це буде грубою помилкою). 5 Виявлення каузальних відношень в даних і каузальність за Грейнджером Навіть в умовах прихованих причин апарат каузальних мереж (за певних відомих обставин) забезпечує виведення каузальних ребер, які свідчать про каузальні відношення [3, 4, 6, 7]. Натомість концепція каузальності К.Грейнджера розрахована на ситуацію повної спостережуваності світу (приховані змінні, які Рис. 4. Ілюстрація виведення каузальних моделей в умовах прихованих змінних та прихованих часових рядів; (а) та (б) – генеративні моделі; (в) та (г) – виведені моделі. а X(t-3) X(t-2) e(t-2) e(t-1) e(t) X(t-1) X(t) e(t-3) б X(t-2) X(t-1) X(t) X(t-2) U(t-3) U(t-2) U(t-1) U(t) в X(t-3) X(t-2) X(t-1) X(t) г X . Позначка кінця ребра «*» означає, що цей кінець ребра залишається не специфікованим і може бути довільним. Для ілюстрації виведення в умовах спільних прихованих причин розглянемо генеративну модель, по- казану на рис. 4,а. В цій структурі приховані причини Моделі і засоби систем баз даних та знань [Введите текст] QYX →→  & ),(Sepmin QXY   QYX →→ , (3) де ),(Sepmin QX – це мінімальний сепаратор для пари змінних X , Q . Позначка кінця ребра «» означає, що цей кінець ребра залишається не специфікованим і може бути довільним. Для ілюстрації виведення в умовах спільних прихованих причин розглянемо генеративну модель, показану на рис. 4,а. В цій структурі приховані причини ie – взаємонезалежні. (У наведеній структурі кожна ie впливає відразу на дві спостережувані змінні. Це є відхиленням від стандартних припущень.) Маючи достатньо даних, типові алгоритми виведуть модель, показану на рис. 4,в. Біорієнтовані ребра виводяться завдяки правилу 0 . Модель адекватна. Проблем не виникло, оскільки приховані спільні причини ie не займають позицій конфаундерів для каузальних зв'язків [7]. Повертаємося до фізичного пояснення впливів з великим часовим лагом. Ясно, що існують механізми, які передають вплив минулого через посередників (приховані змінні). Змінні, що є першоджерелом впливу, можуть бути організовані як динамічний автокорельований процес. Тому можна припустити, що і посередники впливу також організовані як автокорельований процес. Отже, можна очікувати, що існують приховані автокорельовані часові ряди, які взаємодіють з іншими підпроцесами. Такі часові ряди можуть створити ілюзію зв'язків з нескінченно-довгим часовим лагом. Це підриває тестування марковських властивостей як принцип виведення моделі. Покажемо можливі наслідки існування прихованих часових рядів. Розглянемо екстремально спрощену структуру моделі (рис. 4,б) з наступними особливостями. Прихований часовий ряд iU – автономний, тобто не зазнає впливів від спостережуваної частини моделі. Немає безпосередніх зв'язків між спостережуваними змінними iX . Спочатку уявімо ідеалізовану постановку задачі виведення моделі, коли всі факти незалежності строго випливають з фактів d-сепарації. Тоді всі змінні ряду iX – взаємозалежні, і немає жодної умовні незалежності в рамках спостережуваної моделі. Як наслідок, алгоритм виведе повнозв'язану (насичену) структуру, частково показану на рис. 4,г. Всі ребра мають вигляд ji XX → . Глибина моделі буде визначена технічними обмеженнями алгоритму. Тепер уявімо виведення такої моделі з реалістичних даних. В ході виведення можуть відбутися різні сценарії, пов'язані з тим, що певні непрямі залежності (через ланцюги) поведуть себе як слабкі. Якщо будуть виявлені факти безумовної незалежності, то (завдяки правилу 0 ) в моделі з'являться біорієнтовані ребра, зокрема, ii XX −1 . Якщо алгоритм знайде факти умовної незалежності, то правило 1 виведе каузальні ребра (і це буде грубою помилкою). 5 Виявлення каузальних відношень в даних і каузальність за Грейнджером Навіть в умовах прихованих причин апарат каузальних мереж (за певних відомих обставин) забезпечує виведення каузальних ребер, які свідчать про каузальні відношення [3, 4, 6, 7]. Натомість концепція каузальності К.Грейнджера розрахована на ситуацію повної спостережуваності світу (приховані змінні, які Рис. 4. Ілюстрація виведення каузальних моделей в умовах прихованих змінних та прихованих часових рядів; (а) та (б) – генеративні моделі; (в) та (г) – виведені моделі. а X(t-3) X(t-2) e(t-2) e(t-1) e(t) X(t-1) X(t) e(t-3) б X(t-2) X(t-1) X(t) X(t-2) U(t-3) U(t-2) U(t-1) U(t) в X(t-3) X(t-2) X(t-1) X(t) г X – взаємонезалежні. (У наведеній структурі кожна Моделі і засоби систем баз даних та знань [Введите текст] QYX →→  & ),(Sepmin QXY   QYX →→ , (3) де ),(Sepmin QX – це мінімальний сепаратор для пари змінних X , Q . Позначка кінця ребра «» означає, що цей кінець ребра залишається не специфікованим і може бути довільним. Для ілюстрації виведення в умовах спільних прихованих причин розглянемо генеративну модель, показану на рис. 4,а. В цій структурі приховані причини ie – взаємонезалежні. (У наведеній структурі кожна ie впливає відразу на дві спостережувані змінні. Це є відхиленням від стандартних припущень.) Маючи достатньо даних, типові алгоритми виведуть модель, показану на рис. 4,в. Біорієнтовані ребра виводяться завдяки правилу 0 . Модель адекватна. Проблем не виникло, оскільки приховані спільні причини ie не займають позицій конфаундерів для каузальних зв'язків [7]. Повертаємося до фізичного пояснення впливів з великим часовим лагом. Ясно, що існують механізми, які передають вплив минулого через посередників (приховані змінні). Змінні, що є першоджерелом впливу, можуть бути організовані як динамічний автокорельований процес. Тому можна припустити, що і посередники впливу також організовані як автокорельований процес. Отже, можна очікувати, що існують приховані автокорельовані часові ряди, які взаємодіють з іншими підпроцесами. Такі часові ряди можуть створити ілюзію зв'язків з нескінченно-довгим часовим лагом. Це підриває тестування марковських властивостей як принцип виведення моделі. Покажемо можливі наслідки існування прихованих часових рядів. Розглянемо екстремально спрощену структуру моделі (рис. 4,б) з наступними особливостями. Прихований часовий ряд iU – автономний, тобто не зазнає впливів від спостережуваної частини моделі. Немає безпосередніх зв'язків між спостережуваними змінними iX . Спочатку уявімо ідеалізовану постановку задачі виведення моделі, коли всі факти незалежності строго випливають з фактів d-сепарації. Тоді всі змінні ряду iX – взаємозалежні, і немає жодної умовні незалежності в рамках спостережуваної моделі. Як наслідок, алгоритм виведе повнозв'язану (насичену) структуру, частково показану на рис. 4,г. Всі ребра мають вигляд ji XX → . Глибина моделі буде визначена технічними обмеженнями алгоритму. Тепер уявімо виведення такої моделі з реалістичних даних. В ході виведення можуть відбутися різні сценарії, пов'язані з тим, що певні непрямі залежності (через ланцюги) поведуть себе як слабкі. Якщо будуть виявлені факти безумовної незалежності, то (завдяки правилу 0 ) в моделі з'являться біорієнтовані ребра, зокрема, ii XX −1 . Якщо алгоритм знайде факти умовної незалежності, то правило 1 виведе каузальні ребра (і це буде грубою помилкою). 5 Виявлення каузальних відношень в даних і каузальність за Грейнджером Навіть в умовах прихованих причин апарат каузальних мереж (за певних відомих обставин) забезпечує виведення каузальних ребер, які свідчать про каузальні відношення [3, 4, 6, 7]. Натомість концепція каузальності К.Грейнджера розрахована на ситуацію повної спостережуваності світу (приховані змінні, які Рис. 4. Ілюстрація виведення каузальних моделей в умовах прихованих змінних та прихованих часових рядів; (а) та (б) – генеративні моделі; (в) та (г) – виведені моделі. а X(t-3) X(t-2) e(t-2) e(t-1) e(t) X(t-1) X(t) e(t-3) б X(t-2) X(t-1) X(t) X(t-2) U(t-3) U(t-2) U(t-1) U(t) в X(t-3) X(t-2) X(t-1) X(t) г X впливає відразу на дві спостережувані змінні. Це є відхиленням від стандартних припущень.) Маючи достат- ньо даних, типові алгоритми виведуть модель, показану на рис. 4,в. Біорієнтовані ребра виводяться завдяки правилу Моделі і засоби систем баз даних та знань [Введите текст] QYX →→  & ),(Sepmin QXY   QYX →→ , (3) де ),(Sepmin QX – це мінімальний сепаратор для пари змінних X , Q . Позначка кінця ребра «» означає, що цей кінець ребра залишається не специфікованим і може бути довільним. Для ілюстрації виведення в умовах спільних прихованих причин розглянемо генеративну модель, показану на рис. 4,а. В цій структурі приховані причини ie – взаємонезалежні. (У наведеній структурі кожна ie впливає відразу на дві спостережувані змінні. Це є відхиленням від стандартних припущень.) Маючи достатньо даних, типові алгоритми виведуть модель, показану на рис. 4,в. Біорієнтовані ребра виводяться завдяки правилу 0 . Модель адекватна. Проблем не виникло, оскільки приховані спільні причини ie не займають позицій конфаундерів для каузальних зв'язків [7]. Повертаємося до фізичного пояснення впливів з великим часовим лагом. Ясно, що існують механізми, які передають вплив минулого через посередників (приховані змінні). Змінні, що є першоджерелом впливу, можуть бути організовані як динамічний автокорельований процес. Тому можна припустити, що і посередники впливу також організовані як автокорельований процес. Отже, можна очікувати, що існують приховані автокорельовані часові ряди, які взаємодіють з іншими підпроцесами. Такі часові ряди можуть створити ілюзію зв'язків з нескінченно-довгим часовим лагом. Це підриває тестування марковських властивостей як принцип виведення моделі. Покажемо можливі наслідки існування прихованих часових рядів. Розглянемо екстремально спрощену структуру моделі (рис. 4,б) з наступними особливостями. Прихований часовий ряд iU – автономний, тобто не зазнає впливів від спостережуваної частини моделі. Немає безпосередніх зв'язків між спостережуваними змінними iX . Спочатку уявімо ідеалізовану постановку задачі виведення моделі, коли всі факти незалежності строго випливають з фактів d-сепарації. Тоді всі змінні ряду iX – взаємозалежні, і немає жодної умовні незалежності в рамках спостережуваної моделі. Як наслідок, алгоритм виведе повнозв'язану (насичену) структуру, частково показану на рис. 4,г. Всі ребра мають вигляд ji XX → . Глибина моделі буде визначена технічними обмеженнями алгоритму. Тепер уявімо виведення такої моделі з реалістичних даних. В ході виведення можуть відбутися різні сценарії, пов'язані з тим, що певні непрямі залежності (через ланцюги) поведуть себе як слабкі. Якщо будуть виявлені факти безумовної незалежності, то (завдяки правилу 0 ) в моделі з'являться біорієнтовані ребра, зокрема, ii XX −1 . Якщо алгоритм знайде факти умовної незалежності, то правило 1 виведе каузальні ребра (і це буде грубою помилкою). 5 Виявлення каузальних відношень в даних і каузальність за Грейнджером Навіть в умовах прихованих причин апарат каузальних мереж (за певних відомих обставин) забезпечує виведення каузальних ребер, які свідчать про каузальні відношення [3, 4, 6, 7]. Натомість концепція каузальності К.Грейнджера розрахована на ситуацію повної спостережуваності світу (приховані змінні, які Рис. 4. Ілюстрація виведення каузальних моделей в умовах прихованих змінних та прихованих часових рядів; (а) та (б) – генеративні моделі; (в) та (г) – виведені моделі. а X(t-3) X(t-2) e(t-2) e(t-1) e(t) X(t-1) X(t) e(t-3) б X(t-2) X(t-1) X(t) X(t-2) U(t-3) U(t-2) U(t-1) U(t) в X(t-3) X(t-2) X(t-1) X(t) г X . Модель адекватна. Проблем не виникло, оскільки приховані спільні причини Моделі і засоби систем баз даних та знань [Введите текст] QYX →→  & ),(Sepmin QXY   QYX →→ , (3) де ),(Sepmin QX – це мінімальний сепаратор для пари змінних X , Q . Позначка кінця ребра «» означає, що цей кінець ребра залишається не специфікованим і може бути довільним. Для ілюстрації виведення в умовах спільних прихованих причин розглянемо генеративну модель, показану на рис. 4,а. В цій структурі приховані причини ie – взаємонезалежні. (У наведеній структурі кожна ie впливає відразу на дві спостережувані змінні. Це є відхиленням від стандартних припущень.) Маючи достатньо даних, типові алгоритми виведуть модель, показану на рис. 4,в. Біорієнтовані ребра виводяться завдяки правилу 0 . Модель адекватна. Проблем не виникло, оскільки приховані спільні причини ie не займають позицій конфаундерів для каузальних зв'язків [7]. Повертаємося до фізичного пояснення впливів з великим часовим лагом. Ясно, що існують механізми, які передають вплив минулого через посередників (приховані змінні). Змінні, що є першоджерелом впливу, можуть бути організовані як динамічний автокорельований процес. Тому можна припустити, що і посередники впливу також організовані як автокорельований процес. Отже, можна очікувати, що існують приховані автокорельовані часові ряди, які взаємодіють з іншими підпроцесами. Такі часові ряди можуть створити ілюзію зв'язків з нескінченно-довгим часовим лагом. Це підриває тестування марковських властивостей як принцип виведення моделі. Покажемо можливі наслідки існування прихованих часових рядів. Розглянемо екстремально спрощену структуру моделі (рис. 4,б) з наступними особливостями. Прихований часовий ряд iU – автономний, тобто не зазнає впливів від спостережуваної частини моделі. Немає безпосередніх зв'язків між спостережуваними змінними iX . Спочатку уявімо ідеалізовану постановку задачі виведення моделі, коли всі факти незалежності строго випливають з фактів d-сепарації. Тоді всі змінні ряду iX – взаємозалежні, і немає жодної умовні незалежності в рамках спостережуваної моделі. Як наслідок, алгоритм виведе повнозв'язану (насичену) структуру, частково показану на рис. 4,г. Всі ребра мають вигляд ji XX → . Глибина моделі буде визначена технічними обмеженнями алгоритму. Тепер уявімо виведення такої моделі з реалістичних даних. В ході виведення можуть відбутися різні сценарії, пов'язані з тим, що певні непрямі залежності (через ланцюги) поведуть себе як слабкі. Якщо будуть виявлені факти безумовної незалежності, то (завдяки правилу 0 ) в моделі з'являться біорієнтовані ребра, зокрема, ii XX −1 . Якщо алгоритм знайде факти умовної незалежності, то правило 1 виведе каузальні ребра (і це буде грубою помилкою). 5 Виявлення каузальних відношень в даних і каузальність за Грейнджером Навіть в умовах прихованих причин апарат каузальних мереж (за певних відомих обставин) забезпечує виведення каузальних ребер, які свідчать про каузальні відношення [3, 4, 6, 7]. Натомість концепція каузальності К.Грейнджера розрахована на ситуацію повної спостережуваності світу (приховані змінні, які Рис. 4. Ілюстрація виведення каузальних моделей в умовах прихованих змінних та прихованих часових рядів; (а) та (б) – генеративні моделі; (в) та (г) – виведені моделі. а X(t-3) X(t-2) e(t-2) e(t-1) e(t) X(t-1) X(t) e(t-3) б X(t-2) X(t-1) X(t) X(t-2) U(t-3) U(t-2) U(t-1) U(t) в X(t-3) X(t-2) X(t-1) X(t) г X не займають по- зицій конфаундерів для каузальних зв’язків [7]. Моделі і засоби систем баз даних та знань [Введите текст] QYX →→  & ),(Sepmin QXY   QYX →→ , (3) де ),(Sepmin QX – це мінімальний сепаратор для пари змінних X , Q . Позначка кінця ребра «» означає, що цей кінець ребра залишається не специфікованим і може бути довільним. Для ілюстрації виведення в умовах спільних прихованих причин розглянемо генеративну модель, показану на рис. 4,а. В цій структурі приховані причини ie – взаємонезалежні. (У наведеній структурі кожна ie впливає відразу на дві спостережувані змінні. Це є відхиленням від стандартних припущень.) Маючи достатньо даних, типові алгоритми виведуть модель, показану на рис. 4,в. Біорієнтовані ребра виводяться завдяки правилу 0 . Модель адекватна. Проблем не виникло, оскільки приховані спільні причини ie не займають позицій конфаундерів для каузальних зв'язків [7]. Повертаємося до фізичного пояснення впливів з великим часовим лагом. Ясно, що існують механізми, які передають вплив минулого через посередників (приховані змінні). Змінні, що є першоджерелом впливу, можуть бути організовані як динамічний автокорельований процес. Тому можна припустити, що і посередники впливу також організовані як автокорельований процес. Отже, можна очікувати, що існують приховані автокорельовані часові ряди, які взаємодіють з іншими підпроцесами. Такі часові ряди можуть створити ілюзію зв'язків з нескінченно-довгим часовим лагом. Це підриває тестування марковських властивостей як принцип виведення моделі. Покажемо можливі наслідки існування прихованих часових рядів. Розглянемо екстремально спрощену структуру моделі (рис. 4,б) з наступними особливостями. Прихований часовий ряд iU – автономний, тобто не зазнає впливів від спостережуваної частини моделі. Немає безпосередніх зв'язків між спостережуваними змінними iX . Спочатку уявімо ідеалізовану постановку задачі виведення моделі, коли всі факти незалежності строго випливають з фактів d-сепарації. Тоді всі змінні ряду iX – взаємозалежні, і немає жодної умовні незалежності в рамках спостережуваної моделі. Як наслідок, алгоритм виведе повнозв'язану (насичену) структуру, частково показану на рис. 4,г. Всі ребра мають вигляд ji XX → . Глибина моделі буде визначена технічними обмеженнями алгоритму. Тепер уявімо виведення такої моделі з реалістичних даних. В ході виведення можуть відбутися різні сценарії, пов'язані з тим, що певні непрямі залежності (через ланцюги) поведуть себе як слабкі. Якщо будуть виявлені факти безумовної незалежності, то (завдяки правилу 0 ) в моделі з'являться біорієнтовані ребра, зокрема, ii XX −1 . Якщо алгоритм знайде факти умовної незалежності, то правило 1 виведе каузальні ребра (і це буде грубою помилкою). 5 Виявлення каузальних відношень в даних і каузальність за Грейнджером Навіть в умовах прихованих причин апарат каузальних мереж (за певних відомих обставин) забезпечує виведення каузальних ребер, які свідчать про каузальні відношення [3, 4, 6, 7]. Натомість концепція каузальності К.Грейнджера розрахована на ситуацію повної спостережуваності світу (приховані змінні, які Рис. 4. Ілюстрація виведення каузальних моделей в умовах прихованих змінних та прихованих часових рядів; (а) та (б) – генеративні моделі; (в) та (г) – виведені моделі. а X(t-3) X(t-2) e(t-2) e(t-1) e(t) X(t-1) X(t) e(t-3) б X(t-2) X(t-1) X(t) X(t-2) U(t-3) U(t-2) U(t-1) U(t) в X(t-3) X(t-2) X(t-1) X(t) г X Рис. 4. Ілюстрація виведення каузальних моделей в умовах прихованих змінних та прихованих часових рядів; (а) та (б) – генеративні моделі; (в) та (г) – виведені моделі. 193 Моделі і засоби систем баз даних та знань Повертаємося до фізичного пояснення впливів з великим часовим лагом. Ясно, що існують механізми, які передають вплив минулого через посередників (приховані змінні). Змінні, що є першоджерелом впливу, можуть бути організовані як динамічний автокорельований процес. Тому можна припустити, що і посередники впливу також організовані як автокорельований процес. Отже, можна очікувати, що існують приховані авто- корельовані часові ряди, які взаємодіють з іншими підпроцесами. Такі часові ряди можуть створити ілюзію зв’язків з нескінченно-довгим часовим лагом. Це підриває тестування марковських властивостей як принцип виведення моделі. Покажемо можливі наслідки існування прихованих часових рядів. Розглянемо екстремально спро- щену структуру моделі (рис. 4,б) з наступними особливостями. Прихований часовий ряд Моделі і засоби систем баз даних та знань [Введите текст] QYX →→  & ),(Sepmin QXY   QYX →→ , (3) де ),(Sepmin QX – це мінімальний сепаратор для пари змінних X , Q . Позначка кінця ребра «» означає, що цей кінець ребра залишається не специфікованим і може бути довільним. Для ілюстрації виведення в умовах спільних прихованих причин розглянемо генеративну модель, показану на рис. 4,а. В цій структурі приховані причини ie – взаємонезалежні. (У наведеній структурі кожна ie впливає відразу на дві спостережувані змінні. Це є відхиленням від стандартних припущень.) Маючи достатньо даних, типові алгоритми виведуть модель, показану на рис. 4,в. Біорієнтовані ребра виводяться завдяки правилу 0 . Модель адекватна. Проблем не виникло, оскільки приховані спільні причини ie не займають позицій конфаундерів для каузальних зв'язків [7]. Повертаємося до фізичного пояснення впливів з великим часовим лагом. Ясно, що існують механізми, які передають вплив минулого через посередників (приховані змінні). Змінні, що є першоджерелом впливу, можуть бути організовані як динамічний автокорельований процес. Тому можна припустити, що і посередники впливу також організовані як автокорельований процес. Отже, можна очікувати, що існують приховані автокорельовані часові ряди, які взаємодіють з іншими підпроцесами. Такі часові ряди можуть створити ілюзію зв'язків з нескінченно-довгим часовим лагом. Це підриває тестування марковських властивостей як принцип виведення моделі. Покажемо можливі наслідки існування прихованих часових рядів. Розглянемо екстремально спрощену структуру моделі (рис. 4,б) з наступними особливостями. Прихований часовий ряд iU – автономний, тобто не зазнає впливів від спостережуваної частини моделі. Немає безпосередніх зв'язків між спостережуваними змінними iX . Спочатку уявімо ідеалізовану постановку задачі виведення моделі, коли всі факти незалежності строго випливають з фактів d-сепарації. Тоді всі змінні ряду iX – взаємозалежні, і немає жодної умовні незалежності в рамках спостережуваної моделі. Як наслідок, алгоритм виведе повнозв'язану (насичену) структуру, частково показану на рис. 4,г. Всі ребра мають вигляд ji XX → . Глибина моделі буде визначена технічними обмеженнями алгоритму. Тепер уявімо виведення такої моделі з реалістичних даних. В ході виведення можуть відбутися різні сценарії, пов'язані з тим, що певні непрямі залежності (через ланцюги) поведуть себе як слабкі. Якщо будуть виявлені факти безумовної незалежності, то (завдяки правилу 0 ) в моделі з'являться біорієнтовані ребра, зокрема, ii XX −1 . Якщо алгоритм знайде факти умовної незалежності, то правило 1 виведе каузальні ребра (і це буде грубою помилкою). 5 Виявлення каузальних відношень в даних і каузальність за Грейнджером Навіть в умовах прихованих причин апарат каузальних мереж (за певних відомих обставин) забезпечує виведення каузальних ребер, які свідчать про каузальні відношення [3, 4, 6, 7]. Натомість концепція каузальності К.Грейнджера розрахована на ситуацію повної спостережуваності світу (приховані змінні, які Рис. 4. Ілюстрація виведення каузальних моделей в умовах прихованих змінних та прихованих часових рядів; (а) та (б) – генеративні моделі; (в) та (г) – виведені моделі. а X(t-3) X(t-2) e(t-2) e(t-1) e(t) X(t-1) X(t) e(t-3) б X(t-2) X(t-1) X(t) X(t-2) U(t-3) U(t-2) U(t-1) U(t) в X(t-3) X(t-2) X(t-1) X(t) г X – автономний, тобто не зазнає впливів від спостережуваної частини моделі. Немає безпосередніх зв’язків між спостере- жуваними змінними Моделі і засоби систем баз даних та знань [Введите текст] QYX →→  & ),(Sepmin QXY   QYX →→ , (3) де ),(Sepmin QX – це мінімальний сепаратор для пари змінних X , Q . Позначка кінця ребра «» означає, що цей кінець ребра залишається не специфікованим і може бути довільним. Для ілюстрації виведення в умовах спільних прихованих причин розглянемо генеративну модель, показану на рис. 4,а. В цій структурі приховані причини ie – взаємонезалежні. (У наведеній структурі кожна ie впливає відразу на дві спостережувані змінні. Це є відхиленням від стандартних припущень.) Маючи достатньо даних, типові алгоритми виведуть модель, показану на рис. 4,в. Біорієнтовані ребра виводяться завдяки правилу 0 . Модель адекватна. Проблем не виникло, оскільки приховані спільні причини ie не займають позицій конфаундерів для каузальних зв'язків [7]. Повертаємося до фізичного пояснення впливів з великим часовим лагом. Ясно, що існують механізми, які передають вплив минулого через посередників (приховані змінні). Змінні, що є першоджерелом впливу, можуть бути організовані як динамічний автокорельований процес. Тому можна припустити, що і посередники впливу також організовані як автокорельований процес. Отже, можна очікувати, що існують приховані автокорельовані часові ряди, які взаємодіють з іншими підпроцесами. Такі часові ряди можуть створити ілюзію зв'язків з нескінченно-довгим часовим лагом. Це підриває тестування марковських властивостей як принцип виведення моделі. Покажемо можливі наслідки існування прихованих часових рядів. Розглянемо екстремально спрощену структуру моделі (рис. 4,б) з наступними особливостями. Прихований часовий ряд iU – автономний, тобто не зазнає впливів від спостережуваної частини моделі. Немає безпосередніх зв'язків між спостережуваними змінними iX . Спочатку уявімо ідеалізовану постановку задачі виведення моделі, коли всі факти незалежності строго випливають з фактів d-сепарації. Тоді всі змінні ряду iX – взаємозалежні, і немає жодної умовні незалежності в рамках спостережуваної моделі. Як наслідок, алгоритм виведе повнозв'язану (насичену) структуру, частково показану на рис. 4,г. Всі ребра мають вигляд ji XX → . Глибина моделі буде визначена технічними обмеженнями алгоритму. Тепер уявімо виведення такої моделі з реалістичних даних. В ході виведення можуть відбутися різні сценарії, пов'язані з тим, що певні непрямі залежності (через ланцюги) поведуть себе як слабкі. Якщо будуть виявлені факти безумовної незалежності, то (завдяки правилу 0 ) в моделі з'являться біорієнтовані ребра, зокрема, ii XX −1 . Якщо алгоритм знайде факти умовної незалежності, то правило 1 виведе каузальні ребра (і це буде грубою помилкою). 5 Виявлення каузальних відношень в даних і каузальність за Грейнджером Навіть в умовах прихованих причин апарат каузальних мереж (за певних відомих обставин) забезпечує виведення каузальних ребер, які свідчать про каузальні відношення [3, 4, 6, 7]. Натомість концепція каузальності К.Грейнджера розрахована на ситуацію повної спостережуваності світу (приховані змінні, які Рис. 4. Ілюстрація виведення каузальних моделей в умовах прихованих змінних та прихованих часових рядів; (а) та (б) – генеративні моделі; (в) та (г) – виведені моделі. а X(t-3) X(t-2) e(t-2) e(t-1) e(t) X(t-1) X(t) e(t-3) б X(t-2) X(t-1) X(t) X(t-2) U(t-3) U(t-2) U(t-1) U(t) в X(t-3) X(t-2) X(t-1) X(t) г X . Спочатку уявімо ідеалізовану постановку задачі виведення моделі, коли всі факти незалежності строго випливають з фактів d-сепарації. Тоді всі змінні ряду Моделі і засоби систем баз даних та знань [Введите текст] QYX →→  & ),(Sepmin QXY   QYX →→ , (3) де ),(Sepmin QX – це мінімальний сепаратор для пари змінних X , Q . Позначка кінця ребра «» означає, що цей кінець ребра залишається не специфікованим і може бути довільним. Для ілюстрації виведення в умовах спільних прихованих причин розглянемо генеративну модель, показану на рис. 4,а. В цій структурі приховані причини ie – взаємонезалежні. (У наведеній структурі кожна ie впливає відразу на дві спостережувані змінні. Це є відхиленням від стандартних припущень.) Маючи достатньо даних, типові алгоритми виведуть модель, показану на рис. 4,в. Біорієнтовані ребра виводяться завдяки правилу 0 . Модель адекватна. Проблем не виникло, оскільки приховані спільні причини ie не займають позицій конфаундерів для каузальних зв'язків [7]. Повертаємося до фізичного пояснення впливів з великим часовим лагом. Ясно, що існують механізми, які передають вплив минулого через посередників (приховані змінні). Змінні, що є першоджерелом впливу, можуть бути організовані як динамічний автокорельований процес. Тому можна припустити, що і посередники впливу також організовані як автокорельований процес. Отже, можна очікувати, що існують приховані автокорельовані часові ряди, які взаємодіють з іншими підпроцесами. Такі часові ряди можуть створити ілюзію зв'язків з нескінченно-довгим часовим лагом. Це підриває тестування марковських властивостей як принцип виведення моделі. Покажемо можливі наслідки існування прихованих часових рядів. Розглянемо екстремально спрощену структуру моделі (рис. 4,б) з наступними особливостями. Прихований часовий ряд iU – автономний, тобто не зазнає впливів від спостережуваної частини моделі. Немає безпосередніх зв'язків між спостережуваними змінними iX . Спочатку уявімо ідеалізовану постановку задачі виведення моделі, коли всі факти незалежності строго випливають з фактів d-сепарації. Тоді всі змінні ряду iX – взаємозалежні, і немає жодної умовні незалежності в рамках спостережуваної моделі. Як наслідок, алгоритм виведе повнозв'язану (насичену) структуру, частково показану на рис. 4,г. Всі ребра мають вигляд ji XX → . Глибина моделі буде визначена технічними обмеженнями алгоритму. Тепер уявімо виведення такої моделі з реалістичних даних. В ході виведення можуть відбутися різні сценарії, пов'язані з тим, що певні непрямі залежності (через ланцюги) поведуть себе як слабкі. Якщо будуть виявлені факти безумовної незалежності, то (завдяки правилу 0 ) в моделі з'являться біорієнтовані ребра, зокрема, ii XX −1 . Якщо алгоритм знайде факти умовної незалежності, то правило 1 виведе каузальні ребра (і це буде грубою помилкою). 5 Виявлення каузальних відношень в даних і каузальність за Грейнджером Навіть в умовах прихованих причин апарат каузальних мереж (за певних відомих обставин) забезпечує виведення каузальних ребер, які свідчать про каузальні відношення [3, 4, 6, 7]. Натомість концепція каузальності К.Грейнджера розрахована на ситуацію повної спостережуваності світу (приховані змінні, які Рис. 4. Ілюстрація виведення каузальних моделей в умовах прихованих змінних та прихованих часових рядів; (а) та (б) – генеративні моделі; (в) та (г) – виведені моделі. а X(t-3) X(t-2) e(t-2) e(t-1) e(t) X(t-1) X(t) e(t-3) б X(t-2) X(t-1) X(t) X(t-2) U(t-3) U(t-2) U(t-1) U(t) в X(t-3) X(t-2) X(t-1) X(t) г X – взаємозалежні, і немає жод- ної умовні незалежності в рамках спостережуваної моделі. Як наслідок, алгоритм виведе повнозв’язану (насичену) структуру, частково показану на рис. 4,г. Всі ребра мають вигляд Моделі і засоби систем баз даних та знань [Введите текст] QYX →→  & ),(Sepmin QXY   QYX →→ , (3) де ),(Sepmin QX – це мінімальний сепаратор для пари змінних X , Q . Позначка кінця ребра «» означає, що цей кінець ребра залишається не специфікованим і може бути довільним. Для ілюстрації виведення в умовах спільних прихованих причин розглянемо генеративну модель, показану на рис. 4,а. В цій структурі приховані причини ie – взаємонезалежні. (У наведеній структурі кожна ie впливає відразу на дві спостережувані змінні. Це є відхиленням від стандартних припущень.) Маючи достатньо даних, типові алгоритми виведуть модель, показану на рис. 4,в. Біорієнтовані ребра виводяться завдяки правилу 0 . Модель адекватна. Проблем не виникло, оскільки приховані спільні причини ie не займають позицій конфаундерів для каузальних зв'язків [7]. Повертаємося до фізичного пояснення впливів з великим часовим лагом. Ясно, що існують механізми, які передають вплив минулого через посередників (приховані змінні). Змінні, що є першоджерелом впливу, можуть бути організовані як динамічний автокорельований процес. Тому можна припустити, що і посередники впливу також організовані як автокорельований процес. Отже, можна очікувати, що існують приховані автокорельовані часові ряди, які взаємодіють з іншими підпроцесами. Такі часові ряди можуть створити ілюзію зв'язків з нескінченно-довгим часовим лагом. Це підриває тестування марковських властивостей як принцип виведення моделі. Покажемо можливі наслідки існування прихованих часових рядів. Розглянемо екстремально спрощену структуру моделі (рис. 4,б) з наступними особливостями. Прихований часовий ряд iU – автономний, тобто не зазнає впливів від спостережуваної частини моделі. Немає безпосередніх зв'язків між спостережуваними змінними iX . Спочатку уявімо ідеалізовану постановку задачі виведення моделі, коли всі факти незалежності строго випливають з фактів d-сепарації. Тоді всі змінні ряду iX – взаємозалежні, і немає жодної умовні незалежності в рамках спостережуваної моделі. Як наслідок, алгоритм виведе повнозв'язану (насичену) структуру, частково показану на рис. 4,г. Всі ребра мають вигляд ji XX → . Глибина моделі буде визначена технічними обмеженнями алгоритму. Тепер уявімо виведення такої моделі з реалістичних даних. В ході виведення можуть відбутися різні сценарії, пов'язані з тим, що певні непрямі залежності (через ланцюги) поведуть себе як слабкі. Якщо будуть виявлені факти безумовної незалежності, то (завдяки правилу 0 ) в моделі з'являться біорієнтовані ребра, зокрема, ii XX −1 . Якщо алгоритм знайде факти умовної незалежності, то правило 1 виведе каузальні ребра (і це буде грубою помилкою). 5 Виявлення каузальних відношень в даних і каузальність за Грейнджером Навіть в умовах прихованих причин апарат каузальних мереж (за певних відомих обставин) забезпечує виведення каузальних ребер, які свідчать про каузальні відношення [3, 4, 6, 7]. Натомість концепція каузальності К.Грейнджера розрахована на ситуацію повної спостережуваності світу (приховані змінні, які Рис. 4. Ілюстрація виведення каузальних моделей в умовах прихованих змінних та прихованих часових рядів; (а) та (б) – генеративні моделі; (в) та (г) – виведені моделі. а X(t-3) X(t-2) e(t-2) e(t-1) e(t) X(t-1) X(t) e(t-3) б X(t-2) X(t-1) X(t) X(t-2) U(t-3) U(t-2) U(t-1) U(t) в X(t-3) X(t-2) X(t-1) X(t) г X . Глибина моделі буде визначена технічними обмеженнями алгоритму. Тепер уявімо виведення такої моделі з реалістичних да- них. В ході виведення можуть відбутися різні сценарії, пов’язані з тим, що певні непрямі залежності (через ланцюги) поведуть себе як слабкі. Якщо будуть виявлені факти безумовної незалежності, то (завдяки пра- вилу Моделі і засоби систем баз даних та знань [Введите текст] QYX →→  & ),(Sepmin QXY   QYX →→ , (3) де ),(Sepmin QX – це мінімальний сепаратор для пари змінних X , Q . Позначка кінця ребра «» означає, що цей кінець ребра залишається не специфікованим і може бути довільним. Для ілюстрації виведення в умовах спільних прихованих причин розглянемо генеративну модель, показану на рис. 4,а. В цій структурі приховані причини ie – взаємонезалежні. (У наведеній структурі кожна ie впливає відразу на дві спостережувані змінні. Це є відхиленням від стандартних припущень.) Маючи достатньо даних, типові алгоритми виведуть модель, показану на рис. 4,в. Біорієнтовані ребра виводяться завдяки правилу 0 . Модель адекватна. Проблем не виникло, оскільки приховані спільні причини ie не займають позицій конфаундерів для каузальних зв'язків [7]. Повертаємося до фізичного пояснення впливів з великим часовим лагом. Ясно, що існують механізми, які передають вплив минулого через посередників (приховані змінні). Змінні, що є першоджерелом впливу, можуть бути організовані як динамічний автокорельований процес. Тому можна припустити, що і посередники впливу також організовані як автокорельований процес. Отже, можна очікувати, що існують приховані автокорельовані часові ряди, які взаємодіють з іншими підпроцесами. Такі часові ряди можуть створити ілюзію зв'язків з нескінченно-довгим часовим лагом. Це підриває тестування марковських властивостей як принцип виведення моделі. Покажемо можливі наслідки існування прихованих часових рядів. Розглянемо екстремально спрощену структуру моделі (рис. 4,б) з наступними особливостями. Прихований часовий ряд iU – автономний, тобто не зазнає впливів від спостережуваної частини моделі. Немає безпосередніх зв'язків між спостережуваними змінними iX . Спочатку уявімо ідеалізовану постановку задачі виведення моделі, коли всі факти незалежності строго випливають з фактів d-сепарації. Тоді всі змінні ряду iX – взаємозалежні, і немає жодної умовні незалежності в рамках спостережуваної моделі. Як наслідок, алгоритм виведе повнозв'язану (насичену) структуру, частково показану на рис. 4,г. Всі ребра мають вигляд ji XX → . Глибина моделі буде визначена технічними обмеженнями алгоритму. Тепер уявімо виведення такої моделі з реалістичних даних. В ході виведення можуть відбутися різні сценарії, пов'язані з тим, що певні непрямі залежності (через ланцюги) поведуть себе як слабкі. Якщо будуть виявлені факти безумовної незалежності, то (завдяки правилу 0 ) в моделі з'являться біорієнтовані ребра, зокрема, ii XX −1 . Якщо алгоритм знайде факти умовної незалежності, то правило 1 виведе каузальні ребра (і це буде грубою помилкою). 5 Виявлення каузальних відношень в даних і каузальність за Грейнджером Навіть в умовах прихованих причин апарат каузальних мереж (за певних відомих обставин) забезпечує виведення каузальних ребер, які свідчать про каузальні відношення [3, 4, 6, 7]. Натомість концепція каузальності К.Грейнджера розрахована на ситуацію повної спостережуваності світу (приховані змінні, які Рис. 4. Ілюстрація виведення каузальних моделей в умовах прихованих змінних та прихованих часових рядів; (а) та (б) – генеративні моделі; (в) та (г) – виведені моделі. а X(t-3) X(t-2) e(t-2) e(t-1) e(t) X(t-1) X(t) e(t-3) б X(t-2) X(t-1) X(t) X(t-2) U(t-3) U(t-2) U(t-1) U(t) в X(t-3) X(t-2) X(t-1) X(t) г X ) в моделі з’являться біорієнтовані ребра, зокрема, Моделі і засоби систем баз даних та знань [Введите текст] QYX →→  & ),(Sepmin QXY   QYX →→ , (3) де ),(Sepmin QX – це мінімальний сепаратор для пари змінних X , Q . Позначка кінця ребра «» означає, що цей кінець ребра залишається не специфікованим і може бути довільним. Для ілюстрації виведення в умовах спільних прихованих причин розглянемо генеративну модель, показану на рис. 4,а. В цій структурі приховані причини ie – взаємонезалежні. (У наведеній структурі кожна ie впливає відразу на дві спостережувані змінні. Це є відхиленням від стандартних припущень.) Маючи достатньо даних, типові алгоритми виведуть модель, показану на рис. 4,в. Біорієнтовані ребра виводяться завдяки правилу 0 . Модель адекватна. Проблем не виникло, оскільки приховані спільні причини ie не займають позицій конфаундерів для каузальних зв'язків [7]. Повертаємося до фізичного пояснення впливів з великим часовим лагом. Ясно, що існують механізми, які передають вплив минулого через посередників (приховані змінні). Змінні, що є першоджерелом впливу, можуть бути організовані як динамічний автокорельований процес. Тому можна припустити, що і посередники впливу також організовані як автокорельований процес. Отже, можна очікувати, що існують приховані автокорельовані часові ряди, які взаємодіють з іншими підпроцесами. Такі часові ряди можуть створити ілюзію зв'язків з нескінченно-довгим часовим лагом. Це підриває тестування марковських властивостей як принцип виведення моделі. Покажемо можливі наслідки існування прихованих часових рядів. Розглянемо екстремально спрощену структуру моделі (рис. 4,б) з наступними особливостями. Прихований часовий ряд iU – автономний, тобто не зазнає впливів від спостережуваної частини моделі. Немає безпосередніх зв'язків між спостережуваними змінними iX . Спочатку уявімо ідеалізовану постановку задачі виведення моделі, коли всі факти незалежності строго випливають з фактів d-сепарації. Тоді всі змінні ряду iX – взаємозалежні, і немає жодної умовні незалежності в рамках спостережуваної моделі. Як наслідок, алгоритм виведе повнозв'язану (насичену) структуру, частково показану на рис. 4,г. Всі ребра мають вигляд ji XX → . Глибина моделі буде визначена технічними обмеженнями алгоритму. Тепер уявімо виведення такої моделі з реалістичних даних. В ході виведення можуть відбутися різні сценарії, пов'язані з тим, що певні непрямі залежності (через ланцюги) поведуть себе як слабкі. Якщо будуть виявлені факти безумовної незалежності, то (завдяки правилу 0 ) в моделі з'являться біорієнтовані ребра, зокрема, ii XX −1 . Якщо алгоритм знайде факти умовної незалежності, то правило 1 виведе каузальні ребра (і це буде грубою помилкою). 5 Виявлення каузальних відношень в даних і каузальність за Грейнджером Навіть в умовах прихованих причин апарат каузальних мереж (за певних відомих обставин) забезпечує виведення каузальних ребер, які свідчать про каузальні відношення [3, 4, 6, 7]. Натомість концепція каузальності К.Грейнджера розрахована на ситуацію повної спостережуваності світу (приховані змінні, які Рис. 4. Ілюстрація виведення каузальних моделей в умовах прихованих змінних та прихованих часових рядів; (а) та (б) – генеративні моделі; (в) та (г) – виведені моделі. а X(t-3) X(t-2) e(t-2) e(t-1) e(t) X(t-1) X(t) e(t-3) б X(t-2) X(t-1) X(t) X(t-2) U(t-3) U(t-2) U(t-1) U(t) в X(t-3) X(t-2) X(t-1) X(t) г X . Якщо алгоритм знайде факти умовної незалежності, то правило Моделі і засоби систем баз даних та знань [Введите текст] QYX →→  & ),(Sepmin QXY   QYX →→ , (3) де ),(Sepmin QX – це мінімальний сепаратор для пари змінних X , Q . Позначка кінця ребра «» означає, що цей кінець ребра залишається не специфікованим і може бути довільним. Для ілюстрації виведення в умовах спільних прихованих причин розглянемо генеративну модель, показану на рис. 4,а. В цій структурі приховані причини ie – взаємонезалежні. (У наведеній структурі кожна ie впливає відразу на дві спостережувані змінні. Це є відхиленням від стандартних припущень.) Маючи достатньо даних, типові алгоритми виведуть модель, показану на рис. 4,в. Біорієнтовані ребра виводяться завдяки правилу 0 . Модель адекватна. Проблем не виникло, оскільки приховані спільні причини ie не займають позицій конфаундерів для каузальних зв'язків [7]. Повертаємося до фізичного пояснення впливів з великим часовим лагом. Ясно, що існують механізми, які передають вплив минулого через посередників (приховані змінні). Змінні, що є першоджерелом впливу, можуть бути організовані як динамічний автокорельований процес. Тому можна припустити, що і посередники впливу також організовані як автокорельований процес. Отже, можна очікувати, що існують приховані автокорельовані часові ряди, які взаємодіють з іншими підпроцесами. Такі часові ряди можуть створити ілюзію зв'язків з нескінченно-довгим часовим лагом. Це підриває тестування марковських властивостей як принцип виведення моделі. Покажемо можливі наслідки існування прихованих часових рядів. Розглянемо екстремально спрощену структуру моделі (рис. 4,б) з наступними особливостями. Прихований часовий ряд iU – автономний, тобто не зазнає впливів від спостережуваної частини моделі. Немає безпосередніх зв'язків між спостережуваними змінними iX . Спочатку уявімо ідеалізовану постановку задачі виведення моделі, коли всі факти незалежності строго випливають з фактів d-сепарації. Тоді всі змінні ряду iX – взаємозалежні, і немає жодної умовні незалежності в рамках спостережуваної моделі. Як наслідок, алгоритм виведе повнозв'язану (насичену) структуру, частково показану на рис. 4,г. Всі ребра мають вигляд ji XX → . Глибина моделі буде визначена технічними обмеженнями алгоритму. Тепер уявімо виведення такої моделі з реалістичних даних. В ході виведення можуть відбутися різні сценарії, пов'язані з тим, що певні непрямі залежності (через ланцюги) поведуть себе як слабкі. Якщо будуть виявлені факти безумовної незалежності, то (завдяки правилу 0 ) в моделі з'являться біорієнтовані ребра, зокрема, ii XX −1 . Якщо алгоритм знайде факти умовної незалежності, то правило 1 виведе каузальні ребра (і це буде грубою помилкою). 5 Виявлення каузальних відношень в даних і каузальність за Грейнджером Навіть в умовах прихованих причин апарат каузальних мереж (за певних відомих обставин) забезпечує виведення каузальних ребер, які свідчать про каузальні відношення [3, 4, 6, 7]. Натомість концепція каузальності К.Грейнджера розрахована на ситуацію повної спостережуваності світу (приховані змінні, які Рис. 4. Ілюстрація виведення каузальних моделей в умовах прихованих змінних та прихованих часових рядів; (а) та (б) – генеративні моделі; (в) та (г) – виведені моделі. а X(t-3) X(t-2) e(t-2) e(t-1) e(t) X(t-1) X(t) e(t-3) б X(t-2) X(t-1) X(t) X(t-2) U(t-3) U(t-2) U(t-1) U(t) в X(t-3) X(t-2) X(t-1) X(t) г X виведе каузальні ребра (і це буде грубою помилкою). 6. Виявлення каузальних відношень в даних і каузальність за Грейнджером Навіть в умовах прихованих причин апарат каузальних мереж (за певних відомих обставин) забезпечує виведення каузальних ребер, які свідчать про каузальні відношення [3, 4, 6, 7]. Натомість концепція каузаль- ності К.Грейнджера розрахована на ситуацію повної спостережуваності світу (приховані змінні, які впливають на цільові змінні, не припускаються). В реальних ситуаціях доводиться застосовувати критерій Грейнджера в сурогатному режимі, тобто в умовах доступності лише неповної інформації Моделі і засоби систем баз даних та знань впливають на цільові змінні, не припускаються). В реальних ситуаціях доводиться застосовувати критерій Грейнджера в сурогатному режимі, тобто в умовах доступності лише неповної інформації t . Порівняємо можливості цих двох підходів. Спочатку відзначимо другорядну особливість, що відрізняє «причину» (за К. Грейнджером) від «причини» в апараті каузальних мереж. В каузальній мережі змінна X вважається причиною для Y , якщо є строго орієнтований шлях від X до Y . Тобто в перелік причин включено також і непрямі (опосередковані) причини. Натомість за К. Грейнджером непрямі причини X будуть визнані не-причинами, якщо доступний достатній набір посередників, через які здійснюється вплив X на Y . Суттєвим є те, що сурогатний критерій К. Грейнджера може призводити до систематичних помилок у визначенні каузальності. Можна описати роботу критерія К. Грейнджера так: формується набір предикторів 1−t , який мінімізує помилку прогнозу змінної tY , а потім з набору 1−t видаляються всі «надлишкові» предиктори. Виключення надлишкових предикторів не погіршує прогноз. Всі предиктори, що не були видалені як надлишкові, визнаються «причинами» для tY за Грейнджером. Легко бачити, якщо, припустимо, для ktX − та tY алгоритм виведення моделі не знайшов сепаратора, то ktX − буде визнана причиною для tY за Грейнджером. Отже, критерій К. Грейнджера включає в перелік «причин» для tY всі змінні, які поєднані з tY ребром і які йдуть у часі раніше за tY . Зокрема, якщо є ребро tkt YZ − , то змінна ktZ − також буде визнана причиною для tY , що є помилкою. Не-причина може бути необхідною для покращення прогнозу, бо несе «незамінну» інформацію в умовах недоступності справжніх причин. Наприклад, якщо маємо генеративну модель, показану на рис. 4,б, то, згідно Грейнджеру, причинами змінної X будуть визнані всі минулі значення цієї змінної. Більш того, неадекватність критерія Грейнджера простягається ще далі. В певних ситуаціях цей критерій може включити в набір «причин» для tY змінну, яка є безумовно незалежна від tY . Так станеться, якщо в моделі є ребро tkt YZ − та ребро ltkt QZ −−  . Це може здатися парадоксальним, але включення змінної ltQ − в набір предикторів зменшує помилку прогнозу змінної tY (за умови, що на змінну ktZ − не здійснюється втручання). Отже, в реалістичних умовах критерій К. Грейнджера є некоректним для задачі виявлення причин. Звернемося до правил орієнтації ребер в методах виведення каузальних мереж. Як показано в [7], якщо можливі конфаундери, то серед всіх відомих правил тільки правило 1 виводить каузальне ребро. Це правило є коректним засобом виявлення причинних зв'язків. Але для того, щоб правило орієнтації ребер 1 спрацювало, має виконуватися відповідна умовна незалежність. А для цього треба, щоб алгоритм «дістався» до відповідного зв'язку з найбільшим лагом, і щоб не було прихованого конфаундера. Якщо жодного непустого сепаратора не знайдено, то тоді не буде виведено жодного каузального зв'язку, і всі зв'язки залишаться у невизначеному статусі (в формі ребра YX → ). Висновки Динамічні каузальні моделі є потужним засобом аналізу й дослідження різноманітних процесів та об'єктів і забезпечує відображення таких рис, як швидкість змін, періодичність, лаг післядії, зворотні зв'язки тощо. Серед різноманітних типів динамічних процесів (які включають, зокрема, рекурентні процеси, «запрограмовані» процеси, потоки стохастичних подій, лічильні процеси і так далі) виділено векторні авторегресійні процеси. (Відомо, як для них можна виводити каузальні моделі.) Вимоги до архітектури темпоральних даних, способів та частоти їх збору диктуються характером динамічного процесу. Частота вимірювання даних має критичне значення для адекватності виведеної моделі і визначається тривалістю елементарних впливів між компонентами векторного процесу. Для виведення динамічним моделей з даних важливу роль відіграють припущення стаціонарності та регулярності структури. Особливостями виведення динамічних каузальних моделей є врахування темпорального порядку змінних та проблеми, пов'язані з невідомим лагом післядії та існуванням прихованих автокорельованих часових рядів. Проведено порівняльний аналіз критерію каузальності за Грейнджером та правил орієнтації ребер в апараті каузальних мереж з точки зору їх спроможності виявляти каузальні відношення. Концепція каузальності за Грейнджером в реальних умовах неповноти інформації непридатна для виявлення каузальних відношень в даних. За критерієм Грейнджера, в набір предикторів для прогнозу наслідку Y будуть включені всі змінні, корисні для покращення пасивного прогнозу. Взагалі, коректність критерію залежить від формату керування. Оскільки деякі справжні причини X для наслідку Y є недоступними, то корисними (для певних форматів втручання в об’єкт) можуть бути не-причини Z , які передають «незамінну» (в даному контексті) інформацію для прогнозу наслідку Y . (Зокрема, це змінні, пов'язані будь-яким ребром з Y , які йдуть у часі раніше Y .) Коректним засобом виявлення каузальних відношень в даних є правило орієнтації ребер 1 (розроблене в апараті каузальних мереж). Але це правило результативне тільки за певних умов (каузальне ребро не знаходиться під дією прихованого конфаундери і не оточене повно зв'язаною структурою). Бібліографія 1. Handbook of Big Data. P. Bühlmann, P. Drineas, M. Kane, M. van der Laan (Eds.). Boca Raton, FL.: CRC Press. Taylor & Francis Group, 2016. 452p. 2. Балабанов О.С. Задачі та методи аналізу великих даних (огляд). (Оновлено) Jan 2020. – [Electronic resource] URL: https://www.researchgate.net/publication/338714383_Tasks_and_methods_of_Big_Data_analysis_a_survey_revised. . Порівняємо можливості цих двох підходів. Спочатку відзначимо другорядну особливість, що відрізняє «причину» (за К. Грейнджером) від «причини» в апараті каузальних мереж. В каузальній мережі змінна X вважається причиною для Y, якщо є стро- го орієнтований шлях від X до Y. Тобто в перелік причин включено також і непрямі (опосередковані) причини. Натомість за К. Грейнджером непрямі причини X будуть визнані не-причинами, якщо доступний достатній на- бір посередників, через які здійснюється вплив X на Y. Суттєвим є те, що сурогатний критерій К. Грейнджера може призводити до систематичних помилок у визначенні каузальності. Можна описати роботу критерія К. Грейнджера так: формується набір предикторів Моделі і засоби систем баз даних та знань впливають на цільові змінні, не припускаються). В реальних ситуаціях доводиться застосовувати критерій Грейнджера в сурогатному режимі, тобто в умовах доступності лише неповної інформації t . Порівняємо можливості цих двох підходів. Спочатку відзначимо другорядну особливість, що відрізняє «причину» (за К. Грейнджером) від «причини» в апараті каузальних мереж. В каузальній мережі змінна X вважається причиною для Y , якщо є строго орієнтований шлях від X до Y . Тобто в перелік причин включено також і непрямі (опосередковані) причини. Натомість за К. Грейнджером непрямі причини X будуть визнані не-причинами, якщо доступний достатній набір посередників, через які здійснюється вплив X на Y . Суттєвим є те, що сурогатний критерій К. Грейнджера може призводити до систематичних помилок у визначенні каузальності. Можна описати роботу критерія К. Грейнджера так: формується набір предикторів 1−t , який мінімізує помилку прогнозу змінної tY , а потім з набору 1−t видаляються всі «надлишкові» предиктори. Виключення надлишкових предикторів не погіршує прогноз. Всі предиктори, що не були видалені як надлишкові, визнаються «причинами» для tY за Грейнджером. Легко бачити, якщо, припустимо, для ktX − та tY алгоритм виведення моделі не знайшов сепаратора, то ktX − буде визнана причиною для tY за Грейнджером. Отже, критерій К. Грейнджера включає в перелік «причин» для tY всі змінні, які поєднані з tY ребром і які йдуть у часі раніше за tY . Зокрема, якщо є ребро tkt YZ − , то змінна ktZ − також буде визнана причиною для tY , що є помилкою. Не-причина може бути необхідною для покращення прогнозу, бо несе «незамінну» інформацію в умовах недоступності справжніх причин. Наприклад, якщо маємо генеративну модель, показану на рис. 4,б, то, згідно Грейнджеру, причинами змінної X будуть визнані всі минулі значення цієї змінної. Більш того, неадекватність критерія Грейнджера простягається ще далі. В певних ситуаціях цей критерій може включити в набір «причин» для tY змінну, яка є безумовно незалежна від tY . Так станеться, якщо в моделі є ребро tkt YZ − та ребро ltkt QZ −−  . Це може здатися парадоксальним, але включення змінної ltQ − в набір предикторів зменшує помилку прогнозу змінної tY (за умови, що на змінну ktZ − не здійснюється втручання). Отже, в реалістичних умовах критерій К. Грейнджера є некоректним для задачі виявлення причин. Звернемося до правил орієнтації ребер в методах виведення каузальних мереж. Як показано в [7], якщо можливі конфаундери, то серед всіх відомих правил тільки правило 1 виводить каузальне ребро. Це правило є коректним засобом виявлення причинних зв'язків. Але для того, щоб правило орієнтації ребер 1 спрацювало, має виконуватися відповідна умовна незалежність. А для цього треба, щоб алгоритм «дістався» до відповідного зв'язку з найбільшим лагом, і щоб не було прихованого конфаундера. Якщо жодного непустого сепаратора не знайдено, то тоді не буде виведено жодного каузального зв'язку, і всі зв'язки залишаться у невизначеному статусі (в формі ребра YX → ). Висновки Динамічні каузальні моделі є потужним засобом аналізу й дослідження різноманітних процесів та об'єктів і забезпечує відображення таких рис, як швидкість змін, періодичність, лаг післядії, зворотні зв'язки тощо. Серед різноманітних типів динамічних процесів (які включають, зокрема, рекурентні процеси, «запрограмовані» процеси, потоки стохастичних подій, лічильні процеси і так далі) виділено векторні авторегресійні процеси. (Відомо, як для них можна виводити каузальні моделі.) Вимоги до архітектури темпоральних даних, способів та частоти їх збору диктуються характером динамічного процесу. Частота вимірювання даних має критичне значення для адекватності виведеної моделі і визначається тривалістю елементарних впливів між компонентами векторного процесу. Для виведення динамічним моделей з даних важливу роль відіграють припущення стаціонарності та регулярності структури. Особливостями виведення динамічних каузальних моделей є врахування темпорального порядку змінних та проблеми, пов'язані з невідомим лагом післядії та існуванням прихованих автокорельованих часових рядів. Проведено порівняльний аналіз критерію каузальності за Грейнджером та правил орієнтації ребер в апараті каузальних мереж з точки зору їх спроможності виявляти каузальні відношення. Концепція каузальності за Грейнджером в реальних умовах неповноти інформації непридатна для виявлення каузальних відношень в даних. За критерієм Грейнджера, в набір предикторів для прогнозу наслідку Y будуть включені всі змінні, корисні для покращення пасивного прогнозу. Взагалі, коректність критерію залежить від формату керування. Оскільки деякі справжні причини X для наслідку Y є недоступними, то корисними (для певних форматів втручання в об’єкт) можуть бути не-причини Z , які передають «незамінну» (в даному контексті) інформацію для прогнозу наслідку Y . (Зокрема, це змінні, пов'язані будь-яким ребром з Y , які йдуть у часі раніше Y .) Коректним засобом виявлення каузальних відношень в даних є правило орієнтації ребер 1 (розроблене в апараті каузальних мереж). Але це правило результативне тільки за певних умов (каузальне ребро не знаходиться під дією прихованого конфаундери і не оточене повно зв'язаною структурою). Бібліографія 1. Handbook of Big Data. P. Bühlmann, P. Drineas, M. Kane, M. van der Laan (Eds.). Boca Raton, FL.: CRC Press. Taylor & Francis Group, 2016. 452p. 2. Балабанов О.С. Задачі та методи аналізу великих даних (огляд). (Оновлено) Jan 2020. – [Electronic resource] URL: https://www.researchgate.net/publication/338714383_Tasks_and_methods_of_Big_Data_analysis_a_survey_revised. , який мінімізує помилку прогнозу змінної Моделі і засоби систем баз даних та знань впливають на цільові змінні, не припускаються). В реальних ситуаціях доводиться застосовувати критерій Грейнджера в сурогатному режимі, тобто в умовах доступності лише неповної інформації t . Порівняємо можливості цих двох підходів. Спочатку відзначимо другорядну особливість, що відрізняє «причину» (за К. Грейнджером) від «причини» в апараті каузальних мереж. В каузальній мережі змінна X вважається причиною для Y , якщо є строго орієнтований шлях від X до Y . Тобто в перелік причин включено також і непрямі (опосередковані) причини. Натомість за К. Грейнджером непрямі причини X будуть визнані не-причинами, якщо доступний достатній набір посередників, через які здійснюється вплив X на Y . Суттєвим є те, що сурогатний критерій К. Грейнджера може призводити до систематичних помилок у визначенні каузальності. Можна описати роботу критерія К. Грейнджера так: формується набір предикторів 1−t , який мінімізує помилку прогнозу змінної tY , а потім з набору 1−t видаляються всі «надлишкові» предиктори. Виключення надлишкових предикторів не погіршує прогноз. Всі предиктори, що не були видалені як надлишкові, визнаються «причинами» для tY за Грейнджером. Легко бачити, якщо, припустимо, для ktX − та tY алгоритм виведення моделі не знайшов сепаратора, то ktX − буде визнана причиною для tY за Грейнджером. Отже, критерій К. Грейнджера включає в перелік «причин» для tY всі змінні, які поєднані з tY ребром і які йдуть у часі раніше за tY . Зокрема, якщо є ребро tkt YZ − , то змінна ktZ − також буде визнана причиною для tY , що є помилкою. Не-причина може бути необхідною для покращення прогнозу, бо несе «незамінну» інформацію в умовах недоступності справжніх причин. Наприклад, якщо маємо генеративну модель, показану на рис. 4,б, то, згідно Грейнджеру, причинами змінної X будуть визнані всі минулі значення цієї змінної. Більш того, неадекватність критерія Грейнджера простягається ще далі. В певних ситуаціях цей критерій може включити в набір «причин» для tY змінну, яка є безумовно незалежна від tY . Так станеться, якщо в моделі є ребро tkt YZ − та ребро ltkt QZ −−  . Це може здатися парадоксальним, але включення змінної ltQ − в набір предикторів зменшує помилку прогнозу змінної tY (за умови, що на змінну ktZ − не здійснюється втручання). Отже, в реалістичних умовах критерій К. Грейнджера є некоректним для задачі виявлення причин. Звернемося до правил орієнтації ребер в методах виведення каузальних мереж. Як показано в [7], якщо можливі конфаундери, то серед всіх відомих правил тільки правило 1 виводить каузальне ребро. Це правило є коректним засобом виявлення причинних зв'язків. Але для того, щоб правило орієнтації ребер 1 спрацювало, має виконуватися відповідна умовна незалежність. А для цього треба, щоб алгоритм «дістався» до відповідного зв'язку з найбільшим лагом, і щоб не було прихованого конфаундера. Якщо жодного непустого сепаратора не знайдено, то тоді не буде виведено жодного каузального зв'язку, і всі зв'язки залишаться у невизначеному статусі (в формі ребра YX → ). Висновки Динамічні каузальні моделі є потужним засобом аналізу й дослідження різноманітних процесів та об'єктів і забезпечує відображення таких рис, як швидкість змін, періодичність, лаг післядії, зворотні зв'язки тощо. Серед різноманітних типів динамічних процесів (які включають, зокрема, рекурентні процеси, «запрограмовані» процеси, потоки стохастичних подій, лічильні процеси і так далі) виділено векторні авторегресійні процеси. (Відомо, як для них можна виводити каузальні моделі.) Вимоги до архітектури темпоральних даних, способів та частоти їх збору диктуються характером динамічного процесу. Частота вимірювання даних має критичне значення для адекватності виведеної моделі і визначається тривалістю елементарних впливів між компонентами векторного процесу. Для виведення динамічним моделей з даних важливу роль відіграють припущення стаціонарності та регулярності структури. Особливостями виведення динамічних каузальних моделей є врахування темпорального порядку змінних та проблеми, пов'язані з невідомим лагом післядії та існуванням прихованих автокорельованих часових рядів. Проведено порівняльний аналіз критерію каузальності за Грейнджером та правил орієнтації ребер в апараті каузальних мереж з точки зору їх спроможності виявляти каузальні відношення. Концепція каузальності за Грейнджером в реальних умовах неповноти інформації непридатна для виявлення каузальних відношень в даних. За критерієм Грейнджера, в набір предикторів для прогнозу наслідку Y будуть включені всі змінні, корисні для покращення пасивного прогнозу. Взагалі, коректність критерію залежить від формату керування. Оскільки деякі справжні причини X для наслідку Y є недоступними, то корисними (для певних форматів втручання в об’єкт) можуть бути не-причини Z , які передають «незамінну» (в даному контексті) інформацію для прогнозу наслідку Y . (Зокрема, це змінні, пов'язані будь-яким ребром з Y , які йдуть у часі раніше Y .) Коректним засобом виявлення каузальних відношень в даних є правило орієнтації ребер 1 (розроблене в апараті каузальних мереж). Але це правило результативне тільки за певних умов (каузальне ребро не знаходиться під дією прихованого конфаундери і не оточене повно зв'язаною структурою). Бібліографія 1. Handbook of Big Data. P. Bühlmann, P. Drineas, M. Kane, M. van der Laan (Eds.). Boca Raton, FL.: CRC Press. Taylor & Francis Group, 2016. 452p. 2. Балабанов О.С. Задачі та методи аналізу великих даних (огляд). (Оновлено) Jan 2020. – [Electronic resource] URL: https://www.researchgate.net/publication/338714383_Tasks_and_methods_of_Big_Data_analysis_a_survey_revised. , а потім з набору Моделі і засоби систем баз даних та знань впливають на цільові змінні, не припускаються). В реальних ситуаціях доводиться застосовувати критерій Грейнджера в сурогатному режимі, тобто в умовах доступності лише неповної інформації t . Порівняємо можливості цих двох підходів. Спочатку відзначимо другорядну особливість, що відрізняє «причину» (за К. Грейнджером) від «причини» в апараті каузальних мереж. В каузальній мережі змінна X вважається причиною для Y , якщо є строго орієнтований шлях від X до Y . Тобто в перелік причин включено також і непрямі (опосередковані) причини. Натомість за К. Грейнджером непрямі причини X будуть визнані не-причинами, якщо доступний достатній набір посередників, через які здійснюється вплив X на Y . Суттєвим є те, що сурогатний критерій К. Грейнджера може призводити до систематичних помилок у визначенні каузальності. Можна описати роботу критерія К. Грейнджера так: формується набір предикторів 1−t , який мінімізує помилку прогнозу змінної tY , а потім з набору 1−t видаляються всі «надлишкові» предиктори. Виключення надлишкових предикторів не погіршує прогноз. Всі предиктори, що не були видалені як надлишкові, визнаються «причинами» для tY за Грейнджером. Легко бачити, якщо, припустимо, для ktX − та tY алгоритм виведення моделі не знайшов сепаратора, то ktX − буде визнана причиною для tY за Грейнджером. Отже, критерій К. Грейнджера включає в перелік «причин» для tY всі змінні, які поєднані з tY ребром і які йдуть у часі раніше за tY . Зокрема, якщо є ребро tkt YZ − , то змінна ktZ − також буде визнана причиною для tY , що є помилкою. Не-причина може бути необхідною для покращення прогнозу, бо несе «незамінну» інформацію в умовах недоступності справжніх причин. Наприклад, якщо маємо генеративну модель, показану на рис. 4,б, то, згідно Грейнджеру, причинами змінної X будуть визнані всі минулі значення цієї змінної. Більш того, неадекватність критерія Грейнджера простягається ще далі. В певних ситуаціях цей критерій може включити в набір «причин» для tY змінну, яка є безумовно незалежна від tY . Так станеться, якщо в моделі є ребро tkt YZ − та ребро ltkt QZ −−  . Це може здатися парадоксальним, але включення змінної ltQ − в набір предикторів зменшує помилку прогнозу змінної tY (за умови, що на змінну ktZ − не здійснюється втручання). Отже, в реалістичних умовах критерій К. Грейнджера є некоректним для задачі виявлення причин. Звернемося до правил орієнтації ребер в методах виведення каузальних мереж. Як показано в [7], якщо можливі конфаундери, то серед всіх відомих правил тільки правило 1 виводить каузальне ребро. Це правило є коректним засобом виявлення причинних зв'язків. Але для того, щоб правило орієнтації ребер 1 спрацювало, має виконуватися відповідна умовна незалежність. А для цього треба, щоб алгоритм «дістався» до відповідного зв'язку з найбільшим лагом, і щоб не було прихованого конфаундера. Якщо жодного непустого сепаратора не знайдено, то тоді не буде виведено жодного каузального зв'язку, і всі зв'язки залишаться у невизначеному статусі (в формі ребра YX → ). Висновки Динамічні каузальні моделі є потужним засобом аналізу й дослідження різноманітних процесів та об'єктів і забезпечує відображення таких рис, як швидкість змін, періодичність, лаг післядії, зворотні зв'язки тощо. Серед різноманітних типів динамічних процесів (які включають, зокрема, рекурентні процеси, «запрограмовані» процеси, потоки стохастичних подій, лічильні процеси і так далі) виділено векторні авторегресійні процеси. (Відомо, як для них можна виводити каузальні моделі.) Вимоги до архітектури темпоральних даних, способів та частоти їх збору диктуються характером динамічного процесу. Частота вимірювання даних має критичне значення для адекватності виведеної моделі і визначається тривалістю елементарних впливів між компонентами векторного процесу. Для виведення динамічним моделей з даних важливу роль відіграють припущення стаціонарності та регулярності структури. Особливостями виведення динамічних каузальних моделей є врахування темпорального порядку змінних та проблеми, пов'язані з невідомим лагом післядії та існуванням прихованих автокорельованих часових рядів. Проведено порівняльний аналіз критерію каузальності за Грейнджером та правил орієнтації ребер в апараті каузальних мереж з точки зору їх спроможності виявляти каузальні відношення. Концепція каузальності за Грейнджером в реальних умовах неповноти інформації непридатна для виявлення каузальних відношень в даних. За критерієм Грейнджера, в набір предикторів для прогнозу наслідку Y будуть включені всі змінні, корисні для покращення пасивного прогнозу. Взагалі, коректність критерію залежить від формату керування. Оскільки деякі справжні причини X для наслідку Y є недоступними, то корисними (для певних форматів втручання в об’єкт) можуть бути не-причини Z , які передають «незамінну» (в даному контексті) інформацію для прогнозу наслідку Y . (Зокрема, це змінні, пов'язані будь-яким ребром з Y , які йдуть у часі раніше Y .) Коректним засобом виявлення каузальних відношень в даних є правило орієнтації ребер 1 (розроблене в апараті каузальних мереж). Але це правило результативне тільки за певних умов (каузальне ребро не знаходиться під дією прихованого конфаундери і не оточене повно зв'язаною структурою). Бібліографія 1. Handbook of Big Data. P. Bühlmann, P. Drineas, M. Kane, M. van der Laan (Eds.). Boca Raton, FL.: CRC Press. Taylor & Francis Group, 2016. 452p. 2. Балабанов О.С. Задачі та методи аналізу великих даних (огляд). (Оновлено) Jan 2020. – [Electronic resource] URL: https://www.researchgate.net/publication/338714383_Tasks_and_methods_of_Big_Data_analysis_a_survey_revised. видаляються всі «надлишкові» пред- иктори. Виключення надлишкових предикторів не погіршує прогноз. Всі предиктори, що не були видалені як надлишкові, визнаються «причинами» для Моделі і засоби систем баз даних та знань впливають на цільові змінні, не припускаються). В реальних ситуаціях доводиться застосовувати критерій Грейнджера в сурогатному режимі, тобто в умовах доступності лише неповної інформації t . Порівняємо можливості цих двох підходів. Спочатку відзначимо другорядну особливість, що відрізняє «причину» (за К. Грейнджером) від «причини» в апараті каузальних мереж. В каузальній мережі змінна X вважається причиною для Y , якщо є строго орієнтований шлях від X до Y . Тобто в перелік причин включено також і непрямі (опосередковані) причини. Натомість за К. Грейнджером непрямі причини X будуть визнані не-причинами, якщо доступний достатній набір посередників, через які здійснюється вплив X на Y . Суттєвим є те, що сурогатний критерій К. Грейнджера може призводити до систематичних помилок у визначенні каузальності. Можна описати роботу критерія К. Грейнджера так: формується набір предикторів 1−t , який мінімізує помилку прогнозу змінної tY , а потім з набору 1−t видаляються всі «надлишкові» предиктори. Виключення надлишкових предикторів не погіршує прогноз. Всі предиктори, що не були видалені як надлишкові, визнаються «причинами» для tY за Грейнджером. Легко бачити, якщо, припустимо, для ktX − та tY алгоритм виведення моделі не знайшов сепаратора, то ktX − буде визнана причиною для tY за Грейнджером. Отже, критерій К. Грейнджера включає в перелік «причин» для tY всі змінні, які поєднані з tY ребром і які йдуть у часі раніше за tY . Зокрема, якщо є ребро tkt YZ − , то змінна ktZ − також буде визнана причиною для tY , що є помилкою. Не-причина може бути необхідною для покращення прогнозу, бо несе «незамінну» інформацію в умовах недоступності справжніх причин. Наприклад, якщо маємо генеративну модель, показану на рис. 4,б, то, згідно Грейнджеру, причинами змінної X будуть визнані всі минулі значення цієї змінної. Більш того, неадекватність критерія Грейнджера простягається ще далі. В певних ситуаціях цей критерій може включити в набір «причин» для tY змінну, яка є безумовно незалежна від tY . Так станеться, якщо в моделі є ребро tkt YZ − та ребро ltkt QZ −−  . Це може здатися парадоксальним, але включення змінної ltQ − в набір предикторів зменшує помилку прогнозу змінної tY (за умови, що на змінну ktZ − не здійснюється втручання). Отже, в реалістичних умовах критерій К. Грейнджера є некоректним для задачі виявлення причин. Звернемося до правил орієнтації ребер в методах виведення каузальних мереж. Як показано в [7], якщо можливі конфаундери, то серед всіх відомих правил тільки правило 1 виводить каузальне ребро. Це правило є коректним засобом виявлення причинних зв'язків. Але для того, щоб правило орієнтації ребер 1 спрацювало, має виконуватися відповідна умовна незалежність. А для цього треба, щоб алгоритм «дістався» до відповідного зв'язку з найбільшим лагом, і щоб не було прихованого конфаундера. Якщо жодного непустого сепаратора не знайдено, то тоді не буде виведено жодного каузального зв'язку, і всі зв'язки залишаться у невизначеному статусі (в формі ребра YX → ). Висновки Динамічні каузальні моделі є потужним засобом аналізу й дослідження різноманітних процесів та об'єктів і забезпечує відображення таких рис, як швидкість змін, періодичність, лаг післядії, зворотні зв'язки тощо. Серед різноманітних типів динамічних процесів (які включають, зокрема, рекурентні процеси, «запрограмовані» процеси, потоки стохастичних подій, лічильні процеси і так далі) виділено векторні авторегресійні процеси. (Відомо, як для них можна виводити каузальні моделі.) Вимоги до архітектури темпоральних даних, способів та частоти їх збору диктуються характером динамічного процесу. Частота вимірювання даних має критичне значення для адекватності виведеної моделі і визначається тривалістю елементарних впливів між компонентами векторного процесу. Для виведення динамічним моделей з даних важливу роль відіграють припущення стаціонарності та регулярності структури. Особливостями виведення динамічних каузальних моделей є врахування темпорального порядку змінних та проблеми, пов'язані з невідомим лагом післядії та існуванням прихованих автокорельованих часових рядів. Проведено порівняльний аналіз критерію каузальності за Грейнджером та правил орієнтації ребер в апараті каузальних мереж з точки зору їх спроможності виявляти каузальні відношення. Концепція каузальності за Грейнджером в реальних умовах неповноти інформації непридатна для виявлення каузальних відношень в даних. За критерієм Грейнджера, в набір предикторів для прогнозу наслідку Y будуть включені всі змінні, корисні для покращення пасивного прогнозу. Взагалі, коректність критерію залежить від формату керування. Оскільки деякі справжні причини X для наслідку Y є недоступними, то корисними (для певних форматів втручання в об’єкт) можуть бути не-причини Z , які передають «незамінну» (в даному контексті) інформацію для прогнозу наслідку Y . (Зокрема, це змінні, пов'язані будь-яким ребром з Y , які йдуть у часі раніше Y .) Коректним засобом виявлення каузальних відношень в даних є правило орієнтації ребер 1 (розроблене в апараті каузальних мереж). Але це правило результативне тільки за певних умов (каузальне ребро не знаходиться під дією прихованого конфаундери і не оточене повно зв'язаною структурою). Бібліографія 1. Handbook of Big Data. P. Bühlmann, P. Drineas, M. Kane, M. van der Laan (Eds.). Boca Raton, FL.: CRC Press. Taylor & Francis Group, 2016. 452p. 2. Балабанов О.С. Задачі та методи аналізу великих даних (огляд). (Оновлено) Jan 2020. – [Electronic resource] URL: https://www.researchgate.net/publication/338714383_Tasks_and_methods_of_Big_Data_analysis_a_survey_revised. за Грейнджером. Легко бачити, якщо, припустимо, для Моделі і засоби систем баз даних та знань впливають на цільові змінні, не припускаються). В реальних ситуаціях доводиться застосовувати критерій Грейнджера в сурогатному режимі, тобто в умовах доступності лише неповної інформації t . Порівняємо можливості цих двох підходів. Спочатку відзначимо другорядну особливість, що відрізняє «причину» (за К. Грейнджером) від «причини» в апараті каузальних мереж. В каузальній мережі змінна X вважається причиною для Y , якщо є строго орієнтований шлях від X до Y . Тобто в перелік причин включено також і непрямі (опосередковані) причини. Натомість за К. Грейнджером непрямі причини X будуть визнані не-причинами, якщо доступний достатній набір посередників, через які здійснюється вплив X на Y . Суттєвим є те, що сурогатний критерій К. Грейнджера може призводити до систематичних помилок у визначенні каузальності. Можна описати роботу критерія К. Грейнджера так: формується набір предикторів 1−t , який мінімізує помилку прогнозу змінної tY , а потім з набору 1−t видаляються всі «надлишкові» предиктори. Виключення надлишкових предикторів не погіршує прогноз. Всі предиктори, що не були видалені як надлишкові, визнаються «причинами» для tY за Грейнджером. Легко бачити, якщо, припустимо, для ktX − та tY алгоритм виведення моделі не знайшов сепаратора, то ktX − буде визнана причиною для tY за Грейнджером. Отже, критерій К. Грейнджера включає в перелік «причин» для tY всі змінні, які поєднані з tY ребром і які йдуть у часі раніше за tY . Зокрема, якщо є ребро tkt YZ − , то змінна ktZ − також буде визнана причиною для tY , що є помилкою. Не-причина може бути необхідною для покращення прогнозу, бо несе «незамінну» інформацію в умовах недоступності справжніх причин. Наприклад, якщо маємо генеративну модель, показану на рис. 4,б, то, згідно Грейнджеру, причинами змінної X будуть визнані всі минулі значення цієї змінної. Більш того, неадекватність критерія Грейнджера простягається ще далі. В певних ситуаціях цей критерій може включити в набір «причин» для tY змінну, яка є безумовно незалежна від tY . Так станеться, якщо в моделі є ребро tkt YZ − та ребро ltkt QZ −−  . Це може здатися парадоксальним, але включення змінної ltQ − в набір предикторів зменшує помилку прогнозу змінної tY (за умови, що на змінну ktZ − не здійснюється втручання). Отже, в реалістичних умовах критерій К. Грейнджера є некоректним для задачі виявлення причин. Звернемося до правил орієнтації ребер в методах виведення каузальних мереж. Як показано в [7], якщо можливі конфаундери, то серед всіх відомих правил тільки правило 1 виводить каузальне ребро. Це правило є коректним засобом виявлення причинних зв'язків. Але для того, щоб правило орієнтації ребер 1 спрацювало, має виконуватися відповідна умовна незалежність. А для цього треба, щоб алгоритм «дістався» до відповідного зв'язку з найбільшим лагом, і щоб не було прихованого конфаундера. Якщо жодного непустого сепаратора не знайдено, то тоді не буде виведено жодного каузального зв'язку, і всі зв'язки залишаться у невизначеному статусі (в формі ребра YX → ). Висновки Динамічні каузальні моделі є потужним засобом аналізу й дослідження різноманітних процесів та об'єктів і забезпечує відображення таких рис, як швидкість змін, періодичність, лаг післядії, зворотні зв'язки тощо. Серед різноманітних типів динамічних процесів (які включають, зокрема, рекурентні процеси, «запрограмовані» процеси, потоки стохастичних подій, лічильні процеси і так далі) виділено векторні авторегресійні процеси. (Відомо, як для них можна виводити каузальні моделі.) Вимоги до архітектури темпоральних даних, способів та частоти їх збору диктуються характером динамічного процесу. Частота вимірювання даних має критичне значення для адекватності виведеної моделі і визначається тривалістю елементарних впливів між компонентами векторного процесу. Для виведення динамічним моделей з даних важливу роль відіграють припущення стаціонарності та регулярності структури. Особливостями виведення динамічних каузальних моделей є врахування темпорального порядку змінних та проблеми, пов'язані з невідомим лагом післядії та існуванням прихованих автокорельованих часових рядів. Проведено порівняльний аналіз критерію каузальності за Грейнджером та правил орієнтації ребер в апараті каузальних мереж з точки зору їх спроможності виявляти каузальні відношення. Концепція каузальності за Грейнджером в реальних умовах неповноти інформації непридатна для виявлення каузальних відношень в даних. За критерієм Грейнджера, в набір предикторів для прогнозу наслідку Y будуть включені всі змінні, корисні для покращення пасивного прогнозу. Взагалі, коректність критерію залежить від формату керування. Оскільки деякі справжні причини X для наслідку Y є недоступними, то корисними (для певних форматів втручання в об’єкт) можуть бути не-причини Z , які передають «незамінну» (в даному контексті) інформацію для прогнозу наслідку Y . (Зокрема, це змінні, пов'язані будь-яким ребром з Y , які йдуть у часі раніше Y .) Коректним засобом виявлення каузальних відношень в даних є правило орієнтації ребер 1 (розроблене в апараті каузальних мереж). Але це правило результативне тільки за певних умов (каузальне ребро не знаходиться під дією прихованого конфаундери і не оточене повно зв'язаною структурою). Бібліографія 1. Handbook of Big Data. P. Bühlmann, P. Drineas, M. Kane, M. van der Laan (Eds.). Boca Raton, FL.: CRC Press. Taylor & Francis Group, 2016. 452p. 2. Балабанов О.С. Задачі та методи аналізу великих даних (огляд). (Оновлено) Jan 2020. – [Electronic resource] URL: https://www.researchgate.net/publication/338714383_Tasks_and_methods_of_Big_Data_analysis_a_survey_revised. та Моделі і засоби систем баз даних та знань впливають на цільові змінні, не припускаються). В реальних ситуаціях доводиться застосовувати критерій Грейнджера в сурогатному режимі, тобто в умовах доступності лише неповної інформації t . Порівняємо можливості цих двох підходів. Спочатку відзначимо другорядну особливість, що відрізняє «причину» (за К. Грейнджером) від «причини» в апараті каузальних мереж. В каузальній мережі змінна X вважається причиною для Y , якщо є строго орієнтований шлях від X до Y . Тобто в перелік причин включено також і непрямі (опосередковані) причини. Натомість за К. Грейнджером непрямі причини X будуть визнані не-причинами, якщо доступний достатній набір посередників, через які здійснюється вплив X на Y . Суттєвим є те, що сурогатний критерій К. Грейнджера може призводити до систематичних помилок у визначенні каузальності. Можна описати роботу критерія К. Грейнджера так: формується набір предикторів 1−t , який мінімізує помилку прогнозу змінної tY , а потім з набору 1−t видаляються всі «надлишкові» предиктори. Виключення надлишкових предикторів не погіршує прогноз. Всі предиктори, що не були видалені як надлишкові, визнаються «причинами» для tY за Грейнджером. Легко бачити, якщо, припустимо, для ktX − та tY алгоритм виведення моделі не знайшов сепаратора, то ktX − буде визнана причиною для tY за Грейнджером. Отже, критерій К. Грейнджера включає в перелік «причин» для tY всі змінні, які поєднані з tY ребром і які йдуть у часі раніше за tY . Зокрема, якщо є ребро tkt YZ − , то змінна ktZ − також буде визнана причиною для tY , що є помилкою. Не-причина може бути необхідною для покращення прогнозу, бо несе «незамінну» інформацію в умовах недоступності справжніх причин. Наприклад, якщо маємо генеративну модель, показану на рис. 4,б, то, згідно Грейнджеру, причинами змінної X будуть визнані всі минулі значення цієї змінної. Більш того, неадекватність критерія Грейнджера простягається ще далі. В певних ситуаціях цей критерій може включити в набір «причин» для tY змінну, яка є безумовно незалежна від tY . Так станеться, якщо в моделі є ребро tkt YZ − та ребро ltkt QZ −−  . Це може здатися парадоксальним, але включення змінної ltQ − в набір предикторів зменшує помилку прогнозу змінної tY (за умови, що на змінну ktZ − не здійснюється втручання). Отже, в реалістичних умовах критерій К. Грейнджера є некоректним для задачі виявлення причин. Звернемося до правил орієнтації ребер в методах виведення каузальних мереж. Як показано в [7], якщо можливі конфаундери, то серед всіх відомих правил тільки правило 1 виводить каузальне ребро. Це правило є коректним засобом виявлення причинних зв'язків. Але для того, щоб правило орієнтації ребер 1 спрацювало, має виконуватися відповідна умовна незалежність. А для цього треба, щоб алгоритм «дістався» до відповідного зв'язку з найбільшим лагом, і щоб не було прихованого конфаундера. Якщо жодного непустого сепаратора не знайдено, то тоді не буде виведено жодного каузального зв'язку, і всі зв'язки залишаться у невизначеному статусі (в формі ребра YX → ). Висновки Динамічні каузальні моделі є потужним засобом аналізу й дослідження різноманітних процесів та об'єктів і забезпечує відображення таких рис, як швидкість змін, періодичність, лаг післядії, зворотні зв'язки тощо. Серед різноманітних типів динамічних процесів (які включають, зокрема, рекурентні процеси, «запрограмовані» процеси, потоки стохастичних подій, лічильні процеси і так далі) виділено векторні авторегресійні процеси. (Відомо, як для них можна виводити каузальні моделі.) Вимоги до архітектури темпоральних даних, способів та частоти їх збору диктуються характером динамічного процесу. Частота вимірювання даних має критичне значення для адекватності виведеної моделі і визначається тривалістю елементарних впливів між компонентами векторного процесу. Для виведення динамічним моделей з даних важливу роль відіграють припущення стаціонарності та регулярності структури. Особливостями виведення динамічних каузальних моделей є врахування темпорального порядку змінних та проблеми, пов'язані з невідомим лагом післядії та існуванням прихованих автокорельованих часових рядів. Проведено порівняльний аналіз критерію каузальності за Грейнджером та правил орієнтації ребер в апараті каузальних мереж з точки зору їх спроможності виявляти каузальні відношення. Концепція каузальності за Грейнджером в реальних умовах неповноти інформації непридатна для виявлення каузальних відношень в даних. За критерієм Грейнджера, в набір предикторів для прогнозу наслідку Y будуть включені всі змінні, корисні для покращення пасивного прогнозу. Взагалі, коректність критерію залежить від формату керування. Оскільки деякі справжні причини X для наслідку Y є недоступними, то корисними (для певних форматів втручання в об’єкт) можуть бути не-причини Z , які передають «незамінну» (в даному контексті) інформацію для прогнозу наслідку Y . (Зокрема, це змінні, пов'язані будь-яким ребром з Y , які йдуть у часі раніше Y .) Коректним засобом виявлення каузальних відношень в даних є правило орієнтації ребер 1 (розроблене в апараті каузальних мереж). Але це правило результативне тільки за певних умов (каузальне ребро не знаходиться під дією прихованого конфаундери і не оточене повно зв'язаною структурою). Бібліографія 1. Handbook of Big Data. P. Bühlmann, P. Drineas, M. Kane, M. van der Laan (Eds.). Boca Raton, FL.: CRC Press. Taylor & Francis Group, 2016. 452p. 2. Балабанов О.С. Задачі та методи аналізу великих даних (огляд). (Оновлено) Jan 2020. – [Electronic resource] URL: https://www.researchgate.net/publication/338714383_Tasks_and_methods_of_Big_Data_analysis_a_survey_revised. алгоритм виведення моделі не знайшов сепаратора, то Моделі і засоби систем баз даних та знань впливають на цільові змінні, не припускаються). В реальних ситуаціях доводиться застосовувати критерій Грейнджера в сурогатному режимі, тобто в умовах доступності лише неповної інформації t . Порівняємо можливості цих двох підходів. Спочатку відзначимо другорядну особливість, що відрізняє «причину» (за К. Грейнджером) від «причини» в апараті каузальних мереж. В каузальній мережі змінна X вважається причиною для Y , якщо є строго орієнтований шлях від X до Y . Тобто в перелік причин включено також і непрямі (опосередковані) причини. Натомість за К. Грейнджером непрямі причини X будуть визнані не-причинами, якщо доступний достатній набір посередників, через які здійснюється вплив X на Y . Суттєвим є те, що сурогатний критерій К. Грейнджера може призводити до систематичних помилок у визначенні каузальності. Можна описати роботу критерія К. Грейнджера так: формується набір предикторів 1−t , який мінімізує помилку прогнозу змінної tY , а потім з набору 1−t видаляються всі «надлишкові» предиктори. Виключення надлишкових предикторів не погіршує прогноз. Всі предиктори, що не були видалені як надлишкові, визнаються «причинами» для tY за Грейнджером. Легко бачити, якщо, припустимо, для ktX − та tY алгоритм виведення моделі не знайшов сепаратора, то ktX − буде визнана причиною для tY за Грейнджером. Отже, критерій К. Грейнджера включає в перелік «причин» для tY всі змінні, які поєднані з tY ребром і які йдуть у часі раніше за tY . Зокрема, якщо є ребро tkt YZ − , то змінна ktZ − також буде визнана причиною для tY , що є помилкою. Не-причина може бути необхідною для покращення прогнозу, бо несе «незамінну» інформацію в умовах недоступності справжніх причин. Наприклад, якщо маємо генеративну модель, показану на рис. 4,б, то, згідно Грейнджеру, причинами змінної X будуть визнані всі минулі значення цієї змінної. Більш того, неадекватність критерія Грейнджера простягається ще далі. В певних ситуаціях цей критерій може включити в набір «причин» для tY змінну, яка є безумовно незалежна від tY . Так станеться, якщо в моделі є ребро tkt YZ − та ребро ltkt QZ −−  . Це може здатися парадоксальним, але включення змінної ltQ − в набір предикторів зменшує помилку прогнозу змінної tY (за умови, що на змінну ktZ − не здійснюється втручання). Отже, в реалістичних умовах критерій К. Грейнджера є некоректним для задачі виявлення причин. Звернемося до правил орієнтації ребер в методах виведення каузальних мереж. Як показано в [7], якщо можливі конфаундери, то серед всіх відомих правил тільки правило 1 виводить каузальне ребро. Це правило є коректним засобом виявлення причинних зв'язків. Але для того, щоб правило орієнтації ребер 1 спрацювало, має виконуватися відповідна умовна незалежність. А для цього треба, щоб алгоритм «дістався» до відповідного зв'язку з найбільшим лагом, і щоб не було прихованого конфаундера. Якщо жодного непустого сепаратора не знайдено, то тоді не буде виведено жодного каузального зв'язку, і всі зв'язки залишаться у невизначеному статусі (в формі ребра YX → ). Висновки Динамічні каузальні моделі є потужним засобом аналізу й дослідження різноманітних процесів та об'єктів і забезпечує відображення таких рис, як швидкість змін, періодичність, лаг післядії, зворотні зв'язки тощо. Серед різноманітних типів динамічних процесів (які включають, зокрема, рекурентні процеси, «запрограмовані» процеси, потоки стохастичних подій, лічильні процеси і так далі) виділено векторні авторегресійні процеси. (Відомо, як для них можна виводити каузальні моделі.) Вимоги до архітектури темпоральних даних, способів та частоти їх збору диктуються характером динамічного процесу. Частота вимірювання даних має критичне значення для адекватності виведеної моделі і визначається тривалістю елементарних впливів між компонентами векторного процесу. Для виведення динамічним моделей з даних важливу роль відіграють припущення стаціонарності та регулярності структури. Особливостями виведення динамічних каузальних моделей є врахування темпорального порядку змінних та проблеми, пов'язані з невідомим лагом післядії та існуванням прихованих автокорельованих часових рядів. Проведено порівняльний аналіз критерію каузальності за Грейнджером та правил орієнтації ребер в апараті каузальних мереж з точки зору їх спроможності виявляти каузальні відношення. Концепція каузальності за Грейнджером в реальних умовах неповноти інформації непридатна для виявлення каузальних відношень в даних. За критерієм Грейнджера, в набір предикторів для прогнозу наслідку Y будуть включені всі змінні, корисні для покращення пасивного прогнозу. Взагалі, коректність критерію залежить від формату керування. Оскільки деякі справжні причини X для наслідку Y є недоступними, то корисними (для певних форматів втручання в об’єкт) можуть бути не-причини Z , які передають «незамінну» (в даному контексті) інформацію для прогнозу наслідку Y . (Зокрема, це змінні, пов'язані будь-яким ребром з Y , які йдуть у часі раніше Y .) Коректним засобом виявлення каузальних відношень в даних є правило орієнтації ребер 1 (розроблене в апараті каузальних мереж). Але це правило результативне тільки за певних умов (каузальне ребро не знаходиться під дією прихованого конфаундери і не оточене повно зв'язаною структурою). Бібліографія 1. Handbook of Big Data. P. Bühlmann, P. Drineas, M. Kane, M. van der Laan (Eds.). Boca Raton, FL.: CRC Press. Taylor & Francis Group, 2016. 452p. 2. Балабанов О.С. Задачі та методи аналізу великих даних (огляд). (Оновлено) Jan 2020. – [Electronic resource] URL: https://www.researchgate.net/publication/338714383_Tasks_and_methods_of_Big_Data_analysis_a_survey_revised. буде визнана причиною для Моделі і засоби систем баз даних та знань впливають на цільові змінні, не припускаються). В реальних ситуаціях доводиться застосовувати критерій Грейнджера в сурогатному режимі, тобто в умовах доступності лише неповної інформації t . Порівняємо можливості цих двох підходів. Спочатку відзначимо другорядну особливість, що відрізняє «причину» (за К. Грейнджером) від «причини» в апараті каузальних мереж. В каузальній мережі змінна X вважається причиною для Y , якщо є строго орієнтований шлях від X до Y . Тобто в перелік причин включено також і непрямі (опосередковані) причини. Натомість за К. Грейнджером непрямі причини X будуть визнані не-причинами, якщо доступний достатній набір посередників, через які здійснюється вплив X на Y . Суттєвим є те, що сурогатний критерій К. Грейнджера може призводити до систематичних помилок у визначенні каузальності. Можна описати роботу критерія К. Грейнджера так: формується набір предикторів 1−t , який мінімізує помилку прогнозу змінної tY , а потім з набору 1−t видаляються всі «надлишкові» предиктори. Виключення надлишкових предикторів не погіршує прогноз. Всі предиктори, що не були видалені як надлишкові, визнаються «причинами» для tY за Грейнджером. Легко бачити, якщо, припустимо, для ktX − та tY алгоритм виведення моделі не знайшов сепаратора, то ktX − буде визнана причиною для tY за Грейнджером. Отже, критерій К. Грейнджера включає в перелік «причин» для tY всі змінні, які поєднані з tY ребром і які йдуть у часі раніше за tY . Зокрема, якщо є ребро tkt YZ − , то змінна ktZ − також буде визнана причиною для tY , що є помилкою. Не-причина може бути необхідною для покращення прогнозу, бо несе «незамінну» інформацію в умовах недоступності справжніх причин. Наприклад, якщо маємо генеративну модель, показану на рис. 4,б, то, згідно Грейнджеру, причинами змінної X будуть визнані всі минулі значення цієї змінної. Більш того, неадекватність критерія Грейнджера простягається ще далі. В певних ситуаціях цей критерій може включити в набір «причин» для tY змінну, яка є безумовно незалежна від tY . Так станеться, якщо в моделі є ребро tkt YZ − та ребро ltkt QZ −−  . Це може здатися парадоксальним, але включення змінної ltQ − в набір предикторів зменшує помилку прогнозу змінної tY (за умови, що на змінну ktZ − не здійснюється втручання). Отже, в реалістичних умовах критерій К. Грейнджера є некоректним для задачі виявлення причин. Звернемося до правил орієнтації ребер в методах виведення каузальних мереж. Як показано в [7], якщо можливі конфаундери, то серед всіх відомих правил тільки правило 1 виводить каузальне ребро. Це правило є коректним засобом виявлення причинних зв'язків. Але для того, щоб правило орієнтації ребер 1 спрацювало, має виконуватися відповідна умовна незалежність. А для цього треба, щоб алгоритм «дістався» до відповідного зв'язку з найбільшим лагом, і щоб не було прихованого конфаундера. Якщо жодного непустого сепаратора не знайдено, то тоді не буде виведено жодного каузального зв'язку, і всі зв'язки залишаться у невизначеному статусі (в формі ребра YX → ). Висновки Динамічні каузальні моделі є потужним засобом аналізу й дослідження різноманітних процесів та об'єктів і забезпечує відображення таких рис, як швидкість змін, періодичність, лаг післядії, зворотні зв'язки тощо. Серед різноманітних типів динамічних процесів (які включають, зокрема, рекурентні процеси, «запрограмовані» процеси, потоки стохастичних подій, лічильні процеси і так далі) виділено векторні авторегресійні процеси. (Відомо, як для них можна виводити каузальні моделі.) Вимоги до архітектури темпоральних даних, способів та частоти їх збору диктуються характером динамічного процесу. Частота вимірювання даних має критичне значення для адекватності виведеної моделі і визначається тривалістю елементарних впливів між компонентами векторного процесу. Для виведення динамічним моделей з даних важливу роль відіграють припущення стаціонарності та регулярності структури. Особливостями виведення динамічних каузальних моделей є врахування темпорального порядку змінних та проблеми, пов'язані з невідомим лагом післядії та існуванням прихованих автокорельованих часових рядів. Проведено порівняльний аналіз критерію каузальності за Грейнджером та правил орієнтації ребер в апараті каузальних мереж з точки зору їх спроможності виявляти каузальні відношення. Концепція каузальності за Грейнджером в реальних умовах неповноти інформації непридатна для виявлення каузальних відношень в даних. За критерієм Грейнджера, в набір предикторів для прогнозу наслідку Y будуть включені всі змінні, корисні для покращення пасивного прогнозу. Взагалі, коректність критерію залежить від формату керування. Оскільки деякі справжні причини X для наслідку Y є недоступними, то корисними (для певних форматів втручання в об’єкт) можуть бути не-причини Z , які передають «незамінну» (в даному контексті) інформацію для прогнозу наслідку Y . (Зокрема, це змінні, пов'язані будь-яким ребром з Y , які йдуть у часі раніше Y .) Коректним засобом виявлення каузальних відношень в даних є правило орієнтації ребер 1 (розроблене в апараті каузальних мереж). Але це правило результативне тільки за певних умов (каузальне ребро не знаходиться під дією прихованого конфаундери і не оточене повно зв'язаною структурою). Бібліографія 1. Handbook of Big Data. P. Bühlmann, P. Drineas, M. Kane, M. van der Laan (Eds.). Boca Raton, FL.: CRC Press. Taylor & Francis Group, 2016. 452p. 2. Балабанов О.С. Задачі та методи аналізу великих даних (огляд). (Оновлено) Jan 2020. – [Electronic resource] URL: https://www.researchgate.net/publication/338714383_Tasks_and_methods_of_Big_Data_analysis_a_survey_revised. за Грейнджером. Отже, критерій К. Грейнджера включає в перелік «причин» для Моделі і засоби систем баз даних та знань впливають на цільові змінні, не припускаються). В реальних ситуаціях доводиться застосовувати критерій Грейнджера в сурогатному режимі, тобто в умовах доступності лише неповної інформації t . Порівняємо можливості цих двох підходів. Спочатку відзначимо другорядну особливість, що відрізняє «причину» (за К. Грейнджером) від «причини» в апараті каузальних мереж. В каузальній мережі змінна X вважається причиною для Y , якщо є строго орієнтований шлях від X до Y . Тобто в перелік причин включено також і непрямі (опосередковані) причини. Натомість за К. Грейнджером непрямі причини X будуть визнані не-причинами, якщо доступний достатній набір посередників, через які здійснюється вплив X на Y . Суттєвим є те, що сурогатний критерій К. Грейнджера може призводити до систематичних помилок у визначенні каузальності. Можна описати роботу критерія К. Грейнджера так: формується набір предикторів 1−t , який мінімізує помилку прогнозу змінної tY , а потім з набору 1−t видаляються всі «надлишкові» предиктори. Виключення надлишкових предикторів не погіршує прогноз. Всі предиктори, що не були видалені як надлишкові, визнаються «причинами» для tY за Грейнджером. Легко бачити, якщо, припустимо, для ktX − та tY алгоритм виведення моделі не знайшов сепаратора, то ktX − буде визнана причиною для tY за Грейнджером. Отже, критерій К. Грейнджера включає в перелік «причин» для tY всі змінні, які поєднані з tY ребром і які йдуть у часі раніше за tY . Зокрема, якщо є ребро tkt YZ − , то змінна ktZ − також буде визнана причиною для tY , що є помилкою. Не-причина може бути необхідною для покращення прогнозу, бо несе «незамінну» інформацію в умовах недоступності справжніх причин. Наприклад, якщо маємо генеративну модель, показану на рис. 4,б, то, згідно Грейнджеру, причинами змінної X будуть визнані всі минулі значення цієї змінної. Більш того, неадекватність критерія Грейнджера простягається ще далі. В певних ситуаціях цей критерій може включити в набір «причин» для tY змінну, яка є безумовно незалежна від tY . Так станеться, якщо в моделі є ребро tkt YZ − та ребро ltkt QZ −−  . Це може здатися парадоксальним, але включення змінної ltQ − в набір предикторів зменшує помилку прогнозу змінної tY (за умови, що на змінну ktZ − не здійснюється втручання). Отже, в реалістичних умовах критерій К. Грейнджера є некоректним для задачі виявлення причин. Звернемося до правил орієнтації ребер в методах виведення каузальних мереж. Як показано в [7], якщо можливі конфаундери, то серед всіх відомих правил тільки правило 1 виводить каузальне ребро. Це правило є коректним засобом виявлення причинних зв'язків. Але для того, щоб правило орієнтації ребер 1 спрацювало, має виконуватися відповідна умовна незалежність. А для цього треба, щоб алгоритм «дістався» до відповідного зв'язку з найбільшим лагом, і щоб не було прихованого конфаундера. Якщо жодного непустого сепаратора не знайдено, то тоді не буде виведено жодного каузального зв'язку, і всі зв'язки залишаться у невизначеному статусі (в формі ребра YX → ). Висновки Динамічні каузальні моделі є потужним засобом аналізу й дослідження різноманітних процесів та об'єктів і забезпечує відображення таких рис, як швидкість змін, періодичність, лаг післядії, зворотні зв'язки тощо. Серед різноманітних типів динамічних процесів (які включають, зокрема, рекурентні процеси, «запрограмовані» процеси, потоки стохастичних подій, лічильні процеси і так далі) виділено векторні авторегресійні процеси. (Відомо, як для них можна виводити каузальні моделі.) Вимоги до архітектури темпоральних даних, способів та частоти їх збору диктуються характером динамічного процесу. Частота вимірювання даних має критичне значення для адекватності виведеної моделі і визначається тривалістю елементарних впливів між компонентами векторного процесу. Для виведення динамічним моделей з даних важливу роль відіграють припущення стаціонарності та регулярності структури. Особливостями виведення динамічних каузальних моделей є врахування темпорального порядку змінних та проблеми, пов'язані з невідомим лагом післядії та існуванням прихованих автокорельованих часових рядів. Проведено порівняльний аналіз критерію каузальності за Грейнджером та правил орієнтації ребер в апараті каузальних мереж з точки зору їх спроможності виявляти каузальні відношення. Концепція каузальності за Грейнджером в реальних умовах неповноти інформації непридатна для виявлення каузальних відношень в даних. За критерієм Грейнджера, в набір предикторів для прогнозу наслідку Y будуть включені всі змінні, корисні для покращення пасивного прогнозу. Взагалі, коректність критерію залежить від формату керування. Оскільки деякі справжні причини X для наслідку Y є недоступними, то корисними (для певних форматів втручання в об’єкт) можуть бути не-причини Z , які передають «незамінну» (в даному контексті) інформацію для прогнозу наслідку Y . (Зокрема, це змінні, пов'язані будь-яким ребром з Y , які йдуть у часі раніше Y .) Коректним засобом виявлення каузальних відношень в даних є правило орієнтації ребер 1 (розроблене в апараті каузальних мереж). Але це правило результативне тільки за певних умов (каузальне ребро не знаходиться під дією прихованого конфаундери і не оточене повно зв'язаною структурою). Бібліографія 1. Handbook of Big Data. P. Bühlmann, P. Drineas, M. Kane, M. van der Laan (Eds.). Boca Raton, FL.: CRC Press. Taylor & Francis Group, 2016. 452p. 2. Балабанов О.С. Задачі та методи аналізу великих даних (огляд). (Оновлено) Jan 2020. – [Electronic resource] URL: https://www.researchgate.net/publication/338714383_Tasks_and_methods_of_Big_Data_analysis_a_survey_revised. всі змінні, які поєднані з Моделі і засоби систем баз даних та знань впливають на цільові змінні, не припускаються). В реальних ситуаціях доводиться застосовувати критерій Грейнджера в сурогатному режимі, тобто в умовах доступності лише неповної інформації t . Порівняємо можливості цих двох підходів. Спочатку відзначимо другорядну особливість, що відрізняє «причину» (за К. Грейнджером) від «причини» в апараті каузальних мереж. В каузальній мережі змінна X вважається причиною для Y , якщо є строго орієнтований шлях від X до Y . Тобто в перелік причин включено також і непрямі (опосередковані) причини. Натомість за К. Грейнджером непрямі причини X будуть визнані не-причинами, якщо доступний достатній набір посередників, через які здійснюється вплив X на Y . Суттєвим є те, що сурогатний критерій К. Грейнджера може призводити до систематичних помилок у визначенні каузальності. Можна описати роботу критерія К. Грейнджера так: формується набір предикторів 1−t , який мінімізує помилку прогнозу змінної tY , а потім з набору 1−t видаляються всі «надлишкові» предиктори. Виключення надлишкових предикторів не погіршує прогноз. Всі предиктори, що не були видалені як надлишкові, визнаються «причинами» для tY за Грейнджером. Легко бачити, якщо, припустимо, для ktX − та tY алгоритм виведення моделі не знайшов сепаратора, то ktX − буде визнана причиною для tY за Грейнджером. Отже, критерій К. Грейнджера включає в перелік «причин» для tY всі змінні, які поєднані з tY ребром і які йдуть у часі раніше за tY . Зокрема, якщо є ребро tkt YZ − , то змінна ktZ − також буде визнана причиною для tY , що є помилкою. Не-причина може бути необхідною для покращення прогнозу, бо несе «незамінну» інформацію в умовах недоступності справжніх причин. Наприклад, якщо маємо генеративну модель, показану на рис. 4,б, то, згідно Грейнджеру, причинами змінної X будуть визнані всі минулі значення цієї змінної. Більш того, неадекватність критерія Грейнджера простягається ще далі. В певних ситуаціях цей критерій може включити в набір «причин» для tY змінну, яка є безумовно незалежна від tY . Так станеться, якщо в моделі є ребро tkt YZ − та ребро ltkt QZ −−  . Це може здатися парадоксальним, але включення змінної ltQ − в набір предикторів зменшує помилку прогнозу змінної tY (за умови, що на змінну ktZ − не здійснюється втручання). Отже, в реалістичних умовах критерій К. Грейнджера є некоректним для задачі виявлення причин. Звернемося до правил орієнтації ребер в методах виведення каузальних мереж. Як показано в [7], якщо можливі конфаундери, то серед всіх відомих правил тільки правило 1 виводить каузальне ребро. Це правило є коректним засобом виявлення причинних зв'язків. Але для того, щоб правило орієнтації ребер 1 спрацювало, має виконуватися відповідна умовна незалежність. А для цього треба, щоб алгоритм «дістався» до відповідного зв'язку з найбільшим лагом, і щоб не було прихованого конфаундера. Якщо жодного непустого сепаратора не знайдено, то тоді не буде виведено жодного каузального зв'язку, і всі зв'язки залишаться у невизначеному статусі (в формі ребра YX → ). Висновки Динамічні каузальні моделі є потужним засобом аналізу й дослідження різноманітних процесів та об'єктів і забезпечує відображення таких рис, як швидкість змін, періодичність, лаг післядії, зворотні зв'язки тощо. Серед різноманітних типів динамічних процесів (які включають, зокрема, рекурентні процеси, «запрограмовані» процеси, потоки стохастичних подій, лічильні процеси і так далі) виділено векторні авторегресійні процеси. (Відомо, як для них можна виводити каузальні моделі.) Вимоги до архітектури темпоральних даних, способів та частоти їх збору диктуються характером динамічного процесу. Частота вимірювання даних має критичне значення для адекватності виведеної моделі і визначається тривалістю елементарних впливів між компонентами векторного процесу. Для виведення динамічним моделей з даних важливу роль відіграють припущення стаціонарності та регулярності структури. Особливостями виведення динамічних каузальних моделей є врахування темпорального порядку змінних та проблеми, пов'язані з невідомим лагом післядії та існуванням прихованих автокорельованих часових рядів. Проведено порівняльний аналіз критерію каузальності за Грейнджером та правил орієнтації ребер в апараті каузальних мереж з точки зору їх спроможності виявляти каузальні відношення. Концепція каузальності за Грейнджером в реальних умовах неповноти інформації непридатна для виявлення каузальних відношень в даних. За критерієм Грейнджера, в набір предикторів для прогнозу наслідку Y будуть включені всі змінні, корисні для покращення пасивного прогнозу. Взагалі, коректність критерію залежить від формату керування. Оскільки деякі справжні причини X для наслідку Y є недоступними, то корисними (для певних форматів втручання в об’єкт) можуть бути не-причини Z , які передають «незамінну» (в даному контексті) інформацію для прогнозу наслідку Y . (Зокрема, це змінні, пов'язані будь-яким ребром з Y , які йдуть у часі раніше Y .) Коректним засобом виявлення каузальних відношень в даних є правило орієнтації ребер 1 (розроблене в апараті каузальних мереж). Але це правило результативне тільки за певних умов (каузальне ребро не знаходиться під дією прихованого конфаундери і не оточене повно зв'язаною структурою). Бібліографія 1. Handbook of Big Data. P. Bühlmann, P. Drineas, M. Kane, M. van der Laan (Eds.). Boca Raton, FL.: CRC Press. Taylor & Francis Group, 2016. 452p. 2. Балабанов О.С. Задачі та методи аналізу великих даних (огляд). (Оновлено) Jan 2020. – [Electronic resource] URL: https://www.researchgate.net/publication/338714383_Tasks_and_methods_of_Big_Data_analysis_a_survey_revised. ребром і які йдуть у часі раніше за Моделі і засоби систем баз даних та знань впливають на цільові змінні, не припускаються). В реальних ситуаціях доводиться застосовувати критерій Грейнджера в сурогатному режимі, тобто в умовах доступності лише неповної інформації t . Порівняємо можливості цих двох підходів. Спочатку відзначимо другорядну особливість, що відрізняє «причину» (за К. Грейнджером) від «причини» в апараті каузальних мереж. В каузальній мережі змінна X вважається причиною для Y , якщо є строго орієнтований шлях від X до Y . Тобто в перелік причин включено також і непрямі (опосередковані) причини. Натомість за К. Грейнджером непрямі причини X будуть визнані не-причинами, якщо доступний достатній набір посередників, через які здійснюється вплив X на Y . Суттєвим є те, що сурогатний критерій К. Грейнджера може призводити до систематичних помилок у визначенні каузальності. Можна описати роботу критерія К. Грейнджера так: формується набір предикторів 1−t , який мінімізує помилку прогнозу змінної tY , а потім з набору 1−t видаляються всі «надлишкові» предиктори. Виключення надлишкових предикторів не погіршує прогноз. Всі предиктори, що не були видалені як надлишкові, визнаються «причинами» для tY за Грейнджером. Легко бачити, якщо, припустимо, для ktX − та tY алгоритм виведення моделі не знайшов сепаратора, то ktX − буде визнана причиною для tY за Грейнджером. Отже, критерій К. Грейнджера включає в перелік «причин» для tY всі змінні, які поєднані з tY ребром і які йдуть у часі раніше за tY . Зокрема, якщо є ребро tkt YZ − , то змінна ktZ − також буде визнана причиною для tY , що є помилкою. Не-причина може бути необхідною для покращення прогнозу, бо несе «незамінну» інформацію в умовах недоступності справжніх причин. Наприклад, якщо маємо генеративну модель, показану на рис. 4,б, то, згідно Грейнджеру, причинами змінної X будуть визнані всі минулі значення цієї змінної. Більш того, неадекватність критерія Грейнджера простягається ще далі. В певних ситуаціях цей критерій може включити в набір «причин» для tY змінну, яка є безумовно незалежна від tY . Так станеться, якщо в моделі є ребро tkt YZ − та ребро ltkt QZ −−  . Це може здатися парадоксальним, але включення змінної ltQ − в набір предикторів зменшує помилку прогнозу змінної tY (за умови, що на змінну ktZ − не здійснюється втручання). Отже, в реалістичних умовах критерій К. Грейнджера є некоректним для задачі виявлення причин. Звернемося до правил орієнтації ребер в методах виведення каузальних мереж. Як показано в [7], якщо можливі конфаундери, то серед всіх відомих правил тільки правило 1 виводить каузальне ребро. Це правило є коректним засобом виявлення причинних зв'язків. Але для того, щоб правило орієнтації ребер 1 спрацювало, має виконуватися відповідна умовна незалежність. А для цього треба, щоб алгоритм «дістався» до відповідного зв'язку з найбільшим лагом, і щоб не було прихованого конфаундера. Якщо жодного непустого сепаратора не знайдено, то тоді не буде виведено жодного каузального зв'язку, і всі зв'язки залишаться у невизначеному статусі (в формі ребра YX → ). Висновки Динамічні каузальні моделі є потужним засобом аналізу й дослідження різноманітних процесів та об'єктів і забезпечує відображення таких рис, як швидкість змін, періодичність, лаг післядії, зворотні зв'язки тощо. Серед різноманітних типів динамічних процесів (які включають, зокрема, рекурентні процеси, «запрограмовані» процеси, потоки стохастичних подій, лічильні процеси і так далі) виділено векторні авторегресійні процеси. (Відомо, як для них можна виводити каузальні моделі.) Вимоги до архітектури темпоральних даних, способів та частоти їх збору диктуються характером динамічного процесу. Частота вимірювання даних має критичне значення для адекватності виведеної моделі і визначається тривалістю елементарних впливів між компонентами векторного процесу. Для виведення динамічним моделей з даних важливу роль відіграють припущення стаціонарності та регулярності структури. Особливостями виведення динамічних каузальних моделей є врахування темпорального порядку змінних та проблеми, пов'язані з невідомим лагом післядії та існуванням прихованих автокорельованих часових рядів. Проведено порівняльний аналіз критерію каузальності за Грейнджером та правил орієнтації ребер в апараті каузальних мереж з точки зору їх спроможності виявляти каузальні відношення. Концепція каузальності за Грейнджером в реальних умовах неповноти інформації непридатна для виявлення каузальних відношень в даних. За критерієм Грейнджера, в набір предикторів для прогнозу наслідку Y будуть включені всі змінні, корисні для покращення пасивного прогнозу. Взагалі, коректність критерію залежить від формату керування. Оскільки деякі справжні причини X для наслідку Y є недоступними, то корисними (для певних форматів втручання в об’єкт) можуть бути не-причини Z , які передають «незамінну» (в даному контексті) інформацію для прогнозу наслідку Y . (Зокрема, це змінні, пов'язані будь-яким ребром з Y , які йдуть у часі раніше Y .) Коректним засобом виявлення каузальних відношень в даних є правило орієнтації ребер 1 (розроблене в апараті каузальних мереж). Але це правило результативне тільки за певних умов (каузальне ребро не знаходиться під дією прихованого конфаундери і не оточене повно зв'язаною структурою). Бібліографія 1. Handbook of Big Data. P. Bühlmann, P. Drineas, M. Kane, M. van der Laan (Eds.). Boca Raton, FL.: CRC Press. Taylor & Francis Group, 2016. 452p. 2. Балабанов О.С. Задачі та методи аналізу великих даних (огляд). (Оновлено) Jan 2020. – [Electronic resource] URL: https://www.researchgate.net/publication/338714383_Tasks_and_methods_of_Big_Data_analysis_a_survey_revised. . Зокрема, якщо є ребро Моделі і засоби систем баз даних та знань впливають на цільові змінні, не припускаються). В реальних ситуаціях доводиться застосовувати критерій Грейнджера в сурогатному режимі, тобто в умовах доступності лише неповної інформації t . Порівняємо можливості цих двох підходів. Спочатку відзначимо другорядну особливість, що відрізняє «причину» (за К. Грейнджером) від «причини» в апараті каузальних мереж. В каузальній мережі змінна X вважається причиною для Y , якщо є строго орієнтований шлях від X до Y . Тобто в перелік причин включено також і непрямі (опосередковані) причини. Натомість за К. Грейнджером непрямі причини X будуть визнані не-причинами, якщо доступний достатній набір посередників, через які здійснюється вплив X на Y . Суттєвим є те, що сурогатний критерій К. Грейнджера може призводити до систематичних помилок у визначенні каузальності. Можна описати роботу критерія К. Грейнджера так: формується набір предикторів 1−t , який мінімізує помилку прогнозу змінної tY , а потім з набору 1−t видаляються всі «надлишкові» предиктори. Виключення надлишкових предикторів не погіршує прогноз. Всі предиктори, що не були видалені як надлишкові, визнаються «причинами» для tY за Грейнджером. Легко бачити, якщо, припустимо, для ktX − та tY алгоритм виведення моделі не знайшов сепаратора, то ktX − буде визнана причиною для tY за Грейнджером. Отже, критерій К. Грейнджера включає в перелік «причин» для tY всі змінні, які поєднані з tY ребром і які йдуть у часі раніше за tY . Зокрема, якщо є ребро tkt YZ − , то змінна ktZ − також буде визнана причиною для tY , що є помилкою. Не-причина може бути необхідною для покращення прогнозу, бо несе «незамінну» інформацію в умовах недоступності справжніх причин. Наприклад, якщо маємо генеративну модель, показану на рис. 4,б, то, згідно Грейнджеру, причинами змінної X будуть визнані всі минулі значення цієї змінної. Більш того, неадекватність критерія Грейнджера простягається ще далі. В певних ситуаціях цей критерій може включити в набір «причин» для tY змінну, яка є безумовно незалежна від tY . Так станеться, якщо в моделі є ребро tkt YZ − та ребро ltkt QZ −−  . Це може здатися парадоксальним, але включення змінної ltQ − в набір предикторів зменшує помилку прогнозу змінної tY (за умови, що на змінну ktZ − не здійснюється втручання). Отже, в реалістичних умовах критерій К. Грейнджера є некоректним для задачі виявлення причин. Звернемося до правил орієнтації ребер в методах виведення каузальних мереж. Як показано в [7], якщо можливі конфаундери, то серед всіх відомих правил тільки правило 1 виводить каузальне ребро. Це правило є коректним засобом виявлення причинних зв'язків. Але для того, щоб правило орієнтації ребер 1 спрацювало, має виконуватися відповідна умовна незалежність. А для цього треба, щоб алгоритм «дістався» до відповідного зв'язку з найбільшим лагом, і щоб не було прихованого конфаундера. Якщо жодного непустого сепаратора не знайдено, то тоді не буде виведено жодного каузального зв'язку, і всі зв'язки залишаться у невизначеному статусі (в формі ребра YX → ). Висновки Динамічні каузальні моделі є потужним засобом аналізу й дослідження різноманітних процесів та об'єктів і забезпечує відображення таких рис, як швидкість змін, періодичність, лаг післядії, зворотні зв'язки тощо. Серед різноманітних типів динамічних процесів (які включають, зокрема, рекурентні процеси, «запрограмовані» процеси, потоки стохастичних подій, лічильні процеси і так далі) виділено векторні авторегресійні процеси. (Відомо, як для них можна виводити каузальні моделі.) Вимоги до архітектури темпоральних даних, способів та частоти їх збору диктуються характером динамічного процесу. Частота вимірювання даних має критичне значення для адекватності виведеної моделі і визначається тривалістю елементарних впливів між компонентами векторного процесу. Для виведення динамічним моделей з даних важливу роль відіграють припущення стаціонарності та регулярності структури. Особливостями виведення динамічних каузальних моделей є врахування темпорального порядку змінних та проблеми, пов'язані з невідомим лагом післядії та існуванням прихованих автокорельованих часових рядів. Проведено порівняльний аналіз критерію каузальності за Грейнджером та правил орієнтації ребер в апараті каузальних мереж з точки зору їх спроможності виявляти каузальні відношення. Концепція каузальності за Грейнджером в реальних умовах неповноти інформації непридатна для виявлення каузальних відношень в даних. За критерієм Грейнджера, в набір предикторів для прогнозу наслідку Y будуть включені всі змінні, корисні для покращення пасивного прогнозу. Взагалі, коректність критерію залежить від формату керування. Оскільки деякі справжні причини X для наслідку Y є недоступними, то корисними (для певних форматів втручання в об’єкт) можуть бути не-причини Z , які передають «незамінну» (в даному контексті) інформацію для прогнозу наслідку Y . (Зокрема, це змінні, пов'язані будь-яким ребром з Y , які йдуть у часі раніше Y .) Коректним засобом виявлення каузальних відношень в даних є правило орієнтації ребер 1 (розроблене в апараті каузальних мереж). Але це правило результативне тільки за певних умов (каузальне ребро не знаходиться під дією прихованого конфаундери і не оточене повно зв'язаною структурою). Бібліографія 1. Handbook of Big Data. P. Bühlmann, P. Drineas, M. Kane, M. van der Laan (Eds.). Boca Raton, FL.: CRC Press. Taylor & Francis Group, 2016. 452p. 2. Балабанов О.С. Задачі та методи аналізу великих даних (огляд). (Оновлено) Jan 2020. – [Electronic resource] URL: https://www.researchgate.net/publication/338714383_Tasks_and_methods_of_Big_Data_analysis_a_survey_revised. , то змінна Моделі і засоби систем баз даних та знань впливають на цільові змінні, не припускаються). В реальних ситуаціях доводиться застосовувати критерій Грейнджера в сурогатному режимі, тобто в умовах доступності лише неповної інформації t . Порівняємо можливості цих двох підходів. Спочатку відзначимо другорядну особливість, що відрізняє «причину» (за К. Грейнджером) від «причини» в апараті каузальних мереж. В каузальній мережі змінна X вважається причиною для Y , якщо є строго орієнтований шлях від X до Y . Тобто в перелік причин включено також і непрямі (опосередковані) причини. Натомість за К. Грейнджером непрямі причини X будуть визнані не-причинами, якщо доступний достатній набір посередників, через які здійснюється вплив X на Y . Суттєвим є те, що сурогатний критерій К. Грейнджера може призводити до систематичних помилок у визначенні каузальності. Можна описати роботу критерія К. Грейнджера так: формується набір предикторів 1−t , який мінімізує помилку прогнозу змінної tY , а потім з набору 1−t видаляються всі «надлишкові» предиктори. Виключення надлишкових предикторів не погіршує прогноз. Всі предиктори, що не були видалені як надлишкові, визнаються «причинами» для tY за Грейнджером. Легко бачити, якщо, припустимо, для ktX − та tY алгоритм виведення моделі не знайшов сепаратора, то ktX − буде визнана причиною для tY за Грейнджером. Отже, критерій К. Грейнджера включає в перелік «причин» для tY всі змінні, які поєднані з tY ребром і які йдуть у часі раніше за tY . Зокрема, якщо є ребро tkt YZ − , то змінна ktZ − також буде визнана причиною для tY , що є помилкою. Не-причина може бути необхідною для покращення прогнозу, бо несе «незамінну» інформацію в умовах недоступності справжніх причин. Наприклад, якщо маємо генеративну модель, показану на рис. 4,б, то, згідно Грейнджеру, причинами змінної X будуть визнані всі минулі значення цієї змінної. Більш того, неадекватність критерія Грейнджера простягається ще далі. В певних ситуаціях цей критерій може включити в набір «причин» для tY змінну, яка є безумовно незалежна від tY . Так станеться, якщо в моделі є ребро tkt YZ − та ребро ltkt QZ −−  . Це може здатися парадоксальним, але включення змінної ltQ − в набір предикторів зменшує помилку прогнозу змінної tY (за умови, що на змінну ktZ − не здійснюється втручання). Отже, в реалістичних умовах критерій К. Грейнджера є некоректним для задачі виявлення причин. Звернемося до правил орієнтації ребер в методах виведення каузальних мереж. Як показано в [7], якщо можливі конфаундери, то серед всіх відомих правил тільки правило 1 виводить каузальне ребро. Це правило є коректним засобом виявлення причинних зв'язків. Але для того, щоб правило орієнтації ребер 1 спрацювало, має виконуватися відповідна умовна незалежність. А для цього треба, щоб алгоритм «дістався» до відповідного зв'язку з найбільшим лагом, і щоб не було прихованого конфаундера. Якщо жодного непустого сепаратора не знайдено, то тоді не буде виведено жодного каузального зв'язку, і всі зв'язки залишаться у невизначеному статусі (в формі ребра YX → ). Висновки Динамічні каузальні моделі є потужним засобом аналізу й дослідження різноманітних процесів та об'єктів і забезпечує відображення таких рис, як швидкість змін, періодичність, лаг післядії, зворотні зв'язки тощо. Серед різноманітних типів динамічних процесів (які включають, зокрема, рекурентні процеси, «запрограмовані» процеси, потоки стохастичних подій, лічильні процеси і так далі) виділено векторні авторегресійні процеси. (Відомо, як для них можна виводити каузальні моделі.) Вимоги до архітектури темпоральних даних, способів та частоти їх збору диктуються характером динамічного процесу. Частота вимірювання даних має критичне значення для адекватності виведеної моделі і визначається тривалістю елементарних впливів між компонентами векторного процесу. Для виведення динамічним моделей з даних важливу роль відіграють припущення стаціонарності та регулярності структури. Особливостями виведення динамічних каузальних моделей є врахування темпорального порядку змінних та проблеми, пов'язані з невідомим лагом післядії та існуванням прихованих автокорельованих часових рядів. Проведено порівняльний аналіз критерію каузальності за Грейнджером та правил орієнтації ребер в апараті каузальних мереж з точки зору їх спроможності виявляти каузальні відношення. Концепція каузальності за Грейнджером в реальних умовах неповноти інформації непридатна для виявлення каузальних відношень в даних. За критерієм Грейнджера, в набір предикторів для прогнозу наслідку Y будуть включені всі змінні, корисні для покращення пасивного прогнозу. Взагалі, коректність критерію залежить від формату керування. Оскільки деякі справжні причини X для наслідку Y є недоступними, то корисними (для певних форматів втручання в об’єкт) можуть бути не-причини Z , які передають «незамінну» (в даному контексті) інформацію для прогнозу наслідку Y . (Зокрема, це змінні, пов'язані будь-яким ребром з Y , які йдуть у часі раніше Y .) Коректним засобом виявлення каузальних відношень в даних є правило орієнтації ребер 1 (розроблене в апараті каузальних мереж). Але це правило результативне тільки за певних умов (каузальне ребро не знаходиться під дією прихованого конфаундери і не оточене повно зв'язаною структурою). Бібліографія 1. Handbook of Big Data. P. Bühlmann, P. Drineas, M. Kane, M. van der Laan (Eds.). Boca Raton, FL.: CRC Press. Taylor & Francis Group, 2016. 452p. 2. Балабанов О.С. Задачі та методи аналізу великих даних (огляд). (Оновлено) Jan 2020. – [Electronic resource] URL: https://www.researchgate.net/publication/338714383_Tasks_and_methods_of_Big_Data_analysis_a_survey_revised. також буде визнана причиною для Моделі і засоби систем баз даних та знань впливають на цільові змінні, не припускаються). В реальних ситуаціях доводиться застосовувати критерій Грейнджера в сурогатному режимі, тобто в умовах доступності лише неповної інформації t . Порівняємо можливості цих двох підходів. Спочатку відзначимо другорядну особливість, що відрізняє «причину» (за К. Грейнджером) від «причини» в апараті каузальних мереж. В каузальній мережі змінна X вважається причиною для Y , якщо є строго орієнтований шлях від X до Y . Тобто в перелік причин включено також і непрямі (опосередковані) причини. Натомість за К. Грейнджером непрямі причини X будуть визнані не-причинами, якщо доступний достатній набір посередників, через які здійснюється вплив X на Y . Суттєвим є те, що сурогатний критерій К. Грейнджера може призводити до систематичних помилок у визначенні каузальності. Можна описати роботу критерія К. Грейнджера так: формується набір предикторів 1−t , який мінімізує помилку прогнозу змінної tY , а потім з набору 1−t видаляються всі «надлишкові» предиктори. Виключення надлишкових предикторів не погіршує прогноз. Всі предиктори, що не були видалені як надлишкові, визнаються «причинами» для tY за Грейнджером. Легко бачити, якщо, припустимо, для ktX − та tY алгоритм виведення моделі не знайшов сепаратора, то ktX − буде визнана причиною для tY за Грейнджером. Отже, критерій К. Грейнджера включає в перелік «причин» для tY всі змінні, які поєднані з tY ребром і які йдуть у часі раніше за tY . Зокрема, якщо є ребро tkt YZ − , то змінна ktZ − також буде визнана причиною для tY , що є помилкою. Не-причина може бути необхідною для покращення прогнозу, бо несе «незамінну» інформацію в умовах недоступності справжніх причин. Наприклад, якщо маємо генеративну модель, показану на рис. 4,б, то, згідно Грейнджеру, причинами змінної X будуть визнані всі минулі значення цієї змінної. Більш того, неадекватність критерія Грейнджера простягається ще далі. В певних ситуаціях цей критерій може включити в набір «причин» для tY змінну, яка є безумовно незалежна від tY . Так станеться, якщо в моделі є ребро tkt YZ − та ребро ltkt QZ −−  . Це може здатися парадоксальним, але включення змінної ltQ − в набір предикторів зменшує помилку прогнозу змінної tY (за умови, що на змінну ktZ − не здійснюється втручання). Отже, в реалістичних умовах критерій К. Грейнджера є некоректним для задачі виявлення причин. Звернемося до правил орієнтації ребер в методах виведення каузальних мереж. Як показано в [7], якщо можливі конфаундери, то серед всіх відомих правил тільки правило 1 виводить каузальне ребро. Це правило є коректним засобом виявлення причинних зв'язків. Але для того, щоб правило орієнтації ребер 1 спрацювало, має виконуватися відповідна умовна незалежність. А для цього треба, щоб алгоритм «дістався» до відповідного зв'язку з найбільшим лагом, і щоб не було прихованого конфаундера. Якщо жодного непустого сепаратора не знайдено, то тоді не буде виведено жодного каузального зв'язку, і всі зв'язки залишаться у невизначеному статусі (в формі ребра YX → ). Висновки Динамічні каузальні моделі є потужним засобом аналізу й дослідження різноманітних процесів та об'єктів і забезпечує відображення таких рис, як швидкість змін, періодичність, лаг післядії, зворотні зв'язки тощо. Серед різноманітних типів динамічних процесів (які включають, зокрема, рекурентні процеси, «запрограмовані» процеси, потоки стохастичних подій, лічильні процеси і так далі) виділено векторні авторегресійні процеси. (Відомо, як для них можна виводити каузальні моделі.) Вимоги до архітектури темпоральних даних, способів та частоти їх збору диктуються характером динамічного процесу. Частота вимірювання даних має критичне значення для адекватності виведеної моделі і визначається тривалістю елементарних впливів між компонентами векторного процесу. Для виведення динамічним моделей з даних важливу роль відіграють припущення стаціонарності та регулярності структури. Особливостями виведення динамічних каузальних моделей є врахування темпорального порядку змінних та проблеми, пов'язані з невідомим лагом післядії та існуванням прихованих автокорельованих часових рядів. Проведено порівняльний аналіз критерію каузальності за Грейнджером та правил орієнтації ребер в апараті каузальних мереж з точки зору їх спроможності виявляти каузальні відношення. Концепція каузальності за Грейнджером в реальних умовах неповноти інформації непридатна для виявлення каузальних відношень в даних. За критерієм Грейнджера, в набір предикторів для прогнозу наслідку Y будуть включені всі змінні, корисні для покращення пасивного прогнозу. Взагалі, коректність критерію залежить від формату керування. Оскільки деякі справжні причини X для наслідку Y є недоступними, то корисними (для певних форматів втручання в об’єкт) можуть бути не-причини Z , які передають «незамінну» (в даному контексті) інформацію для прогнозу наслідку Y . (Зокрема, це змінні, пов'язані будь-яким ребром з Y , які йдуть у часі раніше Y .) Коректним засобом виявлення каузальних відношень в даних є правило орієнтації ребер 1 (розроблене в апараті каузальних мереж). Але це правило результативне тільки за певних умов (каузальне ребро не знаходиться під дією прихованого конфаундери і не оточене повно зв'язаною структурою). Бібліографія 1. Handbook of Big Data. P. Bühlmann, P. Drineas, M. Kane, M. van der Laan (Eds.). Boca Raton, FL.: CRC Press. Taylor & Francis Group, 2016. 452p. 2. Балабанов О.С. Задачі та методи аналізу великих даних (огляд). (Оновлено) Jan 2020. – [Electronic resource] URL: https://www.researchgate.net/publication/338714383_Tasks_and_methods_of_Big_Data_analysis_a_survey_revised. , що є помилкою. Не-причина може бути необхідною для покращення прогнозу, бо несе «незамінну» інформацію в умовах недоступності справжніх причин. Наприклад, якщо маємо генеративну модель, показану на рис. 4,б, то, згідно Грейнджеру, причинами змінної X будуть визнані всі минулі значення цієї змінної. Більш того, неадекватність критерія Грейнджера простягається ще далі. В певних ситуаціях цей кри- терій може включити в набір «причин» для Моделі і засоби систем баз даних та знань впливають на цільові змінні, не припускаються). В реальних ситуаціях доводиться застосовувати критерій Грейнджера в сурогатному режимі, тобто в умовах доступності лише неповної інформації t . Порівняємо можливості цих двох підходів. Спочатку відзначимо другорядну особливість, що відрізняє «причину» (за К. Грейнджером) від «причини» в апараті каузальних мереж. В каузальній мережі змінна X вважається причиною для Y , якщо є строго орієнтований шлях від X до Y . Тобто в перелік причин включено також і непрямі (опосередковані) причини. Натомість за К. Грейнджером непрямі причини X будуть визнані не-причинами, якщо доступний достатній набір посередників, через які здійснюється вплив X на Y . Суттєвим є те, що сурогатний критерій К. Грейнджера може призводити до систематичних помилок у визначенні каузальності. Можна описати роботу критерія К. Грейнджера так: формується набір предикторів 1−t , який мінімізує помилку прогнозу змінної tY , а потім з набору 1−t видаляються всі «надлишкові» предиктори. Виключення надлишкових предикторів не погіршує прогноз. Всі предиктори, що не були видалені як надлишкові, визнаються «причинами» для tY за Грейнджером. Легко бачити, якщо, припустимо, для ktX − та tY алгоритм виведення моделі не знайшов сепаратора, то ktX − буде визнана причиною для tY за Грейнджером. Отже, критерій К. Грейнджера включає в перелік «причин» для tY всі змінні, які поєднані з tY ребром і які йдуть у часі раніше за tY . Зокрема, якщо є ребро tkt YZ − , то змінна ktZ − також буде визнана причиною для tY , що є помилкою. Не-причина може бути необхідною для покращення прогнозу, бо несе «незамінну» інформацію в умовах недоступності справжніх причин. Наприклад, якщо маємо генеративну модель, показану на рис. 4,б, то, згідно Грейнджеру, причинами змінної X будуть визнані всі минулі значення цієї змінної. Більш того, неадекватність критерія Грейнджера простягається ще далі. В певних ситуаціях цей критерій може включити в набір «причин» для tY змінну, яка є безумовно незалежна від tY . Так станеться, якщо в моделі є ребро tkt YZ − та ребро ltkt QZ −−  . Це може здатися парадоксальним, але включення змінної ltQ − в набір предикторів зменшує помилку прогнозу змінної tY (за умови, що на змінну ktZ − не здійснюється втручання). Отже, в реалістичних умовах критерій К. Грейнджера є некоректним для задачі виявлення причин. Звернемося до правил орієнтації ребер в методах виведення каузальних мереж. Як показано в [7], якщо можливі конфаундери, то серед всіх відомих правил тільки правило 1 виводить каузальне ребро. Це правило є коректним засобом виявлення причинних зв'язків. Але для того, щоб правило орієнтації ребер 1 спрацювало, має виконуватися відповідна умовна незалежність. А для цього треба, щоб алгоритм «дістався» до відповідного зв'язку з найбільшим лагом, і щоб не було прихованого конфаундера. Якщо жодного непустого сепаратора не знайдено, то тоді не буде виведено жодного каузального зв'язку, і всі зв'язки залишаться у невизначеному статусі (в формі ребра YX → ). Висновки Динамічні каузальні моделі є потужним засобом аналізу й дослідження різноманітних процесів та об'єктів і забезпечує відображення таких рис, як швидкість змін, періодичність, лаг післядії, зворотні зв'язки тощо. Серед різноманітних типів динамічних процесів (які включають, зокрема, рекурентні процеси, «запрограмовані» процеси, потоки стохастичних подій, лічильні процеси і так далі) виділено векторні авторегресійні процеси. (Відомо, як для них можна виводити каузальні моделі.) Вимоги до архітектури темпоральних даних, способів та частоти їх збору диктуються характером динамічного процесу. Частота вимірювання даних має критичне значення для адекватності виведеної моделі і визначається тривалістю елементарних впливів між компонентами векторного процесу. Для виведення динамічним моделей з даних важливу роль відіграють припущення стаціонарності та регулярності структури. Особливостями виведення динамічних каузальних моделей є врахування темпорального порядку змінних та проблеми, пов'язані з невідомим лагом післядії та існуванням прихованих автокорельованих часових рядів. Проведено порівняльний аналіз критерію каузальності за Грейнджером та правил орієнтації ребер в апараті каузальних мереж з точки зору їх спроможності виявляти каузальні відношення. Концепція каузальності за Грейнджером в реальних умовах неповноти інформації непридатна для виявлення каузальних відношень в даних. За критерієм Грейнджера, в набір предикторів для прогнозу наслідку Y будуть включені всі змінні, корисні для покращення пасивного прогнозу. Взагалі, коректність критерію залежить від формату керування. Оскільки деякі справжні причини X для наслідку Y є недоступними, то корисними (для певних форматів втручання в об’єкт) можуть бути не-причини Z , які передають «незамінну» (в даному контексті) інформацію для прогнозу наслідку Y . (Зокрема, це змінні, пов'язані будь-яким ребром з Y , які йдуть у часі раніше Y .) Коректним засобом виявлення каузальних відношень в даних є правило орієнтації ребер 1 (розроблене в апараті каузальних мереж). Але це правило результативне тільки за певних умов (каузальне ребро не знаходиться під дією прихованого конфаундери і не оточене повно зв'язаною структурою). Бібліографія 1. Handbook of Big Data. P. Bühlmann, P. Drineas, M. Kane, M. van der Laan (Eds.). Boca Raton, FL.: CRC Press. Taylor & Francis Group, 2016. 452p. 2. Балабанов О.С. Задачі та методи аналізу великих даних (огляд). (Оновлено) Jan 2020. – [Electronic resource] URL: https://www.researchgate.net/publication/338714383_Tasks_and_methods_of_Big_Data_analysis_a_survey_revised. змінну, яка є безумовно незалежна від Моделі і засоби систем баз даних та знань впливають на цільові змінні, не припускаються). В реальних ситуаціях доводиться застосовувати критерій Грейнджера в сурогатному режимі, тобто в умовах доступності лише неповної інформації t . Порівняємо можливості цих двох підходів. Спочатку відзначимо другорядну особливість, що відрізняє «причину» (за К. Грейнджером) від «причини» в апараті каузальних мереж. В каузальній мережі змінна X вважається причиною для Y , якщо є строго орієнтований шлях від X до Y . Тобто в перелік причин включено також і непрямі (опосередковані) причини. Натомість за К. Грейнджером непрямі причини X будуть визнані не-причинами, якщо доступний достатній набір посередників, через які здійснюється вплив X на Y . Суттєвим є те, що сурогатний критерій К. Грейнджера може призводити до систематичних помилок у визначенні каузальності. Можна описати роботу критерія К. Грейнджера так: формується набір предикторів 1−t , який мінімізує помилку прогнозу змінної tY , а потім з набору 1−t видаляються всі «надлишкові» предиктори. Виключення надлишкових предикторів не погіршує прогноз. Всі предиктори, що не були видалені як надлишкові, визнаються «причинами» для tY за Грейнджером. Легко бачити, якщо, припустимо, для ktX − та tY алгоритм виведення моделі не знайшов сепаратора, то ktX − буде визнана причиною для tY за Грейнджером. Отже, критерій К. Грейнджера включає в перелік «причин» для tY всі змінні, які поєднані з tY ребром і які йдуть у часі раніше за tY . Зокрема, якщо є ребро tkt YZ − , то змінна ktZ − також буде визнана причиною для tY , що є помилкою. Не-причина може бути необхідною для покращення прогнозу, бо несе «незамінну» інформацію в умовах недоступності справжніх причин. Наприклад, якщо маємо генеративну модель, показану на рис. 4,б, то, згідно Грейнджеру, причинами змінної X будуть визнані всі минулі значення цієї змінної. Більш того, неадекватність критерія Грейнджера простягається ще далі. В певних ситуаціях цей критерій може включити в набір «причин» для tY змінну, яка є безумовно незалежна від tY . Так станеться, якщо в моделі є ребро tkt YZ − та ребро ltkt QZ −−  . Це може здатися парадоксальним, але включення змінної ltQ − в набір предикторів зменшує помилку прогнозу змінної tY (за умови, що на змінну ktZ − не здійснюється втручання). Отже, в реалістичних умовах критерій К. Грейнджера є некоректним для задачі виявлення причин. Звернемося до правил орієнтації ребер в методах виведення каузальних мереж. Як показано в [7], якщо можливі конфаундери, то серед всіх відомих правил тільки правило 1 виводить каузальне ребро. Це правило є коректним засобом виявлення причинних зв'язків. Але для того, щоб правило орієнтації ребер 1 спрацювало, має виконуватися відповідна умовна незалежність. А для цього треба, щоб алгоритм «дістався» до відповідного зв'язку з найбільшим лагом, і щоб не було прихованого конфаундера. Якщо жодного непустого сепаратора не знайдено, то тоді не буде виведено жодного каузального зв'язку, і всі зв'язки залишаться у невизначеному статусі (в формі ребра YX → ). Висновки Динамічні каузальні моделі є потужним засобом аналізу й дослідження різноманітних процесів та об'єктів і забезпечує відображення таких рис, як швидкість змін, періодичність, лаг післядії, зворотні зв'язки тощо. Серед різноманітних типів динамічних процесів (які включають, зокрема, рекурентні процеси, «запрограмовані» процеси, потоки стохастичних подій, лічильні процеси і так далі) виділено векторні авторегресійні процеси. (Відомо, як для них можна виводити каузальні моделі.) Вимоги до архітектури темпоральних даних, способів та частоти їх збору диктуються характером динамічного процесу. Частота вимірювання даних має критичне значення для адекватності виведеної моделі і визначається тривалістю елементарних впливів між компонентами векторного процесу. Для виведення динамічним моделей з даних важливу роль відіграють припущення стаціонарності та регулярності структури. Особливостями виведення динамічних каузальних моделей є врахування темпорального порядку змінних та проблеми, пов'язані з невідомим лагом післядії та існуванням прихованих автокорельованих часових рядів. Проведено порівняльний аналіз критерію каузальності за Грейнджером та правил орієнтації ребер в апараті каузальних мереж з точки зору їх спроможності виявляти каузальні відношення. Концепція каузальності за Грейнджером в реальних умовах неповноти інформації непридатна для виявлення каузальних відношень в даних. За критерієм Грейнджера, в набір предикторів для прогнозу наслідку Y будуть включені всі змінні, корисні для покращення пасивного прогнозу. Взагалі, коректність критерію залежить від формату керування. Оскільки деякі справжні причини X для наслідку Y є недоступними, то корисними (для певних форматів втручання в об’єкт) можуть бути не-причини Z , які передають «незамінну» (в даному контексті) інформацію для прогнозу наслідку Y . (Зокрема, це змінні, пов'язані будь-яким ребром з Y , які йдуть у часі раніше Y .) Коректним засобом виявлення каузальних відношень в даних є правило орієнтації ребер 1 (розроблене в апараті каузальних мереж). Але це правило результативне тільки за певних умов (каузальне ребро не знаходиться під дією прихованого конфаундери і не оточене повно зв'язаною структурою). Бібліографія 1. Handbook of Big Data. P. Bühlmann, P. Drineas, M. Kane, M. van der Laan (Eds.). Boca Raton, FL.: CRC Press. Taylor & Francis Group, 2016. 452p. 2. Балабанов О.С. Задачі та методи аналізу великих даних (огляд). (Оновлено) Jan 2020. – [Electronic resource] URL: https://www.researchgate.net/publication/338714383_Tasks_and_methods_of_Big_Data_analysis_a_survey_revised. . Так станеться, якщо в моделі є ребро Моделі і засоби систем баз даних та знань впливають на цільові змінні, не припускаються). В реальних ситуаціях доводиться застосовувати критерій Грейнджера в сурогатному режимі, тобто в умовах доступності лише неповної інформації t . Порівняємо можливості цих двох підходів. Спочатку відзначимо другорядну особливість, що відрізняє «причину» (за К. Грейнджером) від «причини» в апараті каузальних мереж. В каузальній мережі змінна X вважається причиною для Y , якщо є строго орієнтований шлях від X до Y . Тобто в перелік причин включено також і непрямі (опосередковані) причини. Натомість за К. Грейнджером непрямі причини X будуть визнані не-причинами, якщо доступний достатній набір посередників, через які здійснюється вплив X на Y . Суттєвим є те, що сурогатний критерій К. Грейнджера може призводити до систематичних помилок у визначенні каузальності. Можна описати роботу критерія К. Грейнджера так: формується набір предикторів 1−t , який мінімізує помилку прогнозу змінної tY , а потім з набору 1−t видаляються всі «надлишкові» предиктори. Виключення надлишкових предикторів не погіршує прогноз. Всі предиктори, що не були видалені як надлишкові, визнаються «причинами» для tY за Грейнджером. Легко бачити, якщо, припустимо, для ktX − та tY алгоритм виведення моделі не знайшов сепаратора, то ktX − буде визнана причиною для tY за Грейнджером. Отже, критерій К. Грейнджера включає в перелік «причин» для tY всі змінні, які поєднані з tY ребром і які йдуть у часі раніше за tY . Зокрема, якщо є ребро tkt YZ − , то змінна ktZ − також буде визнана причиною для tY , що є помилкою. Не-причина може бути необхідною для покращення прогнозу, бо несе «незамінну» інформацію в умовах недоступності справжніх причин. Наприклад, якщо маємо генеративну модель, показану на рис. 4,б, то, згідно Грейнджеру, причинами змінної X будуть визнані всі минулі значення цієї змінної. Більш того, неадекватність критерія Грейнджера простягається ще далі. В певних ситуаціях цей критерій може включити в набір «причин» для tY змінну, яка є безумовно незалежна від tY . Так станеться, якщо в моделі є ребро tkt YZ − та ребро ltkt QZ −−  . Це може здатися парадоксальним, але включення змінної ltQ − в набір предикторів зменшує помилку прогнозу змінної tY (за умови, що на змінну ktZ − не здійснюється втручання). Отже, в реалістичних умовах критерій К. Грейнджера є некоректним для задачі виявлення причин. Звернемося до правил орієнтації ребер в методах виведення каузальних мереж. Як показано в [7], якщо можливі конфаундери, то серед всіх відомих правил тільки правило 1 виводить каузальне ребро. Це правило є коректним засобом виявлення причинних зв'язків. Але для того, щоб правило орієнтації ребер 1 спрацювало, має виконуватися відповідна умовна незалежність. А для цього треба, щоб алгоритм «дістався» до відповідного зв'язку з найбільшим лагом, і щоб не було прихованого конфаундера. Якщо жодного непустого сепаратора не знайдено, то тоді не буде виведено жодного каузального зв'язку, і всі зв'язки залишаться у невизначеному статусі (в формі ребра YX → ). Висновки Динамічні каузальні моделі є потужним засобом аналізу й дослідження різноманітних процесів та об'єктів і забезпечує відображення таких рис, як швидкість змін, періодичність, лаг післядії, зворотні зв'язки тощо. Серед різноманітних типів динамічних процесів (які включають, зокрема, рекурентні процеси, «запрограмовані» процеси, потоки стохастичних подій, лічильні процеси і так далі) виділено векторні авторегресійні процеси. (Відомо, як для них можна виводити каузальні моделі.) Вимоги до архітектури темпоральних даних, способів та частоти їх збору диктуються характером динамічного процесу. Частота вимірювання даних має критичне значення для адекватності виведеної моделі і визначається тривалістю елементарних впливів між компонентами векторного процесу. Для виведення динамічним моделей з даних важливу роль відіграють припущення стаціонарності та регулярності структури. Особливостями виведення динамічних каузальних моделей є врахування темпорального порядку змінних та проблеми, пов'язані з невідомим лагом післядії та існуванням прихованих автокорельованих часових рядів. Проведено порівняльний аналіз критерію каузальності за Грейнджером та правил орієнтації ребер в апараті каузальних мереж з точки зору їх спроможності виявляти каузальні відношення. Концепція каузальності за Грейнджером в реальних умовах неповноти інформації непридатна для виявлення каузальних відношень в даних. За критерієм Грейнджера, в набір предикторів для прогнозу наслідку Y будуть включені всі змінні, корисні для покращення пасивного прогнозу. Взагалі, коректність критерію залежить від формату керування. Оскільки деякі справжні причини X для наслідку Y є недоступними, то корисними (для певних форматів втручання в об’єкт) можуть бути не-причини Z , які передають «незамінну» (в даному контексті) інформацію для прогнозу наслідку Y . (Зокрема, це змінні, пов'язані будь-яким ребром з Y , які йдуть у часі раніше Y .) Коректним засобом виявлення каузальних відношень в даних є правило орієнтації ребер 1 (розроблене в апараті каузальних мереж). Але це правило результативне тільки за певних умов (каузальне ребро не знаходиться під дією прихованого конфаундери і не оточене повно зв'язаною структурою). Бібліографія 1. Handbook of Big Data. P. Bühlmann, P. Drineas, M. Kane, M. van der Laan (Eds.). Boca Raton, FL.: CRC Press. Taylor & Francis Group, 2016. 452p. 2. Балабанов О.С. Задачі та методи аналізу великих даних (огляд). (Оновлено) Jan 2020. – [Electronic resource] URL: https://www.researchgate.net/publication/338714383_Tasks_and_methods_of_Big_Data_analysis_a_survey_revised. та ребро Моделі і засоби систем баз даних та знань впливають на цільові змінні, не припускаються). В реальних ситуаціях доводиться застосовувати критерій Грейнджера в сурогатному режимі, тобто в умовах доступності лише неповної інформації t . Порівняємо можливості цих двох підходів. Спочатку відзначимо другорядну особливість, що відрізняє «причину» (за К. Грейнджером) від «причини» в апараті каузальних мереж. В каузальній мережі змінна X вважається причиною для Y , якщо є строго орієнтований шлях від X до Y . Тобто в перелік причин включено також і непрямі (опосередковані) причини. Натомість за К. Грейнджером непрямі причини X будуть визнані не-причинами, якщо доступний достатній набір посередників, через які здійснюється вплив X на Y . Суттєвим є те, що сурогатний критерій К. Грейнджера може призводити до систематичних помилок у визначенні каузальності. Можна описати роботу критерія К. Грейнджера так: формується набір предикторів 1−t , який мінімізує помилку прогнозу змінної tY , а потім з набору 1−t видаляються всі «надлишкові» предиктори. Виключення надлишкових предикторів не погіршує прогноз. Всі предиктори, що не були видалені як надлишкові, визнаються «причинами» для tY за Грейнджером. Легко бачити, якщо, припустимо, для ktX − та tY алгоритм виведення моделі не знайшов сепаратора, то ktX − буде визнана причиною для tY за Грейнджером. Отже, критерій К. Грейнджера включає в перелік «причин» для tY всі змінні, які поєднані з tY ребром і які йдуть у часі раніше за tY . Зокрема, якщо є ребро tkt YZ − , то змінна ktZ − також буде визнана причиною для tY , що є помилкою. Не-причина може бути необхідною для покращення прогнозу, бо несе «незамінну» інформацію в умовах недоступності справжніх причин. Наприклад, якщо маємо генеративну модель, показану на рис. 4,б, то, згідно Грейнджеру, причинами змінної X будуть визнані всі минулі значення цієї змінної. Більш того, неадекватність критерія Грейнджера простягається ще далі. В певних ситуаціях цей критерій може включити в набір «причин» для tY змінну, яка є безумовно незалежна від tY . Так станеться, якщо в моделі є ребро tkt YZ − та ребро ltkt QZ −−  . Це може здатися парадоксальним, але включення змінної ltQ − в набір предикторів зменшує помилку прогнозу змінної tY (за умови, що на змінну ktZ − не здійснюється втручання). Отже, в реалістичних умовах критерій К. Грейнджера є некоректним для задачі виявлення причин. Звернемося до правил орієнтації ребер в методах виведення каузальних мереж. Як показано в [7], якщо можливі конфаундери, то серед всіх відомих правил тільки правило 1 виводить каузальне ребро. Це правило є коректним засобом виявлення причинних зв'язків. Але для того, щоб правило орієнтації ребер 1 спрацювало, має виконуватися відповідна умовна незалежність. А для цього треба, щоб алгоритм «дістався» до відповідного зв'язку з найбільшим лагом, і щоб не було прихованого конфаундера. Якщо жодного непустого сепаратора не знайдено, то тоді не буде виведено жодного каузального зв'язку, і всі зв'язки залишаться у невизначеному статусі (в формі ребра YX → ). Висновки Динамічні каузальні моделі є потужним засобом аналізу й дослідження різноманітних процесів та об'єктів і забезпечує відображення таких рис, як швидкість змін, періодичність, лаг післядії, зворотні зв'язки тощо. Серед різноманітних типів динамічних процесів (які включають, зокрема, рекурентні процеси, «запрограмовані» процеси, потоки стохастичних подій, лічильні процеси і так далі) виділено векторні авторегресійні процеси. (Відомо, як для них можна виводити каузальні моделі.) Вимоги до архітектури темпоральних даних, способів та частоти їх збору диктуються характером динамічного процесу. Частота вимірювання даних має критичне значення для адекватності виведеної моделі і визначається тривалістю елементарних впливів між компонентами векторного процесу. Для виведення динамічним моделей з даних важливу роль відіграють припущення стаціонарності та регулярності структури. Особливостями виведення динамічних каузальних моделей є врахування темпорального порядку змінних та проблеми, пов'язані з невідомим лагом післядії та існуванням прихованих автокорельованих часових рядів. Проведено порівняльний аналіз критерію каузальності за Грейнджером та правил орієнтації ребер в апараті каузальних мереж з точки зору їх спроможності виявляти каузальні відношення. Концепція каузальності за Грейнджером в реальних умовах неповноти інформації непридатна для виявлення каузальних відношень в даних. За критерієм Грейнджера, в набір предикторів для прогнозу наслідку Y будуть включені всі змінні, корисні для покращення пасивного прогнозу. Взагалі, коректність критерію залежить від формату керування. Оскільки деякі справжні причини X для наслідку Y є недоступними, то корисними (для певних форматів втручання в об’єкт) можуть бути не-причини Z , які передають «незамінну» (в даному контексті) інформацію для прогнозу наслідку Y . (Зокрема, це змінні, пов'язані будь-яким ребром з Y , які йдуть у часі раніше Y .) Коректним засобом виявлення каузальних відношень в даних є правило орієнтації ребер 1 (розроблене в апараті каузальних мереж). Але це правило результативне тільки за певних умов (каузальне ребро не знаходиться під дією прихованого конфаундери і не оточене повно зв'язаною структурою). Бібліографія 1. Handbook of Big Data. P. Bühlmann, P. Drineas, M. Kane, M. van der Laan (Eds.). Boca Raton, FL.: CRC Press. Taylor & Francis Group, 2016. 452p. 2. Балабанов О.С. Задачі та методи аналізу великих даних (огляд). (Оновлено) Jan 2020. – [Electronic resource] URL: https://www.researchgate.net/publication/338714383_Tasks_and_methods_of_Big_Data_analysis_a_survey_revised. . Це може здатися парадоксальним, але включення змінної Моделі і засоби систем баз даних та знань впливають на цільові змінні, не припускаються). В реальних ситуаціях доводиться застосовувати критерій Грейнджера в сурогатному режимі, тобто в умовах доступності лише неповної інформації t . Порівняємо можливості цих двох підходів. Спочатку відзначимо другорядну особливість, що відрізняє «причину» (за К. Грейнджером) від «причини» в апараті каузальних мереж. В каузальній мережі змінна X вважається причиною для Y , якщо є строго орієнтований шлях від X до Y . Тобто в перелік причин включено також і непрямі (опосередковані) причини. Натомість за К. Грейнджером непрямі причини X будуть визнані не-причинами, якщо доступний достатній набір посередників, через які здійснюється вплив X на Y . Суттєвим є те, що сурогатний критерій К. Грейнджера може призводити до систематичних помилок у визначенні каузальності. Можна описати роботу критерія К. Грейнджера так: формується набір предикторів 1−t , який мінімізує помилку прогнозу змінної tY , а потім з набору 1−t видаляються всі «надлишкові» предиктори. Виключення надлишкових предикторів не погіршує прогноз. Всі предиктори, що не були видалені як надлишкові, визнаються «причинами» для tY за Грейнджером. Легко бачити, якщо, припустимо, для ktX − та tY алгоритм виведення моделі не знайшов сепаратора, то ktX − буде визнана причиною для tY за Грейнджером. Отже, критерій К. Грейнджера включає в перелік «причин» для tY всі змінні, які поєднані з tY ребром і які йдуть у часі раніше за tY . Зокрема, якщо є ребро tkt YZ − , то змінна ktZ − також буде визнана причиною для tY , що є помилкою. Не-причина може бути необхідною для покращення прогнозу, бо несе «незамінну» інформацію в умовах недоступності справжніх причин. Наприклад, якщо маємо генеративну модель, показану на рис. 4,б, то, згідно Грейнджеру, причинами змінної X будуть визнані всі минулі значення цієї змінної. Більш того, неадекватність критерія Грейнджера простягається ще далі. В певних ситуаціях цей критерій може включити в набір «причин» для tY змінну, яка є безумовно незалежна від tY . Так станеться, якщо в моделі є ребро tkt YZ − та ребро ltkt QZ −−  . Це може здатися парадоксальним, але включення змінної ltQ − в набір предикторів зменшує помилку прогнозу змінної tY (за умови, що на змінну ktZ − не здійснюється втручання). Отже, в реалістичних умовах критерій К. Грейнджера є некоректним для задачі виявлення причин. Звернемося до правил орієнтації ребер в методах виведення каузальних мереж. Як показано в [7], якщо можливі конфаундери, то серед всіх відомих правил тільки правило 1 виводить каузальне ребро. Це правило є коректним засобом виявлення причинних зв'язків. Але для того, щоб правило орієнтації ребер 1 спрацювало, має виконуватися відповідна умовна незалежність. А для цього треба, щоб алгоритм «дістався» до відповідного зв'язку з найбільшим лагом, і щоб не було прихованого конфаундера. Якщо жодного непустого сепаратора не знайдено, то тоді не буде виведено жодного каузального зв'язку, і всі зв'язки залишаться у невизначеному статусі (в формі ребра YX → ). Висновки Динамічні каузальні моделі є потужним засобом аналізу й дослідження різноманітних процесів та об'єктів і забезпечує відображення таких рис, як швидкість змін, періодичність, лаг післядії, зворотні зв'язки тощо. Серед різноманітних типів динамічних процесів (які включають, зокрема, рекурентні процеси, «запрограмовані» процеси, потоки стохастичних подій, лічильні процеси і так далі) виділено векторні авторегресійні процеси. (Відомо, як для них можна виводити каузальні моделі.) Вимоги до архітектури темпоральних даних, способів та частоти їх збору диктуються характером динамічного процесу. Частота вимірювання даних має критичне значення для адекватності виведеної моделі і визначається тривалістю елементарних впливів між компонентами векторного процесу. Для виведення динамічним моделей з даних важливу роль відіграють припущення стаціонарності та регулярності структури. Особливостями виведення динамічних каузальних моделей є врахування темпорального порядку змінних та проблеми, пов'язані з невідомим лагом післядії та існуванням прихованих автокорельованих часових рядів. Проведено порівняльний аналіз критерію каузальності за Грейнджером та правил орієнтації ребер в апараті каузальних мереж з точки зору їх спроможності виявляти каузальні відношення. Концепція каузальності за Грейнджером в реальних умовах неповноти інформації непридатна для виявлення каузальних відношень в даних. За критерієм Грейнджера, в набір предикторів для прогнозу наслідку Y будуть включені всі змінні, корисні для покращення пасивного прогнозу. Взагалі, коректність критерію залежить від формату керування. Оскільки деякі справжні причини X для наслідку Y є недоступними, то корисними (для певних форматів втручання в об’єкт) можуть бути не-причини Z , які передають «незамінну» (в даному контексті) інформацію для прогнозу наслідку Y . (Зокрема, це змінні, пов'язані будь-яким ребром з Y , які йдуть у часі раніше Y .) Коректним засобом виявлення каузальних відношень в даних є правило орієнтації ребер 1 (розроблене в апараті каузальних мереж). Але це правило результативне тільки за певних умов (каузальне ребро не знаходиться під дією прихованого конфаундери і не оточене повно зв'язаною структурою). Бібліографія 1. Handbook of Big Data. P. Bühlmann, P. Drineas, M. Kane, M. van der Laan (Eds.). Boca Raton, FL.: CRC Press. Taylor & Francis Group, 2016. 452p. 2. Балабанов О.С. Задачі та методи аналізу великих даних (огляд). (Оновлено) Jan 2020. – [Electronic resource] URL: https://www.researchgate.net/publication/338714383_Tasks_and_methods_of_Big_Data_analysis_a_survey_revised. в набір предикторів зменшує помилку прогнозу змінної Моделі і засоби систем баз даних та знань впливають на цільові змінні, не припускаються). В реальних ситуаціях доводиться застосовувати критерій Грейнджера в сурогатному режимі, тобто в умовах доступності лише неповної інформації t . Порівняємо можливості цих двох підходів. Спочатку відзначимо другорядну особливість, що відрізняє «причину» (за К. Грейнджером) від «причини» в апараті каузальних мереж. В каузальній мережі змінна X вважається причиною для Y , якщо є строго орієнтований шлях від X до Y . Тобто в перелік причин включено також і непрямі (опосередковані) причини. Натомість за К. Грейнджером непрямі причини X будуть визнані не-причинами, якщо доступний достатній набір посередників, через які здійснюється вплив X на Y . Суттєвим є те, що сурогатний критерій К. Грейнджера може призводити до систематичних помилок у визначенні каузальності. Можна описати роботу критерія К. Грейнджера так: формується набір предикторів 1−t , який мінімізує помилку прогнозу змінної tY , а потім з набору 1−t видаляються всі «надлишкові» предиктори. Виключення надлишкових предикторів не погіршує прогноз. Всі предиктори, що не були видалені як надлишкові, визнаються «причинами» для tY за Грейнджером. Легко бачити, якщо, припустимо, для ktX − та tY алгоритм виведення моделі не знайшов сепаратора, то ktX − буде визнана причиною для tY за Грейнджером. Отже, критерій К. Грейнджера включає в перелік «причин» для tY всі змінні, які поєднані з tY ребром і які йдуть у часі раніше за tY . Зокрема, якщо є ребро tkt YZ − , то змінна ktZ − також буде визнана причиною для tY , що є помилкою. Не-причина може бути необхідною для покращення прогнозу, бо несе «незамінну» інформацію в умовах недоступності справжніх причин. Наприклад, якщо маємо генеративну модель, показану на рис. 4,б, то, згідно Грейнджеру, причинами змінної X будуть визнані всі минулі значення цієї змінної. Більш того, неадекватність критерія Грейнджера простягається ще далі. В певних ситуаціях цей критерій може включити в набір «причин» для tY змінну, яка є безумовно незалежна від tY . Так станеться, якщо в моделі є ребро tkt YZ − та ребро ltkt QZ −−  . Це може здатися парадоксальним, але включення змінної ltQ − в набір предикторів зменшує помилку прогнозу змінної tY (за умови, що на змінну ktZ − не здійснюється втручання). Отже, в реалістичних умовах критерій К. Грейнджера є некоректним для задачі виявлення причин. Звернемося до правил орієнтації ребер в методах виведення каузальних мереж. Як показано в [7], якщо можливі конфаундери, то серед всіх відомих правил тільки правило 1 виводить каузальне ребро. Це правило є коректним засобом виявлення причинних зв'язків. Але для того, щоб правило орієнтації ребер 1 спрацювало, має виконуватися відповідна умовна незалежність. А для цього треба, щоб алгоритм «дістався» до відповідного зв'язку з найбільшим лагом, і щоб не було прихованого конфаундера. Якщо жодного непустого сепаратора не знайдено, то тоді не буде виведено жодного каузального зв'язку, і всі зв'язки залишаться у невизначеному статусі (в формі ребра YX → ). Висновки Динамічні каузальні моделі є потужним засобом аналізу й дослідження різноманітних процесів та об'єктів і забезпечує відображення таких рис, як швидкість змін, періодичність, лаг післядії, зворотні зв'язки тощо. Серед різноманітних типів динамічних процесів (які включають, зокрема, рекурентні процеси, «запрограмовані» процеси, потоки стохастичних подій, лічильні процеси і так далі) виділено векторні авторегресійні процеси. (Відомо, як для них можна виводити каузальні моделі.) Вимоги до архітектури темпоральних даних, способів та частоти їх збору диктуються характером динамічного процесу. Частота вимірювання даних має критичне значення для адекватності виведеної моделі і визначається тривалістю елементарних впливів між компонентами векторного процесу. Для виведення динамічним моделей з даних важливу роль відіграють припущення стаціонарності та регулярності структури. Особливостями виведення динамічних каузальних моделей є врахування темпорального порядку змінних та проблеми, пов'язані з невідомим лагом післядії та існуванням прихованих автокорельованих часових рядів. Проведено порівняльний аналіз критерію каузальності за Грейнджером та правил орієнтації ребер в апараті каузальних мереж з точки зору їх спроможності виявляти каузальні відношення. Концепція каузальності за Грейнджером в реальних умовах неповноти інформації непридатна для виявлення каузальних відношень в даних. За критерієм Грейнджера, в набір предикторів для прогнозу наслідку Y будуть включені всі змінні, корисні для покращення пасивного прогнозу. Взагалі, коректність критерію залежить від формату керування. Оскільки деякі справжні причини X для наслідку Y є недоступними, то корисними (для певних форматів втручання в об’єкт) можуть бути не-причини Z , які передають «незамінну» (в даному контексті) інформацію для прогнозу наслідку Y . (Зокрема, це змінні, пов'язані будь-яким ребром з Y , які йдуть у часі раніше Y .) Коректним засобом виявлення каузальних відношень в даних є правило орієнтації ребер 1 (розроблене в апараті каузальних мереж). Але це правило результативне тільки за певних умов (каузальне ребро не знаходиться під дією прихованого конфаундери і не оточене повно зв'язаною структурою). Бібліографія 1. Handbook of Big Data. P. Bühlmann, P. Drineas, M. Kane, M. van der Laan (Eds.). Boca Raton, FL.: CRC Press. Taylor & Francis Group, 2016. 452p. 2. Балабанов О.С. Задачі та методи аналізу великих даних (огляд). (Оновлено) Jan 2020. – [Electronic resource] URL: https://www.researchgate.net/publication/338714383_Tasks_and_methods_of_Big_Data_analysis_a_survey_revised. (за умови, що на змінну Моделі і засоби систем баз даних та знань впливають на цільові змінні, не припускаються). В реальних ситуаціях доводиться застосовувати критерій Грейнджера в сурогатному режимі, тобто в умовах доступності лише неповної інформації t . Порівняємо можливості цих двох підходів. Спочатку відзначимо другорядну особливість, що відрізняє «причину» (за К. Грейнджером) від «причини» в апараті каузальних мереж. В каузальній мережі змінна X вважається причиною для Y , якщо є строго орієнтований шлях від X до Y . Тобто в перелік причин включено також і непрямі (опосередковані) причини. Натомість за К. Грейнджером непрямі причини X будуть визнані не-причинами, якщо доступний достатній набір посередників, через які здійснюється вплив X на Y . Суттєвим є те, що сурогатний критерій К. Грейнджера може призводити до систематичних помилок у визначенні каузальності. Можна описати роботу критерія К. Грейнджера так: формується набір предикторів 1−t , який мінімізує помилку прогнозу змінної tY , а потім з набору 1−t видаляються всі «надлишкові» предиктори. Виключення надлишкових предикторів не погіршує прогноз. Всі предиктори, що не були видалені як надлишкові, визнаються «причинами» для tY за Грейнджером. Легко бачити, якщо, припустимо, для ktX − та tY алгоритм виведення моделі не знайшов сепаратора, то ktX − буде визнана причиною для tY за Грейнджером. Отже, критерій К. Грейнджера включає в перелік «причин» для tY всі змінні, які поєднані з tY ребром і які йдуть у часі раніше за tY . Зокрема, якщо є ребро tkt YZ − , то змінна ktZ − також буде визнана причиною для tY , що є помилкою. Не-причина може бути необхідною для покращення прогнозу, бо несе «незамінну» інформацію в умовах недоступності справжніх причин. Наприклад, якщо маємо генеративну модель, показану на рис. 4,б, то, згідно Грейнджеру, причинами змінної X будуть визнані всі минулі значення цієї змінної. Більш того, неадекватність критерія Грейнджера простягається ще далі. В певних ситуаціях цей критерій може включити в набір «причин» для tY змінну, яка є безумовно незалежна від tY . Так станеться, якщо в моделі є ребро tkt YZ − та ребро ltkt QZ −−  . Це може здатися парадоксальним, але включення змінної ltQ − в набір предикторів зменшує помилку прогнозу змінної tY (за умови, що на змінну ktZ − не здійснюється втручання). Отже, в реалістичних умовах критерій К. Грейнджера є некоректним для задачі виявлення причин. Звернемося до правил орієнтації ребер в методах виведення каузальних мереж. Як показано в [7], якщо можливі конфаундери, то серед всіх відомих правил тільки правило 1 виводить каузальне ребро. Це правило є коректним засобом виявлення причинних зв'язків. Але для того, щоб правило орієнтації ребер 1 спрацювало, має виконуватися відповідна умовна незалежність. А для цього треба, щоб алгоритм «дістався» до відповідного зв'язку з найбільшим лагом, і щоб не було прихованого конфаундера. Якщо жодного непустого сепаратора не знайдено, то тоді не буде виведено жодного каузального зв'язку, і всі зв'язки залишаться у невизначеному статусі (в формі ребра YX → ). Висновки Динамічні каузальні моделі є потужним засобом аналізу й дослідження різноманітних процесів та об'єктів і забезпечує відображення таких рис, як швидкість змін, періодичність, лаг післядії, зворотні зв'язки тощо. Серед різноманітних типів динамічних процесів (які включають, зокрема, рекурентні процеси, «запрограмовані» процеси, потоки стохастичних подій, лічильні процеси і так далі) виділено векторні авторегресійні процеси. (Відомо, як для них можна виводити каузальні моделі.) Вимоги до архітектури темпоральних даних, способів та частоти їх збору диктуються характером динамічного процесу. Частота вимірювання даних має критичне значення для адекватності виведеної моделі і визначається тривалістю елементарних впливів між компонентами векторного процесу. Для виведення динамічним моделей з даних важливу роль відіграють припущення стаціонарності та регулярності структури. Особливостями виведення динамічних каузальних моделей є врахування темпорального порядку змінних та проблеми, пов'язані з невідомим лагом післядії та існуванням прихованих автокорельованих часових рядів. Проведено порівняльний аналіз критерію каузальності за Грейнджером та правил орієнтації ребер в апараті каузальних мереж з точки зору їх спроможності виявляти каузальні відношення. Концепція каузальності за Грейнджером в реальних умовах неповноти інформації непридатна для виявлення каузальних відношень в даних. За критерієм Грейнджера, в набір предикторів для прогнозу наслідку Y будуть включені всі змінні, корисні для покращення пасивного прогнозу. Взагалі, коректність критерію залежить від формату керування. Оскільки деякі справжні причини X для наслідку Y є недоступними, то корисними (для певних форматів втручання в об’єкт) можуть бути не-причини Z , які передають «незамінну» (в даному контексті) інформацію для прогнозу наслідку Y . (Зокрема, це змінні, пов'язані будь-яким ребром з Y , які йдуть у часі раніше Y .) Коректним засобом виявлення каузальних відношень в даних є правило орієнтації ребер 1 (розроблене в апараті каузальних мереж). Але це правило результативне тільки за певних умов (каузальне ребро не знаходиться під дією прихованого конфаундери і не оточене повно зв'язаною структурою). Бібліографія 1. Handbook of Big Data. P. Bühlmann, P. Drineas, M. Kane, M. van der Laan (Eds.). Boca Raton, FL.: CRC Press. Taylor & Francis Group, 2016. 452p. 2. Балабанов О.С. Задачі та методи аналізу великих даних (огляд). (Оновлено) Jan 2020. – [Electronic resource] URL: https://www.researchgate.net/publication/338714383_Tasks_and_methods_of_Big_Data_analysis_a_survey_revised. не здійснюється втручання). Отже, в реалістичних умовах критерій К. Грейнджера є некоректним для задачі виявлення причин. Звернемося до правил орієнтації ребер в методах виведення каузальних мереж. Як показано в [7], якщо можливі конфаундери, то серед всіх відомих правил тільки правило Моделі і засоби систем баз даних та знань впливають на цільові змінні, не припускаються). В реальних ситуаціях доводиться застосовувати критерій Грейнджера в сурогатному режимі, тобто в умовах доступності лише неповної інформації t . Порівняємо можливості цих двох підходів. Спочатку відзначимо другорядну особливість, що відрізняє «причину» (за К. Грейнджером) від «причини» в апараті каузальних мереж. В каузальній мережі змінна X вважається причиною для Y , якщо є строго орієнтований шлях від X до Y . Тобто в перелік причин включено також і непрямі (опосередковані) причини. Натомість за К. Грейнджером непрямі причини X будуть визнані не-причинами, якщо доступний достатній набір посередників, через які здійснюється вплив X на Y . Суттєвим є те, що сурогатний критерій К. Грейнджера може призводити до систематичних помилок у визначенні каузальності. Можна описати роботу критерія К. Грейнджера так: формується набір предикторів 1−t , який мінімізує помилку прогнозу змінної tY , а потім з набору 1−t видаляються всі «надлишкові» предиктори. Виключення надлишкових предикторів не погіршує прогноз. Всі предиктори, що не були видалені як надлишкові, визнаються «причинами» для tY за Грейнджером. Легко бачити, якщо, припустимо, для ktX − та tY алгоритм виведення моделі не знайшов сепаратора, то ktX − буде визнана причиною для tY за Грейнджером. Отже, критерій К. Грейнджера включає в перелік «причин» для tY всі змінні, які поєднані з tY ребром і які йдуть у часі раніше за tY . Зокрема, якщо є ребро tkt YZ − , то змінна ktZ − також буде визнана причиною для tY , що є помилкою. Не-причина може бути необхідною для покращення прогнозу, бо несе «незамінну» інформацію в умовах недоступності справжніх причин. Наприклад, якщо маємо генеративну модель, показану на рис. 4,б, то, згідно Грейнджеру, причинами змінної X будуть визнані всі минулі значення цієї змінної. Більш того, неадекватність критерія Грейнджера простягається ще далі. В певних ситуаціях цей критерій може включити в набір «причин» для tY змінну, яка є безумовно незалежна від tY . Так станеться, якщо в моделі є ребро tkt YZ − та ребро ltkt QZ −−  . Це може здатися парадоксальним, але включення змінної ltQ − в набір предикторів зменшує помилку прогнозу змінної tY (за умови, що на змінну ktZ − не здійснюється втручання). Отже, в реалістичних умовах критерій К. Грейнджера є некоректним для задачі виявлення причин. Звернемося до правил орієнтації ребер в методах виведення каузальних мереж. Як показано в [7], якщо можливі конфаундери, то серед всіх відомих правил тільки правило 1 виводить каузальне ребро. Це правило є коректним засобом виявлення причинних зв'язків. Але для того, щоб правило орієнтації ребер 1 спрацювало, має виконуватися відповідна умовна незалежність. А для цього треба, щоб алгоритм «дістався» до відповідного зв'язку з найбільшим лагом, і щоб не було прихованого конфаундера. Якщо жодного непустого сепаратора не знайдено, то тоді не буде виведено жодного каузального зв'язку, і всі зв'язки залишаться у невизначеному статусі (в формі ребра YX → ). Висновки Динамічні каузальні моделі є потужним засобом аналізу й дослідження різноманітних процесів та об'єктів і забезпечує відображення таких рис, як швидкість змін, періодичність, лаг післядії, зворотні зв'язки тощо. Серед різноманітних типів динамічних процесів (які включають, зокрема, рекурентні процеси, «запрограмовані» процеси, потоки стохастичних подій, лічильні процеси і так далі) виділено векторні авторегресійні процеси. (Відомо, як для них можна виводити каузальні моделі.) Вимоги до архітектури темпоральних даних, способів та частоти їх збору диктуються характером динамічного процесу. Частота вимірювання даних має критичне значення для адекватності виведеної моделі і визначається тривалістю елементарних впливів між компонентами векторного процесу. Для виведення динамічним моделей з даних важливу роль відіграють припущення стаціонарності та регулярності структури. Особливостями виведення динамічних каузальних моделей є врахування темпорального порядку змінних та проблеми, пов'язані з невідомим лагом післядії та існуванням прихованих автокорельованих часових рядів. Проведено порівняльний аналіз критерію каузальності за Грейнджером та правил орієнтації ребер в апараті каузальних мереж з точки зору їх спроможності виявляти каузальні відношення. Концепція каузальності за Грейнджером в реальних умовах неповноти інформації непридатна для виявлення каузальних відношень в даних. За критерієм Грейнджера, в набір предикторів для прогнозу наслідку Y будуть включені всі змінні, корисні для покращення пасивного прогнозу. Взагалі, коректність критерію залежить від формату керування. Оскільки деякі справжні причини X для наслідку Y є недоступними, то корисними (для певних форматів втручання в об’єкт) можуть бути не-причини Z , які передають «незамінну» (в даному контексті) інформацію для прогнозу наслідку Y . (Зокрема, це змінні, пов'язані будь-яким ребром з Y , які йдуть у часі раніше Y .) Коректним засобом виявлення каузальних відношень в даних є правило орієнтації ребер 1 (розроблене в апараті каузальних мереж). Але це правило результативне тільки за певних умов (каузальне ребро не знаходиться під дією прихованого конфаундери і не оточене повно зв'язаною структурою). Бібліографія 1. Handbook of Big Data. P. Bühlmann, P. Drineas, M. Kane, M. van der Laan (Eds.). Boca Raton, FL.: CRC Press. Taylor & Francis Group, 2016. 452p. 2. Балабанов О.С. Задачі та методи аналізу великих даних (огляд). (Оновлено) Jan 2020. – [Electronic resource] URL: https://www.researchgate.net/publication/338714383_Tasks_and_methods_of_Big_Data_analysis_a_survey_revised. виводить каузальне ребро. Це правило є коректним засобом виявлення причинних зв’язків. Але для того, щоб правило орієнтації ребер Моделі і засоби систем баз даних та знань впливають на цільові змінні, не припускаються). В реальних ситуаціях доводиться застосовувати критерій Грейнджера в сурогатному режимі, тобто в умовах доступності лише неповної інформації t . Порівняємо можливості цих двох підходів. Спочатку відзначимо другорядну особливість, що відрізняє «причину» (за К. Грейнджером) від «причини» в апараті каузальних мереж. В каузальній мережі змінна X вважається причиною для Y , якщо є строго орієнтований шлях від X до Y . Тобто в перелік причин включено також і непрямі (опосередковані) причини. Натомість за К. Грейнджером непрямі причини X будуть визнані не-причинами, якщо доступний достатній набір посередників, через які здійснюється вплив X на Y . Суттєвим є те, що сурогатний критерій К. Грейнджера може призводити до систематичних помилок у визначенні каузальності. Можна описати роботу критерія К. Грейнджера так: формується набір предикторів 1−t , який мінімізує помилку прогнозу змінної tY , а потім з набору 1−t видаляються всі «надлишкові» предиктори. Виключення надлишкових предикторів не погіршує прогноз. Всі предиктори, що не були видалені як надлишкові, визнаються «причинами» для tY за Грейнджером. Легко бачити, якщо, припустимо, для ktX − та tY алгоритм виведення моделі не знайшов сепаратора, то ktX − буде визнана причиною для tY за Грейнджером. Отже, критерій К. Грейнджера включає в перелік «причин» для tY всі змінні, які поєднані з tY ребром і які йдуть у часі раніше за tY . Зокрема, якщо є ребро tkt YZ − , то змінна ktZ − також буде визнана причиною для tY , що є помилкою. Не-причина може бути необхідною для покращення прогнозу, бо несе «незамінну» інформацію в умовах недоступності справжніх причин. Наприклад, якщо маємо генеративну модель, показану на рис. 4,б, то, згідно Грейнджеру, причинами змінної X будуть визнані всі минулі значення цієї змінної. Більш того, неадекватність критерія Грейнджера простягається ще далі. В певних ситуаціях цей критерій може включити в набір «причин» для tY змінну, яка є безумовно незалежна від tY . Так станеться, якщо в моделі є ребро tkt YZ − та ребро ltkt QZ −−  . Це може здатися парадоксальним, але включення змінної ltQ − в набір предикторів зменшує помилку прогнозу змінної tY (за умови, що на змінну ktZ − не здійснюється втручання). Отже, в реалістичних умовах критерій К. Грейнджера є некоректним для задачі виявлення причин. Звернемося до правил орієнтації ребер в методах виведення каузальних мереж. Як показано в [7], якщо можливі конфаундери, то серед всіх відомих правил тільки правило 1 виводить каузальне ребро. Це правило є коректним засобом виявлення причинних зв'язків. Але для того, щоб правило орієнтації ребер 1 спрацювало, має виконуватися відповідна умовна незалежність. А для цього треба, щоб алгоритм «дістався» до відповідного зв'язку з найбільшим лагом, і щоб не було прихованого конфаундера. Якщо жодного непустого сепаратора не знайдено, то тоді не буде виведено жодного каузального зв'язку, і всі зв'язки залишаться у невизначеному статусі (в формі ребра YX → ). Висновки Динамічні каузальні моделі є потужним засобом аналізу й дослідження різноманітних процесів та об'єктів і забезпечує відображення таких рис, як швидкість змін, періодичність, лаг післядії, зворотні зв'язки тощо. Серед різноманітних типів динамічних процесів (які включають, зокрема, рекурентні процеси, «запрограмовані» процеси, потоки стохастичних подій, лічильні процеси і так далі) виділено векторні авторегресійні процеси. (Відомо, як для них можна виводити каузальні моделі.) Вимоги до архітектури темпоральних даних, способів та частоти їх збору диктуються характером динамічного процесу. Частота вимірювання даних має критичне значення для адекватності виведеної моделі і визначається тривалістю елементарних впливів між компонентами векторного процесу. Для виведення динамічним моделей з даних важливу роль відіграють припущення стаціонарності та регулярності структури. Особливостями виведення динамічних каузальних моделей є врахування темпорального порядку змінних та проблеми, пов'язані з невідомим лагом післядії та існуванням прихованих автокорельованих часових рядів. Проведено порівняльний аналіз критерію каузальності за Грейнджером та правил орієнтації ребер в апараті каузальних мереж з точки зору їх спроможності виявляти каузальні відношення. Концепція каузальності за Грейнджером в реальних умовах неповноти інформації непридатна для виявлення каузальних відношень в даних. За критерієм Грейнджера, в набір предикторів для прогнозу наслідку Y будуть включені всі змінні, корисні для покращення пасивного прогнозу. Взагалі, коректність критерію залежить від формату керування. Оскільки деякі справжні причини X для наслідку Y є недоступними, то корисними (для певних форматів втручання в об’єкт) можуть бути не-причини Z , які передають «незамінну» (в даному контексті) інформацію для прогнозу наслідку Y . (Зокрема, це змінні, пов'язані будь-яким ребром з Y , які йдуть у часі раніше Y .) Коректним засобом виявлення каузальних відношень в даних є правило орієнтації ребер 1 (розроблене в апараті каузальних мереж). Але це правило результативне тільки за певних умов (каузальне ребро не знаходиться під дією прихованого конфаундери і не оточене повно зв'язаною структурою). Бібліографія 1. Handbook of Big Data. P. Bühlmann, P. Drineas, M. Kane, M. van der Laan (Eds.). Boca Raton, FL.: CRC Press. Taylor & Francis Group, 2016. 452p. 2. Балабанов О.С. Задачі та методи аналізу великих даних (огляд). (Оновлено) Jan 2020. – [Electronic resource] URL: https://www.researchgate.net/publication/338714383_Tasks_and_methods_of_Big_Data_analysis_a_survey_revised. спрацювало, має виконуватися відповідна умовна незалежність. А для цього треба, щоб алгоритм «дістався» до відповідного зв’язку з найбільшим лагом, і щоб не було прихованого конфаундера. Якщо жодного непус- того сепаратора не знайдено, то тоді не буде виведено жодного каузального зв’язку, і всі зв’язки залишаться у невизначеному статусі (в формі ребра Моделі і засоби систем баз даних та знань впливають на цільові змінні, не припускаються). В реальних ситуаціях доводиться застосовувати критерій Грейнджера в сурогатному режимі, тобто в умовах доступності лише неповної інформації t . Порівняємо можливості цих двох підходів. Спочатку відзначимо другорядну особливість, що відрізняє «причину» (за К. Грейнджером) від «причини» в апараті каузальних мереж. В каузальній мережі змінна X вважається причиною для Y , якщо є строго орієнтований шлях від X до Y . Тобто в перелік причин включено також і непрямі (опосередковані) причини. Натомість за К. Грейнджером непрямі причини X будуть визнані не-причинами, якщо доступний достатній набір посередників, через які здійснюється вплив X на Y . Суттєвим є те, що сурогатний критерій К. Грейнджера може призводити до систематичних помилок у визначенні каузальності. Можна описати роботу критерія К. Грейнджера так: формується набір предикторів 1−t , який мінімізує помилку прогнозу змінної tY , а потім з набору 1−t видаляються всі «надлишкові» предиктори. Виключення надлишкових предикторів не погіршує прогноз. Всі предиктори, що не були видалені як надлишкові, визнаються «причинами» для tY за Грейнджером. Легко бачити, якщо, припустимо, для ktX − та tY алгоритм виведення моделі не знайшов сепаратора, то ktX − буде визнана причиною для tY за Грейнджером. Отже, критерій К. Грейнджера включає в перелік «причин» для tY всі змінні, які поєднані з tY ребром і які йдуть у часі раніше за tY . Зокрема, якщо є ребро tkt YZ − , то змінна ktZ − також буде визнана причиною для tY , що є помилкою. Не-причина може бути необхідною для покращення прогнозу, бо несе «незамінну» інформацію в умовах недоступності справжніх причин. Наприклад, якщо маємо генеративну модель, показану на рис. 4,б, то, згідно Грейнджеру, причинами змінної X будуть визнані всі минулі значення цієї змінної. Більш того, неадекватність критерія Грейнджера простягається ще далі. В певних ситуаціях цей критерій може включити в набір «причин» для tY змінну, яка є безумовно незалежна від tY . Так станеться, якщо в моделі є ребро tkt YZ − та ребро ltkt QZ −−  . Це може здатися парадоксальним, але включення змінної ltQ − в набір предикторів зменшує помилку прогнозу змінної tY (за умови, що на змінну ktZ − не здійснюється втручання). Отже, в реалістичних умовах критерій К. Грейнджера є некоректним для задачі виявлення причин. Звернемося до правил орієнтації ребер в методах виведення каузальних мереж. Як показано в [7], якщо можливі конфаундери, то серед всіх відомих правил тільки правило 1 виводить каузальне ребро. Це правило є коректним засобом виявлення причинних зв'язків. Але для того, щоб правило орієнтації ребер 1 спрацювало, має виконуватися відповідна умовна незалежність. А для цього треба, щоб алгоритм «дістався» до відповідного зв'язку з найбільшим лагом, і щоб не було прихованого конфаундера. Якщо жодного непустого сепаратора не знайдено, то тоді не буде виведено жодного каузального зв'язку, і всі зв'язки залишаться у невизначеному статусі (в формі ребра YX → ). Висновки Динамічні каузальні моделі є потужним засобом аналізу й дослідження різноманітних процесів та об'єктів і забезпечує відображення таких рис, як швидкість змін, періодичність, лаг післядії, зворотні зв'язки тощо. Серед різноманітних типів динамічних процесів (які включають, зокрема, рекурентні процеси, «запрограмовані» процеси, потоки стохастичних подій, лічильні процеси і так далі) виділено векторні авторегресійні процеси. (Відомо, як для них можна виводити каузальні моделі.) Вимоги до архітектури темпоральних даних, способів та частоти їх збору диктуються характером динамічного процесу. Частота вимірювання даних має критичне значення для адекватності виведеної моделі і визначається тривалістю елементарних впливів між компонентами векторного процесу. Для виведення динамічним моделей з даних важливу роль відіграють припущення стаціонарності та регулярності структури. Особливостями виведення динамічних каузальних моделей є врахування темпорального порядку змінних та проблеми, пов'язані з невідомим лагом післядії та існуванням прихованих автокорельованих часових рядів. Проведено порівняльний аналіз критерію каузальності за Грейнджером та правил орієнтації ребер в апараті каузальних мереж з точки зору їх спроможності виявляти каузальні відношення. Концепція каузальності за Грейнджером в реальних умовах неповноти інформації непридатна для виявлення каузальних відношень в даних. За критерієм Грейнджера, в набір предикторів для прогнозу наслідку Y будуть включені всі змінні, корисні для покращення пасивного прогнозу. Взагалі, коректність критерію залежить від формату керування. Оскільки деякі справжні причини X для наслідку Y є недоступними, то корисними (для певних форматів втручання в об’єкт) можуть бути не-причини Z , які передають «незамінну» (в даному контексті) інформацію для прогнозу наслідку Y . (Зокрема, це змінні, пов'язані будь-яким ребром з Y , які йдуть у часі раніше Y .) Коректним засобом виявлення каузальних відношень в даних є правило орієнтації ребер 1 (розроблене в апараті каузальних мереж). Але це правило результативне тільки за певних умов (каузальне ребро не знаходиться під дією прихованого конфаундери і не оточене повно зв'язаною структурою). Бібліографія 1. Handbook of Big Data. P. Bühlmann, P. Drineas, M. Kane, M. van der Laan (Eds.). Boca Raton, FL.: CRC Press. Taylor & Francis Group, 2016. 452p. 2. Балабанов О.С. Задачі та методи аналізу великих даних (огляд). (Оновлено) Jan 2020. – [Electronic resource] URL: https://www.researchgate.net/publication/338714383_Tasks_and_methods_of_Big_Data_analysis_a_survey_revised. ). Висновки Динамічні каузальні моделі є потужним засобом аналізу й дослідження різноманітних процесів та об’єктів і забезпечує відображення таких рис, як швидкість змін, періодичність, лаг післядії, зворотні зв’язки тощо. Серед різноманітних типів динамічних процесів (які включають, зокрема, рекурентні процеси, «запро- грамовані» процеси, потоки стохастичних подій, лічильні процеси і так далі) виділено векторні авторегресійні процеси. (Відомо, як для них можна виводити каузальні моделі.) Вимоги до архітектури темпоральних даних, способів та частоти їх збору диктуються характером динамічного процесу. Частота вимірювання даних має критичне значення для адекватності виведеної моделі і визначається тривалістю елементарних впливів між 194 Моделі і засоби систем баз даних та знань компонентами векторного процесу. Для виведення динамічним моделей з даних важливу роль відіграють при- пущення стаціонарності та регулярності структури. Особливостями виведення динамічних каузальних моделей є врахування темпорального порядку змінних та проблеми, пов’язані з невідомим лагом післядії та існуванням прихованих автокорельованих часових рядів. Проведено порівняльний аналіз критерію каузальності за Грейнджером та правил орієнтації ребер в апараті каузальних мереж з точки зору їх спроможності виявляти каузальні відношення. Концепція каузальнос- ті за Грейнджером в реальних умовах неповноти інформації непридатна для виявлення каузальних відношень в даних. За критерієм Грейнджера, в набір предикторів для прогнозу наслідку Y будуть включені всі змінні, корисні для покращення пасивного прогнозу. Взагалі, коректність критерію залежить від формату керування. Оскільки деякі справжні причини X для наслідку Y є недоступними, то корисними (для певних форматів втру- чання в об’єкт) можуть бути не-причини Z, які передають «незамінну» (в даному контексті) інформацію для прогнозу наслідку Y. (Зокрема, це змінні, пов’язані будь-яким ребром з Y, які йдуть у часі раніше Y.) Коректним засобом виявлення каузальних відношень в даних є правило орієнтації ребер Моделі і засоби систем баз даних та знань впливають на цільові змінні, не припускаються). В реальних ситуаціях доводиться застосовувати критерій Грейнджера в сурогатному режимі, тобто в умовах доступності лише неповної інформації t . Порівняємо можливості цих двох підходів. Спочатку відзначимо другорядну особливість, що відрізняє «причину» (за К. Грейнджером) від «причини» в апараті каузальних мереж. В каузальній мережі змінна X вважається причиною для Y , якщо є строго орієнтований шлях від X до Y . Тобто в перелік причин включено також і непрямі (опосередковані) причини. Натомість за К. Грейнджером непрямі причини X будуть визнані не-причинами, якщо доступний достатній набір посередників, через які здійснюється вплив X на Y . Суттєвим є те, що сурогатний критерій К. Грейнджера може призводити до систематичних помилок у визначенні каузальності. Можна описати роботу критерія К. Грейнджера так: формується набір предикторів 1−t , який мінімізує помилку прогнозу змінної tY , а потім з набору 1−t видаляються всі «надлишкові» предиктори. Виключення надлишкових предикторів не погіршує прогноз. Всі предиктори, що не були видалені як надлишкові, визнаються «причинами» для tY за Грейнджером. Легко бачити, якщо, припустимо, для ktX − та tY алгоритм виведення моделі не знайшов сепаратора, то ktX − буде визнана причиною для tY за Грейнджером. Отже, критерій К. Грейнджера включає в перелік «причин» для tY всі змінні, які поєднані з tY ребром і які йдуть у часі раніше за tY . Зокрема, якщо є ребро tkt YZ − , то змінна ktZ − також буде визнана причиною для tY , що є помилкою. Не-причина може бути необхідною для покращення прогнозу, бо несе «незамінну» інформацію в умовах недоступності справжніх причин. Наприклад, якщо маємо генеративну модель, показану на рис. 4,б, то, згідно Грейнджеру, причинами змінної X будуть визнані всі минулі значення цієї змінної. Більш того, неадекватність критерія Грейнджера простягається ще далі. В певних ситуаціях цей критерій може включити в набір «причин» для tY змінну, яка є безумовно незалежна від tY . Так станеться, якщо в моделі є ребро tkt YZ − та ребро ltkt QZ −−  . Це може здатися парадоксальним, але включення змінної ltQ − в набір предикторів зменшує помилку прогнозу змінної tY (за умови, що на змінну ktZ − не здійснюється втручання). Отже, в реалістичних умовах критерій К. Грейнджера є некоректним для задачі виявлення причин. Звернемося до правил орієнтації ребер в методах виведення каузальних мереж. Як показано в [7], якщо можливі конфаундери, то серед всіх відомих правил тільки правило 1 виводить каузальне ребро. Це правило є коректним засобом виявлення причинних зв'язків. Але для того, щоб правило орієнтації ребер 1 спрацювало, має виконуватися відповідна умовна незалежність. А для цього треба, щоб алгоритм «дістався» до відповідного зв'язку з найбільшим лагом, і щоб не було прихованого конфаундера. Якщо жодного непустого сепаратора не знайдено, то тоді не буде виведено жодного каузального зв'язку, і всі зв'язки залишаться у невизначеному статусі (в формі ребра YX → ). Висновки Динамічні каузальні моделі є потужним засобом аналізу й дослідження різноманітних процесів та об'єктів і забезпечує відображення таких рис, як швидкість змін, періодичність, лаг післядії, зворотні зв'язки тощо. Серед різноманітних типів динамічних процесів (які включають, зокрема, рекурентні процеси, «запрограмовані» процеси, потоки стохастичних подій, лічильні процеси і так далі) виділено векторні авторегресійні процеси. (Відомо, як для них можна виводити каузальні моделі.) Вимоги до архітектури темпоральних даних, способів та частоти їх збору диктуються характером динамічного процесу. Частота вимірювання даних має критичне значення для адекватності виведеної моделі і визначається тривалістю елементарних впливів між компонентами векторного процесу. Для виведення динамічним моделей з даних важливу роль відіграють припущення стаціонарності та регулярності структури. Особливостями виведення динамічних каузальних моделей є врахування темпорального порядку змінних та проблеми, пов'язані з невідомим лагом післядії та існуванням прихованих автокорельованих часових рядів. Проведено порівняльний аналіз критерію каузальності за Грейнджером та правил орієнтації ребер в апараті каузальних мереж з точки зору їх спроможності виявляти каузальні відношення. Концепція каузальності за Грейнджером в реальних умовах неповноти інформації непридатна для виявлення каузальних відношень в даних. За критерієм Грейнджера, в набір предикторів для прогнозу наслідку Y будуть включені всі змінні, корисні для покращення пасивного прогнозу. Взагалі, коректність критерію залежить від формату керування. Оскільки деякі справжні причини X для наслідку Y є недоступними, то корисними (для певних форматів втручання в об’єкт) можуть бути не-причини Z , які передають «незамінну» (в даному контексті) інформацію для прогнозу наслідку Y . (Зокрема, це змінні, пов'язані будь-яким ребром з Y , які йдуть у часі раніше Y .) Коректним засобом виявлення каузальних відношень в даних є правило орієнтації ребер 1 (розроблене в апараті каузальних мереж). Але це правило результативне тільки за певних умов (каузальне ребро не знаходиться під дією прихованого конфаундери і не оточене повно зв'язаною структурою). Бібліографія 1. Handbook of Big Data. P. Bühlmann, P. Drineas, M. Kane, M. van der Laan (Eds.). Boca Raton, FL.: CRC Press. Taylor & Francis Group, 2016. 452p. 2. Балабанов О.С. Задачі та методи аналізу великих даних (огляд). (Оновлено) Jan 2020. – [Electronic resource] URL: https://www.researchgate.net/publication/338714383_Tasks_and_methods_of_Big_Data_analysis_a_survey_revised. (розроблене в апараті каузаль- них мереж). Але це правило результативне тільки за певних умов (каузальне ребро не знаходиться під дією прихованого конфаундери і не оточене повно зв’язаною структурою). Бібліографія 1. Handbook of Big Data. P. Bühlmann, P. Drineas, M. Kane, M. van der Laan (Eds.). Boca Raton, FL.: CRC Press. Taylor & Francis Group, 2016. 452p. 2. Балабанов О.С. Задачі та методи аналізу великих даних (огляд). (Оновлено) Jan 2020. – [Electronic resource] URL: https://www.researchgate. net/publication/338714383_Tasks_and_methods_of_Big_Data_analysis_a_survey_revised. 3. Pearl J. Causality: models, reasoning, and inference. Cambridge: Cambridge Univ. Press, 2000. 526 p. 4. Spirtes P., Glymour C. and Scheines R. Causation, prediction and search. New York: MIT Press, 2001. 543 p. 5. Spirtes P., Zhang K. Causal discovery and inference: concepts and recent methodological advances. Applied Informatics. (2016). V.3: 3. 28 p. 6. Zhang J. On the completeness of orientation rules for causal discovery in the presence of latent confounders and selection bias. Artificial Intelligence. (2008). V. 172. P. 1873–1896. 7. Балабанов О.С. Логіка каузального виведення з даних в умовах прихованих спільних причин. Кибернетика и системный анализ. 2022. № 2. С. 10–28. 8. Aalen O.O., Borgan O., Gjessing H.K. Survival and Event History Analysis. A Process Point of View. Springer, New York, 2008. 539 p. 9. Lütkepohl H. New introduction to multiple time series analysis. Springer-Verlag, 2005. 764 p 10. Shumway R.H., Stoffer D.S. Time series analysis and its applications with R examples. Springer, 2011, 596 p. 11. Kulkarni V.G. Introduction to modeling and analysis of stochastic systems. (2nd Ed.) Springer, 2011. 313 p. 12. Schweder T. Composable Markov processes. J. Appl. Probab. (1970). V. 7. P. 400–410. 13. Reconstructing regime-dependent causal relationship from observational time series / E. Saggioro, J. de Wiljes, M. Kretschmer, J. Runge – Chaos. (2020). V. 30 (n.11). 113115. –22p. ISSN 1089-7682. 14. Gong M., Zhang K., Schölkopf B., Tao D. and Geiger P. Discovering temporal causal relations from subsampled data. Proc. of the 32nd Intern. Conf. on Machine Learning, 2015. P. 1898–1906. 15. Plis S., Danks D., Freeman C., and Calhoun V. Rate-agnostic (causal) structure learning. In: Advances in Neural Information Processing Systems. 2015. P. 3303–3311. 16. Granger C.V.J. Testing for causality. A personal viewpoint. Journal of Economic Dynamics and Control. (1980). V. 2. Issue 1, P. 329–352. 17. Granger C.V.J. Investigating causal relations by econometric models and cross-spectral methods. Econometrica. (1969). V. 37. P. 424–459. 18. Swanson N.R. and Granger C.W.J. Impulse response functions based on a causal approach to residual orthogonalization in vector autoregressions. J. of the American Statistical Association. (1997). V. 92. N 437. P. 357–367. 19. Malinsky D. and Spirtes P. Learning the structure of a nonstationary vector autoregression. The 22nd Intern. Conf. on Artificial Intelligence and Statistics. – Proc. of Machine Learning Research, PMLR, 2019. V. 89. P. 2986–2994. 20. Entner D. and Hoyer P.O. On causal discovery from time series data using FCI. Proc. of the 5th European Workshop on Probabilistic graphical models. 2010, Helsinki, Finland. P. 121–128. 21. Runge J. Causal network reconstruction from timeseries: From theoretical assumptions to practical estimation. Chaos. (2018). V. 28, paper 075310. 20 p. 22. Malinsky D. and Spirtes P. Causal structure learning from multivariate time series in settings with unmeasured confounding. Proc. of 2018 ACM SIGKDD Workshop on Causal Discovery, 2018, London, UK. – PMLR, V. 92. P. 23–47. References 1. Handbook of Big Data. P. Bühlmann, P. Drineas, M. Kane, M. van der Laan (Eds.). Boca Raton, FL.: CRC Press. Taylor & Francis Group, 2016. 452p. 2. Balabanov O.S. (2020) Tasks and methods of Big Data analysis (a survey). (Revised). (preprint at ResearchGate) DOI: 10.13140/ RG.2.2.18586.39367 [in Ukrainian] 3. Pearl J. Causality: models, reasoning, and inference. Cambridge: Cambridge Univ. Press, 2000. 526 p. 4. Spirtes P., Glymour C. and Scheines R. Causation, prediction and search. New York: MIT Press, 2001. 543 p. 5. Spirtes P., Zhang K. (2016) Causal discovery and inference: concepts and recent methodological advances. Applied Informatics. V.3: 3. 28 p. 6. Zhang J. (2008) On the completeness of orientation rules for causal discovery in the presence of latent confounders and selection bias. Artificial Intelligence. V. 172. P. 1873–1896. 7. Balabanov O.S. (2022). Logic of causal inference from data under presence of latent confounders. Cybernetics and Systems Analysis. V. 58. No. 2, P. 171–185. DOI 10.1007/s10559-022-00448-z 8. Aalen O.O., Borgan O., Gjessing H.K. Survival and Event History Analysis. A Process Point of View. Springer, New York, 2008, 539 p. 9. Lütkepohl H. New introduction to multiple time series analysis. Springer-Verlag, 2005, 764 p. 10. Shumway R.H., Stoffer D.S. Time series analysis and its applications with R examples. Springer, 2011, 596 p. 11. Kulkarni V.G. Introduction to modeling and analysis of stochastic systems (2nd Ed.) Springer 2011. 313 p. 12. Schweder T. (1970) Composable Markov processes. J. Appl. Probab. V. 7. P. 400–410. 13. Reconstructing regime-dependent causal relationship from observational time series / E. Saggioro, J. de Wiljes, M. Kretschmer, J. Runge – Chaos. (2020). V. 30 (n.11). 113115. –22p. ISSN 1089-7682. 14. Gong M., Zhang K., Schölkopf B., Tao D. and Geiger P. (2015) Discovering temporal causal relations from subsampled data. Proc. of the 32nd Intern. Conf. on Machine Learning, P. 1898–1906. 195 Моделі і засоби систем баз даних та знань 15. Plis S., Danks D., Freeman C., and Calhoun V. Rate-agnostic (causal) structure learning. In: Advances in Neural Information Processing Systems. 2015. P. 3303–3311. 16. Granger C.V.J. (1980) Testing for causality. A personal viewpoint. Journal of Economic Dynamics and Control. V. 2. issue 1, P. 329–352. 17. Granger C.V.J. (1969) Investigating causal relations by econometric models and cross-spectral methods. Econometrica. V. 37. P. 424–459. 18. Swanson N.R. and Granger C.W.J. (1997) Impulse response functions based on a causal approach to residual orthogonalization in vector autoregressions. J. of the American Statistical Association. V. 92. N 437. P. 357–367. 19. Malinsky D. and Spirtes P. (2019) Learning the structure of a nonstationary vector autoregression. The 22nd Intern. Conf. on Artificial Intelligence and Statistics. – Proc. of Machine Learning Research, PMLR. V. 89. P. 2986–2994. 20. Entner D. and Hoyer P.O. (2010) On causal discovery from time series data using FCI. Proc. of the 5th European Workshop on Probabilistic graphical models. Helsinki, Finland. P. 121–128. 21. Runge J. (2018) Causal network reconstruction from timeseries: From theoretical assumptions to practical estimation. Chaos. V. 28, paper 075310. 20 p. 22. Malinsky D. and Spirtes P. (2018) Causal structure learning from multivariate time series in settings with unmeasured confounding. Proc. of 2018 ACM SIGKDD Workshop on Causal Discovery, London, UK. – PMLR, V. 92. P. 23–47. Одержано 19.08.2022 Про автора: Балабанов Олександр Степанович, доктор фіз.-мат. наук, провідний науковий співробітник. Кількість наукових публікації в українських виданнях – 62. Кількість наукових публікації в іноземних індексованих виданнях – 13. Індекс Хірша – 7. http://orcid.org/0000-0001-9141-9074 Місце роботи автора: Інститут програмних систем НАН України, 03187, м. Київ-187, проспект Академіка Глушкова, 40 Тел.: (38)(044) 526-34-20 e-mail: bas@isofts.kiev.ua Прізвища та ініціали авторів і назва доповіді англійською мовою: Balabanov O. S. From temporal data to dynamic causal models Прізвища та ініціали авторів і назва доповіді українською мовою: Балабанов О.С. Від темпоральних даних до динамічних каузальних моделей Контакти для редактора: м. тел. 095-5405228