Прикладний статистичний аналіз високочастотних випадкових процесів у дискретному часі

Досліджується спектральний аналіз високочастотних стаціонарних та нестаціонарних випадкових послідовностей на основі перевірки відповідних статистичних гіпотез в частотній області. Здійснено перевірки низки статистичних гіпотез про приналежність спостережуваної випадкової реалізації марковській гаус...

Повний опис

Збережено в:
Бібліографічні деталі
Опубліковано в: :Системні дослідження та інформаційні технології
Дата:2002
Автор: Андрєєв, М.В.
Формат: Стаття
Мова:Українська
Опубліковано: Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України 2002
Теми:
Онлайн доступ:https://nasplib.isofts.kiev.ua/handle/123456789/50245
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Прикладний статистичний аналіз високочастотних випадкових процесів у дискретному часі / М.В. Андрєєв // Систем. дослідж. та інформ. технології. — 2002. — № 4. — С. 61-79. — Бібліогр.: 3 назв. — укр.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1859676836825399296
author Андрєєв, М.В.
author_facet Андрєєв, М.В.
citation_txt Прикладний статистичний аналіз високочастотних випадкових процесів у дискретному часі / М.В. Андрєєв // Систем. дослідж. та інформ. технології. — 2002. — № 4. — С. 61-79. — Бібліогр.: 3 назв. — укр.
collection DSpace DC
container_title Системні дослідження та інформаційні технології
description Досліджується спектральний аналіз високочастотних стаціонарних та нестаціонарних випадкових послідовностей на основі перевірки відповідних статистичних гіпотез в частотній області. Здійснено перевірки низки статистичних гіпотез про приналежність спостережуваної випадкової реалізації марковській гауссовій послідовності. Исследуется спектральный анализ высокочастотных стационарных и нестационарных случайных последовательностей на основе проверки соответствующих статистических гипотез в частотной области. A spectral analysis of high-frequency stationary and nonstationary stochastic sequences, made on the basis of solution of problems for testing corresponding statistical hypotheses in a frequency domain is investgated.
first_indexed 2025-11-30T16:24:25Z
format Article
fulltext © М.В. Андрєєв, 2002 Системні дослідження та інформаційні технології, 2002, 4 61 УДК 519.24 ПРИКЛАДНИЙ СТАТИСТИЧНИЙ АНАЛІЗ ВИСОКОЧАСТОТНИХ ВИПАДКОВИХ ПРОЦЕСІВ У ДИСКРЕТНОМУ ЧАСІ М.В. АНДРЄЄВ Досліджується спектральний аналіз високочастотних стаціонарних та нестаціонарних випадкових послідовностей на основі перевірки відповідних статистичних гіпотез у частотній області. ВСТУП Високочастотні випадкові процеси можна розглядати як математичні моделі різного роду випадкових явищ, які часто зустрічаються у різних сферах людської діяльності. Такими процесами описуються, наприклад, сигнали, що отримують внаслідок вібраційних випробувань у техніці [1], процеси ціноутворення фінансових активів — акцій та інших цінних паперів на фон- довому ринку [2] тощо. У практиці застосувань зазначених моделей, відповідно процесів, мож- на спостерігати єдину, для кожного свою реалізацію, що обумовлює статистич- ну постановку задачі їх оцінки та оптимізаційну задачу адаптивного керування відповідними випадковими моделями та процесами. У статті узагальнюються результати практичної діяльності автора сто- совно статистичного аналізу різних типів стаціонарних і нестаціонарних ви- сокочастотних випадкових послідовностей, що зустрічаються при дослідженні систем автоматичного керування технічними, біологічними, економічними, соціальними та іншими системами, а також задач, пов’язаних з конструктивним заданням та експериментальним дослідженням випадкових процесів у дискретному часі. I. АДАПТИВНІ АЛГОРИТМИ ОЦІНКИ СПЕКТРАЛЬНОЇ ГУСТИНИ ВИСОКОЧАСТОТНИХ ВИПАДКОВИХ ПРОЦЕСІВ Розглядається задача адаптивного вибору часових інтервалів усереднення для оцінки спектральної густини стаціонарних та нестаціонарних висо- кочастотних випадкових процесів. Від величини інтервалу усереднення за- лежить довірчий інтервал для оцінки спектральної густини. Математична формалізація задачі та методи дослідження потужності критеріїв еквівалентності спектрів ґрунтуються на основі математичних моделей оцінки спектральної густини. Вибір інтервалів усереднення ґрунтується на основі лінійних поро- гових критеріїв перевірки еквівалентності спектрів і відповідно цьому вибір залежить від коригування статистичних даних, а тому є адаптивним. М.В. Андрєєв ISSN 1681–6048 System Research & Information Technologies, 2002, 4 62 При постановці статистичної задачі та її розв’язанні виникає необхідність у висвітленні таких основних питань: • аналіз основних особливостей отримання оцінок спектральної густини стаціонарних і нестаціонарних високочастотних випадкових процесів; • аналіз деяких типових моделей сигналів, що зустрічаються в техніці та фінансах; • дослідження критеріїв класифікації процесів за типами нестаціонарності, що є основою для адаптивного вибору інтервалів усереднення спектральної густини; • дослідження адаптивних алгоритмів оцінювання спектральної густини на основі оптимізації потужності критерія еквівалентності спектрів. 1.1. Постановка задачі оцінки спектральної густини високочастотних випадкових процесів Спектральна густина є перетворенням Фур’є кореляційної функції випадкового процесу; вона показує, як дисперсія випадкового процесу розподілена за частотою. Обмежимося відомостями про оцінки спектральної густини на основі дискретного перетворення Фур’є. Вибірковий спектр сигналу )(tx на відрізку 22 TtT ≤≤− визначається як ( ) ∆<≤∆−∆⋅− ∆ = ∑ − −= 2 1 2 1,2exp)( 21 ftfix N fc n nt txx π , (1.1) де f — частота; ∆ — часовий інтервал дискретизації )(tx , nN 2= — чис- ло вибіркових значень )(tx : ∆=∆−∆∆−== NTnnttxxt ,)1(,...,,0,...,),( . (1.2) Вибірковий спектр )( fcxx в деякій точці f розглядається як значення випадкової величини )( fC XX , що є оцінкою спектральної густини. Спектральна густина )( fXXΓ визначається як { } ,2 1 2 1,)(lim)( ∆<≤∆−=Γ ∞→ ffCMf XXNXX (1.3) що математичне сподівання )( fMCXX визначається згідно з [3]: { } dggf Tg TgTfCM XXXX )(sin)( 2 −Γ⋅⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ = ∫ ∞ ∞− π π . (1.4) Вираз (1.4) показує, що усереднення оцінки )( fC XX відповідає начебто прогляданню теоретичного спектра через спектральне вікно )( fw , що ви- значається як 2 sin )( ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ = g g T T Tfw π π . (1.5) Задачі прикладного статистичного аналізу випадкових процесів у дискретному часі Системні дослідження та інформаційні технології, 2002, 4 63 Оскільки )( fw в (1.5) при великих T веде себе як δ -функція Дірака, то з (1.4) випливає, що { } )()(lim ffCM XXXX T Γ= ∞→ , (1.6) тобто оцінка )( fC XX є асимптотично незміщеною оцінкою )( fXXΓ . Для скі- нченного T із (1.4) випливає, що )( fC XX у загальному випадку є зміщеною оцінкою )( fXXΓ , і це зміщення визначається як { } )()()( ffCMfB XXXX Γ−= . (1.7) Розподіл оцінки )( fC XX наближено апроксимується 2χ -розподілом таким чином, що величина )()(2 ffC XXXX Γ розподілена майже як 2χ з двома ступенями вільності, причому оцінки для частот, кратних T/1 , прак- тично некорельовані. Відповідно дисперсія оцінки )( fC XX оцінюється як { } )()( 2 ffCD XXXX Γ≅ . (1.8) Для зменшення дисперсії оцінки спектра використовують згладжування ви- біркового спектра )( fC XX за допомогою вибору спектрального вікна )( fw або часового вікна при оцінці спектра, вираженого через оцінку кореляцій- ної функції. Один з підходів до вибору спектрального вікна передбачає мінімізацію середньоквадратичної похибки )(2 fε , що визначається формулою { } )()()( 22 fBfCDf XX +=ε , (1.9) де )( fC XX — згладжена оцінка спектра, дисперсія якої має вигляд { } T IffCD XXXX )()( 2Γ≅ , ∫ ∞ ∞− = dggwI )(2 . (1.10) Із формули (1.10), з урахуванням (1.8), випливає, що відношення TI дорів- нює відносному зменшенню дисперсії, обумовленому згладжуванням. Розподіл величини )( fC XX за фіксованого f можна апроксимувати за допомогою 2 vaχ -розподілу, де константи a і v обчислюються відповідно як I T2 =ν , (1.11) ν )( f a XXΓ = , (1.12) яке еквівалентно тому, що випадкова величина )()( ffC XXXX Γν має 2χ -розподіл з ν ступенями вільності. Ширина спектрального вікна визначається як М.В. Андрєєв ISSN 1681–6048 System Research & Information Technologies, 2002, 4 64 ∫ ∞ ∞− == dggwIb )(11 , (1.13) причому виконується рівність { } const)()( 2 =Γ= fbfCD XXXX . (1.14) Процедура згладжування Бартлетта. Весь інтервал T розбивається на k інтервалів )( TkTT nn =× . Для кожного nT обчислюється вибірковий спектр, і як оцінку спектра на частоті f приймають середнє значення k вибір- кових спектрів на частоті f: ∑ = = k i i XXXX fC k fC 1 )( )(1)( , (1.15) де )()( fC i XX - оцінка спектра на і-му інтервалі, ki ,1= . Спектральне вікно Бартлетта визначається як 2 sin )( ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ = n n n B Tf Tf Tfw π π , (1.16) що відповідає зменшенню дисперсії згладженої оцінки спектра T T T I n B 667,0= , (1.17) Bν — число ступенів вільності визначається як n B T T3=ν . (1.18) Таким чином, з (1.17) випливає, що при ∞→T і const=nT дисперсія згладженої оцінки (1.15) необмежено зменшується за відповідного збільшення кількості інтервалів. На практиці є труднощі з вибором інтервалу розбиття nT , оскільки ви- никає необхідність, щоб процес )(tX на інтервалі nTkT ×= був стаціо- нарним (а також ергодичним). 1.2. Спектральна структура нестаціонарного процесу Спектральна густина тут визначається як подвійне перетворення Фур’є не- стаціонарної кореляційної функції ),( 21 ttRXX , тобто ∫∫ ∞ ∞− − ∞ ∞− = 21 )(2 2121 2211),(),( dtdtettRffS tftfi XXX π , (1.19) де ),( 21 ffS XX — подвійна за частотою, а кореляційна функція має вигляд { })(),(),( 2121 tXtXMttRXX = . (1.20) Задачі прикладного статистичного аналізу випадкових процесів у дискретному часі Системні дослідження та інформаційні технології, 2002, 4 65 Існує другий підхід до вивчення спектральної структури нестаціонарних процесів, що заключається у виконанні перетворення Фур’є за аргументом τ нестаціонарної автокореляційної функції ),( tRX τ , заданої у вигляді ⎭ ⎬ ⎫ ⎩ ⎨ ⎧ ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ +⎟ ⎠ ⎞ ⎜ ⎝ ⎛ −= 22 ),( τττ tXtXMtRX . (1.21) Такий підхід призводить до визначення частотно-часової спектральної густини ∫ ∞ ∞− −= ττϕ τπ detRtf if XX 2),(),( . (1.22) Функція ),( tfXϕ описує розподіл середнього значення квадрата { })(2 tXM на площині ),( tf , що забезпечує цілком прийнятну фізичну ін- терпретацію цієї функції, тобто інтегрування ),( tfXϕ за всіма f дає середнє значення квадрата процесу в момент t. Як ),( 21 ffS x , так і ),( tfXϕ не можуть бути отримані усередненням за часом окремих реалізацій )(tx як у випадку випадкових стаціонарних про- цесів. Однак існує виняток для локально стаціонарних процесів. Зокрема, якщо процес має сепарабельну нестаціонарну кореляційну функцію, що визнача- ється як )()(),( 21 ττ RtRTR ⋅= , (1.23) тоді ),( tfXϕ можна подати у вигляді { } )()(),( 2 fStXMtf H XX =ϕ , (1.24) а при центруванні процесу )(tX , тобто при { } 0)( =tXM , подаємо частотно- часову спектральну густину випадкового процесу, нестаціонарного за дисперсією { } )()(),( fStXDtf H XX =ϕ , (1.25) де )( fS H X — нормована спектральна густина, тобто 1)( =∫ ∞ ∞− dffS H X . (1.26) Якщо затухання )(2 τR в (1.23) проходить досить швидко порівняно зі зміною )(1 tR , то в цьому випадку спектральну густину можна оцінити за окремою реалізацією, оцінюючи спочатку функцію )}({ 2 tXM або )}({ tXD за реалізацією на короткому інтервалі часу, що відповідає часу кореляції )(2 τR , а відтак оцінити функцію )( fS H X усередненням реалізації )(tx , як і у випадку стаціонарного процесу. М.В. Андрєєв ISSN 1681–6048 System Research & Information Technologies, 2002, 4 66 1.3. Про моделі сигналів, отриманих при плануванні експерименту Для аналізу і розрахунку параметрів алгоритмів оцінки спектральної густи- ни (СГ) розглядаються наближені моделі сигналів, отримані при плануванні експерименту. Зручно скористатися при цьому співвідношенням між СГ вхідного сигналу )( fS x та СГ вихідного сигналу )( fS y лінійної системи з передаточною функцією )( fH : )()()( fSfHfS xy = . (1.27) Моделі нестаціонарного вихідного сигналу )(ty , що поступає на стати- стичну обробку, можна визначити заданням змінної в часі )( fH або )( fS x , а відтак розбити на ділянки, де має місце стаціонарність. Друга модель характеризується нестаціонарністю за дисперсією. Визначення 1. Допустимий інтервал gT випадкового процесу )(tX ви- значається мінімальною тривалістю реалізації )(tx , за якої зміщення оцінок вибіркового спектра не перевищує за абсолютною величиною заданої вели- чини gε . У загальному випадку gε є функцією як f, так і )( fXXΓ . Завдяки використанню (1.4) та (1.6) це визначення формалізується: }{min TTg = (1.28) за умови gXXXX g g fdggf T T T ε π π ≤Γ−−Γ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ ∫ ∞ ∞− )()( sin 2 . Визначення 2. Процес називається слабко нестаціонарним, якщо він є нестаціонарним процесом, для якого існує допустимий інтервал. Визначення 3. Нестаціонарність дисперсії називаються слабкою, якщо відхилення дисперсії від її середнього значення на допустимому інтервалі не перевищує заданої величини gε , тобто gg Tt t xx TttttDdD g +≤≤≤−∫ + 00,)()( 0 0 εττ . (1.29) Для сигналів, що охоплюються цими моделями, досить просто отримати оцінки спектральної густини за допомогою процедури усереднення оцінок нормованих спектрів, отриманих на допустимих інтервалах. Перевірка гіпотези про те, що конкретна реалізація випадкового процесу належить до моделі стаціонарного процесу або нестаціонарного за дисперсією зводиться до розв’язання двох задач: 1. Перевірка гіпотези про рівність дисперсій, отриманих на допустимих інтервалах. 2. Перевірка гіпотези про еквівалентність нормованих спектрів, отриманих на допустимих інтервалах. Задачі прикладного статистичного аналізу випадкових процесів у дискретному часі Системні дослідження та інформаційні технології, 2002, 4 67 Із задачі 2 випливає стаціонарність або нестаціонарність за дисперсією, якщо до того ж приймається гіпотеза про рівність дисперсій, то звідси ви- пливає стаціонарність на всьому інтервалі. 1.4. Загальна характеристика адаптивного алгоритму вибору інтервалів усереднення Тут використовується ідея згладжування (усереднення) за допустимими інтер- валами. Як відомо, відносне зменшення середньоквадратичного оцінки за рахунок усереднення некорельованих оцінок характеризується величиною m 1æ = , (1.30) де m — кількість оцінок, що усереднюються. При використанні статистичних критеріїв для вибору кількості оцінок m величина m , а отже і æ будуть випадковими величинами. Величина m визначається числом послідовних ділянок, які за критерієм еквівалентні. Рівень значущості критерію α визначається як ймовірність помилки першо- го роду, а тому для кількості еквівалентних ділянок можна знайти функцію розподілу випадкової величини m { } µαµµ )1(1)( −−=<= mPF , (1.31) оскільки з урахуванням ергодичної теорії з надійністю )1( α− можна гово- рити про знаходження випадкового процесу в довірчому інтервалі, побудо- ваному за його реалізацією. Очевидно, що за такого підходу середнє значення довірчого інтервалу має співпадати з довжиною допустимого ін- тервалу. Із формули (1.31), беручи до уваги (1.30), функція розподілу випадкової величини æ має вигляд { } 2 1 )1(1æ)( kkPkF α−−=<= . (1.32) 2. ВИБІР ТА АНАЛІЗ КРИТЕРІЇВ ПЕРЕВІРКИ ЕКВІВАЛЕНТНОСТІ СПЕКТРІВ При виборі та аналізі критеріїв перевірки статистичних гіпотез часто вико- ристовують припущення щодо гауссовості (нормальності) розподілу статис- тичних даних. Однак виникає питання, наскільки ймовірно, що це припущення призводить до помилок. Статистична процедура, нечутлива до відхилень від припущень, що лежать в її основі, називається стійкою або робастною. Виявляється, що критерії стосовно генеральних середніх (тобто t -критерій Стьюдента для середнього значення нормального розподілу та різниці середніх двох нормальних розподілів з однаковими дисперсіями) достатньо нечутливі до відхилень від нормальності, а критерії стосовно дис- персій (тобто 2υ -критерій для дисперсії нормального розподілу), 2υ -критерій для відношення дисперсій двох нормальних розподілів) дуже чутливі до відхилень, тобто вони нестійкі або неробастні. М.В. Андрєєв ISSN 1681–6048 System Research & Information Technologies, 2002, 4 68 На практиці часто дуже важко обґрунтувати рішення про те, чи будуть стандартні процедури з деяким наближенням справедливими, чи призведуть до невірного результату. У тих випадках, коли порушуються або не викону- ються припущення нормальності, розглядаються два інших підходи до при- йняття статистичних рішень. Перший підхід полягає в тому, щоб знайти перетворення, за якого роз- поділ спостережень став би більш близьким до нормального з тим, щоб до перетворення спостережень можна було застосувати нормальну теорію. Другий підхід є більш радикальним. Замість того, щоб дотримуватися стандартних методів нормальної теорії (через те, що вони є стійкими і з де- яким наближенням їх можна застосовувати при відхиленні від нормальності, або через те, що їх можна застосувати з деяким наближенням після пере- творення спостережень), стараються знайти статистичні процедури, які б могли бути застосовані в широкому класі розподілів. Такі процедури нази- ваються вільними від розподілів. Для оцінки еквівалентності спектрів скористаємось саме цими підходами. 2.1. Вибір класу критеріїв Задачу перевірки еквівалентності спектрів можна сформулювати таким чи- ном. Задано дві послідовності оцінок спектрів { })(1 fC і { })(2 fC в точках T kf = , 2,...,2,1 Nk = з числом ступенів вільності кожної із оцінок 1ν і 2ν відповідно. Необхідно перевірити гіпотезу 0H на рівні значущості α про те, що істинні значення спектрів )(1 fΓ і )(2 fΓ ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ ∆ ≤ 2 1f цих двох послідов- ностей співпадають. Виникає питання, яку інформацію про розподіл оцінок маємо? Як за- значалося, величина )()( ffC XXXX Γν має 2χ -розподіл з ν ступенями ві- льності (1.11) і (1.12). Оскільки на практиці істинне значення спектра )( fXXΓ невідоме, то для порівняння спектрів зазвичай використовують статистику )( )( 2 12 , 21 fC fC =ννυ , (2.1) яка має розподіл відношення дисперсій ( 2v — розподіл Фішера) за умови еквівалентності спектрів =))(,( 212 Yννϕ υ ( ) ( ) ( ) ( ) 0,1 22 2 2 2 122 21 212 2 1 21 1 1 >⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ + ΓΓ ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ + Γ ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ = +− − YYY ν ν ν ν ν νν νν ν ν , (2.2) Задачі прикладного статистичного аналізу випадкових процесів у дискретному часі Системні дослідження та інформаційні технології, 2002, 4 69 0,0))(,( 212 <= YYννϕ υ , (2.3) де )(xΓ — гамма-функція. Числові характеристики цього розподілу мають вигляд )2( 2 }{ 2 2 2 > − = ν ν ν YM , ( ) ( ) ( ) )4(, 42 22 }{ 4 2 2 21 21 2 2 > −− −+ = ν νν ννν v YD . (2.4) Розподіл (2.2) значно відрізняється від нормального розподілу. Більш близьким до нормального є z -розподіл: ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ === )( )( ln 2 1ln 2 1ln 2 12 fC fC z υυ . (2.5) При ∞→1ν та ∞→2ν випадкова величина z розподілена асимпто- тично нормально з математичним сподіванням 21 21 2 νν νν − та дисперсією 21 21 2 νν νν − + . Ця апроксимація має місце для великих виборок при 301 >ν , 302 >ν . Отже, розподіл відношення спектрів близький до нормального, тому логічно перейти до дослідження статистик і критерію перевірки еквівалентності спектрів, що враховують цей розподіл. Важливим моментом у виборі критерію є простота обчислень. Широко застосовуються статистики у вигляді лінійних функцій від елементарних статистик ∑ = = E i N i ESy 1 , (2.6) де iES — елементарні статистики; EN — кількість елементарних статистик. Статистика iES , як правило, є функцією від невеликої кількості ви- хідних даних, стосовно яких перевіряється деяка гіпотеза, при цьому вважа- ється відомим розподіл iES або його перші два моменти. Значно спрощується аналіз і розрахунок критерію, якщо елементарні статистики можна вважати незалежними, оскільки легко оцінити перші два моменти розподілу сумарної статистики. За першими двома моментами з урахуванням розподілу елементарних статистик можна апроксимувати розподіл статистики y і на основі цього розподілу проводити аналіз і розрахунок критерію. За- звичай стараються, щоб елементарні статистики задовольняли умовам центральної граничної теореми для того, щоб мати можливість апроксимувати розподіл статистики (2.6) нормальним розподілом. Якщо елементарна статистика розподілена на півпрямій, то широко ви- користовується апроксимація за допомогою 2χ -розподілу, яка необхідна М.В. Андрєєв ISSN 1681–6048 System Research & Information Technologies, 2002, 4 70 для визначення допустимого інтервалу }{ 21 pp yyy ≤≤ статистики y , для якого α−=−=≤≤ 1}{ 1221 ppyyyP pp , (2.7) де 1py і 2py — квантилі вибіркового розподілу; α — рівень значущості, що задається. Оцінка квантилів для (2.7) за апроксимацією нормальним законом роз- поділу має вигляд EEpEEp NDuMNy += , (2.8) де pu — квантиль стандартного нормального розподілу; EM і ED — відповідно математичне сподівання і дисперсія статистики ES за умови справедливості гіпотези, що перевіряється. За апроксимації 2χ -розподілом можна скористатися наближеною формулою для випадку, коли ймовірнісні квантилі близькі до 0 або 1, а саме 3 2 9 2 9 21)( ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ +−≅ m u m mm ppχ , (2.9) де m — число ступенів вільності. Використовуючи (2.9), неважко отримати для квантилів такий вираз: 3 22 99 1 ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ +−= EE E p EE E EEp NM D u NM D MNy . (2.10) Як бачимо з (2.8) і (2.10), визначення допустимого інтервалу для стати- стики (2.6) не пов’язане з великими труднощами, особливо за апроксимаці- єю нормальним законом розподілу. Обмежимося лінійними статистиками вигляду (2.6) з таких міркувань. Розглянемо статистику 2 1 2 1 1 21 2 )( )( ln22 ∑ = − ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ += fN i i i fC fC nn d , (2.11) яка має 2χ -розподіл з fN ступенями вільності; 1n і 2n — числа ступенів вільності відповідних розподілів оцінок спектрів )(1 ifC і )(2 ifC . У (2.11) елементарною статистикою є 2 2 1 )( )( ln ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ = i i E fC fC S . (2.12) Функція логарифма в (2.12) асимптотично є статистикою квадрата від- ношень нормально розподілених випадкових величин. Звідси випливає аси- Задачі прикладного статистичного аналізу випадкових процесів у дискретному часі Системні дослідження та інформаційні технології, 2002, 4 71 мптотична оптимальність властивості цієї статистики. Однак розподіл (2.5) близький до нормального уже за числа ступенів вільності розподілів оцінок спектрів більшого 30. 2.2. Вибір елементарних статистик Регулярних методів, що дозволяють однозначно синтезувати елементарну статистику, оптимальну в деякому сенсі з точки зору простоти обчислень потужності отриманого критерію, наразі не існує. У зв'язку з цим розглянемо одну із методик вибору елементарних статистик, а саме: 1. На основі якісного аналізу задачі інтуїтивно вибирається деякий на- бір елементарних статистик. 2. Проводиться оцінка потужності вибраних елементарних статистик. 3. На основі оцінки потужності критеріїв з урахуванням простоти об- числень проводиться вибір елементарних статистик. Для оцінки потужності критеріїв необхідно визначити альтернативні гіпо- тези щодо розподілів спектральних густин )(1 fΓ і )(2 fΓ . Це можна здійс- нити за допомогою введення функції відношення спектрів )( fθ : )( )( )( 1 2 f f f Γ Γ =θ . (2.13) Ставиться задача перевірки нульової гіпотези 0H щодо функції )( fθ : 1const)( 0 =≡Hfθ . (2.14) Відповідно альтернативні гіпотези iH , 0≠i , можна визначити за допомогою функцій )( fiθ , відмінних від тотожної одиниці, тобто 1)()( ≡/= iHi ff θθ . (2.15) Використовуючи визначення функції )( fθ , умова незміщення для по- рогового критерію зі статистикою (2.5) означає, що ймовірність виходу ста- тистики за довірчий інтервал має не зменшуватись за будь-якої альтернативної гіпотези, тобто за будь-якої функції )( fθ , відмінної від то- тожної одиниці. Відтак виникає питання про вибір вигляду довірчого інтервала, тобто, чи буде використовуватися двосторонній або односторонній критерій. Дво- сторонній критерій доцільно використовувати тільки тоді, коли статистика критерію за альтернативних гіпотез має тенденцію як до зменшення, так і до збільшення. Враховуючи лінійність статистики (2.5), ця умова буде вико- нуватися лише тоді, коли елементарні статистики матимуть тенденцію як до збільшення, так і до зменшення за альтернативних гіпотез. Для статистики )( fθ це означає, наприклад, що при збільшенні )( fθ і елементарна статистика має тенденцію до збільшення, тобто її розподіл зміщується в напрямку більших значень, а при зменшенні )( fθ — до зменшення, тобто її розподіл зміщується в напрямку менших значень. Однак при цьому буде спостерігатися компенсація відхилень елементарних ста- М.В. Андрєєв ISSN 1681–6048 System Research & Information Technologies, 2002, 4 72 тистик за альтернативних гіпотез, що веде до зменшення потужності крите- рію і робить його зміщеним. Цей факт особливо суттєвий при перевірці еквівалентності нормованих спектрів, оскільки мають місце умови норму- вання: ∑∑ == ff fCfC 1)(,1)( 21 . (2.16) Ефект компенсації пропаде, якщо використати елементарні статистики з односторонньою тенденцією зміни за відхилень )( fθ від одиниці. На ос- нові цих статистик будуються односторонні критерії, при цьому ці статис- тики називаються також односторонніми. Для них має виконуватися умова { } { }[ ]EfE SMSM (max) min1)( ==θ . (2.17) З метою задоволення умов центральної граничної теореми умову (2.17) слід доповнити умовою { } ∞<ESD . (2.18) Перейдемо до вибору елементарних статистик. Якщо відома альтернативна гіпотеза у вигляді функції )( fθ , то можна переконатися, що статистика )( )( )( 2 12 fC fC fθυ = (2.19) наближено має 2υ -розподіл. Цим же розподілом описується і статистика )()( )( )( 2 2 1 f v fC fC f θ ξ == . (2.20) Із формули (2.20) випливає, що безпосередньо )( fξ не є односторонньою статистикою для відхилення )( fθ від одиниці. Оскільки 2υ -розподіл зо- середжений близько одиниці, то слід очікувати, що односторонніми будуть такі елементарні статистики: ∞≤≤−= MM ηξη 0|,1| , (2.21) { } ∞≤≤= XX ηξξη 0,1,max , (2.22) { } 10,1,min ≤≤= YY ηξξη . (2.23) Всі ці оцінки зміщені, тобто для них не виконується умова (2.17). Задачі прикладного статистичного аналізу випадкових процесів у дискретному часі Системні дослідження та інформаційні технології, 2002, 4 73 Враховуючи, що число ступенів вільності незгладжених спектральних оцінок дорівнює 2, а дисперсія 2υ -розподілу скінченна, якщо 42 >ν , то можна показати, що статистика ξ в (2.21) і (2.22) має будуватися на основі згладжених спектральних оцінок. Для (2.23) можна використати і незгладжені оцінки. Щодо потужності критеріїв, то найменшою потужністю характеризується статистика (2.23), а найбільшою — (2.22), оскільки для останньої спо- стерігається найбільша відносна чутливість за зміни )( fθ . Наразі виникає задача оцінки параметрів цих елементарних статистик, а саме їх математичного сподівання та дисперсії в залежності від параметра θ . 2.3. Результати обчислень числових характеристик розподілів елементарних статистик Для статистик (2.21) та (2.22) при 61 =ν нескладно отримати точні вира- зи для математичного сподівання та дисперсії. Наведемо ці вирази, допус- каючи, що ,,...2,1,62 == MMν (2.24) тобто )(1 fC у (2.19) відповідає згладженій оцінці з 6 ступенями вільності, отриманій на одному допустимому інтервалі, а )(2 fC відповідає оцінці спектральної густини, отриманій внаслідок адаптивного згладжування за попередніми припустимими інтервалами. З урахуванням заданих 1ν і 2ν розподіл (2.2) буде мати вигляд ⎪ ⎩ ⎪ ⎨ ⎧ >⎟ ⎠ ⎞ ⎜ ⎝ ⎛ + ++ < = +− .0,1 2 )13)(23(3 ,0,0 )( )33( 2 2 Y M YY M MM Y Y M yϕ (2.25) Початковий момент порядка r має вигляд rr M rM rMrrrMY )!3(2 )3()3( − −+ = . (2.26) При проведенні обчислень використовується значення інтеграла ∫ ∑ = −++− + + −+−−− +− = ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ + m i imMi m M m imMim MYmM M y dyy 0 )23( 1 33 )23()!( )1(!)1( 1 (2.27) для m — цілого, 130 +≤≤ Mm . Для зручності вводять змінну θ 1=A . (2.28) М.В. Андрєєв ISSN 1681–6048 System Research & Information Technologies, 2002, 4 74 Наведемо результати обчислень числових характеристик розподілу ста- тистики 1−= AYMη . Математичне сподівання { }MM η має вигляд { } −⎟ ⎠ ⎞ ⎜ ⎝ ⎛ + +− +++++ = − M M AMAMM MAMAAM 322 11 )1()13( 2)98()9126( η 13 )1(31 − −− − M AM . (2.29) В асимптотичному випадку при ∞→M маємо { } A e AAM AM −+ ++ = 1342 3η . (2.30) Початковий момент 2-го порядку для Mη має вигляд { } )23()13( 2)912()91812( 222 −− +−++− = MM AMAAM YM M . (2.31) В асимптотичному випадку при ∞→M маємо { } 3 364 2 2 +− = AAM Mη . (2.32) Наведемо результати обчислень параметрів розподілу статистики { }ξξη 1,max=X . Для зручності її апроксимації 2χ -розподілом розглянемо статистику 1−= Xηη . (2.33) Математичні сподівання статистик η та Xη відрізняються на одиницю, а дисперсії — рівні. Математичне сподівання { }ηM має вигляд { } [ ] A A AMAMM AAAMM M M 2 2311 )1()13( 2)33(3 32 − +⎟ ⎠ ⎞ ⎜ ⎝ ⎛ + +− ++++ = − η . (2.34) В асимптотичному випадку при ∞→M маємо { } A A e AA M A 2 2333 3 − + ++ =η . (2.35) Початковий момент 2-го порядку для η має вигляд { } . 2 3)962(11 )13()23( )1()23(6 2 23 2 MA AAM AMMM MAMAM M ++− +⎟ ⎠ ⎞ ⎜ ⎝ ⎛ + −− ++ = − η (2.36) Задачі прикладного статистичного аналізу випадкових процесів у дискретному часі Системні дослідження та інформаційні технології, 2002, 4 75 В асимптотичному випадку при ∞→M маємо { } 2 962 3 )3(2 2 3 2 +− + + = AA e AAM Aη . (2.37) Проаналізуємо отримані асимптотичні залежності числових характеристик розподілу статистики Mη , показаних на рис. 1. Із рис.1 видно, що математичне сподівання та дисперсія не досягають мінімальних значень при 1=A , тобто критерій, що використовує як еле- ментарну статистику Mη , буде зміщеним. Скоригуємо статистику: 1−⋅⋅= YAA MCMCη , (2.38) причому AAMC ′= , де A′ — значення A , за якого досягається мінімальне значення математичного сподівання статистики Mη . Однак цього недостатньо, щоб критерій був незміщеним, оскільки із збільшенням математичного спо- дівання при відхиленні A від одиниці дисперсія статистики може зменши- тись настільки, що ймовірність виходу за довірчий інтервал буде меншою рівня значущості, що характеризує зміщення критерію. Аналіз з урахуван- ням математичного сподівання та дисперсії є раціональним, оскільки число елементарних статистик Eγ в статистиці (2.6) наближено описується нор- мальним законом розподілу. Крім того, неважко показати, що коли для нормальної випадкової вели- чини установлено деяку границю, ймовірність перевищення якої дорівнює 5,0<α (відповідає рівню значущості критерію), то за умови, що математи- чне сподівання та дисперсія не зменшуватимуться, ймовірність )1( β− пере- вищення нормальною величиною заданої границі (відповідає потужності критерію), не буде меншою α (відповідає незміщенню критерію). Формула залежності потужності критерію від приростів математичного сподівання та дисперсії статистики (2.6) має вигляд 0,00 0,20 0,40 0,60 0,80 1,00 1,20 0,0 05 0,5 1 1,5 2 2,5 M{ηM} {M 0,00 1,00 2,00 3,00 4,00 5,00 0, 02 0, 25 0, 5 0, 75 1 1, 25 1, 5 1, 75 2 2, 25 2, 5 2 , 75 D{ηM} Рис. 1 М.В. Андрєєв ISSN 1681–6048 System Research & Information Technologies, 2002, 4 76 ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ ∆+ ⋅−⋅∆ Φ=− − )( 1 0 01 DDN DNuNM E EE αβ , (2.39) де )(xΦ — функція нормального розподілу Гаусса; EN — кількість еле- ментарних статистик в (2.6); M∆ , D∆ — відповідний приріст математично- го сподівання та дисперсії елементарної статистики за деякої альтернативної гіпотези; 0D — дисперсія елементарної статистики за нульової гіпотези (коли спектри еквівалентні); pu — квантиль нормального розподілу. У формулі (2.39) необхідно пам’ятати, що M∆ і D∆ для кожної елеме- нтарної статистики функціонально пов’язані змінною A . Однак із (2.39) ви- пливає, якщо дисперсія елементарної статистики не змінюється, то збільшення M∆ буде завжди збільшувати потужність критерію, якщо M∆ не змінюється, то збільшення D∆ буде збільшувати потужність, якщо 5,0)1( <− β , і зменшувати — якщо 5,0)1( >− β . Формулу (2. 39) можна перетворити до вигляду ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ ∆+ − ∆+ ⋅∆ Φ=− − DD D u DD NM E 0 0 1 0 1 αβ . (2.40) На основі (2.40) зручно порівнювати критерії за альтернативних гіпо- тез, заданих у вигляді змін M∆ і D∆ . Для того, щоб критерій був незміщеним, необхідно, щоб вираз (2.40) досягав мінімального значення за 0=∆M та 0=∆D . Звідси видно, як проводити коригування або адаптацію статистики. Якщо мінімальні значення математичного сподівання та дисперсії статистики близькі, то доцільно коригувати статистику за математичним сподіванням, оскільки у (2.40) вплив відхилень дисперсій частково компенсується. З рис. 1 випливає, що статистика M η характеризується низкою небажаних властивостей. 1. Мінімальні значення { }MM η та { }MD η досягаються в істотно різ- них точках, приблизно при 1=A та 0=A відповідно, а тому важко запро- понувати прості методи коригування елементарної статистики Mη . 2. Скінченне відхилення { }MM η за зміни A від 0 до 1 свідчить про низьку чутливість статистики Mη у цій області. На підставі цих властивостей статистика Mη вилучається з подальшого розгляду, відтак розглядається статистика максимуму (2.22). Для обчислення числових характеристик ηM та ηD розподілу η існує програмне забезпечення з комп’ютерною реалізацією і графічним зображенням, звідки видно, що точки A , які мінімізують { }ηM та { }ηD , близькі одна до одної. Тому можна очікувати прийнятних результатів щодо незміщення критерію, скориставшись тільки центруванням математичного сподівання статистики η . Задачі прикладного статистичного аналізу випадкових процесів у дискретному часі Системні дослідження та інформаційні технології, 2002, 4 77 Скоригована статистика η матиме вигляд { } 11,max −⋅′⋅⋅′⋅=′ YAAYAA CCη , (2.41) однак статистику η можна скоригувати ще й таким чином: { }CC AAYAAY ′′−′′−=′′ 11,maxη , (2.42) де CA ′′ знаходиться за допомогою підпрограми пошуку екстремуму { }ηM , ста- тистика AY формується за допомогою підпрограми моделювання норма- льно розподілених випадкових чисел на основі відомого співвідношення: 2 1 2 2 2 1 21 ν ν νν χν χνA YA = , (2.43) де 2 νχ — «xi-квадрат» розподіл з ν ступенями вільності. Для роботи підпрограми задаються такі параметри: число ступенів ві- льності 1ν , кількість усереднень M ( 12 νν M= ), границі та крок зміни A і кількість статистичних випробувань N . Можна переконатися, що для статистики мінімуму (2.23) критерій ма- тиме малу потужність, хоча він характеризується скінченною дисперсією за будь-якого числа ступенів вільності, тобто може безпосередньо викорис- товувати незгладжені оцінки спектрів з 21 =ν . Застосування статистики мінімуму (2.23) є мало перспективним за малої потужності критерію, а статис- тика максимуму (2.22) може використовуватися з числом ступенів вільності 61 ≥ν , тобто згладжування невелике, і можливе відхилення розподілу цієї статистики від теоретичного буде незначним. 2.4. Про дослідження потужності критеріїв Одне з найважливіших питань, що виникає при розробці критеріїв, — вибір альтернативних гіпотез. Як уже зазначалося, для дослідження потужності кри- теріїв доцільно використати функцію )( 1)( f fA θ = . Як )( fA приймають функцію відношення двох спектрів резонансного характеру. Поблизу резонансу спектр з точністю до коефіцієнта пропорційності подається у вигляді 22 1)( d fp + =Γ ε , (2.44) де p p p f ff f f )(22 − = ∆ =ε — розладнання частоти щодо резонансу; pf — резонансна частота; d — затухання. З урахуванням (2.44) )( fA має вигляд 2 2 2 2 2 1 2 1 )( )( )( 1)( df df f fA + + == ε ε θ , 2,1, )(2 = − = i f ff i i p p iε . (2.45) М.В. Андрєєв ISSN 1681–6048 System Research & Information Technologies, 2002, 4 78 Функція (2.45) наближено визначає відношення двох нормованих спектрів із заданими резонансними частотами 1pf і 2pf та їх добротностями. Із графіка видно, що область зміни )( fA досить значна і для оцінки потужності критеріїв необхідно враховувати розподіл )( fA . Це можна врахувати у формулі вигляду (2.40), а саме ⎟ ⎟ ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝ ⎛ ∆+ ⋅−∆ Φ=− ∑ ∑ = = − E E N i i N i Ei fADD DNufAM 1 0 1 01 )()( ))(( 1 α β . (2.46) У виразі (2.46) враховується конкретний розподіл змін математичних сподівань iM∆ та дисперсій iD∆ елементарних статистик в (2.6). Отже, методика дослідження потужності критеріїв перевірки еквіва- лентності спектрів на основі статистики (2.6) виглядає таким чином: 1. Для досліджуваної статистики визначається залежність математичного сподівання та дисперсії від відношення спектрів. 2. Із фізичних міркувань вибирається конкретна залежність відношення спектрів від частоти, наприклад, у вигляді (2.45). 3. Оцінюється потужність критерію за формулою (2.46). Важливим є також питання визначення границі для довірчої області критерію. З метою дослідження точності визначення границі при апроксимації нормальним та «xi-квадрат»-законами, а також для статистичного дослі- дження потужності критерію розроблена комп’ютерна реалізація статистич- ного оцінювання ймовірності перевищення статистикою (2.6) границі NΓ , визначеною за формулою (2.8), та границі 2χ Γ , визначеною за формулою (2.10). Вихідними даними при цьому є математичне сподівання та дисперсія статистики за умови еквівалентності спектрів; коефіцієнт )( fA є однаковий для всіх елементарних статистик; кількість елементарних статистик EN ; квантиль α−1u для заданого рівня значущості α критерія та кількість ста- тистичних випробувань N . Точність задання границі визначається порі- внянням оцінки потужності β−1 при 1)( =fA (тобто рівня значущості) із заданим значенням α . На рис. 2 показані результати дослідження для статистики максимуму при 28,1,20,1 1 === −αuNM E , тобто 1,0=α . Із рис. 2 видно, що границя 2χ Γ при 1)( =fA дуже близька до значення 1,0 , в той час як границя NΓ дає приблизно у 2 рази занижений рівень значущості. Критерій 2χ з ймовірністю близькою до 0.5 виявлятиме зміну спектральної густини в середньому у 2 рази частіше за критерій NΓ . Підсумовуючи результати досліджень статистичного аналізу високоча- стотних випадкових процесів у дискретному часі, окреслимо важливий напрямок їх застосувань на прикладі трактування ризикового процесу ціно- Задачі прикладного статистичного аналізу випадкових процесів у дискретному часі Системні дослідження та інформаційні технології, 2002, 4 79 утворення цінних паперів, зокрема процесу котировки акцій на фондовому ринку як високочастотного в залежності від кон’юнктури ринку, стаціонарного або нестаціонарного випадкового процесу. На основі реальних спостережень конкретної реалізації котировки ак- цій на певному відрізку часу будується статистика або критерій, що з надій- ністю )1( α− (α — рівень значущості) попадає в область прийняття нульової гіпотези про рівність спектрів. Питання про розподіл статистик розв’язується з урахуванням результатів ергодичної теорії випадкових про- цесів, що призводять до нормального або «xi-квадрат» розподілів дослі- джуваних статистик. ЛІТЕРАТУРА 1. Случайные колебания // Под ред. С. Кренделл. — М.: Мир, 1967. — 356 с. 2. Andreev A., Andreev M.V. Optimal Investment Strategy on Financial Market Derivatives // Third International School on Applied Statistics, Financial and Actuarial Mathematics, Sept. 4–13, 2000. — Feodosiya, Crimea, 2000. — Р. 1–2. 3. Бартлетт М.В. Введение в теорию случайных процессов. — М.: Изд-во иност. лит., 1958. — 384 с. Надійшла 12.11.2002 Рис. 2 0 0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45 0,5 0,60 0,80 1,00 1,20 1,40 ΓΝ Γχ2
id nasplib_isofts_kiev_ua-123456789-50245
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 1681–6048
language Ukrainian
last_indexed 2025-11-30T16:24:25Z
publishDate 2002
publisher Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України
record_format dspace
spelling Андрєєв, М.В.
2013-10-08T17:03:39Z
2013-10-08T17:03:39Z
2002
Прикладний статистичний аналіз високочастотних випадкових процесів у дискретному часі / М.В. Андрєєв // Систем. дослідж. та інформ. технології. — 2002. — № 4. — С. 61-79. — Бібліогр.: 3 назв. — укр.
1681–6048
https://nasplib.isofts.kiev.ua/handle/123456789/50245
519.24
Досліджується спектральний аналіз високочастотних стаціонарних та нестаціонарних випадкових послідовностей на основі перевірки відповідних статистичних гіпотез в частотній області. Здійснено перевірки низки статистичних гіпотез про приналежність спостережуваної випадкової реалізації марковській гауссовій послідовності.
Исследуется спектральный анализ высокочастотных стационарных и нестационарных случайных последовательностей на основе проверки соответствующих статистических гипотез в частотной области.
A spectral analysis of high-frequency stationary and nonstationary stochastic sequences, made on the basis of solution of problems for testing corresponding statistical hypotheses in a frequency domain is investgated.
uk
Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України
Системні дослідження та інформаційні технології
Теоретичні та прикладні проблеми інтелектуальних систем підтримки прийняття рішень
Прикладний статистичний аналіз високочастотних випадкових процесів у дискретному часі
Прикладной статистический анализ высокочастотных случайных процессов в дискретном времени
Applied Statistical Problems of Descrete Time High-Frequency Stochastic Processes
Article
published earlier
spellingShingle Прикладний статистичний аналіз високочастотних випадкових процесів у дискретному часі
Андрєєв, М.В.
Теоретичні та прикладні проблеми інтелектуальних систем підтримки прийняття рішень
title Прикладний статистичний аналіз високочастотних випадкових процесів у дискретному часі
title_alt Прикладной статистический анализ высокочастотных случайных процессов в дискретном времени
Applied Statistical Problems of Descrete Time High-Frequency Stochastic Processes
title_full Прикладний статистичний аналіз високочастотних випадкових процесів у дискретному часі
title_fullStr Прикладний статистичний аналіз високочастотних випадкових процесів у дискретному часі
title_full_unstemmed Прикладний статистичний аналіз високочастотних випадкових процесів у дискретному часі
title_short Прикладний статистичний аналіз високочастотних випадкових процесів у дискретному часі
title_sort прикладний статистичний аналіз високочастотних випадкових процесів у дискретному часі
topic Теоретичні та прикладні проблеми інтелектуальних систем підтримки прийняття рішень
topic_facet Теоретичні та прикладні проблеми інтелектуальних систем підтримки прийняття рішень
url https://nasplib.isofts.kiev.ua/handle/123456789/50245
work_keys_str_mv AT andrêêvmv prikladniistatističniianalízvisokočastotnihvipadkovihprocesívudiskretnomučasí
AT andrêêvmv prikladnoistatističeskiianalizvysokočastotnyhslučainyhprocessovvdiskretnomvremeni
AT andrêêvmv appliedstatisticalproblemsofdescretetimehighfrequencystochasticprocesses