Статистический анализ локальных участков битовых последовательностей

В работе установлены совместные распределения числа 2-цепочек и числа 3-цепочек фиксированного вида случайной битовой последовательности. Даны примеры использования этих распределений. Возможным применением полученных формул может быть проверка гипотезы случайности расположения нулей и единиц в (0,...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Datum:2019
Hauptverfasser: Масол, В.И., Поперешняк, С.В.
Format: Artikel
Sprache:Russian
Veröffentlicht: Інститут кібернетики ім. В.М. Глушкова НАН України 2019
Schriftenreihe:Проблемы управления и информатики
Schlagworte:
Online Zugang:http://dspace.nbuv.gov.ua/handle/123456789/180836
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:Статистический анализ локальных участков битовых последовательностей / В.И. Масол, С.В. Поперешняк// Проблемы управления и информатики. — 2019. — № 5. — С. 92-105. — Бібліогр.: 4 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id irk-123456789-180836
record_format dspace
spelling irk-123456789-1808362021-10-21T01:26:34Z Статистический анализ локальных участков битовых последовательностей Масол, В.И. Поперешняк, С.В. Методы обработки и защиты информации В работе установлены совместные распределения числа 2-цепочек и числа 3-цепочек фиксированного вида случайной битовой последовательности. Даны примеры использования этих распределений. Возможным применением полученных формул может быть проверка гипотезы случайности расположения нулей и единиц в (0, 1)-последовательности конечной длины. Розглянуто сумісні розподіли числа 2-ланцюжків і числа 3-ланцюжків фіксованого вигляду випадкової (0, 1)-послідовності, які дозволяють здійснювати статистичний аналіз локальних ділянок цієї послідовності. Сформульовано і доведено дві теореми. The joint distributions of the number of 2-chains and the number of 3-chains of a fixed form of a random (0, 1)-sequence, which allow a statistical analysis of local sections of this sequence, were examined. Two theorems are formulated and proved. 2019 Article Статистический анализ локальных участков битовых последовательностей / В.И. Масол, С.В. Поперешняк// Проблемы управления и информатики. — 2019. — № 5. — С. 92-105. — Бібліогр.: 4 назв. — рос. 0572-2691 http://dspace.nbuv.gov.ua/handle/123456789/180836 519.237.3 + 519.669 + 681.51 ru Проблемы управления и информатики Інститут кібернетики ім. В.М. Глушкова НАН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Russian
topic Методы обработки и защиты информации
Методы обработки и защиты информации
spellingShingle Методы обработки и защиты информации
Методы обработки и защиты информации
Масол, В.И.
Поперешняк, С.В.
Статистический анализ локальных участков битовых последовательностей
Проблемы управления и информатики
description В работе установлены совместные распределения числа 2-цепочек и числа 3-цепочек фиксированного вида случайной битовой последовательности. Даны примеры использования этих распределений. Возможным применением полученных формул может быть проверка гипотезы случайности расположения нулей и единиц в (0, 1)-последовательности конечной длины.
format Article
author Масол, В.И.
Поперешняк, С.В.
author_facet Масол, В.И.
Поперешняк, С.В.
author_sort Масол, В.И.
title Статистический анализ локальных участков битовых последовательностей
title_short Статистический анализ локальных участков битовых последовательностей
title_full Статистический анализ локальных участков битовых последовательностей
title_fullStr Статистический анализ локальных участков битовых последовательностей
title_full_unstemmed Статистический анализ локальных участков битовых последовательностей
title_sort статистический анализ локальных участков битовых последовательностей
publisher Інститут кібернетики ім. В.М. Глушкова НАН України
publishDate 2019
topic_facet Методы обработки и защиты информации
url http://dspace.nbuv.gov.ua/handle/123456789/180836
citation_txt Статистический анализ локальных участков битовых последовательностей / В.И. Масол, С.В. Поперешняк// Проблемы управления и информатики. — 2019. — № 5. — С. 92-105. — Бібліогр.: 4 назв. — рос.
series Проблемы управления и информатики
work_keys_str_mv AT masolvi statističeskijanalizlokalʹnyhučastkovbitovyhposledovatelʹnostej
AT poperešnâksv statističeskijanalizlokalʹnyhučastkovbitovyhposledovatelʹnostej
first_indexed 2025-07-15T21:10:39Z
last_indexed 2025-07-15T21:10:39Z
_version_ 1837748812099092480
fulltext © В.И. МАСОЛ, С.В. ПОПЕРЕШНЯК, 2019 92 ISSN 0572-2691 УДК 519.237.3 + 519.669 + 681.51 В.И. Масол, С.В. Поперешняк СТАТИСТИЧЕСКИЙ АНАЛИЗ ЛОКАЛЬНЫХ УЧАСТКОВ БИТОВЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ Ключевые слова: s-цепочки, битовая последовательность, случайность, ло- кальные участки, совместное распределение. Введение Всесторонний статистический анализ битовой последовательности, получае- мой на выходе генераторов псевдослучайных чисел, не исключает проверки гипо- тезы случайного расположения нулей и единиц на некоторых интервалах неболь- шой длины, например до ста битов (вариант классификации битовых последова- тельностей согласно их длине приведен в [1]). Необходимость в проверке этой гипотезы возникает также в иных областях, например в химической промышлен- ности при производстве синтетических волокон в процессе анализа причин обры- ва нити в ходе ее формирования. Здесь (0, 1)-последовательность получается по результатам взвешивания отрезков нити на небольшом участке до ее обрыва с по- следующим сравнением с номинальным весом этих отрезков. В тестах для проверки гипотезы случайности расположения нулей и единиц в (0, 1)-последовательностях предполагается, что длина (0, 1)-последовательности велика (см., например, [2]). Это предположение связано с использованием асимп- тотических приближений для точного распределения статистики (как правило, одномерной) соответствующего теста. В данной работе предлагаются точные совместные распределения некоторых статистик (0, 1)-последовательности длины ,n 1 .n   Для 20n  (т.е. для би- товой последовательности малой длины [1]) приведены таблицы, содержащие числовые значения соответствующего распределения. Эти таблицы, равно как и предлагаемые их графические представления, могут быть использованы для про- верки гипотезы случайности расположения нулей и единиц. 1. Постановка задачи Рассмотрим последовательность случайных величин 1 2 ... ,n   (1) где {0, 1},i  1, 2,..., ,i n 0.n  Подпоследовательность 1 1...j j j s     последовательности (1) будем называть s-цепочкой, 1, 2,..., 1,j n s   1, 2,..., .s n Обозначим 1 2( ... )st t t число s-цепочек в последовательности (1), которые совпадают с 1 2 ... ,st t t где {0, 1},it  1, 2,..., .i s Сформулируем условие. Условие. Последовательность (1) состоит из ,n 0,n  независимых одинако- во распределенных случайных величин; вероятности событий { 1},i  { 0}i  известны и равны P{ 1} ,i p   P{ 0} ,i q   1,p q  1, 2,..., .i n В данной работе рассмотрены совместные распределения случайных величин 1 2( ... ),st t t 1 2( ... ),st t t    где , {0,1},j it t  1, 2,..., ,j s 1, 2,..., ,i s для некото- рых значений s и .s Перейдем к точным формулировкам. Международный научно-технический журнал «Проблемы управления и информатики», 2019, № 5 93 2. Совместные распределения числа 2-цепочек и числа 3-цепочек фиксированного вида Теорема 1. Пусть выполняется сформулированное выше условие, ,n 1,k 2 ,k 3,k ,t 1t — целые числа, такие, что 1 0,k  2 0,k  3 0,k  1max(2 , 3),n k 1, {0,1}.t t  Тогда 1 101 1 1 1 1 1 1 * * * 1 2 0 P{ ( ) , ( 1 ) ( ,0 ) } i i k m n k mm k m k i k t t k t t t t k p q C C                 (2) где 0 1,m n m  символ  обозначает суммирование по всем целым неотрица- тельным числам 0 и 1, таким, что 0 1 1 22 ,k k    * 1 ;t t  2 2 1 1 1 1 01 1 1 * * * 1 1 1 1 1 2P{ ;( , ( ) }) t t n k m k k k k m k m m m k t t k t t t k p q C C C          (3) 3 32 2 1 1 1 1 0 1 1 1 1 0 1 * * * 31 2P{ ( ) , ( 1 ) ), .0 }( n k mm m k k kk k k k m k m k t t k t t k t t k p q C C C C             (4) Пример. Для (0, 1)-последовательности вида 0 1 1 0 0 1 1 0 1 1 1 0 0 0 0 1 0 1 0 1 значениями случайных величин *( ),t t *( 1 ),t t *( 0 )t t и *( ),t t  где {0,1}, для 1t  являются соответственно числа 5, 3, 2 и 5. Доказательство. Проверим соотношение (3). Обозначим  количество единиц в случайной последовательности (1). Случайная величина  имеет биномиальное распределение с параметрами ( , ),n p что позволяет записать для 0,1, 2, ...,m n вероятность события { },m  а именно: P{ } .m m n m nm C p q    (5) С помощью формулы полной вероятности находим 1 1 2 1 1 2 1 0 P{ , P{ } P{ / },} , n m A A m A A m        (6) где def * 1 1 1 1{ ,( ) }A t t k   def * 2 1 1 2( ) .{ }A t t t k   Покажем, что 1 2 2 1 1 1 * 1 1 2 1P{ , / } ( ) t t k k k k m k m m nA A m C C C C     . (7) Введем следующие обозначения: 1( , )n m — множество всех n-мерных (0, 1)-векторов, каждый из которых содержит 1m единиц и 0m нулей, 0 1 ;m m n  0 1 1 2 1( , , , ; )D m m k k t — подмножество множества 1( , )n m , которое содержит все попарно различные векторы, начинающиеся с элемента 1,t заканчивающи- еся элементом * 1 ,t содержащие 1 2( )k k цепочек вида * * 1 1 1 1( );t t t t t Q — общее число векторов , 1( , ),n m каждый из которых имеет 1 2( )k k цепочек ви- да * * 1 1 1 1( ).t t t t t 94 ISSN 0572-2691 Используя принятые обозначения, получаем 1 2 11 1P{ , / } ( ( ,, ) )nA m Q mA     (8) * * * * 1 2 1 0 0 ( , , , ; ) t t t t mm t t t t Q D m m k k t           . (9) Далее убедимся в том, что 2 2 1 1 1 * 1 1 0 1 1 2 1 1 1 ( , , , ; ) . t t k k k k m k m C CD m m k k t C       (10) Действительно, для произвольного вектора , 0 1 1 2 1( , , , ; ),D m m k k t во- первых, событие 1 2{ , }A A имеет место тогда и только тогда, когда ( ) 2 1 1 0, t k k    (11) где ( ) 1 t  — число t -серий длины единица каждая в векторе , {0,1};t во-вто- рых, перестановка между собой t -серий не изменяет чисел 1k и 2.k Поэтому вектор  определяется однозначно, если  зафиксировано одно из ( ) 1 1 t k C  возможных размещений t -серий длины еди- ница каждая;  зафиксировано одно из возможных разбиений ( ) 1 t tm   t -элементов на ( ) 1 1 t k   t -серий, длина каждой из которых равняется двум или больше двух;  зафиксировано одно из возможных разбиений *t m *t -элементов на 1k *t -се- рий, длина каждой из которых не меньше единицы. Между указанными разбиениями множества t -элементов ( *t -элементов) и решениями уравнения ( ) 1 1 ( ) ( ) ( ) ( ) 1 1 2 ... t t t t t t k m x x x        (12) 1 ( *) ( *) ( *) ( *) * 1 1 2( ... ) t t t t t k m x x x     (13) в целых числах, каждое из которых не меньше двух (единицы), существует вза- имно-однозначное соответствие. В свою очередь, число решений уравнения (12) или (13), таких, что ( ) 2 t jx  , ( ) 1 11, 2, ..., t j k   ( *) ( 1 t jx  , 11, 2, ..., ),j k равня- ется ( ) 1 1 1 1 * 1 1 1 1 ( ). t t t k k m k m C C       Таким образом, с учетом (11) произведение 2 2 1 1 1 * 1 1 1 1t t k k k k m k m C C C      дает общее число элементов множества 0 1 1 2 1( , , , ; ),D m m k k t что доказывает (10). Принимая во внимание (9), (10) и равенство 1 1 1 1... ,nnC C C        (14) Международный научно-технический журнал «Проблемы управления и информатики», 2019, № 5 95 получаем соотношение 2 2 1 1 1 * , t t k k k k m k m Q C C C   которое совместно с (8) и равен- ством 1 1( , ) m nn m C  (15) приводит к (7). В свою очередь, из (5)–(7) непосредственно следует (3). Соотношения (2) и (4) можно проверить, используя схему доказательства равенства (3). Частный случай соотношения (2) установлен в [3]. 3. Примеры к теореме 1 3.1. Иллюстрация использования равенства (2). В табл. 1 и на рис. 1 при- ведено использование соотношения (2) для 1/ 2,p q  малой выборки длины ,n 20,n  и некоторых значений 1,k 2.k В первом столбце табл. 1 помещены все возможные варианты значений 1k и 2 ,k для которых вероятность * * * 1 2P{ ( ) , ( 1 ) ( 0 ) 0,0} 1.t t k t t t t k      Во втором столбце даны вероятности (в неубывающем порядке) * * 1P{ ( ) , ( 1 )t t k t t    * 2( }0 )t t k  для пар чисел 1 2( , ),k k указанных в первом столбце. В каждой строке третьего столбца дана сумма накопленных вероятностей до реализации события * * * 1 2{ ( ) , ( 1 ) ( 0 })t t k t t t t k      включительно, где 1k и 2k указаны в этой же строке в первом столбце. Таблица 1 (k1, k2) P Pc (k1, k2) P Pc (7, 3) 0,012149811 0,100008011 (5, 7) 0,018882751 0,132255554 (7, 5) 0,013364792 0,113372803 (7, 4) 0,020047188 0,152302742 (5, 7) 0,018882751 0,132255554 (3, 3) 0,026035309 0,178338051 (7, 4) 0,020047188 0,152302742 (6, 3) 0,026435852 0,204773903 (3, 3) 0,026035309 0,178338051 (3, 5) 0,02863884 0,233412743 (6, 3) 0,026435852 0,204773903 (6, 6) 0,031723022 0,265135765 (3, 5) 0,02863884 0,233412743 (5, 3) 0,037765503 0,302901268 (6, 6) 0,031723022 0,265135765 (4, 3) 0,03818512 0,341086388 (5, 3) 0,037765503 0,302901268 (3, 4) 0,04295826 0,384044647 (4, 3) 0,03818512 0,341086388 Например, для 1 7k  и 2 3k  имеем * * * 1 2P{ ( ) , ( 1 ) ( 0 ) }t t k t t t t k       ,01210 49811, * * * 1 2P P{ ( ) , ( 1 ) ( },0 )c t t k t t t t k       где знак суммирова- ния  распространяется на все пары 1 2( , ),k k для которых * 1P{ ( ) ,t t k  * * 2( 1 ) ( 0 ) ,0121498 1} 10 .t t t t k     На рис. 1 представлена пузырьковая диаграмма [4], в которой первый параметр (горизонтальная ось) — значение 1,k второй (вертикальная ось) — 96 ISSN 0572-2691 значение 2 ,k третий (размер пузырька) — вероятность осуществления со- бытия * 1{ ( ) ,t t k  * * 2( 1 ) ) },( 0t t t t k    выраженная в процентах. Например, на рис. 1 при 1 5k  и 2 5k  вероятность осуществления собы- тия * * * 1 2{ ( ) , ( 1 ) ( 0 })t t k t t t t k      в процентах равняется 11,10 %. Рис. 1 3.2. Иллюстрация использования равенства (3) . В табл. 2 и на рис. 2 приведено использование соотношения (3) для 1/ 2,p q  малой выборки длины ,n 20,n  и некоторых значений 1k и 2.k Таблица 2 (k1, k2) P Pc (k1, k2) P Pc (2, 2) 0,01108932 0,0622549 (4, 1) 0,04721069 0,3276072 (7, 3) 0,01214981 0,0744047 (3, 2) 0,05311203 0,3807192 (7, 1) 0,01336479 0,0877695 (5, 1) 0,05455017 0,4352694 (6, 4) 0,01952648 0,107296 (6, 3) 0,05727768 0,492547 (7, 2) 0,02004719 0,1273432 (6, 2) 0,0715971 0,5641441 (4, 4) 0,02318382 0,150527 (4, 3) 0,09273529 0,6568794 (3, 1) 0,02451324 0,1750402 (5, 3) 0,10910034 0,7659798 (3, 3) 0,03034973 0,20539 (4, 2) 0,11128235 0,8772621 (6, 1) 0,03682137 0,2422113 (5, 2) 0,12273788 1 (5, 4) 0,03818512 0,2803965 Интерпретация табл. 2 аналогична интерпретации табл. 1. На рис. 2 дана пузырьковая диаграмма, в которой первый параметр (го- ризонтальная ось) — значение 1,k второй (вертикальная ось) — значение 2 ,k третий (размер пузырька) — вероятность осуществления события * 1 1P{ ( )t t  1,k * 1 1 2( ) }t t t k  , которая представлена в процентах. k 2 – 1 0 1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9 k 1 Международный научно-технический журнал «Проблемы управления и информатики», 2019, № 5 97 Рис. 2 3.3. Иллюстрация использования равенства (4). В табл. 3 приведено ис- пользование соотношения (4) для 1/ 2p q  , малой выборки длины ,n 20,n  и некоторых значений 1,k 2k и 3.k Таблица 3 (k1, k2, k3) P Pc (k1, k2, k3) P Pc (6, 1, 2) 0,010815 0,280055 (4, 1, 3) 0,019638 0,522853 (6, 2, 1) 0,010815 0,29087 (4, 3, 1) 0,019638 0,542491 (5, 1, 4) 0,011015 0,301885 (5, 1, 3) 0,02203 0,564521 (5, 4, 1) 0,011015 0,3129 (5, 3, 1) 0,02203 0,586551 (3, 1, 2) 0,011716 0,324615 (6, 2, 3) 0,024033 0,610583 (3, 2, 1) 0,011716 0,336331 (6, 3, 2) 0,024033 0,634616 (6, 3, 3) 0,013733 0,350064 (3, 2, 2) 0,025775 0,660391 (3, 2, 3) 0,014319 0,364384 (4, 3, 3) 0,026184 0,686575 (3, 3, 2) 0,014319 0,378703 (6, 2, 2) 0,027037 0,713612 (6, 1, 3) 0,01442 0,393123 (5, 3, 3) 0,031471 0,745083 (6, 3, 1) 0,01442 0,407542 (4, 2, 3) 0,039276 0,784359 (5, 1, 2) 0,015736 0,423278 (4, 3, 2) 0,039276 0,823635 (5, 2, 1) 0,015736 0,439013 (5, 2, 2) 0,04406 0,867695 (5, 2, 4) 0,015736 0,454749 (5, 2, 3) 0,04406 0,911755 (5, 4, 2) 0,015736 0,470485 (5, 3, 2) 0,04406 0,955814 (4, 1, 2) 0,016365 0,48685 (4, 2, 2) 0,044186 1 (4, 2, 1) 0,016365 0,503215 Пояснения к табл. 3 аналогичны пояснениям к табл. 1. 4. Совместные распределения числа 2-цепочек и числа 3-цепочек вида * 1 1t t и * ,t t {0, 1} Теорема 2. Пусть выполняется сформулированное выше условие, ,n 1,k 2 ,k 3,k ,t 1t — целые числа, такие, что 1 0,k  2 0,k  3 0,k  1max{2 , 3},n k 1, {0,1}.t t  Тогда – 1 0 1 2 3 4 5 6 k 2 1 2 3 4 5 6 7 8 9 k 1 98 ISSN 0572-2691 1 01 1 1 * 1 1 1 2P{ ( ) , ( 1 ) ( 0 ) } n k mm m k t t k t t t t k p q           * 1 * * 1 1 2 1 1 { , 1} ( , ) ( 2)t t t t t m i k t t t t tii m i i k k C C Z m i m i C m Z                            , (16) где  — суммирование по всем целым неотрицательным числам t и *t , таким, что * 2,t t k   1 2( 0) ( 1)t tZ m k k       2 2 1( 1) ( 1) ( 0, 2)tm k k k        1 2 1 2( ( 0) ( 1) ( 1, 0)),k k n k k         ( )E — индикатор события ,E ( )E  1 ( ),E  1 1 def , если 1; ( , ) 1, если 0; 0 в остальных случаях; b aC a b Z a b a b             1 01 1 1 * 1 1 1 2P{ ( ) , ( ) } n k mm m k t t k t t t k p q           21 * 1 1 2 , 1 ( , ) ( 2)t t m k ik t t t tim i k k C C Z m i m i k m Z                     ; (17) * 1 1 1 2P{ ( ) , ( * ) }t t k t t t k       1 2 1 201 * 1 1 1 1 1 , 1 ( 2) t t n k k k kmm i t ti m m i m k i k k p q C C C m Z                      ; (18) 1 01 1 1 * 1 1 1 2 3P{ ( ) , ( ) , ( * ) } n k mm m k t t k t t t k t t t k p q           2 3 1 3 * 1 1 2 21 1 { , 1} ( , ) ( 2)t t k m i k k k t t t ti i m i i k k C C Z m i m i k C m Z                        , (19) где 1 2 3( 0) ( 1)t tZ m k k k        2 3 2 3 1( 1) ( 1) ( 0, 2)tm k k k k k          1 2 3 1 2 3( ( 0) ( 1) ( 1, 0)).k k k n k k k           Доказательство. Проверим соотношение (17). Аналогично (6) находим 1 1 2 1 1 2 1 0 P{ , } P{ } P{ , / }, n m B B m B B m        (20) где def * 1 1 1 1{ ,( ) }B t t k   def 2 2 .{ ) }(B t t t k   Пусть Q — число всех векторов , 1( , ),n m каждый из которых име- ет 1 2( )k k 2-цепочек вида * 1 1t t (3-цепочек вида ).t t t Тогда с учетом (15) имеем 1 1 1 2 1P{ , / } ( ) . m nB B m C Q   (21) Далее установим формулу для нахождения числа .Q Рассмотрим подмно- жество 0 1 1 2 1( , , , ; ) ( , )D m m k k t n m всех попарно отличных векторов, каж- Международный научно-технический журнал «Проблемы управления и информатики», 2019, № 5 99 дый из которых начинается и заканчивается элементом ,t содержит 1 2( )k k 2-цепочек вида * 1 1t t (3-цепочек вида ).t t t Отметим, что произвольный век- тор , 0 1 1 2( , , , ; ),D m m k k t обладает таким свойством: перестановка в век- торе  между собой -серий, {0,1}, не изменяет чисел 1k и 2.k Это поз- воляет записать равенство * * * * 1 2 0 ( , , , ; ) t t m t t tQ D m m k k t       * * * * * * * 1 2 0 1 ( , , 1, ; ) t t t t m m t t t tD m m k k t            . (22) Покажем, что 2 1 1 1 * 1 1 0 1 1 2 1 1 21 1 ( , , , ; ) ( 1, 1).t t m k k k t tk m D m m k k t С C Z m k m k k             (23) Действительно, для произвольного вектора , 0 1 1 2( , , , ; ),D m m k k t имеем ( ) 2 11 2 2, t tk m k     (24) где ( ) 1 t  — число t -серий длины единица в векторе . Для 2tm  и * 1tm  эле- мент множества 0 1 1 2( , , , ; )D m m k k t определяется однозначно, если  зафиксировать одно из ( ) 1 1 1 t k С   возможных размещений t -серий длины еди- ница каждая;  зафиксировать одно из возможных разбиений числа *tm на 1k *t -серий, длина каждой из которых не меньше единицы;  зафиксировать одно из возможных разбиений числа ( ) 1 t tm   на ( ) 1 11 t k    t -серий, длина каждой из которых не меньше двух. Отсюда с учетом (24) получаем (23). (Если * 0,tm  то в формуле (23) пола- гаем 1 * 1 1 1 1{1, если 0; 0, если 1}. t k m C k k      С помощью (14) и (23) находим для 2tm  и * 0tm  * * 0 * * 1 2( , , , ; ) t t m t t tD m m k k t     2 1 1 1 * 1 1 1 21 ( 1, 1),t t m k k k t tk m C C Z m k m k k           (25) * * * 0 * 1 * * * 1 2( , , 1, ; ) t t t t m m t t t tD m m k k t           2 1 1 1 * 1 1 2( , ).t t m k k k t tk m C C Z m k m k k       (26) 100 ISSN 0572-2691 Из (22), (25) и (26) следует равенство 21 * 1 1 2 { , 1} ( , ) ( 2),t t m k ik t t tim i k k Q C C Z m i m i k m           которое вместе с (20), (21), (5) и очевидными соотношениями 1 1 2* 1 1 1 2 (P{ *}) , если 0, P{ ( ) , ( ) } 0 в остальных случаях, n tt m k k t t k t t t k              * 1 1 1 2P{ ( ) , ( ) }t t k t t t k     1 1 1 1 2 1 1 1 1 2 (P{ *}) P{ }, если 1, 0, ( 1)(P{ *}) P{ }, если 1, 0, 0 в остальных случаях n t n t t t m k k n t t m k k                          приводит к (17). Используя схему доказательства равенства (17), можно проверить (16), (18) и (19). 5. Примеры к теореме 2 5.1. Иллюстрация использования равенства (16). В табл. 4 и на рис. 3 при- ведено использование соотношения (16) для 1/ 2p q  , малой выборки длины ,n 20,n  и некоторых значений 1,k 2k . Таблица 4 (k1, k2) P Pc (k1, k2) P Pc (3, 7) 0,010046 0,160690308 (5, 7) 0,0258274 0,415276527 (7, 4) 0,011816 0,172506332 (6, 6) 0,0259638 0,441240311 (3, 2) 0,0121012 0,184607506 (4, 6) 0,0309591 0,47219944 (3, 6) 0,0121164 0,196723938 (6, 5) 0,0358648 0,50806427 (7, 5) 0,0131178 0,209841728 (6, 3) 0,0363922 0,544456482 (3, 5) 0,013607 0,223448753 (4, 2) 0,0369673 0,581423759 (3, 3) 0,0137167 0,237165451 (4, 5) 0,0379229 0,619346619 (3, 4) 0,0142107 0,251376152 (5, 6) 0,0386162 0,657962799 (4, 8) 0,015398 0,266774178 (6, 4) 0,0412607 0,699223518 (5, 8) 0,015399 0,282173157 (4, 3) 0,0421267 0,741350174 (6, 7) 0,0161362 0,298309326 (4, 4) 0,0421772 0,783527374 (6, 2) 0,0196438 0,31795311 (5, 2) 0,0471888 0,830716133 (4, 7) 0,0229654 0,340918541 (5, 5) 0,0509062 0,881622314 (5, 1) 0,0231276 0,364046097 (5, 4) 0,0590916 0,940713882 (4, 1) 0,025403 0,38944912 (5, 3) 0,0592861 1 Табл. 4 составлена из столбцов, содержание которых аналогично содержанию столбцов табл. 1. Международный научно-технический журнал «Проблемы управления и информатики», 2019, № 5 101 Рис. 3 На рис. 3 дана пузырьковая диаграмма, в которой первый параметр (гори- зонтальная ось) — значение 1k , второй (вертикальная ось) — значение 2k , третий (размер пузырька) — вероятность осуществления события * 1 1 1{ ( ) ,t t k  2( 1 ) ( 0 })t t t t k   , представленная в процентах. 5.2. Иллюстрация использования равенства (17) . В табл. 5 и на рис. 4 приведено использование соотношения (17) для 1/ 2p q  , малой выборки длины ,n 20,n  и некоторых значений 1,k 2k . Таблица 5 (k1, k2) P Pc (k1, k2) P Pc (3, 6) 0,011425 0,099241257 (4, 0) 0,0352583 0,363793373 (3, 1) 0,0120115 0,111252785 (6, 2) 0,0405884 0,404381752 (3, 5) 0,0139112 0,125164032 (4, 4) 0,040679 0,44506073 (3, 2) 0,0145435 0,139707565 (4, 1) 0,0458231 0,490883827 (5, 5) 0,0150604 0,15476799 (4, 3) 0,0493002 0,540184021 (3, 4) 0,0154448 0,170212746 (4, 2) 0,0516081 0,591792107 (3, 3) 0,0157051 0,185917854 (5, 3) 0,0564699 0,648262024 (7, 1) 0,0161695 0,202087402 (6, 1) 0,0605555 0,708817482 (4, 6) 0,0171032 0,219190598 (6, 0) 0,0657034 0,774520874 (6, 3) 0,0193596 0,238550186 (5, 0) 0,0684748 0,842995644 (7, 0) 0,027894 0,266444206 (5, 2) 0,0760345 0,91903019 (4, 5) 0,0288258 0,295269966 (5, 1) 0,0809698 1 (5, 4) 0,0332651 0,32853508 Табл. 5 состоит из столбцов, содержание которых аналогично содержа- нию столбцов табл. 1. – 1 0 1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 k 1 10 11 12 13 14 k 2 102 ISSN 0572-2691 Рис. 4 На рис. 4 представлена пузырьковая диаграмма, в которой первый параметр (горизонтальная ось) — значение 1,k второй (вертикальная ось) — значение 2 ,k третий (размер пузырька) — вероятность осуществления события * 1 1 1{ ( ) ,t t k  2( ) },t t t k  которая представлена в процентах. 5.3. Иллюстрация использования равенства (18). В табл. 6 и на рис. 5 при- ведено использование соотношения (18) для 1/ 2,p q  малой выборки дли- ны ,n 20,n  и некоторых значений 1,k 2.k Таблица 6 (k1, k2) P Pc (k1, k2) P Pc (2, 0) 0,0118675 0,075144768 (5, 4) 0,0383215 0,332155228 (7, 4) 0,016923 0,092067719 (3, 1) 0,0517502 0,383905411 (7, 5) 0,0171833 0,109251022 (5, 1) 0,0579596 0,441864967 (3, 2) 0,0206223 0,129873276 (6, 4) 0,0593233 0,501188278 (6, 5) 0,0233202 0,153193474 (6, 3) 0,066824 0,568012238 (6, 2) 0,0338459 0,187039375 (4, 2) 0,1008682 0,668880463 (4, 0) 0,0340939 0,221133232 (4, 1) 0,1047363 0,773616791 (3, 0) 0,0362511 0,2573843 (5, 3) 0,1050091 0,87862587 (4, 3) 0,0364494 0,293833733 (5, 2) 0,1213741 1 Табл. 6 составлена из столбцов, содержание которых аналогично содержанию столбцов табл. 1. На рис. 5 дана пузырьковая диаграмма, в которой первый параметр (горизон- тальная ось) — значение 1,k второй (вертикальная ось) — значение 2 ,k третий (раз- мер пузырька) — вероятность осуществления события * 1 1 1{ ( ) ,t t k  * 2( ) },t t t k  которая представлена в процентах. – 1 0 1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 k 1 10 11 12 13 k 2 – 2 8 9 Международный научно-технический журнал «Проблемы управления и информатики», 2019, № 5 103 Рис. 5 5.4. Иллюстрация использования равенства (19). В табл. 7 приведено ис- пользование соотношения (19) для 1/ 2,p q  малой выборки длины ,n 20,n  и некоторых значений 1,k 2k и 3.k Таблица 7 k1 k2 k3 P Pc k1 k2 k3 P Pc 7 0 4 0,010347 0,432714 5 3 2 0,018559 0,670737 6 1 2 0,010829 0,443543 6 1 4 0,018897 0,689634 5 2 1 0,011859 0,455402 4 3 1 0,01915 0,708784 4 5 2 0,012703 0,468105 4 3 2 0,019386 0,72817 6 2 3 0,01318 0,481285 5 0 1 0,02039 0,74856 5 4 3 0,013247 0,494532 4 1 1 0,02113 0,76969 4 4 1 0,013325 0,507856 5 3 3 0,021782 0,791471 4 1 2 0,013573 0,521429 5 1 3 0,022125 0,813597 5 0 3 0,01358 0,535009 4 2 1 0,022333 0,83593 6 0 4 0,01442 0,549429 6 1 3 0,022564 0,858494 6 2 4 0,014892 0,564321 6 0 3 0,025177 0,883671 4 0 1 0,016785 0,581105 5 2 3 0,025787 0,909458 4 4 2 0,017544 0,598649 5 0 2 0,028 0,937458 4 2 2 0,017824 0,616473 5 2 2 0,029125 0,966583 5 1 1 0,017853 0,634326 5 1 2 0,033417 1 6 0 2 0,017853 0,652179 В табл. 7 в первом, втором и третьем столбцах приведены все возможные ва- рианты значений 1,k 2k и 3,k для которых вероятность * 1 1 1 2P{ ( ) , ( ) ,t t k t t t k    0 1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 k 1 k 2 8 – 1 104 ISSN 0572-2691 * 3( ) 0,01,}t t t k   а содержание четвертого и пятого столбцов аналогично содержанию соответственно второго и третьего столбцов табл. 1 (см. 3.1). Заключение В работе установлены совместные распределения числа 2-цепочек и числа 3-цепочек фиксированного вида случайной битовой последовательности. Даны примеры использования этих распределений. Возможным применением полу- ченных формул может быть проверка гипотезы случайности расположения нулей и единиц в (0, 1)-последовательности конечной длины. В.І. Масол, С.В. Поперешняк СТАТИСТИЧНИЙ АНАЛІЗ ЛОКАЛЬНИХ ДІЛЯНОК БІТОВИХ ПОСЛІДОВНОСТЕЙ Розглянуто сумісні розподіли числа 2-ланцюжків і числа 3-ланцюжків фіксова- ного вигляду випадкової (0, 1)-послідовності, які дозволяють здійснювати ста- тистичний аналіз локальних ділянок цієї послідовності. Сформульовано і дове- дено дві теореми. У теоремах 1, 2 для числа s-ланцюжків вигляду *,t t *1 ,t t *0 ,t t * 1 1 ,t t * 1 11t t ( * 1 1,t t 1 ,t t 0 ,t t ,t t t , * ),t t t що зʼявилися у випадковій бітовій послідо- вності довжини n, 0,n  встановлено явні вирази сумісних розподілів таких подій: * * * 1 2{ ( ) , ( 1 ) ( ) },0t t k t t t t k      * * 1 1 1 1 1 2{ ( ) , },( )t t k t t t k    * 1{ ( ) ,t t k  * * 2 3( 1 ) , ( 0 ) },t t k t t k    * 1 1 1 2}({ ( ) , ) ,( 1 ) ( 0t t k t t t t k      * 1 1 1{ ( ) ,t t k  2( ) },t t t k  * * 1 1 1 2{ ( ) , ( },)t t k t t t k    * * 1 1 1 2 3{ ( ) , ( ) (, })) ,t t k t t t k t t t k      де 1 2( ... )st t t — число s-ланцюжків вигляду 1 2 ... st t t у вихідній n-ви- мірній (0, 1)-послідовності; 1k , 2 ,k 3k — відповідні цілі невідʼємні числа. Одне з основних припущень кожної теореми полягає у тому, що нулі і оди- ниці бітової послідовності — це незалежні однаково розподілені випадкові величини. Доведення формул для розподілів зазначених подій побудовано на підрахунку числа відповідних сприятливих подій за умови, що (0, 1)-пос- лідовність містить фіксовану кількість нулів і одиниць. В якості прикладів використання явних виразів сумісних розподілів наведено таблиці, в яких розміщено значення ймовірностей перерахованих вище подій для випадко- вої (0,1)-послідовності довжини ,n 20,n  і деяких значень параметрів 1k , 2k і 3k за припущенням, що нулі і одиниці зʼявляються рівноймовірно. Для наочності, частина таблиць проілюстрована бульбашковими діаграмами. Знайдені формули можуть становити інтерес для задач тестування локаль- них ділянок, які формуються на виході генераторів псевдовипадкових чи- сел, для деяких задач захисту інформації від несанкціонованого доступу, а також в інших сферах, де виникає необхідність в аналізі бітових послідов- ностей. Ключові слова: s-ланцюжки, бітова послідовність, випадковість, локальні ді- лянки, сумісний розподіл. V.I. Masol, S.V. Popereshnyak STATISTICAL ANALYSIS OF LOCAL PLOTS OF BITS SEQUENCES The joint distributions of the number of 2-chains and the number of 3-chains of a fixed form of a random (0, 1)-sequence, which allow a statistical analysis of local Международный научно-технический журнал «Проблемы управления и информатики», 2019, № 5 105 sections of this sequence, were examined. Two theorems are formulated and proved. Consider s-chains of the form *,t t *1 ,t t *0 ,t t * 1 1 ,t t * 1 11t t ( * 1 1,t t 1 ,t t 0 ,t t ,t t t , * ),t t t which appeared in random bit sequence of fixed length in Theo- rems 1, 2. For these s-chains, explicit expressions for the joint distributions of such events were established: * * * 1 2{ ( ) , ( 1 ) ( ) },0t t k t t t t k      * 1 1 1{ ( ) ,t t k  * 1 1 2( },)t t t k  * * * 1 2 3{ ( ) , ( 1 ) , ( 0 ) },t t k t t k t t k      * 1 1 1({ ( ) , ( 1 )t t k t t    2( 0 ) },t t k  * 1 1 1 2{ ( ) , ) }( ,t t k t t t k    * * 1 1 1 2{ ( ) , ( },)t t k t t t k    * 1 1{ ( )t t  * 1 2 3,, ( ) ( ) }),k t t t k t t t k     where 1 2( ... )st t t is the number of s-chains of the form 1 2 ... st t t in the initial n-dimensional (0, 1)-sequence; 1k , 2k and 3k are suitable non-negative integers. One of the main assumptions of each theorem is that zeros and ones in a bit sequence are independent identically distributed random variables. The proofs of the formulas for the distributions of these events are based on counting the number of corresponding conductive events, provided that the (0, 1)-sequence contains a fixed number of zeros and ones. As examples of the use of explicit expressions of joint distributions, tables that con- tain the probabilities of the above events for a random (0, 1)-sequence of length ,n 20,n  and some values of the parameters 1k , 2k and 3k under the assump- tion that zeros and units appear equally likely are given. For illustrative purpos- es, some of the tables are illustrated by bubble chart. The established formulas may be of interest for tasks like testing local sections formed at the output of pseudorandom number generators. Also, they may be suitable for some tasks of protecting information from unauthorized access, as well as in other areas where it becomes necessary to analyze bit sequences. Keywords: s-chains, bit sequence, randomness, local segments, joint distribu- tion. 1. Гайдышев И.П. Программное обеспечение анализа данных AtteStat. Руководство пользова- теля. Версия 13. 2012. 505 с. 2. A statistical test suite for random and pseudorandom number generators for cryptographic applications. Andrew Rukhin, Juan Soto, James Nechvatal, Miles Smid, Elaine Barker, Stef- an Leigh, Mark Levenson, Mark Vangel, David Banks, Alan Heckert, James Dray, San Vo. National Institute of Standards and Technology. Special Publication 800-22 revision 1a. 2010. 131 p. 3. Масол В.И. О распределении некоторых статистик (0, 1)-вектора. Исслед. операций и АСУ. Вып. 29. 1987. С. 23–27. 4. Yueqi Hu, Tom Polk, Jing Yang, Ye Zhao, Shixia Liu. Spot-tracking lens: A zoomable user interface for animated bubble charts. IEEE Pacific Visualization Symposium (PacificVis). 2016. P. 16–23. Получено 22.02.2019