Самосинхронизирующаяся система робастных цифровых водяных знаков для речевых сигналов

Запропоновано систему ЦВЗ для автентифікації джерела мовних сигналів. Описаний метод маркування забезпечує робастність водяного знака до зсуву, випадкової обрізки, стиснення з втратами, низькочастотної фільтрації, адитивного білого гаусівського шуму. При детектуванні ЦВЗ використовується метод корел...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Datum:2012
1. Verfasser: Кошкина, Н.В.
Format: Artikel
Sprache:Russian
Veröffentlicht: Інститут кібернетики ім. В.М. Глушкова НАН України 2012
Schriftenreihe:Проблемы управления и информатики
Schlagworte:
Online Zugang:https://nasplib.isofts.kiev.ua/handle/123456789/207491
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:Самосинхронизирующаяся система робастных цифровых водяных знаков для речевых сигналов / Н.В. Кошкина // Проблемы управления и информатики. — 2012. — № 2. — С. 136–145. — Бібліогр.: 5 назв. - рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id irk-123456789-207491
record_format dspace
spelling irk-123456789-2074912025-10-09T00:23:02Z Самосинхронизирующаяся система робастных цифровых водяных знаков для речевых сигналов Система з самосинхронізацією робастних цифрових водяних знаків для мовних сигналів Robust Self-Synchronised Speech Watermarking System Кошкина, Н.В. Проблемы защиты информации Запропоновано систему ЦВЗ для автентифікації джерела мовних сигналів. Описаний метод маркування забезпечує робастність водяного знака до зсуву, випадкової обрізки, стиснення з втратами, низькочастотної фільтрації, адитивного білого гаусівського шуму. При детектуванні ЦВЗ використовується метод кореляційного аналізу, при якому детектор не потребує знання оригінального сигналу. Watermarking system for authentication a source of speech signals is offered. The described method of marking provides a watermark robustness to the shift, random cropping, lossy compression, low pass filtering, additive white Gaussian noise. The watermark detection method of the correlation analysis at which the detector does not require knowledge of an original signal is used. 2012 Article Самосинхронизирующаяся система робастных цифровых водяных знаков для речевых сигналов / Н.В. Кошкина // Проблемы управления и информатики. — 2012. — № 2. — С. 136–145. — Бібліогр.: 5 назв. - рос. 0572-2691 https://nasplib.isofts.kiev.ua/handle/123456789/207491 004.415.24/004.56.5 10.1615/JAutomatInfScien.v44.i3.60 ru Проблемы управления и информатики application/pdf Інститут кібернетики ім. В.М. Глушкова НАН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Russian
topic Проблемы защиты информации
Проблемы защиты информации
spellingShingle Проблемы защиты информации
Проблемы защиты информации
Кошкина, Н.В.
Самосинхронизирующаяся система робастных цифровых водяных знаков для речевых сигналов
Проблемы управления и информатики
description Запропоновано систему ЦВЗ для автентифікації джерела мовних сигналів. Описаний метод маркування забезпечує робастність водяного знака до зсуву, випадкової обрізки, стиснення з втратами, низькочастотної фільтрації, адитивного білого гаусівського шуму. При детектуванні ЦВЗ використовується метод кореляційного аналізу, при якому детектор не потребує знання оригінального сигналу.
format Article
author Кошкина, Н.В.
author_facet Кошкина, Н.В.
author_sort Кошкина, Н.В.
title Самосинхронизирующаяся система робастных цифровых водяных знаков для речевых сигналов
title_short Самосинхронизирующаяся система робастных цифровых водяных знаков для речевых сигналов
title_full Самосинхронизирующаяся система робастных цифровых водяных знаков для речевых сигналов
title_fullStr Самосинхронизирующаяся система робастных цифровых водяных знаков для речевых сигналов
title_full_unstemmed Самосинхронизирующаяся система робастных цифровых водяных знаков для речевых сигналов
title_sort самосинхронизирующаяся система робастных цифровых водяных знаков для речевых сигналов
publisher Інститут кібернетики ім. В.М. Глушкова НАН України
publishDate 2012
topic_facet Проблемы защиты информации
url https://nasplib.isofts.kiev.ua/handle/123456789/207491
citation_txt Самосинхронизирующаяся система робастных цифровых водяных знаков для речевых сигналов / Н.В. Кошкина // Проблемы управления и информатики. — 2012. — № 2. — С. 136–145. — Бібліогр.: 5 назв. - рос.
series Проблемы управления и информатики
work_keys_str_mv AT koškinanv samosinhroniziruûŝaâsâsistemarobastnyhcifrovyhvodânyhznakovdlârečevyhsignalov
AT koškinanv sistemazsamosinhronízacíêûrobastnihcifrovihvodânihznakívdlâmovnihsignalív
AT koškinanv robustselfsynchronisedspeechwatermarkingsystem
first_indexed 2025-10-09T01:08:04Z
last_indexed 2025-10-12T01:06:52Z
_version_ 1845736203811291136
fulltext © Н.В. КОШКИНА, 2012 136 ISSN 0572-2691 ПРОБЛЕМЫ ЗАЩИТЫ ИНФОРМАЦИИ УДК 004.415.24/004.56.5 Н.В. Кошкина САМОСИНХРОНИЗИРУЮЩАЯСЯ СИСТЕМА РОБАСТНЫХ ЦИФРОВЫХ ВОДЯНЫХ ЗНАКОВ ДЛЯ РЕЧЕВЫХ СИГНАЛОВ Системы цифровых водяных знаков (ЦВЗ) находят свое применение для ре- шения многих задач информационной безопасности, одна из них — аутентифика- ция источника информации (устройства). Аутентичность источника может быть подтверждена наличием в исследуемом сигнале ЦВЗ, идентифицирующего дан- ный источник и актуального на момент проверки. При этом внедрение ЦВЗ не должно нарушать функциональность сигнала-контейнера, а проверка наличия или отсутствия его в сигнале может быть выполнена только тогда, когда известен сек- ретный ключ. Маркированный цифровым водяным знаком сигнал, как правило, попадает в открытый доступ, где возможно будет модифицирован. Модификации сигнала- контейнера могут отражаться как на значениях его элементов (отсчетов аудиосиг- нала, пикселов изображения и т.д.), так и на их местоположениях. Следствием ряда типичных операций обработки является десинхронизация внедренного ЦВЗ в сиг- нале-контейнере. Например, при конвертации файла с маркированным аудиосигна- лом (рис. 1, а) из формата WAV(PCM) в формат ACC c помощью программы LameXP (рис. 1, б) или в формат WMA с помощью программы WinFF (рис. 1, в) происходит сдвиг (задержка) сигнала во времени, что в дальнейшем может приво- дить к извлечению ЦВЗ из неправильных местоположений (не тех, в которые он был внедрен). Такая же проблема возникает и при обрезке маркированного сигнала. Причем в случае обрезки проблема состоит не только в сдвиге сигнала по времен- ной оси, а и в обеспечении возможности распознать ЦВЗ по части сигнала. Кроме неумышленных атак, возникших в ходе обработки сигнала-контей- нера, при разработке системы ЦВЗ предполагается наличие активного нарушите- ля, который может целенаправленно выполнить атаку десинхронизацией, сохра- няющую функциональность сигнала и по сути не удаляющую ЦВЗ, но нарушаю- щую корректную работу детектора. Таким образом, разработка эффективной системы ЦВЗ включает в себя решение проблемы десинхронизации. В [1, 2] предложен метод маркировки му- зыкальных композиций для защиты авторских прав на них, внедряющий ЦВЗ в области сигнала, инвариантные к сдвигу и умеренной обрезке. Возник интерес исследовать и адаптировать данный метод для решения задачи аутентификации ис- точника цифровых речевых сигналов. Речевые сигналы характеризуются меньшим частотным диапазоном и, как правило, более низким соотношением сигнал/шум по сравнению с музыкальными. Кроме того, в отличие от музыкальных, в речевых за- писях типично наличие участков тишины, и если модификации, привнесенные внедрением ЦВЗ, затронут эти участки, они станут слышимыми, как это происхо- дит для ЦВЗ, внедренных в частотную область вейвлет-коэффициентов 5–6 уровней разложения речевого сигнала, при применении метода из [1]. Международный научно-технический журнал «Проблемы управления и информатики», 2012, № 2 137 0 5000 10000 15000 20000 25000 30000 35000 40000 45000 50000 – 0,5 0 0,5 а 0 – 0,5 0 0,5 б 0 – 0,5 0 0,5 в 5000 10000 15000 20000 25000 30000 35000 40000 45000 50000 5000 10000 15000 20000 25000 30000 35000 40000 45000 50000 Рис. 1 В настоящей статье предлагается система маркировки речевых сигналов цифровыми водяными знаками с самосинхронизацией по особым точкам сигнала и внедрением ЦВЗ в спектральной области. Каждое устройство, зарегистрирован- ное в системе, получает свой ключ key, который используется как стартовое число генератора псевдослучайного ЦВЗ. Цифровой водяной знак внедряется в чувстви- тельные к искажениям области, местоположения которых определяют особые точки. При детектировании используется метод корреляционного анализа, при котором детектор не нуждается в знании оригинального сигнала, т.е. детектиро- вание «слепое». Определить наличие или отсутствие ЦВЗ можно, только зная ключ key или сам водяной знак. В разд. 1 описан используемый метод синхронизации, в разд. 2 — метод внедрения ЦВЗ, в разд. 3 — метод его детектирования, в разд. 4 анализируется робастность ЦВЗ и надежность системы. Численные эксперименты выполнены с помощью пакета Matlab R2010b. 1. Синхронизация аудиосигналов по особым точкам Методы синхронизации ЦВЗ в контейнерах-изображениях рассмотрены авто- ром в работах [3–5]. Сходные методы можно применить и к аудиосигналам. В данном случае синхронизация будет выполняться по особым точкам сигнала. Хо- роший метод извлечения особых точек должен производить приблизительно один и тот же набор точек для исходного и искаженного атаками сигнала-контейнера. Представленный подход характеризуется гораздо меньшей вычислительной слож- ностью, чем синхронизация на основе полного перебора вариантов, что делает воз- можным «слепое» детектирование. Еще одним существенным преимуществом яв- ляется то, что в отличие от методов синхронизации на основе шаблонов, синхрони- зирующая информация не добавляется к сигналу, а извлекается из него на основе анализа содержимого. В то время как явно добавленный шаблон синхронизации может может быть обнаружен и уничтожен нарушителем, синхронизация по осо- бым точкам не вводит никаких дополнительных искажений в сигнал. Одним из вариантов особых точек в сигнале являются точки, в которых наблюдается скачок энергии. Местоположения таких точек трудно существенно сместить, не вводя при этом слышимое искажение. ЦВЗ целесообразно внедрять в значимые области сигнала-контейнера, а такими являются области после особых точек, так как они содержат высокую энергию. 138 ISSN 0572-2691 Пусть имеем исходный речевой сигнал, оцифрованный с частотой дискрети- зации .dF Определение особых точек в нем осуществляется следующим образом. 1. Сигнал разбивается на блоки определенной длины. К каждому блоку при- меняется трехуровневая вейвлет-декомпозиция, на выходе которой образуется че- тыре субполосы: аппроксимирующая ),(3 nA лежащая в частотном диапазоне , 16 ,0       dF и три детализирующих: ),(),(),( 123 nDnDnD лежащие соответственно в диапазонах , 8 , 16       dd FF , 4 , 8       dd FF . 2 , 4       dd FF Так как человеческая речь находится в диапазоне частот 300 Гц – 3,5 кГц, ча- сто оказывается, что субполоса )(3 nA содержит низкую энергию, поэтому ис- ключается из области внедрения. Субполоса )(1 nD тоже может нести мало энер- гии, кроме того, аудиокодеки, выполняющие сжатие с потерями, как правило, об- резают высокочастотные компоненты сигнала. Следовательно, в )(1 nD внедрять ЦВЗ также нецелесообразно. Таким образом, дальнейший анализ и преобразова- ния выполняются только для субполос ).(),( 23 nDnD Этот шаг повышает ста- бильность выделяемого набора особых точек и увеличивает робастность ЦВЗ к дальнейшей обработке сигнала и атакам. 2. Для каждого коэффициента текущей субполосы внедрения ),(nD j ,3,2j рассчитывается полная энергия r коэффициентов до него и после:                .,,1),()( ),()( 2 1 0 after 2 1 before jj r i j ri NninDnE inDnE  (1) 3. Вычисляется отношение найденных двух энергий: .,,1, )( )( )(ratio before after jNn nE nE n  (2) 4. Скачки энергии определяются из условий: .,,1,)(ratio 1 jNnTn  (3) .,,1,)( 2after jNnTnE  (4) Условие (4) предотвращает выбор точек, отмечаемых как скачки энергии, в силу близких к нулю значений ).(before nE 5. Часто коэффициенты, удовлетворяющие условиям (3), (4), встречаются группами. Для повышения стабильности итогового набора оставляются только те группы, которые состоят более чем из 3T подряд идущих выбранных точек. 6. В качестве синхронизирующей точки в каждой оставленной группе выби- рается точка с максимальным значением ).(ratio n По местоположениям точек, отобранных на данном шаге, будет выполняться синхронизация в детекторе ЦВЗ. 7. Так как в дальнейшем ЦВЗ будет внедряться в p2 последовательных от- счета, начиная с каждой отобранной особой точки, то в наборе отобранных точек оставляют только те, расстояние между которыми больше .2 p Международный научно-технический журнал «Проблемы управления и информатики», 2012, № 2 139 ЦВЗ будет внедрен в сигнал столько раз, сколько особых точек было опреде- лено в нем в результате выполнения шагов 1–7. Отметим, что пороги 21, TT и 3T подбираются таким образом, чтобы обеспечить определение как минимум одной- двух особых точек в секунде звучания аудиосигнала. На рис. 2 в качестве примера приведен результат извлечения местоположений особых точек из субполосы )(3 nD одного из исходных тестовых сигналов, оцифро- ванного с частотой дискретизации 8 кГц (местоположения особых точек отмечены вертикальным пунктиром с маркером). В результате применения к сигналу выше- описанного алгоритма определения особых точек с параметрами ;1024r ;201 T ;/5)(mean after2 ET  ;53 T 1024p в )(3 nD было выделено 14 точек. 0 10000 20000 30000 – 1 – 0,5 0 0,5 1 40000 50000 60000 70000 80000 90000 100000 110000 Рис. 2 Поскольку особые точки зависят от содержимого сигнала, а не являются фиксированными относительно временнóй шкалы, то их местоположение инвари- антно к сдвигу сигнала. Наиболее частой на практике операцией обработки аудио является сжатие с потерями. В настоящее время распространены такие стандарты сжатия, как MPEG-1 Layer 3 (MP3), MPEG-2/4 (AAC), Ogg Vorbis, WMA. Они довольно гибки в том смысле, что позволяют задавать разные параметры кодирования, варьируя тем самым степень сжатия и качество результата. Также следует учесть стандар- ты, специально предназначенные для сжатия сигнала в речевом диапазоне частот, например AMR. В отличие от остальных перечисленных стандартов AMR может кодировать звук только в режиме моно с частотой не более 8 кГц и обеспечивать поток данных не выше 12,2 кбит/с. Кроме сжатия, типичными атаками для аудиоконтейнеров являются аддитивный белый гауссовский шум и низкочастот- ная фильтрация. Представление об устойчивости выделенных особых точек к перечисленным модификациям дает табл. 1, полученная в результате одного из экспериментов. В качестве базового вейвлета при декомпозиции использовались вейвлеты семей- ства Добеши от 8-го порядка и выше, с учетом того, что увеличение порядка вейвлета улучшает качество декомпозиции-реконструкции, но вместе с тем уве- личивает вычислительную сложность реализации. В первом столбце табл. 1 приведены индексы местоположений особых точек, определенных в вейвлет-коэффициентах исходного сигнала. В остальных столб- цах приведены индексы местоположений особых точек, определенных в вейвлет- коэффициентах сигнала, подвергшегося указанной в заголовке атаке, и их сдвиг относительно исходных точек. В данном случае особая точка считалась устойчи- вой, если сдвиг ее местоположения до и после атаки сигнала не превышал 50 от- счетов. Неустойчивые особые точки в таблице отмечены жирным шрифтом. Как видим, лидер по количеству смещенных особых точек — атака AMR- сжатием. В этом случае и качество сжатого сигнала хуже, чем сигнала, закодиро- ванного согласно остальным четырем стандартам. Кроме того, при WMA-сжатии получена задержка сигнала на 512 отсчетов, и как следствие, сдвиг индексов вейвлет-коэффициентов субполосы 3D на 64 отсчета, а субполосы 2D — на 128. Подобный сдвиг индексов относительно содержимого возникает и при кодирова- нии MPEG-4 Audio. 140 ISSN 0572-2691 Таблица 1 Исход- ный сигнал Атаки Белый шум, 40 дБ НЧ фильтр, 2 кГц Сжатие MP3, 32 kbps Сжатие OGG, 32 kbps Сжатие WMA, 32 kbps Сжатие MPEG-4 Audio, 32 kbps Сжатие AMR В субполосе D3(n) 156872 156872 0 156872 0 156872 0 156872 0 156936 – 64 156360 512 156886 – 14 159887 159887 0 159887 0 159887 0 159887 0 159951 – 64 159369 518 159909 – 22 162324 162324 0 162324 0 162325 – 1 162324 0 162388 – 64 161812 512 162333 – 9 164437 – 169071 169071 0 169071 0 169071 0 169071 0 169135 – 64 168558 513 169083 – 12 177397 177397 0 177397 0 177397 0 177397 0 177461 – 64 176885 512 177404 – 7 185718 185718 0 185718 0 185718 0 185718 0 185782 – 64 185206 512 185727 – 9 194038 194038 0 194038 0 194038 0 194038 0 194102 – 64 193527 511 194047 – 9 203017 – 210455 210455 0 210455 0 210455 0 210442 13 210519 – 64 209933 522 210464 – 9 215037 215037 0 215037 0 215037 0 215037 0 215101 – 64 214525 512 215046 – 9 217421 217421 0 217421 0 217421 0 217421 0 217485 – 64 216909 512 217431 – 10 220926 220926 0 220926 0 220926 0 220926 0 220990 – 64 220414 512 220935 – 9 227198 227198 0 227198 0 227198 0 227198 0 227262 – 64 226686 512 227206 – 8 235390 235390 0 235390 0 235390 0 235390 0 235454 – 64 234877 513 235402 – 12 243716 243716 0 243716 0 243716 0 243716 0 243780 – 64 243203 513 243723 – 7 В субполосе D2(n) 301658 301658 0 287962 – 301690 – 32 301658 0 301789 – 131 300621 1037 301676 – 18 301658 0 305337 305335 2 305335 2 305337 0 305335 2 305465 – 128 304313 1024 305356 – 19 309628 309628 0 309628 0 309628 0 309629 – 1 309756 – 128 308602 1026 309649 – 21 319700 319700 0 319433 267 319698 2 319433 267 319828 – 128 318700 1000 319463 237 327914 327914 0 327914 0 327914 0 327914 0 328042 – 128 326888 1026 327932 – 18 333329 333329 0 333329 0 333327 2 333329 0 333457 – 128 332305 1024 333018 311 371438 – 403158 403155 3 388078 – 403158 0 403158 0 403286 – 128 402120 1038 403176 – 18 403159 – 1 406625 406625 0 406625 0 406625 0 406625 0 406753 – 128 405601 1024 406643 – 18 415188 415188 0 415188 0 415188 0 415188 0 415316 – 128 414166 1022 415126 62 420037 420037 0 419995 42 420029 8 420041 – 4 420160 – 123 418994 1043 420083 – 46 431737 431737 0 431687 50 431737 0 431707 30 431713 24 430695 1042 431751 – 14 434816 434817 – 1 434783 33 434816 0 434797 19 434930 – 114 433774 1042 434836 – 20 441917 441917 0 441915 2 441923 – 6 441911 6 442056 – 139 440893 1024 441942 – 25 454393 – Международный научно-технический журнал «Проблемы управления и информатики», 2012, № 2 141 2. Внедрение ЦВЗ в коэффициенты дискретного преобразования Фурье Хотя особые точки определяются так, чтобы быть максимально устойчивыми к атакам на сигнал, получить достаточно много точек, устойчивых к любым ак- тивным атакам, нельзя. Часто возникает некоторое, пусть и небольшое, смещение точки после атаки (см. табл. 1). Смещение особых точек может произойти и в ре- зультате процесса маркировки. Если внедрение будет происходить непосред- ственно во временнóй области, то любое смещение окажется критичным для син- хронизации. Однако задача упрощается, если внедрять ЦВЗ в спектральную об- ласть, а именно в коэффициенты амплитудного спектра Фурье. Пусть область внедрения определена как ),(if ,2,,1 pi  где )1(f — осо- бая точка, и ЦВЗ будет внедряться в амплитудный спектр Фурье ,)(rF .2,,1 pr  Предположим, что после атаки на сигнал особая точка была извлече- на со смещением и область внедрения определена как ),(ig pi 2,,1 (рис. 3). Одним из свойств дискретного преобразования Фурье (ДПФ) есть инвариантность амплитудного спектра к циклическому сдвигу сигнала, т.е. если сформировать сигнал ),(ih ,2,,1 pi  как показано на рис. 3, то ,)()( rFrH  .2,,1 pr  (5) Обозначим разность между )(ih и )(ig через :)(is ),()()( igihis  .2,,1 pi  (6) Пользуясь свойством линейности ДПФ, запишем ,)()()( rSrHrG  ,2,,1 pr  (7) откуда с учетом (5) получаем ,)()()( rSrFrG  .2,,1 pr  (8) Для амплитудного спектра Фурье явление десинхронизации во временнóй обла- сти заменяется аддитивной помехой. Если смещение относительно длинны области внедрения p2 небольшое, то энергия )(rS окажется малой и .)()( rFrG  f(i) g(i) h(i) s(i) Особая точка в атакованном сигнале Особая точка в исходном сигнале   Рис. 3 142 ISSN 0572-2691 ЦВЗ )(rW представляет собой псевдослучайную последовательность из 12 p элементов, распределенных по нормальному закону с нулевым средним и единичной дисперсией. В качестве стартового значения генератора ЦВЗ исполь- зуется ключ устройства key. Пусть в результате анализа аудиосигнала в субполосе )(nD j получено jM особых точек. Областями внедрения ЦВЗ будут служить блоки по p2 коэффициен- тов ),(nD j которые обозначим ),(, if mj ,2,,1 pi  ,,,1 jMm  где )1(,mjf — особые точки. Для каждой области вычисляется амплитудный спектр Фурье ,)(, rF mj .2,,1 pr  Далее формируется бинарная перцепционная маска ),(, rI mj которая накладывается на ЦВЗ :)(rW ),()()( ,, rWrIrW mjmj  .2,,1 1 pr  (9) В [1] предложена маска, содержащая единицы в местах расположения q наибольших коэффициентов и нули во всех остальных местоположениях первой половины амплитудного спектра. Такая маска подходит для музыкальных компози- ций, поскольку они обладают «богатым» спектральным наполнением. Вместе с тем для речевых сигналов ее целесообразно оптимизировать, например, рассчитав пороги частотного маскирования согласно психоакустической модели стандарта MPEG-1 Layer 3 и при внедрении ЦВЗ изменять коэффициенты, не превышая эти пороги. Так как спектр вещественного сигнала симметричен, чтобы не нарушить симметрию, ЦВЗ, полученный согласно (9), симметрично дополняется:         .2,,22),22()( ,12,1,0)( 1 ,, 1 , ppp mjmj p mj rrWrW rrW  (10) Сформированный по (9) и (10) ЦВЗ внедряется в спектр следующим образом: )],(1[)()( ,,, rWrFrF mjmjmj  ,2,,1 pr  (11) где  — константа, регулирующая силу ЦВЗ. После маркировки блока соглас- но (11) носителем ЦВЗ становятся измененные коэффициенты амплитудного спектра, а фазовый спектр при этом остается неизменным. В дальнейшем для каждой маркированной области выполняется обратное ДПФ и она замещает в сигнале соответствующую немаркированную область. 3. Слепое детектирование ЦВЗ На вход детектора подается тестируемый аудиосигнал и ЦВЗ, наличие или отсутствие которого будет проверяться. Процедура детектирования ЦВЗ повторя- ет процедуру внедрения до момента нахождения ),( ~ , rW mj формируемого из ис- ходного ЦВЗ по выражениям (9) и (10). Решение о наличии или отсутствии ЦВЗ в сигнале принимается по значению усредненного коэффициента корреляции, определяемого по формуле , )( ~ )( ~ )( ~ )( ~ ~ 1 2 , 2 1 2 , 2 1 ,, 2 1 ~ 1 rWrF rWrF M mj r mj r mjmj r M m pp p         (12) где M ~ — общее количество особых точек, выделенных в аудиосигнале, подан- ном на вход детектора. Если усредненный коэффициент корреляции больше поро- га обнаружения, принимается решение о наличии данного ЦВЗ в сигнале. Международный научно-технический журнал «Проблемы управления и информатики», 2012, № 2 143 В процессе исследований был прове- ден эксперимент по вычислению 1800 коэф- фициентов корреляции для маркирован- ных и немаркированных контейнеров. Ре- зультаты эксперимента отражены на рис. 4, где гистограмма 0H показывает рас- пределение коэффициентов корреляции для пустых, а 1H — для маркированных контейнеров. Из данной статистики следует, что порог обнаружения при параметрах ал- горитма маркирования ;1024r ;201 T ;/5)(mean after2 ET  ;53 T ;1024p 35,0 может быть установлен в преде- лах от 0,14 до 0,17. В детекторе возможно возникновение двух типов ошибок. Существует веро- ятность, что детектор не обнаружит имеющийся ЦВЗ, и вероятность ложного нахождения ЦВЗ в пустом контейнере (вероятность ложной тревоги). Снижение одной вероятности приводит к увеличению другой. Система ЦВЗ должна быть построена таким образом, чтобы минимизировать вероятности возникновения обеих ошибок. Вместе с тем надежность работы детектора характеризуется веро- ятностью ложной тревоги. Чтобы гарантировать отсутствие ложных тревог, порог обнаружения устанавливается максимально высоко. 4. Анализ робастности ЦВЗ и надежности системы При анализе робастности ЦВЗ использовались те же атаки, что и при провер- ке стабильности набора особых точек: аддитивный гауссовский шум мощностью 40 дБ, низкочастотная фильтрация с частотой среза 2 кГц, сжатие MP3, OGG, WMA, MP4 Audio с битрейтом 32 кбит/с и сжатие AMR, а также выполнялся тест на робастность к обрезке, при котором обрезалось 10 % с начала маркированного сигнала и 10 % с конца. На рис. 5 (тест для исходного сиг- нала) коэффициент корреляции, полу- ченный при детектировании ЦВЗ в не- искаженном маркированном контейне- ре с правильным ключом key350, показан в сравнении с коэффициентами корреляции, полученными при детекти- ровании ЦВЗ с 999 другими возможны- ми ключами. На рис. 6 показаны резуль- таты аналогичных тестов для атакован- ного маркированного сигнала, к которому применялись следующие атаки: (а — шум 40 дБ; б — НЧ фильтр 2 кГц; в — сжатие MP3; г — сжатие OGG; д — сжатие WMA; е — сжатие MP4 Audio; ж — сжатие AMR; з — обрезка 20 %). Как видим, коэффициент корреляции, полученный с правильным ключом, может уменьшаться после атак на сигнал. Вместе с тем в данных тестах он всегда остается максимальным и ощутимо бóльшим, чем коэффициенты, полученные с неправильным ключом. Надежность системы ЦВЗ можно оценить с помощью анализа результатов этого же теста. Для этого значения коэффициента корреляции, полученного при детектировании ЦВЗ с правильным ключом в неискаженном маркированном и искаженном атаками маркированном сигнале, выбираются в первую строку табл. 2. Во вторую строку этой таблицы записываются максимальные значения корреляции, полученные при детектировании ЦВЗ с неправильным ключом. – 0,2 – 0,1 0 0,1 0,2 0,3 0,4 0,5 0 5 10 15 20 25 30 35 40 45 0H 1H Рис. 4 0 200 400 600 800 1000 – 0,2 – 0,1 0 0,1 0,2 0,3 0,4 Рис. 5 144 ISSN 0572-2691 0 200 400 600 800 1000 – 0,2 – 0,1 0 0,1 0,2 0,3 0,4 0 200 400 600 800 1000 – 0,2 – 0,1 0 0,1 0,2 0,3 0,4 а б 0 200 400 600 800 1000 – 0,2 – 0,1 0 0,1 0,2 0,3 0,4 0 200 400 600 800 1000 0,1 0,2 0,3 0,4 0 – 0,2 – 0,1 в г 0 200 400 600 800 1000 – 0,2 – 0,1 0 0,1 0,2 0,3 0,4 0 200 400 600 800 1000 – 0,2 – 0,1 0 0,1 0,2 0,3 0,4 д е 0 200 400 600 800 1000 – 0,2 – 0,1 0 0,1 0,2 0,3 0,4 0 200 400 600 800 1000 – 0,2 – 0,1 0 0,1 0,2 0,3 0,4 ж з Рис. 6 Согласно данным первой строки таблицы и предыдущего эксперимента на разде- лимость гипотез (см. рис. 4) после всех указанных атак тестируемый сигнал будет рас- познан как маркированный. Если выставить порог обнаружения равным 0,17, то лож- ная тревога возникает в двух случаях из 9 тыс в этом эксперименте: при детектирова- нии ЦВЗ с ключом key  327 из сигналов, подвергшихся низкочастотной фильтрации и обрезке, что составляет 0,022 % от общего количества тестов в экс- перименте (коэффициенты корреляции, полученные во всех других случаях, не превышают 0,17). Таблица 2  для исходного маркированного контейнера  для маркированного контейнера после атаки Белый шум, 40 дБ НЧ фи- льр, 2 кГц Сжатие MP3, 32 kbps Сжатие OGG, 32 kbps Сжатие WMA, 32 kbps Сжатие MPEG-4 Audio, 32 kbps Сжатие AMR Обрезка, 20 % 0,3932 0,3941 0,3523 0,3794 0,3907 0,3921 0,3734 0,2911 0,303 0,1649 0,1647 0,1703 0,1698 0,1595 0,1658 0,1643 0,1554 0,1915 Международный научно-технический журнал «Проблемы управления и информатики», 2012, № 2 145 Таким образом, для получаемых значений коэффициента корреляции, близ- ких к порогу, имеет смысл проводить полный перебор по всем ключам, что отни- мет больше ресурсов, однако позволит детектору правильно проинтерпретировать полученный результат. Н.В. Кошкіна СИСТЕМА З САМОСИНХРОНІЗАЦІЄЮ РОБАСТНИХ ЦИФРОВИХ ВОДЯНИХ ЗНАКІВ ДЛЯ МОВНИХ СИГНАЛІВ Запропоновано систему ЦВЗ для автентифікації джерела мовних сигналів. Описаний метод маркування забезпечує робастність водяного знака до зсуву, випадкової обрізки, стиснення з втратами, низькочастотної фільтрації, адити- вного білого гаусівського шуму. При детектуванні ЦВЗ використовується ме- тод кореляційного аналізу, при якому детектор не потребує знання оригіналь- ного сигналу. N.V. Koshkina ROBUST SELF-SYNCHRONISED SPEECH WATERMARKING SYSTEM Watermarking system for authentication a source of speech signals is offered. The described method of marking provides a watermark robustness to the shift, random cropping, lossy compression, low pass filtering, additive white Gaussian noise. The watermark detection method of the correlation analysis at which the detector does not require knowledge of an original signal is used. 1. Wu C.-P., Su P.-C., Jay K.C.-C. Robust audio watermarking for copyright protection // Proc. of SPIE, Advanced Signal Processing Algorithms, Architectures, and Implementations IX. — 1999. — 3807. — Р. 387–397. 2. Wu C.-P., Su P.-C., Kuo C.-C. J. Robust and efficient digital audio watermarking using audio content analysis // Proc. of SPIE Electronic Imaging, Security and Watermarking of Multimedia Contents II. — 2000. — 3971. — Р. 382–392. 3. Кошкина Н.В., Никитина О.Ю. К вопросу о защите интеллектуальной собственности на бумажных носителях // Искусственный интеллект. — 2006. — № 3. — C. 757–763. 4. Кошкина Н.В. О методе защиты интеллектуальной собственности на основе выделения то- чечных особенностей изображения // Захист інформації. — 2007. — № 4. — С. 52–63. 5. Кошкина Н.В. Методы синхронизации цифровых водяных знаков // Кибернетика и систем- ный анализ. — 2008. — № 1. — С. 180–188. Получено 13.09.2011