Применение комплексного непрерывного вейвлет-преобразования Морле в обработке аудиосигналов

В статье предложен модифицированный метод фазового вокодера на основе комплексного непрерывного преобразования Морле. Комбинация указанного метода, линейной интерполяции и КИХ-фильтра позволила разработать алгоритм изменения темпа сигнала без изменения его тона. У статті запропоновано модифіковани...

Full description

Saved in:
Bibliographic Details
Date:2008
Main Authors: Ниценко, А.В., Хашан, Т.С.
Format: Article
Language:Russian
Published: Інститут проблем штучного інтелекту МОН України та НАН України 2008
Subjects:
Online Access:https://nasplib.isofts.kiev.ua/handle/123456789/7671
Tags: Add Tag
No Tags, Be the first to tag this record!
Journal Title:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Cite this:Применение комплексного непрерывного вейвлет-преобразования Морле в обработке аудиосигналов / А.В. Ниценко, Т.С. Хашан // Штучний інтелект. — 2008. — № 4. — С. 763-767. — Бібліогр.: 7 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1859643951261155328
author Ниценко, А.В.
Хашан, Т.С.
author_facet Ниценко, А.В.
Хашан, Т.С.
citation_txt Применение комплексного непрерывного вейвлет-преобразования Морле в обработке аудиосигналов / А.В. Ниценко, Т.С. Хашан // Штучний інтелект. — 2008. — № 4. — С. 763-767. — Бібліогр.: 7 назв. — рос.
collection DSpace DC
description В статье предложен модифицированный метод фазового вокодера на основе комплексного непрерывного преобразования Морле. Комбинация указанного метода, линейной интерполяции и КИХ-фильтра позволила разработать алгоритм изменения темпа сигнала без изменения его тона. У статті запропоновано модифікований метод фазового вокодеру, що заснований на комплексному безперервному вейвлет-перетвореннi Морле. Комбiнацiя цього методу, лiнiйної iнтерполяцii та КIХ-фiльтра дозволила розробити алгоритм зміни темпу сигналу без зміни висоти його тону. In this article proposed a modified phase vocoder method, based on complex continuous Morlet wavelet transform. Combination this method with linear interpolation and FIR-filter allowed to develop algorithm of changing the audio tempo without altering the pitch.
first_indexed 2025-12-07T13:25:01Z
format Article
fulltext «Штучний інтелект» 4’2008 763 9Н УДК 004.934 А.В. Ниценко1, Т.С. Хашан2 1Институт проблем искусственного интеллекта МОН и НАН Украины, г. Донецк, Украина 2Институт прикладной математики и механики НАН Украины, г. Донецк, Украина khashan@mail.ru Применение комплексного непрерывного вейвлет-преобразования Морле в обработке аудиосигналов В статье предложен модифицированный метод фазового вокодера на основе комплексного непрерывного преобразования Морле. Комбинация указанного метода, линейной интерполяции и КИХ-фильтра позволила разработать алгоритм изменения темпа сигнала без изменения его тона. В современных приложениях профессиональной обработки аудиоданных широко используются различные методы преобразований сигнала с целью создания эффектов высокого качества. Например, для сокращения времени прослушивания аудиоcигнала, подготовки цифровых фонограмм, реставрации записей, синтезирования электронной музыки, для систем управления партитурой в реальном времени применяют методы изменения высоты тона и темпа сигнала. Они позволяют значительно сэкономить время, поскольку дают возможность исправлять ошибки или корректировать запись без выпол- нения новой. Разработка качественных методов изменения темпа проигрывания сигнала без изменения его тона является актуальной. На текущий момент имеется несколько под- ходов к решению этой задачи. Методы изменения темпа сигнала без изменения его тона Алгоритмы SOLA и PSOLA [1] основаны на методах анализа и обработки сигнала во временной области. Недостатком данных методов является плохое качество звучания измененного сигнала и появление в нем различных артефактов. Применение метода фазового вокодера [2] и ресемплирования сигнала позволяет частично устранить перечисленные недостатки. Ресемплирование сигнала меняет ско- рость воспроизведения сигнала за счет изменения его частоты дискретизации. Для этого обычно применяют методы интерполяции и фильтрации сигналов. Фазовый вокодер – это метод получения частотно-временнόго представления сигнала при помощи быстрого преобразования Фурье (БПФ). Однако БПФ не сохраняет временную информацию о сигнале, о времени появления той или иной частоты. Метод кратковременного преобразо- вания Фурье (КВПФ) является серией оконных БПФ, перекрывающихся по времени и позволяющих за счет фреймового подхода сохранять временнýю информацию о спектре сигнала. Один из традиционных подходов к смене высоты тона без изменения длительности сигнала состоит в вычислении двухмерного частотно-временного представления сигнала описанным выше методом. После этого интервал сетки анализа и фазы коэффициентов масштабируются для создания сетки синтеза. Далее выполняется обратное преобразо- вание, восстанавливающее звуковой сигнал. Таким образом, алгоритм фазового вокодера можно описать последовательностью действий: Ниценко А.В., Хашан Т.С. «Искусственный интеллект» 4’2008 764 9Н 1. Вычисление фазового вокодера. 2. Преобразование коэффициентов в полярную форму. 3. Развертывание фазового спектра и умножение на коэффициент масштабиро- вания c. 4. Восстановление сигнала по новой сетке синтеза. Сетка анализа фазового вокодера очень похожа на частотно-временное представле- ние сигнала, получаемое в результате непрерывного вейвлет-преобразования (НВП) [3-7]. Как и фазовый вокодер, НВП преобразует сигнал в его частотно-временное представ- ление. Изменяя компоненты сетки анализа НВП, можно получить эффекты, подобные тем, что получаются при помощи вокодера. В отличие от КВПФ, в области высоких частот НВП обеспечивает лучшее временное разрешение, а в области низких частот – лучшее частотное разрешение. Главное преимущество вейвлетов – возможность полного восстановления сигнала, которую не обеспечивает Фурье-преобразование, в частности, из-за эффекта Гиббса [5]. Использование окон, которые борются с этим эффектом, ухудшает восстановление сигнала на участках его быстрых изменений. Свойство переменного разрешения хорошо подходит для представления музыкаль- ных и речевых сигналов и поэтому, по мнению авторов, применение НВП позволит получить лучший результат (т.е. улучшить качество звучания измененного сигнала), по сравнению с фазовым вокодером, у которого разрешение одинаково во всех частотных областях. Целью данной работы является разработка методики и алгоритма обработки аудио- сигнала на основе методов вейвлет-анализа применительно к решению задачи изменения темпа сигнала без изменения его тона. Постановка задачи Для достижения поставленной цели исследования необходимо: – выбрать оптимальный базис вейвлет-разложения; – на основе его частотных характеристик и правил вычисления вейвлет-преобразования разработать методику изменения тона сигнала; – для изменения темпа сигнала и сохранения качества звучания выбрать оптимальный метод его ресэмплирования. Выбор базиса вейвлета и его характеристик Математический аппарат непрерывных вейвлет-преобразований (НПВ) хорошо описан в [3-5]. Качество анализа сигналов с помощью вейвлет-преобразований зависит от выбора информативного базиса. В работах [6], [7] показано, что для исследования речевых (РС) и музыкальных сигналов наиболее информативным является непрерывный вейвлет Морле, т.к. его базис лучше аппроксимирует сигнал: 25 2 )( t tj eet   (1) Зная центр  и радиус  частотного окна базового вейвлета ( = 5, = 0,7071 [6]), пользуясь правилом квантования масштабирующей переменной a и формулой для определения ширины частотного окна (2), можно получить значения границ полос пропускания вейвлет-фильтров на каждом уровне разложения m: ]//;//[ 0000 mmmm m aaaawin    , maxmin jmj  . (2) Применение комплексного непрерывного вейвлет-преобразования Морле… «Штучний інтелект» 4’2008 765 9Н Форма АЧХ зависит как от самого анализирующего вейвлета, так и от набора масштабов, на которых выполняется преобразование. Для этого вычисляются начальный (3) и конечный (4) уровни разложения, на которых осуществляется обработка и анализ сигнала:        2 min 2 logint 0 f f j d a   , (3)        1 max 2 logint 0 f f j d a   , (4) где int() – округление до ближайшего целого. В данной работе границы частотного диапазона исследуемых сигналов [f1; f2] и их частота дискретизации fd обозначены следующими величинами: f1 = 50Гц; f2 = 20 КГц (у музыкального сигнала более широкий спектр, чем у РС); fd = 44100Гц. Начальный и конечный уровни разложения сигналов (шаг масштабирования a0 = 1,1) определяются по формулам (3 – 4) и составляют значения jmin = 6 и jmax =70. Для изменения тона сигнала и соответственно для расчета фазового спектра сигнала необходимо применить комплексное непрерывное вейвлет-преобразование (КНВП) Морле. Методика применения КНВП Морле для построения фазового вокодера 1. Вычисление коэффициентов КНВП Морле:     1 0 )()(),( N i mnfmn tiifnmСDWTd  (5) Pm ,1 , 1,0  Nn , где t – шаг квантования по времени. На рис. 1 показан пример спектра (а) исходного сигнала и его амплитудно-времен- ное представление (б). Для наглядности примера был выбран монохроматический сигнал с частотой 500 ГЦ. а) б) Рисунок 1 – Исходный сигнал Гцw 500 : а) – спектр сигнала; б) амплитудно-временное представление сигнала 2. Вычисление амплитуды коэффициентов: 22 ),(),(),( nmCDWTnmCDWTnmA imre  . (6) 3. Вычисление фазового спектра  ),(/),(arctg),( nmCDWTnmCDWTnm reim . (7) Ниценко А.В., Хашан Т.С. «Искусственный интеллект» 4’2008 766 9Н 4. Развертывание фазового спектра путем прибавления к выборкам главного значе- ния фазы (п. 3), величин, равных 2πm, где m – целое число. Значения m определяются путем сравнения соседних отсчетов фазы, образовывая так называемую корректирующую последовательность. 5. Вычисление новых коэффициентов на каждом уровне разложения с учетом коэффициента сдвига с: )),(cos(),(),( unw cnmnmAnmCDWTre   (8) )),(sin(),(),( unw cnmnmAnmCDWTim   . (9) 6. Сдвиг уровней на величину calog . 7. Восстановление сигнала при помощи обратного НВП (рис. 2):      m N l mlml W f nd E E nf 1 0 )()(~  (10) а) б) Рисунок 2 – Восстановленный сигнал со сдвигом на октаву вверх ( Гцw 1000 ): а) спектр сигнала; б) амплитудно-временное представление сигнала Если необходимо выполнить изменение темпа без изменения тональности, то до- полнительно выполняется ресемплирование – изменение частоты дискретизации в с раз. Ресемплирование сигнала Ресемплирование сигнала применяют для изменения темпа его воспроизведения в некоторое количество раз с с сохранением тональности звучания. Для этого изменяется высота тона в c 1 раз, а затем и частота дискретизации сигнала также в c 1 раз (то есть ресемплирование). Если с < 1, т.е. темп воспроизведения замедляется, то после изменения высоты тона в сторону повышения частота дискретизации увеличивается за счет добавления нужного количества новых отсчетов f(xc) между двумя уже существующими отсчетами сигнала f(xa) и f(xb) через равные промежутки времени. При этом значения новых отсчетов рассчитываются при помощи линейной интерполяции: )( )( )()( )()( ac ab ab ac xx xx xfxfxfxf     . (11) Количество вставляемых отсчетов равно c 1 – 1. Для устранения высокочастотного шума выполняется сглаживание сигнала КИХ- фильтром. Если с >1 (темп увеличивается), то выполняется сдвиг тональности исходного сиг- нала в сторону низких частот, далее частота дискретизации уменьшается в c раз путем удаления через равные промежутки времени с – 1 отсчетов (прореживания) полученного сигнала. Применение комплексного непрерывного вейвлет-преобразования Морле… «Штучний інтелект» 4’2008 767 9Н Таким образом удается сохранить тональность звучания исходного сигнала. На рис. 3 в качестве примера приведен ресемплированный сигнал, уменьшающий темп произведения (с = 2). а) б) Рисунок 3 – Ресемплированный сигнал: а) спектр сигнала; б) амплитудно-временное представление сигнала Выводы В статье предложен алгоритм расчета вейвлет-коэффициентов КНВП Морле, учи- тывающий локализацию базисной вейвлет-функции на каждом уровне разложения; рас- считаны минимальный и максимальный уровни разложения по исследуемому базису, центральные частоты и полосы пропускания фильтров и их АЧХ; предложен модифици- рованный алгоритм фазового вокодера на основе НКВП Морле. Разработан алгоритм изменения темпа сигнала без изменения его тона. Для этого применены линейная интерполяция и КИХ-фильтр. Литература  Zolzer U. DAFX Digital Audio Effects. – West Sussex, England: Wiley, 2002. – P. 201-282.  Laroche Jean, Dolson Mark. Improved Phase Vocoder Time-Scale Modification of Audio IEEE Transactions on Speech and Audio Processing. – 1999. – Vol. 7, № 3.  Астафьева Н.М. Вейвлет-анализ: основы теории и некоторые приложения // Успехи физических наук. – 1998. – №11. – С. 1145-1170.  Поршнев С.В. Применение непрерывного вейвлет-преобразования для обработки широкополосных частотно-модулированных сигналов // Вычислительные методы и программирование. – 2003. – Т. 4. – С. 104-116.  Воробьев В.И., Грибунин В.Г. Теория и практика вейвлет-преобразования. – СПб.: ВУС, 1999. – 208 с.  Ермоленко Т.В. Применение вейвлет-анализа для предварительной обработки речевых голосовых сигна- лов и пофонемного распознавания изолированных слов: Дисс... канд. Техн. наук: Донецк, 2008. – 172 с.  Peter De Gersem, Bart De Moor, Marc Moonen. Applications of the Continuous Wavelet Transform in the Processing of Musical Signals // 13th International Conference on Digital Signal Processing (DSP97). – Santorini (Greece). – 1997. – P.563-566. А.В. Ніценко, Т.С. Хашан Застосування комплексного безперервного вейвлет-перетворення Морле в обробці аудіосигналів У статті запропоновано модифікований метод фазового вокодеру, що заснований на комплексному безперервному вейвлет-перетвореннi Морле. Комбiнацiя цього методу, лiнiйної iнтерполяцii та КIХ-фiльтра дозволила розробити алгоритм зміни темпу сигналу без зміни висоти його тону. A.V. Nitsenko, T.S. Khashan Complex Continuous Morlet Wavelet Transform Application in Audio Signals Processing In this article proposed a modified phase vocoder method, based on complex continuous Morlet wavelet transform. Combination this method with linear interpolation and FIR-filter allowed to develop algorithm of changing the audio tempo without altering the pitch. Статья поступила в редакцию 29.07.2008.
id nasplib_isofts_kiev_ua-123456789-7671
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 1561-5359
language Russian
last_indexed 2025-12-07T13:25:01Z
publishDate 2008
publisher Інститут проблем штучного інтелекту МОН України та НАН України
record_format dspace
spelling Ниценко, А.В.
Хашан, Т.С.
2010-04-06T13:30:17Z
2010-04-06T13:30:17Z
2008
Применение комплексного непрерывного вейвлет-преобразования Морле в обработке аудиосигналов / А.В. Ниценко, Т.С. Хашан // Штучний інтелект. — 2008. — № 4. — С. 763-767. — Бібліогр.: 7 назв. — рос.
1561-5359
https://nasplib.isofts.kiev.ua/handle/123456789/7671
004.934
В статье предложен модифицированный метод фазового вокодера на основе комплексного непрерывного преобразования Морле. Комбинация указанного метода, линейной интерполяции и КИХ-фильтра позволила разработать алгоритм изменения темпа сигнала без изменения его тона.
У статті запропоновано модифікований метод фазового вокодеру, що заснований на комплексному безперервному вейвлет-перетвореннi Морле. Комбiнацiя цього методу, лiнiйної iнтерполяцii та КIХ-фiльтра дозволила розробити алгоритм зміни темпу сигналу без зміни висоти його тону.
In this article proposed a modified phase vocoder method, based on complex continuous Morlet wavelet transform. Combination this method with linear interpolation and FIR-filter allowed to develop algorithm of changing the audio tempo without altering the pitch.
ru
Інститут проблем штучного інтелекту МОН України та НАН України
Распознавание речи. Интеллектуальные системы для работы с естественными языками и текстами
Применение комплексного непрерывного вейвлет-преобразования Морле в обработке аудиосигналов
Застосування комплексного безперервного вейвлет-перетворення Морле в обробці аудіосигналів
Complex Continuous Morlet Wavelet Transform Application in Audio Signals Processing
Article
published earlier
spellingShingle Применение комплексного непрерывного вейвлет-преобразования Морле в обработке аудиосигналов
Ниценко, А.В.
Хашан, Т.С.
Распознавание речи. Интеллектуальные системы для работы с естественными языками и текстами
title Применение комплексного непрерывного вейвлет-преобразования Морле в обработке аудиосигналов
title_alt Застосування комплексного безперервного вейвлет-перетворення Морле в обробці аудіосигналів
Complex Continuous Morlet Wavelet Transform Application in Audio Signals Processing
title_full Применение комплексного непрерывного вейвлет-преобразования Морле в обработке аудиосигналов
title_fullStr Применение комплексного непрерывного вейвлет-преобразования Морле в обработке аудиосигналов
title_full_unstemmed Применение комплексного непрерывного вейвлет-преобразования Морле в обработке аудиосигналов
title_short Применение комплексного непрерывного вейвлет-преобразования Морле в обработке аудиосигналов
title_sort применение комплексного непрерывного вейвлет-преобразования морле в обработке аудиосигналов
topic Распознавание речи. Интеллектуальные системы для работы с естественными языками и текстами
topic_facet Распознавание речи. Интеллектуальные системы для работы с естественными языками и текстами
url https://nasplib.isofts.kiev.ua/handle/123456789/7671
work_keys_str_mv AT nicenkoav primeneniekompleksnogonepreryvnogoveivletpreobrazovaniâmorlevobrabotkeaudiosignalov
AT hašants primeneniekompleksnogonepreryvnogoveivletpreobrazovaniâmorlevobrabotkeaudiosignalov
AT nicenkoav zastosuvannâkompleksnogobezperervnogoveivletperetvorennâmorlevobrobcíaudíosignalív
AT hašants zastosuvannâkompleksnogobezperervnogoveivletperetvorennâmorlevobrobcíaudíosignalív
AT nicenkoav complexcontinuousmorletwavelettransformapplicationinaudiosignalsprocessing
AT hašants complexcontinuousmorletwavelettransformapplicationinaudiosignalsprocessing