Применение комплексного непрерывного вейвлет-преобразования Морле в обработке аудиосигналов
В статье предложен модифицированный метод фазового вокодера на основе комплексного непрерывного преобразования Морле. Комбинация указанного метода, линейной интерполяции и КИХ-фильтра позволила разработать алгоритм изменения темпа сигнала без изменения его тона. У статті запропоновано модифіковани...
Saved in:
| Date: | 2008 |
|---|---|
| Main Authors: | , |
| Format: | Article |
| Language: | Russian |
| Published: |
Інститут проблем штучного інтелекту МОН України та НАН України
2008
|
| Subjects: | |
| Online Access: | https://nasplib.isofts.kiev.ua/handle/123456789/7671 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| Journal Title: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Cite this: | Применение комплексного непрерывного вейвлет-преобразования Морле в обработке аудиосигналов / А.В. Ниценко, Т.С. Хашан // Штучний інтелект. — 2008. — № 4. — С. 763-767. — Бібліогр.: 7 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| _version_ | 1859643951261155328 |
|---|---|
| author | Ниценко, А.В. Хашан, Т.С. |
| author_facet | Ниценко, А.В. Хашан, Т.С. |
| citation_txt | Применение комплексного непрерывного вейвлет-преобразования Морле в обработке аудиосигналов / А.В. Ниценко, Т.С. Хашан // Штучний інтелект. — 2008. — № 4. — С. 763-767. — Бібліогр.: 7 назв. — рос. |
| collection | DSpace DC |
| description | В статье предложен модифицированный метод фазового вокодера на основе комплексного непрерывного
преобразования Морле. Комбинация указанного метода, линейной интерполяции и КИХ-фильтра позволила
разработать алгоритм изменения темпа сигнала без изменения его тона.
У статті запропоновано модифікований метод фазового вокодеру, що заснований на комплексному
безперервному вейвлет-перетвореннi Морле. Комбiнацiя цього методу, лiнiйної iнтерполяцii та КIХ-фiльтра
дозволила розробити алгоритм зміни темпу сигналу без зміни висоти його тону.
In this article proposed a modified phase vocoder method, based on complex continuous Morlet wavelet transform.
Combination this method with linear interpolation and FIR-filter allowed to develop algorithm of changing the audio
tempo without altering the pitch.
|
| first_indexed | 2025-12-07T13:25:01Z |
| format | Article |
| fulltext |
«Штучний інтелект» 4’2008 763
9Н
УДК 004.934
А.В. Ниценко1, Т.С. Хашан2
1Институт проблем искусственного интеллекта МОН и НАН Украины, г. Донецк, Украина
2Институт прикладной математики и механики НАН Украины, г. Донецк, Украина
khashan@mail.ru
Применение комплексного непрерывного
вейвлет-преобразования Морле
в обработке аудиосигналов
В статье предложен модифицированный метод фазового вокодера на основе комплексного непрерывного
преобразования Морле. Комбинация указанного метода, линейной интерполяции и КИХ-фильтра позволила
разработать алгоритм изменения темпа сигнала без изменения его тона.
В современных приложениях профессиональной обработки аудиоданных широко
используются различные методы преобразований сигнала с целью создания эффектов
высокого качества. Например, для сокращения времени прослушивания аудиоcигнала,
подготовки цифровых фонограмм, реставрации записей, синтезирования электронной
музыки, для систем управления партитурой в реальном времени применяют методы
изменения высоты тона и темпа сигнала. Они позволяют значительно сэкономить время,
поскольку дают возможность исправлять ошибки или корректировать запись без выпол-
нения новой.
Разработка качественных методов изменения темпа проигрывания сигнала без
изменения его тона является актуальной. На текущий момент имеется несколько под-
ходов к решению этой задачи.
Методы изменения темпа сигнала без изменения его тона
Алгоритмы SOLA и PSOLA [1] основаны на методах анализа и обработки сигнала
во временной области. Недостатком данных методов является плохое качество звучания
измененного сигнала и появление в нем различных артефактов.
Применение метода фазового вокодера [2] и ресемплирования сигнала позволяет
частично устранить перечисленные недостатки. Ресемплирование сигнала меняет ско-
рость воспроизведения сигнала за счет изменения его частоты дискретизации. Для этого
обычно применяют методы интерполяции и фильтрации сигналов. Фазовый вокодер – это
метод получения частотно-временнόго представления сигнала при помощи быстрого
преобразования Фурье (БПФ). Однако БПФ не сохраняет временную информацию о
сигнале, о времени появления той или иной частоты. Метод кратковременного преобразо-
вания Фурье (КВПФ) является серией оконных БПФ, перекрывающихся по времени и
позволяющих за счет фреймового подхода сохранять временнýю информацию о спектре
сигнала.
Один из традиционных подходов к смене высоты тона без изменения длительности
сигнала состоит в вычислении двухмерного частотно-временного представления сигнала
описанным выше методом. После этого интервал сетки анализа и фазы коэффициентов
масштабируются для создания сетки синтеза. Далее выполняется обратное преобразо-
вание, восстанавливающее звуковой сигнал. Таким образом, алгоритм фазового вокодера
можно описать последовательностью действий:
Ниценко А.В., Хашан Т.С.
«Искусственный интеллект» 4’2008 764
9Н
1. Вычисление фазового вокодера.
2. Преобразование коэффициентов в полярную форму.
3. Развертывание фазового спектра и умножение на коэффициент масштабиро-
вания c.
4. Восстановление сигнала по новой сетке синтеза.
Сетка анализа фазового вокодера очень похожа на частотно-временное представле-
ние сигнала, получаемое в результате непрерывного вейвлет-преобразования (НВП) [3-7].
Как и фазовый вокодер, НВП преобразует сигнал в его частотно-временное представ-
ление. Изменяя компоненты сетки анализа НВП, можно получить эффекты, подобные
тем, что получаются при помощи вокодера. В отличие от КВПФ, в области высоких
частот НВП обеспечивает лучшее временное разрешение, а в области низких частот –
лучшее частотное разрешение. Главное преимущество вейвлетов – возможность полного
восстановления сигнала, которую не обеспечивает Фурье-преобразование, в частности,
из-за эффекта Гиббса [5]. Использование окон, которые борются с этим эффектом,
ухудшает восстановление сигнала на участках его быстрых изменений.
Свойство переменного разрешения хорошо подходит для представления музыкаль-
ных и речевых сигналов и поэтому, по мнению авторов, применение НВП позволит
получить лучший результат (т.е. улучшить качество звучания измененного сигнала), по
сравнению с фазовым вокодером, у которого разрешение одинаково во всех частотных
областях.
Целью данной работы является разработка методики и алгоритма обработки аудио-
сигнала на основе методов вейвлет-анализа применительно к решению задачи изменения
темпа сигнала без изменения его тона.
Постановка задачи
Для достижения поставленной цели исследования необходимо:
– выбрать оптимальный базис вейвлет-разложения;
– на основе его частотных характеристик и правил вычисления вейвлет-преобразования
разработать методику изменения тона сигнала;
– для изменения темпа сигнала и сохранения качества звучания выбрать оптимальный
метод его ресэмплирования.
Выбор базиса вейвлета и его характеристик
Математический аппарат непрерывных вейвлет-преобразований (НПВ) хорошо
описан в [3-5]. Качество анализа сигналов с помощью вейвлет-преобразований зависит от
выбора информативного базиса.
В работах [6], [7] показано, что для исследования речевых (РС) и музыкальных
сигналов наиболее информативным является непрерывный вейвлет Морле, т.к. его базис
лучше аппроксимирует сигнал:
25
2
)(
t
tj eet
(1)
Зная центр и радиус частотного окна базового вейвлета ( = 5, = 0,7071 [6]),
пользуясь правилом квантования масштабирующей переменной a и формулой для
определения ширины частотного окна (2), можно получить значения границ полос
пропускания вейвлет-фильтров на каждом уровне разложения m:
]//;//[ 0000
mmmm
m aaaawin , maxmin jmj . (2)
Применение комплексного непрерывного вейвлет-преобразования Морле…
«Штучний інтелект» 4’2008 765
9Н
Форма АЧХ зависит как от самого анализирующего вейвлета, так и от набора
масштабов, на которых выполняется преобразование. Для этого вычисляются начальный
(3) и конечный (4) уровни разложения, на которых осуществляется обработка и анализ
сигнала:
2
min 2
logint
0 f
f
j d
a
, (3)
1
max 2
logint
0 f
f
j d
a
, (4)
где int() – округление до ближайшего целого.
В данной работе границы частотного диапазона исследуемых сигналов [f1; f2] и их
частота дискретизации fd обозначены следующими величинами: f1 = 50Гц; f2 = 20 КГц
(у музыкального сигнала более широкий спектр, чем у РС); fd = 44100Гц.
Начальный и конечный уровни разложения сигналов (шаг масштабирования a0 = 1,1)
определяются по формулам (3 – 4) и составляют значения jmin = 6 и jmax =70.
Для изменения тона сигнала и соответственно для расчета фазового спектра
сигнала необходимо применить комплексное непрерывное вейвлет-преобразование
(КНВП) Морле.
Методика применения КНВП Морле
для построения фазового вокодера
1. Вычисление коэффициентов КНВП Морле:
1
0
)()(),(
N
i
mnfmn tiifnmСDWTd (5)
Pm ,1 , 1,0 Nn , где t – шаг квантования по времени.
На рис. 1 показан пример спектра (а) исходного сигнала и его амплитудно-времен-
ное представление (б). Для наглядности примера был выбран монохроматический сигнал
с частотой 500 ГЦ.
а) б)
Рисунок 1 – Исходный сигнал Гцw 500 : а) – спектр сигнала;
б) амплитудно-временное представление сигнала
2. Вычисление амплитуды коэффициентов:
22 ),(),(),( nmCDWTnmCDWTnmA imre . (6)
3. Вычисление фазового спектра
),(/),(arctg),( nmCDWTnmCDWTnm reim . (7)
Ниценко А.В., Хашан Т.С.
«Искусственный интеллект» 4’2008 766
9Н
4. Развертывание фазового спектра путем прибавления к выборкам главного значе-
ния фазы (п. 3), величин, равных 2πm, где m – целое число. Значения m определяются
путем сравнения соседних отсчетов фазы, образовывая так называемую корректирующую
последовательность.
5. Вычисление новых коэффициентов на каждом уровне разложения с учетом
коэффициента сдвига с:
)),(cos(),(),( unw cnmnmAnmCDWTre (8)
)),(sin(),(),( unw cnmnmAnmCDWTim . (9)
6. Сдвиг уровней на величину calog .
7. Восстановление сигнала при помощи обратного НВП (рис. 2):
m
N
l
mlml
W
f nd
E
E
nf
1
0
)()(~
(10)
а) б)
Рисунок 2 – Восстановленный сигнал со сдвигом на октаву вверх ( Гцw 1000 ):
а) спектр сигнала; б) амплитудно-временное представление сигнала
Если необходимо выполнить изменение темпа без изменения тональности, то до-
полнительно выполняется ресемплирование – изменение частоты дискретизации в с раз.
Ресемплирование сигнала
Ресемплирование сигнала применяют для изменения темпа его воспроизведения в
некоторое количество раз с с сохранением тональности звучания. Для этого изменяется
высота тона в
c
1 раз, а затем и частота дискретизации сигнала также в
c
1 раз (то есть
ресемплирование). Если с < 1, т.е. темп воспроизведения замедляется, то после изменения
высоты тона в сторону повышения частота дискретизации увеличивается за счет
добавления нужного количества новых отсчетов f(xc) между двумя уже существующими
отсчетами сигнала f(xa) и f(xb) через равные промежутки времени. При этом значения
новых отсчетов рассчитываются при помощи линейной интерполяции:
)(
)(
)()(
)()( ac
ab
ab
ac xx
xx
xfxfxfxf
. (11)
Количество вставляемых отсчетов равно c
1
– 1.
Для устранения высокочастотного шума выполняется сглаживание сигнала КИХ-
фильтром.
Если с >1 (темп увеличивается), то выполняется сдвиг тональности исходного сиг-
нала в сторону низких частот, далее частота дискретизации уменьшается в c раз путем
удаления через равные промежутки времени с – 1 отсчетов (прореживания) полученного
сигнала.
Применение комплексного непрерывного вейвлет-преобразования Морле…
«Штучний інтелект» 4’2008 767
9Н
Таким образом удается сохранить тональность звучания исходного сигнала.
На рис. 3 в качестве примера приведен ресемплированный сигнал, уменьшающий
темп произведения (с = 2).
а) б)
Рисунок 3 – Ресемплированный сигнал: а) спектр сигнала;
б) амплитудно-временное представление сигнала
Выводы
В статье предложен алгоритм расчета вейвлет-коэффициентов КНВП Морле, учи-
тывающий локализацию базисной вейвлет-функции на каждом уровне разложения; рас-
считаны минимальный и максимальный уровни разложения по исследуемому базису,
центральные частоты и полосы пропускания фильтров и их АЧХ; предложен модифици-
рованный алгоритм фазового вокодера на основе НКВП Морле.
Разработан алгоритм изменения темпа сигнала без изменения его тона. Для этого
применены линейная интерполяция и КИХ-фильтр.
Литература
Zolzer U. DAFX Digital Audio Effects. – West Sussex, England: Wiley, 2002. – P. 201-282.
Laroche Jean, Dolson Mark. Improved Phase Vocoder Time-Scale Modification of Audio IEEE Transactions on
Speech and Audio Processing. – 1999. – Vol. 7, № 3.
Астафьева Н.М. Вейвлет-анализ: основы теории и некоторые приложения // Успехи физических наук. –
1998. – №11. – С. 1145-1170.
Поршнев С.В. Применение непрерывного вейвлет-преобразования для обработки широкополосных
частотно-модулированных сигналов // Вычислительные методы и программирование. – 2003. – Т. 4. –
С. 104-116.
Воробьев В.И., Грибунин В.Г. Теория и практика вейвлет-преобразования. – СПб.: ВУС, 1999. – 208 с.
Ермоленко Т.В. Применение вейвлет-анализа для предварительной обработки речевых голосовых сигна-
лов и пофонемного распознавания изолированных слов: Дисс... канд. Техн. наук: Донецк, 2008. – 172 с.
Peter De Gersem, Bart De Moor, Marc Moonen. Applications of the Continuous Wavelet Transform in the
Processing of Musical Signals // 13th International Conference on Digital Signal Processing (DSP97). – Santorini
(Greece). – 1997. – P.563-566.
А.В. Ніценко, Т.С. Хашан
Застосування комплексного безперервного вейвлет-перетворення Морле в обробці аудіосигналів
У статті запропоновано модифікований метод фазового вокодеру, що заснований на комплексному
безперервному вейвлет-перетвореннi Морле. Комбiнацiя цього методу, лiнiйної iнтерполяцii та КIХ-фiльтра
дозволила розробити алгоритм зміни темпу сигналу без зміни висоти його тону.
A.V. Nitsenko, T.S. Khashan
Complex Continuous Morlet Wavelet Transform Application in Audio Signals Processing
In this article proposed a modified phase vocoder method, based on complex continuous Morlet wavelet transform.
Combination this method with linear interpolation and FIR-filter allowed to develop algorithm of changing the audio
tempo without altering the pitch.
Статья поступила в редакцию 29.07.2008.
|
| id | nasplib_isofts_kiev_ua-123456789-7671 |
| institution | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| issn | 1561-5359 |
| language | Russian |
| last_indexed | 2025-12-07T13:25:01Z |
| publishDate | 2008 |
| publisher | Інститут проблем штучного інтелекту МОН України та НАН України |
| record_format | dspace |
| spelling | Ниценко, А.В. Хашан, Т.С. 2010-04-06T13:30:17Z 2010-04-06T13:30:17Z 2008 Применение комплексного непрерывного вейвлет-преобразования Морле в обработке аудиосигналов / А.В. Ниценко, Т.С. Хашан // Штучний інтелект. — 2008. — № 4. — С. 763-767. — Бібліогр.: 7 назв. — рос. 1561-5359 https://nasplib.isofts.kiev.ua/handle/123456789/7671 004.934 В статье предложен модифицированный метод фазового вокодера на основе комплексного непрерывного преобразования Морле. Комбинация указанного метода, линейной интерполяции и КИХ-фильтра позволила разработать алгоритм изменения темпа сигнала без изменения его тона. У статті запропоновано модифікований метод фазового вокодеру, що заснований на комплексному безперервному вейвлет-перетвореннi Морле. Комбiнацiя цього методу, лiнiйної iнтерполяцii та КIХ-фiльтра дозволила розробити алгоритм зміни темпу сигналу без зміни висоти його тону. In this article proposed a modified phase vocoder method, based on complex continuous Morlet wavelet transform. Combination this method with linear interpolation and FIR-filter allowed to develop algorithm of changing the audio tempo without altering the pitch. ru Інститут проблем штучного інтелекту МОН України та НАН України Распознавание речи. Интеллектуальные системы для работы с естественными языками и текстами Применение комплексного непрерывного вейвлет-преобразования Морле в обработке аудиосигналов Застосування комплексного безперервного вейвлет-перетворення Морле в обробці аудіосигналів Complex Continuous Morlet Wavelet Transform Application in Audio Signals Processing Article published earlier |
| spellingShingle | Применение комплексного непрерывного вейвлет-преобразования Морле в обработке аудиосигналов Ниценко, А.В. Хашан, Т.С. Распознавание речи. Интеллектуальные системы для работы с естественными языками и текстами |
| title | Применение комплексного непрерывного вейвлет-преобразования Морле в обработке аудиосигналов |
| title_alt | Застосування комплексного безперервного вейвлет-перетворення Морле в обробці аудіосигналів Complex Continuous Morlet Wavelet Transform Application in Audio Signals Processing |
| title_full | Применение комплексного непрерывного вейвлет-преобразования Морле в обработке аудиосигналов |
| title_fullStr | Применение комплексного непрерывного вейвлет-преобразования Морле в обработке аудиосигналов |
| title_full_unstemmed | Применение комплексного непрерывного вейвлет-преобразования Морле в обработке аудиосигналов |
| title_short | Применение комплексного непрерывного вейвлет-преобразования Морле в обработке аудиосигналов |
| title_sort | применение комплексного непрерывного вейвлет-преобразования морле в обработке аудиосигналов |
| topic | Распознавание речи. Интеллектуальные системы для работы с естественными языками и текстами |
| topic_facet | Распознавание речи. Интеллектуальные системы для работы с естественными языками и текстами |
| url | https://nasplib.isofts.kiev.ua/handle/123456789/7671 |
| work_keys_str_mv | AT nicenkoav primeneniekompleksnogonepreryvnogoveivletpreobrazovaniâmorlevobrabotkeaudiosignalov AT hašants primeneniekompleksnogonepreryvnogoveivletpreobrazovaniâmorlevobrabotkeaudiosignalov AT nicenkoav zastosuvannâkompleksnogobezperervnogoveivletperetvorennâmorlevobrobcíaudíosignalív AT hašants zastosuvannâkompleksnogobezperervnogoveivletperetvorennâmorlevobrobcíaudíosignalív AT nicenkoav complexcontinuousmorletwavelettransformapplicationinaudiosignalsprocessing AT hašants complexcontinuousmorletwavelettransformapplicationinaudiosignalsprocessing |