Аналіз часового розподілу випромінювальних спектральних частот і методика їх обчислення
Розглянуто задачу обчислення випромінювальних спектральних частот (ВСЧ), які є альтернативною формою представлення параметрів голосового тракту. Досліджені властивості взаємного розташування ВСЧ на суміжних фреймах мовного сигналу. На їхній базі запропоновано новий ощадливий метод обчислення ВСЧ. Пр...
Saved in:
| Published in: | Акустичний вісник |
|---|---|
| Date: | 2009 |
| Main Author: | |
| Format: | Article |
| Language: | Ukrainian |
| Published: |
Інститут гідромеханіки НАН України
2009
|
| Online Access: | https://nasplib.isofts.kiev.ua/handle/123456789/87292 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| Journal Title: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Cite this: | Аналіз часового розподілу випромінювальних спектральних частот і методика їх обчислення / В.Ю. Семенов // Акустичний вісник — 2009. —Т. 12, № 4. — С. 52-56. — Бібліогр.: 12 назв. — укр. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| _version_ | 1859647710491049984 |
|---|---|
| author | Семенов, В.Ю. |
| author_facet | Семенов, В.Ю. |
| citation_txt | Аналіз часового розподілу випромінювальних спектральних частот і методика їх обчислення / В.Ю. Семенов // Акустичний вісник — 2009. —Т. 12, № 4. — С. 52-56. — Бібліогр.: 12 назв. — укр. |
| collection | DSpace DC |
| container_title | Акустичний вісник |
| description | Розглянуто задачу обчислення випромінювальних спектральних частот (ВСЧ), які є альтернативною формою представлення параметрів голосового тракту. Досліджені властивості взаємного розташування ВСЧ на суміжних фреймах мовного сигналу. На їхній базі запропоновано новий ощадливий метод обчислення ВСЧ. Проведено порівняння обчислювальних характеристик отриманого методу з характеристиками стандартного голосового кодеку AMR-WB. Проаналізовано ефективність методу в умовах втрат голосових даних у каналі зв'язку.
Рассмотрена задача вычисления излучательных спектральных частот (ИСЧ), являющихся альтернативной формой представления параметров голосового тракта. Изучены свойства взаимного расположения ИСЧ на смежных фреймах речевого сигнала. На их основе предложен новый экономичный метод вычисления ИСЧ. Проведено сравнение вычислительных характеристик полученного метода с характеристиками стандартного речевого кодека AMR-WB. Проанализирована эффективность метода в условиях потери голосовых данных в канале связи.
The paper deals with considering of the problem of calculation of the immittance spectral frequencies (ISF) being the alternative representation of parameters of the vocal tract. Properties of the inter-frame ISF relative position have been studied. On this base, the novel efficient method for ISF computation has been proposed. The computational characteristics of this method have been compared with those of the standard AMR-WB speech codec. Performance of the method has been analyzed for conditions of voice data loss in the communication channel.
|
| first_indexed | 2025-12-07T13:29:29Z |
| format | Article |
| fulltext |
ISSN 1028 -7507 Акустичний вiсник. 2009. Том 12, N 4. С. 52 – 56
УДК 534.78+519.615
АНАЛIЗ ЧАСОВОГО РОЗПОДIЛУ
ВИПРОМIНЮВАЛЬНИХ СПЕКТРАЛЬНИХ ЧАСТОТ
I МЕТОДИКА ЇХ ОБЧИСЛЕННЯ
В. Ю. С ЕМЕ Н ОВ
Державне науково-виробниче пiдприємство “Дельта”, Київ
Одержано 15.09.2009
Розглянуто задачу обчислення випромiнювальних спектральних частот (ВСЧ), якi є альтернативною формою пред-
ставлення параметрiв голосового тракту. Дослiдженi властивостi взаємного розташування ВСЧ на сумiжних фре-
ймах мовного сигналу. На їхнiй базi запропоновано новий ощадливий метод обчислення ВСЧ. Проведено порiвняння
обчислювальних характеристик отриманого методу з характеристиками стандартного голосового кодеку AMR-WB.
Проаналiзовано ефективнiсть методу в умовах втрат голосових даних у каналi зв’язку.
Рассмотрена задача вычисления излучательных спектральных частот (ИСЧ), являющихся альтернативной формой
представления параметров голосового тракта. Изучены свойства взаимного расположения ИСЧ на смежных фре-
ймах речевого сигнала. На их основе предложен новый экономичный метод вычисления ИСЧ. Проведено сравнение
вычислительных характеристик полученного метода с характеристиками стандартного речевого кодека AMR-WB.
Проанализирована эффективность метода в условиях потери голосовых данных в канале связи.
The paper deals with considering of the problem of calculation of the immittance spectral frequencies (ISF) being the
alternative representation of parameters of the vocal tract. Properties of the inter-frame ISF relative position have been
studied. On this base, the novel efficient method for ISF computation has been proposed. The computational characteristics
of this method have been compared with those of the standard AMR-WB speech codec. Performance of the method has
been analyzed for conditions of voice data loss in the communication channel.
ВСТУП
Розвиток методiв цифрового аналiзу та оброб-
ки мовних сигналiв потребує простих i водночас
ефективних моделей мовних сигналiв, заснованих
на знаннi фiзичних механiзмiв їх генерування та
сприйняття. Бiльшiсть сучасних методiв оброб-
ки мовних сигналiв базується на авторегресивнiй
(АР) моделi мовного сигналу [1, 2], в якiй форма
голосового тракту визначається за допомогою АР
коефiцiєнтiв ak, k=1, 2, . . . , p.
Проте безпосередньо АР коефiцiєнти зазвичай
не застосовуються в системах кодування або розпi-
знавання мовних сигналiв. Це пояснюється їхньою
великою спектральною чутливiстю й вiдсутнiстю
чiтких динамiчних дiапазонiв. Тому їх зазвичай
перетворюють у деякi альтернативнi набори па-
раметрiв, наприклад, лiнiйнi спектральнi частоти
(line spectral frequencies) – ЛСЧ [5] або випромiню-
вальнi спектральнi частоти (immittance spectrum
frequencies) – ВСЧ. Останнi були введенi дещо пi-
знiше [6] i знайшли застосування, зокрема, при ко-
дуваннi широкосмугових мовних сигналiв (з ча-
стотою дискретизацiї > 16 кГц) [3, 4].
Обчислення ЛСЧ та ВСЧ пов’язано з розв’я-
занням нелiнiйних рiвнянь [5 – 9], що небажано з
точки зору реалiзацiї в системах реального ча-
су внаслiдок можливостi непередбачених затри-
мок та накопичення похибок. Особливо це стосу-
ється цифрових сигнальних процесорiв з фiксова-
ною комою. Найрозповсюдженiшi методи розв’я-
зання таких рiвнянь – сiтковi [10] та методи пони-
ження ступеня [11]. У працi [12] для прискорення
швидкодiї сiткових методiв було застосовано попе-
реднє прогнозування можливих значень ЛСЧ.
Новий пiдхiд до обчислення ЛСЧ, заснований
на загальних принципах розв’язання нелiнiйних
рiвнянь, було запропоновано у працi [7]. У пра-
цях [8,9] показана можливiсть покращити цей пiд-
хiд на основi введеної властивостi мiжфреймової
впорядкованостi.
У цьому дослiдженнi розвинуто пiдхiд до об-
числення випромiнювальних спектральних частот,
який було намiчено в публiкацiї [9]. Основнi зав-
дання статтi полягають у:
1) вивчення властивостей часового розподiлу
ВСЧ, корисних для покращення процедур їх
обчислення;
2) розробка алгоритму обчислення ВСЧ, який би
ефективно використовував цi властивостi;
3) дослiдження ефективностi методу, в тому чи-
слi за умов втрати голосових даних у каналi
зв’язку.
У першому роздiлi аналiзується взаємне роз-
ташування ВСЧ на сумiжних часових вiдрiзках
52 c© В. Ю. Семенов, 2009
ISSN 1028 -7507 Акустичний вiсник. 2009. Том 12, N 4. С. 52 – 56
(фреймах) мовних сигналiв та пояснюється, як
встановленi властивостi їхнього часового розподi-
лу можуть бути використанi для обчислення ВСЧ.
На базi властивостi мiжфреймової впорядковано-
стi ВСЧ у другому роздiлi запропоновано алго-
ритм їх обчислення. Третiй роздiл присвячено ана-
лiзу ефективностi методу, зокрема за умов втрати
фреймiв мовного сигналу в каналi зв’язку.
1. ДОСЛIДЖЕННЯ РОЗТАШУВАННЯ ВСЧ
НА СУМIЖНИХ ЧАСОВИХ ФРЕЙМАХ
1.1. Означення та властивостi ВСЧ
Як вiдомо, обчислення ВСЧ ωk, k=1, 2, . . . , p−1
зводиться до пошуку коренiв полiномiв P1(x) та
P2(x) [6]:
P1(x) =
p/2∑
k=0
r
(1)
k xp/2−k = 0,
P2(x) =
p/2−1∑
k=0
r
(2)
k xp/2−1−k = 0.
Коренi цих рiвнянь вiдповiдають косинусам ВСЧ
(x=cos(ω)) i задовольняють властивостi внутрi-
шньофреймової впорядкованостi:
xi−1 < xi < xi+1, i = 2, . . . , p− 2, (1)
де непарнi косинуси вiдповiдають полiному P1(x),
а парнi – P2(x).
Традицiйно вiдшукання усiх коренiв рiвняння
складається з процедур локалiзацiї та уточнен-
ня їхнiх значень. Методика обчислення ВСЧ, яка
пропонується, включає такi етапи:
1) локалiзацiю коренiв полiнома P2(x);
2) уточнення коренiв полiнома P2(x);
3) уточнення коренiв полiнома P1(x) (їхня ло-
калiзацiя вiдбувається автоматично завдяки
властивостi (1)).
Розглянемо властивостi ВСЧ, важливi для
їхньої локалiзацiї.
На рис. 1 зображено осцилограму та вiдповiдну
динамiку змiни ВСЧ для мовного фрагменту, що
належить диктору-чоловiку. Запис було дискрети-
зовано з частотою 16000 Гц i потiм переквантовано
до 12800 Гц. Обчислення ВСЧ вiдбувалось на ча-
сових фреймах тривалiстю 20 мс при порядку АР
моделi p=16.
З графiкiв видно, що у бiльшостi випадкiв ВСЧ
мають властивiсть мiжфреймової впорядковано-
стi [9] i, як наслiдок, їхнiх косинусiв:
x
(n−1)
i−1 < x
(n)
i < x
(n−1)
i+1 , i = 2, . . . , p − 2. (2)
Тут верхнiми iндексами позначенi номери фрей-
мiв.
З точки зору локалiзацiї ВСЧ важливими є вiд-
повiдi на такi питання.
1. Чи може iнтервал [x
(n−1)
i−1 , x
(n−1)
i+1 ],
i=2, 4, . . . , p−2 мiстити бiльше двох ко-
ренiв полiнома P2(x)?
2. Наскiльки часто iнтервал [x
(n−1)
i−1 , x
(n−1)
i+1 ],
i=2, 4, . . . , p−2 мiстить єдиний корiнь полiно-
ма P2(x), тобто виконується властивiсть мiж-
фреймової впорядкованостi ВСЧ?
Для вiдповiдi на цi питання ми дослiдили ВСЧ
широкосмугових мовних сигналiв, переквантова-
них з 16000 до 12800 Гц. При цьому використо-
вувалась база мовних сигналiв дев’яти дикторiв
загальною тривалiстю 16 хвилин. До того ж за-
стосовувались АР моделi з порядками вiд 14 до
20. У результатi були зробленi такi висновки.
1. Зафiксовано лише 0.002 % випадкiв, у яких
бiльш нiж два кореня полiнома P2(x) розта-
шовувались мiж коренями полiнома P1(x) по-
переднього часового фрейму.
2. З табл. 1 видно, що дослiджувана властивiсть
мiжфреймової впорядкованостi наявна у пе-
реважнiй бiльшостi випадкiв (вiд 95.3 % для
p=20 до 97.2 % для p=14).
а
б
Рис. 1. Осцилограма мовного сигналу (а)
i вiдповiдний часовий розподiл ВСЧ (б)
В. Ю. Семенов 53
ISSN 1028 -7507 Акустичний вiсник. 2009. Том 12, N 4. С. 52 – 56
1.2. Обговорення встановлених властивостей
ВСЧ
Встановленi властивостi ВСЧ мають ключове
значення для процедури їхньої локалiзацiї. Вiдпо-
вiдно до другої властивостi, локалiзацiя коренiв
полiнома P2(x) практично зводиться до порiвня-
ння знакiв полiнома P2(x) у точках, якi вiдповiд-
ають непарним косинусам попереднього фрейму:
{−1, x
(n−1)
3 , x
(n−1)
5 , . . . , x
(n−1)
p−3 , 1}.
Якщо знаки P2(x
(n−1)
i−1 ) i P2(x
(n−1)
i+1 ) не спiвпада-
ють, то на цьому iнтервалi знаходиться єдиний ко-
рiнь (присутнiсть будь-якої iншої непарної кiлько-
стi коренiв виключається завдяки першiй власти-
востi).
Щоб унаочнити сказане, звернiмося до
прикладу, зображеного на рис. 2. Iнтерва-
ли [−1, x
(n−1)
3 ], [x
(n−1)
5 , x
(n−1)
7 ], [x
(n−1)
7 , x
(n−1)
9 ],
[x
(n−1)
11 , x
(n−1)
13 ],[x
(n−1)
13 , 1] задовольняють власти-
востi мiжфреймової впорядкованостi, а значить,
мiстять один корiнь. Для встановлення присутно-
стi коренiв на iнтервалах [x
(n−1)
3 , x
(n−1)
5 ] та [x
(n−1)
9 ,
x
(n−1)
11 ] застосовується метод їхньої послiдовної
бiсекцiї [4].
Табл. 1. Процентна кiлькiсть часових фреймiв,
для яких коренi полiнома P2(x) чергуються
з коренями полiнома P1(x) попереднього фрейму
p 14 16 18 20
% 97.2 96.6 96.0 95.3
Рис. 2. Приклад взаємного розташування
косинусiв ВСЧ на сумiжних часових фреймах
2. АЛГОРИТМ ОБЧИСЛЕННЯ ВСЧ
Вiдповiдно до встановлених властивостей мiж-
фреймового розташування ВСЧ, пропонується на-
ступна структура алгоритму їх обчислення.
Вихiднi данi
АР коефiцiєнти поточного фрейму ak,
k=1, 2, . . . , p; значення косинусiв ВСЧ x
(n−1)
1 ,
x
(n−1)
2 ,. . . , x
(n−1)
p−1 обчисленi на попередньому
часовому фреймi.
Крок 1. Обчислення коефiцiєнтiв P2(x)
АР коефiцiєнти {ak} трансформуються у коефiцi-
єнти полiнома P2(x) за допомогою Чебишевських
полiномiв [10].
Крок 2. Локалiзацiя парних косинусiв ВСЧ
Перевiряються знаки полiнома P2(x) у точках
{−1, x
(n−1)
3 , x
(n−1)
5 , . . . , x
(n−1)
p−3 , 1}.
Якщо sign (P2(x
(n−1)
i−1 )) 6= sign (P2(x
(n−1)
i+1 )), то iн-
тервал [x
(n−1)
i−1 , x
(n−1)
i+1 ] мiстить єдиний корiнь.
Якщо sign (P2(x
(n−1)
i−1 )) = sign (P2(x
(n−1)
i+1 )), то
присутнiсть кореня на iнтервалi [x
(n−1)
i−1 , x
(n−1)
i+1 ] пе-
ревiряється за допомогою методу послiдовної бiсе-
кцiї iнтервалу [4].
Крок 3. Уточнення парних косинусiв ВСЧ
Значення парних косинусiв ВСЧ уточнюються
аналогiчно до алгоритму [4].
Крок 4. Уточнення непарних косинусiв ВСЧ
Значення непарних косинусiв ВСЧ уточнюються
на iнтервалах [−1, x
(n)
2 ], [x
(n)
2 , x
(n)
4 ], . . ., [x
(n)
p−2, 1]
аналогiчно до алгоритму [4].
Крок 5. Перетворення до частотної областi
ВСЧ остаточно обчислюються за допомогою пере-
творення ω = arccos(x).
Зауваження
У разi втрати попереднього фрейму в каналi зв’яз-
ку за опорнi точки на кроцi 2 обираються непар-
нi косинуси останнього коректно прийнятого фре-
йму.
54 В. Ю. Семенов
ISSN 1028 -7507 Акустичний вiсник. 2009. Том 12, N 4. С. 52 – 56
Табл. 2. Порiвняння обчислювальних характеристик методiв обчислення ВСЧ
МЕТОД Nсер Nмакс WMOPSсер WMOPSмакс
AMR-WB 136.6 142.0 0.80 0.83
Запропонований, без втрат 58.8 82.0 0.34 0.47
Запропонований (FER = 5 %) 58.8 82.0 0.34 0.47
Запропонований (FER = 20 %) 59.5 82.0 0.35 0.47
а
б
в
Рис. 3. Спектрограма тестового сигналу (а),
кiлькостi обчислень полiномiальних функцiй
для FER = 5 % i 20 % (б i в вiдповiдно)
3. ЕКСПЕРИМЕНТАЛЬНI РЕЗУЛЬТАТИ
Ефективнiсть запропонованого методу обчисле-
ння ВСЧ було перевiрено для порядку АР моде-
лi p=16. При цьому використовувалась база мов-
них сигналiв, описана у попереднiх роздiлах. У
табл. 2 наведенi середнi й максимальнi обчислю-
вальнi витрати у термiнах WMOPS (weighted milli-
ons operations per second – мiльйонiв зважених опе-
рацiй за секунду) та кiлькiсть обчислень полiно-
мiальних функцiй за один часовий фрейм (N), якi
вiдповiдають запропонованому алгоритму й алго-
ритму голосового кодеку AMR-WB [4]. Доречною
є також перевiрка ефективностi методу в умовах
втрати голосових пакетiв. Для цього були промо-
дельованi канали зв’язку з iмовiрностями втрати
фреймiв (FER – frame error rates) 5 та 20 % вiдпо-
вiдно.
З таблицi видно, що запропонований алгоритм
забезпечує зниження середнiх обчислювальних ви-
трат приблизно в 2.3 рази у порiвняннi iз сiтковим
пiдходом AMR-WB. Iншою важливою його пере-
вагою є те, що вiдповiдна максимальна кiлькiсть
полiномiальних функцiй Nмакс в 1.7 разiв нижча
за середнє значення для пiдходу AMR-WB. Ще
один важливий висновок полягає в тому, що на-
вiть втрати фреймiв з ймовiрнiстю 20 % майже не
впливають на працю методу. Це пояснюється по-
вiльною змiною форми голосового тракту на про-
тязi кiлькох десяткiв мiлiсекунд.
На рис. 3 наведено приклад розподiлу кiлькостi
обчислень полiномiальних функцiй N для пiдходу
AMR-WB [4] й запропонованого методу для мовно-
го сигналу диктора-жiнки тривалiстю 3.5 с. Оче-
видно, що мiнiмальнi обчислювальнi витрати ма-
ють мiсце в паузах, заповнених фоновим шумом, а
невеликi пiки в розподiлi операцiй пов’язанi з ра-
птовими переходами вiд одного звуку до iншого.
Зазначимо, що на вiдмiну вiд методiв послiдов-
ного пониження ступеня [11], запропонований ме-
В. Ю. Семенов 55
ISSN 1028 -7507 Акустичний вiсник. 2009. Том 12, N 4. С. 52 – 56
тод не призводить до послiдовного накопичення
похибок обчислень. Тому вiн добре пiдходить для
реалiзацiї на цифрових сигнальних процесорах з
фiксованою комою (fixed-point DSPs). Так, одна з
версiй методу була застосована при побудовi го-
лосового вокодеру (4800 бiт/с), реалiзованого на
процесорi ADSP 2191.
ВИСНОВКИ
1. Розглянуто задачу обчислення випромiню-
вальних спектральних частот (ВСЧ). Дослi-
дженi властивостi взаємного розташування
ВСЧ на сумiжних фреймах мовного сигналу,
зокрема властивiсть їх мiжфреймової впоряд-
кованостi, на базi яких запропоновано новий
економiчний метод обчислення ВСЧ.
2. Показано, що середню кiлькiсть операцiй
зменшено у 2.3 рази у порiвняннi з сiтковим
пiдходом. Окрiм цього, максимальна кiлькiсть
операцiй виявилась у 1.7 рази меншою, нiж
при стандартному пiдходi, застосованому в го-
лосовому кодеку AMR-WB. Також проаналi-
зовано ефективнiсть методу в умовах втрат
голосових даних у каналi зв’язку. Показано,
що втрати фреймiв з iмовiрнiстю до 20 % май-
же не впливають на роботу методу, що по-
яснюється повiльною змiною форми голосово-
го тракту з часом. Стiйкiсть роботи запропо-
нованого методу продемонстровано при засто-
суваннi в широкосмуговому вокодерi з фiксо-
ваною комою.
1. Рабинер Л., Шафер Р. Цифровая обработка рече-
вых сигналов.– М.: Радио и связь, 1981.– 496 с.
2. Калюжный А. Я., Семенов В. Ю. Экономичный
метод очистки речи от шума, основанный на бло-
чном представлении сигнала в пространстве со-
стояний и векторном квантовании // Акуст. вiсн.–
2002.– 5, N 3.– С. 28–34.
3. Besette B., Salami R., Lefebvre R., Jelinek M.,
Rotola-Pukkila J., Vainio J., Mikkola H.,Jarvinen J.
The adaptive multirate wideband speech codec
(AMR-WB) // IEEE Trans. Speech Audio Proces.–
2000.– 10.– P. 19–41.
4. 3GPP 26.190. Adaptive multi-rate-wideband (AMR-
WB) speech codec; Transcoding functions.– 2005
[электронный ресурс]. Режим доступа к сайту:
http://www.3gpp.org.
5. Itakura F. Line spectrum representation of linear
predictive coefficients of speech signals // J. Acoust.
Soc. Amer.– 1975.– 57, Suppl. 1.– P. S35.
6. Bistritz Y., Peller S. Immittance spectral pairs (ISP)
for speech encoding // Proc. IEEE Int. Conf. Acoust.
Speech Signal Proces.– 1993.– 2.– P. 9–12.
7. Semenov V., Kalyuzhny A.,Kovtonyuk A. Efficient
calculation of line spectral frequencies based on new
method for solution of transcendental equations //
Proc. IEEE Int. Conf. Acoust. Speech Signal Proces.–
2003.– 2.– P. 457–460.
8. Семенов В. Ю. Новый подход к вычислению ли-
нейных спектральных частот речевых сигналов,
основанный на свойстве межфреймовой упорядо-
ченности // Акуст. вiсн.– 2004.– 7, N 3.– С. 55–64.
9. Semenov V. Computation of immittance and line
spectral frequencies based on inter-frame ordering
property // J. Comput.– 2007.– 2, N 7.– P. 75–80.
10. Kabal P., Ramachandran R. P. The computation of
line spectral frequencies using Chebyshev polynomi-
als // IEEE Trans. Acoust. Speech Signal Proces.–
1980.– 28.– P. 562–574.
11. Wu C.-H., Chen J.-H. A novel two-level method
for the computation of LSP frequencies using
a decimation-in-degree algorithm // IEEE Trans.
Speech Audio Proces.– 1997.– 5.– P. 106–115.
12. Dumitrescu B., Tabus I. Predictive LSF computati-
on // Signal Proces.– 2002.– 81.– P. 2019–2031.
56 В. Ю. Семенов
|
| id | nasplib_isofts_kiev_ua-123456789-87292 |
| institution | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| issn | 1028-7507 |
| language | Ukrainian |
| last_indexed | 2025-12-07T13:29:29Z |
| publishDate | 2009 |
| publisher | Інститут гідромеханіки НАН України |
| record_format | dspace |
| spelling | Семенов, В.Ю. 2015-10-16T18:02:42Z 2015-10-16T18:02:42Z 2009 Аналіз часового розподілу випромінювальних спектральних частот і методика їх обчислення / В.Ю. Семенов // Акустичний вісник — 2009. —Т. 12, № 4. — С. 52-56. — Бібліогр.: 12 назв. — укр. 1028-7507 https://nasplib.isofts.kiev.ua/handle/123456789/87292 534.78+519.615 Розглянуто задачу обчислення випромінювальних спектральних частот (ВСЧ), які є альтернативною формою представлення параметрів голосового тракту. Досліджені властивості взаємного розташування ВСЧ на суміжних фреймах мовного сигналу. На їхній базі запропоновано новий ощадливий метод обчислення ВСЧ. Проведено порівняння обчислювальних характеристик отриманого методу з характеристиками стандартного голосового кодеку AMR-WB. Проаналізовано ефективність методу в умовах втрат голосових даних у каналі зв'язку. Рассмотрена задача вычисления излучательных спектральных частот (ИСЧ), являющихся альтернативной формой представления параметров голосового тракта. Изучены свойства взаимного расположения ИСЧ на смежных фреймах речевого сигнала. На их основе предложен новый экономичный метод вычисления ИСЧ. Проведено сравнение вычислительных характеристик полученного метода с характеристиками стандартного речевого кодека AMR-WB. Проанализирована эффективность метода в условиях потери голосовых данных в канале связи. The paper deals with considering of the problem of calculation of the immittance spectral frequencies (ISF) being the alternative representation of parameters of the vocal tract. Properties of the inter-frame ISF relative position have been studied. On this base, the novel efficient method for ISF computation has been proposed. The computational characteristics of this method have been compared with those of the standard AMR-WB speech codec. Performance of the method has been analyzed for conditions of voice data loss in the communication channel. uk Інститут гідромеханіки НАН України Акустичний вісник Аналіз часового розподілу випромінювальних спектральних частот і методика їх обчислення Analyzing of time domain distribution of the immittance spectral frequencies and method for their computation Article published earlier |
| spellingShingle | Аналіз часового розподілу випромінювальних спектральних частот і методика їх обчислення Семенов, В.Ю. |
| title | Аналіз часового розподілу випромінювальних спектральних частот і методика їх обчислення |
| title_alt | Analyzing of time domain distribution of the immittance spectral frequencies and method for their computation |
| title_full | Аналіз часового розподілу випромінювальних спектральних частот і методика їх обчислення |
| title_fullStr | Аналіз часового розподілу випромінювальних спектральних частот і методика їх обчислення |
| title_full_unstemmed | Аналіз часового розподілу випромінювальних спектральних частот і методика їх обчислення |
| title_short | Аналіз часового розподілу випромінювальних спектральних частот і методика їх обчислення |
| title_sort | аналіз часового розподілу випромінювальних спектральних частот і методика їх обчислення |
| url | https://nasplib.isofts.kiev.ua/handle/123456789/87292 |
| work_keys_str_mv | AT semenovvû analízčasovogorozpodíluvipromínûvalʹnihspektralʹnihčastotímetodikaíhobčislennâ AT semenovvû analyzingoftimedomaindistributionoftheimmittancespectralfrequenciesandmethodfortheircomputation |