Прикладне застосування адаптації на голос диктора в системах послівного розпізнавання

Стаття присвячена розгляду та аналізу різних варіантів адаптації систем пофонемного розпізнавання ізольованих слів української мови до нового диктора. Описується метод адаптації під назвою «лінійна регресія максимальної правдоподібності» (MLLR). У рамках цього методу шляхом оптимізації значення кри...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Штучний інтелект
Datum:2012
Hauptverfasser: Селюх, Р.А., Юхименко, О.А.
Format: Artikel
Sprache:Ukrainian
Veröffentlicht: Інститут проблем штучного інтелекту МОН України та НАН України 2012
Schlagworte:
Online Zugang:https://nasplib.isofts.kiev.ua/handle/123456789/57179
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:Прикладне застосування адаптації на голос диктора в системах послівного розпізнавання / Р.А. Селюх, О.А. Юхименко // Штучний інтелект. — 2012. — № 3. — С. 185-193. — Бібліогр.: 6 назв. — укр.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
Beschreibung
Zusammenfassung:Стаття присвячена розгляду та аналізу різних варіантів адаптації систем пофонемного розпізнавання ізольованих слів української мови до нового диктора. Описується метод адаптації під назвою «лінійна регресія максимальної правдоподібності» (MLLR). У рамках цього методу шляхом оптимізації значення критерію розпізнавання обчислюються матриці лінійних перетворень, за якими адаптуються акустичні моделі фонем. Наводяться результати експериментальних досліджень розпізнавання мовлення адаптованої системи. Аналізуються дані розпізнавання адаптованих моделей залежно від кількості слів в адаптаційній вибірці. Статья посвящена рассмотрению и анализу различных вариантов адаптации систем пофонемного распознавания изолированных слов украинского языка к новому диктору. Описывается метод адаптации под названием «линейная регрессия максимальной правдоподобности» (MLLR). В рамках этого метода путем оптимизации значения критерия распознавания вычисляются матрицы линейных преобразований, которые задействованы в адаптации акустических моделей фонем. Представлены результаты экспериментальных исследований распознавания речи адаптированной системы. Анализируются данные распознавания адаптированных моделей в зависимости от количества слов в адаптационной выборке. The paper deals with different variants of practical application of speaker adaptation for phoneme recognition of Ukrainian isolated words. The method of Maximum Likelihood Linear Regression (MLLR) is described. The matrixes of linear transformation are estimated in order to correct initial acoustic phoneme models. The results of experimental research of the adapted recognition system are discussed; particularly the amount of words in the adaptation sample is analyzed.
ISSN:1561-5359