Классификация фреймов речевого сигнала в задачах дикторонезависимого распознавания речи

В статье предлагается метод определения границ речи в поступившем речевом потоке с использованием автоматической настройки под шум окружающей среды и звукозаписывающего оборудования, а также алгоритм классификации фреймов речевого сигнала в терминах обобщенной фонетической транскрипции. Используемые...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Штучний інтелект
Datum:2011
Hauptverfasser: Ермоленко, Т.В., Жук, А.В.
Format: Artikel
Sprache:Russian
Veröffentlicht: Інститут проблем штучного інтелекту МОН України та НАН України 2011
Schlagworte:
Online Zugang:https://nasplib.isofts.kiev.ua/handle/123456789/60256
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:Классификация фреймов речевого сигнала в задачах дикторонезависимого распознавания речи / Т.В. Ермоленко, А.В. Жук // Штучний інтелект. — 2011. — № 4. — С. 87-95. — Бібліогр.: 5 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
Beschreibung
Zusammenfassung:В статье предлагается метод определения границ речи в поступившем речевом потоке с использованием автоматической настройки под шум окружающей среды и звукозаписывающего оборудования, а также алгоритм классификации фреймов речевого сигнала в терминах обобщенной фонетической транскрипции. Используемые параметры базируются на различных спектральных представлениях сигнала, отражают особенности спектральной плотности звуков речи, принадлежащих разным фонетическим классам, что обеспечивает дикторонезависимость процесса классификации. У статті запропоновано метод визначення границь мовлення у потоці мовлення, що надійшов на вхід системи розпізнавання, з використанням автоматичного налаштування під шум оточуючого середовища та звукозаписуючого обладнання, а також алгоритм класифікації фреймів мовленнєвого сигналу у термінах узагальненої фонетичної транскрипції. Параметри, що було використано, базуються на різних спектральних представленнях сигналу, відображають особливості спектральної щільності звуків мовлення, які належать до різних фонетичних класів, що забезпечує дикторонезалежність процесу класифікації. The method for voice activity detection in a captured speech stream with automatic adaptation to environmental and sound-capture hardware noises, and the algorithm for speech signal frames classification in the terms of generalized phonetic transcription are proposed in the article. The speaker-independence is reached because of the parameters used in the classification process. These parameters are based on different spectral representations of a signal and reflect spectral density species of speech sounds.
ISSN:1561-5359