Сегментація мовних голосових сигналів за ознакою зміни диктора

Запропоновано підхід до сегментації голосових мовних сигналів за ознакою зміни диктора та способи визначення позицій зміни диктора в голосовому мовному сигналі. Позиції зміни диктора визначаються за допомогою аналізу множин характеристичних векторів в околі паузи на основі Байєсівського інформац...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Штучний інтелект
Datum:2011
Hauptverfasser: Кривонос, Ю.Г., Крак, Ю.В., Загваздін, О.С., Єфімов, Г.М.
Format: Artikel
Sprache:Ukrainisch
Veröffentlicht: Інститут проблем штучного інтелекту МОН України та НАН України 2011
Schlagworte:
Online Zugang:https://nasplib.isofts.kiev.ua/handle/123456789/59841
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:Сегментація мовних голосових сигналів за ознакою зміни диктора / Ю.Г. Кривонос, Ю.В. Крак, О.С. Загваздін, Г.М. Єфімов // Штучний інтелект. — 2011. — № 3. — С. 167-173. — Бібліогр.: 11 назв. — укр.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
Beschreibung
Zusammenfassung:Запропоновано підхід до сегментації голосових мовних сигналів за ознакою зміни диктора та способи визначення позицій зміни диктора в голосовому мовному сигналі. Позиції зміни диктора визначаються за допомогою аналізу множин характеристичних векторів в околі паузи на основі Байєсівського інформаційного критерію. Покращення якості характеристичних векторів досягається за допомогою використання сегментів з рівнем енергії не нижче певного порогу. Також пропонується адаптивний підхід для автоматичного визначення пауз у мовному сигналі. An approach to the segmentation of speech signals based on the speaker change, as well as to the detection of the speaker change positions in a speech signal is suggested. Speaker change positions are determined by analyzing the sets of characteristic vectors at the pause within the signal based on the Bayesian information criterion. Improvement in quality of the characteristic vectors is achieved by taking into account only the segments with the log energy above the given threshold. It is also suggested an approach for adaptive automatic pause detection in speech signal.
ISSN:1561-5359