Метод идентификации пола диктора на основе моделирования акустических параметров голоса гауссовыми смесями

В статье предложен метод автоматической классификации речевых фрагментов по признаку "мужчина/женщина" и описаны основные этапы его алгоритмической реализации. Метод основан на моделировании плотности распределения вектора акустических признаков голоса взвешенной суммой нескольких гауссовс...

Повний опис

Збережено в:

Бібліографічні деталі
Опубліковано в: :	Акустичний вісник
Дата:	2009
Автори:	Калюжный, А.Я., Семенов, В.Ю.
Формат:	Стаття
Мова:	Російська
Опубліковано:	Інститут гідромеханіки НАН України 2009
Онлайн доступ:	https://nasplib.isofts.kiev.ua/handle/123456789/87277
Теги:	Додати тег Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:	Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:	Метод идентификации пола диктора на основе моделирования акустических параметров голоса гауссовыми смесями / А.Я. Калюжный, В.Ю. Семенов // Акустичний вісник — 2009. —Т. 12, № 2. — С. 31-38. — Бібліогр.: 10 назв. — рос.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine

_version_	1862545232331014144
author	Калюжный, А.Я. Семенов, В.Ю.
author_facet	Калюжный, А.Я. Семенов, В.Ю.
citation_txt	Метод идентификации пола диктора на основе моделирования акустических параметров голоса гауссовыми смесями / А.Я. Калюжный, В.Ю. Семенов // Акустичний вісник — 2009. —Т. 12, № 2. — С. 31-38. — Бібліогр.: 10 назв. — рос.
collection	DSpace DC
container_title	Акустичний вісник
description	В статье предложен метод автоматической классификации речевых фрагментов по признаку "мужчина/женщина" и описаны основные этапы его алгоритмической реализации. Метод основан на моделировании плотности распределения вектора акустических признаков голоса взвешенной суммой нескольких гауссовских распределений (метод гауссовых смесей). Каждый из членов GMM соответствует некоторому подклассу множества акустических параметров голосового сигнала. В качестве вектора акустических признаков была выбрана совокупность кепстральных RASTA-PLP коэффициентов, дополненных периодом основного тона. Обучение гауссовых смесей для мужских и женских голосов проводилось по методу expectation-maximization с инициализацией согласно алгоритму K-средних. Исследована зависимость процента ошибок классификации от типа ковариационных матриц GMM и их порядков. В различных экспериментах предложенный метод показал достаточно малую вероятность ошибки классификации (от 9 до 0%). Сделан вывод о вторичности порядка и типа GMM по сравнению с необходимостью разнообразного представления дикторов в обучающей базе речевых сигналов. В статті запропоновано метод автоматичної класифікації мовних фрагментів за ознакою "чоловік/жінка" та описані основні етапи його алгоритмічної реалізації. Метод заснований на моделюванні щільності розподілу вектора акустичних ознак голосу зваженою сумою декількох гаусівських розподілів (метод гаусових сумішей, GMM). При цьому кожний член GMM відповідає деякому підкласу множини акустичних параметрів голосового сигналу. За вектор акустичних ознак було обрано сукупність кепстральних RASTA-PLP коефіцієнтів, доповнених періодом основного тону. Навчання гаусових сумішей для чоловічих та жіночих голосів виконувалось за методом expectation-maximization з ініціалізацією згідно алгоритму K-середніх. Досліджено залежність процента помилок класифікації від типу коваріаційних матриць GMM та їхніх порядків. У різних експериментах запропонований метод показав достатньо малу ймовірність помилки класифікації (від 9 до 0%). Зроблено висновок щодо другорядності порядку та типу GMM у порівнянні з необхідністю різноманітного представлення дикторів у навчальній базі мовних сигналів. The method for automatic speaker's gender classification has been proposed and its basic algorithmic stages have been described. The method is based on modeling of voice acoustic parameters distribution by a weighted sum of several Gaussian distributions (Gaussian mixture modeling, GMM). In doing so, every component of the GMM corresponds to a certain subset of voice acoustic parameters. The set of cepstral RASTA-PLP coefficients extended by the period of the basic tone has been selected as the vector of acoustic features. The male and female GMMs were trained by the expectation-maximization method initialized according to the K-means algorithm. The dependence of classification errors on the GMM types and their orders has been investigated. In different experiments, the proposed method has shown low probability of classification errors (from 9 to 0%). This fact allows the conclusion about minor importance of the GMM order and type in comparison with a necessity of the diverse presenting of the speakers in the training data set.
first_indexed	2025-11-25T06:09:43Z
format	Article
fulltext
id	nasplib_isofts_kiev_ua-123456789-87277
institution	Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn	1028-7507
language	Russian
last_indexed	2025-11-25T06:09:43Z
publishDate	2009
publisher	Інститут гідромеханіки НАН України
record_format	dspace
spelling	Калюжный, А.Я. Семенов, В.Ю. 2015-10-16T16:31:39Z 2015-10-16T16:31:39Z 2009 Метод идентификации пола диктора на основе моделирования акустических параметров голоса гауссовыми смесями / А.Я. Калюжный, В.Ю. Семенов // Акустичний вісник — 2009. —Т. 12, № 2. — С. 31-38. — Бібліогр.: 10 назв. — рос. 1028-7507 https://nasplib.isofts.kiev.ua/handle/123456789/87277 534.78+621.391 В статье предложен метод автоматической классификации речевых фрагментов по признаку "мужчина/женщина" и описаны основные этапы его алгоритмической реализации. Метод основан на моделировании плотности распределения вектора акустических признаков голоса взвешенной суммой нескольких гауссовских распределений (метод гауссовых смесей). Каждый из членов GMM соответствует некоторому подклассу множества акустических параметров голосового сигнала. В качестве вектора акустических признаков была выбрана совокупность кепстральных RASTA-PLP коэффициентов, дополненных периодом основного тона. Обучение гауссовых смесей для мужских и женских голосов проводилось по методу expectation-maximization с инициализацией согласно алгоритму K-средних. Исследована зависимость процента ошибок классификации от типа ковариационных матриц GMM и их порядков. В различных экспериментах предложенный метод показал достаточно малую вероятность ошибки классификации (от 9 до 0%). Сделан вывод о вторичности порядка и типа GMM по сравнению с необходимостью разнообразного представления дикторов в обучающей базе речевых сигналов. В статті запропоновано метод автоматичної класифікації мовних фрагментів за ознакою "чоловік/жінка" та описані основні етапи його алгоритмічної реалізації. Метод заснований на моделюванні щільності розподілу вектора акустичних ознак голосу зваженою сумою декількох гаусівських розподілів (метод гаусових сумішей, GMM). При цьому кожний член GMM відповідає деякому підкласу множини акустичних параметрів голосового сигналу. За вектор акустичних ознак було обрано сукупність кепстральних RASTA-PLP коефіцієнтів, доповнених періодом основного тону. Навчання гаусових сумішей для чоловічих та жіночих голосів виконувалось за методом expectation-maximization з ініціалізацією згідно алгоритму K-середніх. Досліджено залежність процента помилок класифікації від типу коваріаційних матриць GMM та їхніх порядків. У різних експериментах запропонований метод показав достатньо малу ймовірність помилки класифікації (від 9 до 0%). Зроблено висновок щодо другорядності порядку та типу GMM у порівнянні з необхідністю різноманітного представлення дикторів у навчальній базі мовних сигналів. The method for automatic speaker's gender classification has been proposed and its basic algorithmic stages have been described. The method is based on modeling of voice acoustic parameters distribution by a weighted sum of several Gaussian distributions (Gaussian mixture modeling, GMM). In doing so, every component of the GMM corresponds to a certain subset of voice acoustic parameters. The set of cepstral RASTA-PLP coefficients extended by the period of the basic tone has been selected as the vector of acoustic features. The male and female GMMs were trained by the expectation-maximization method initialized according to the K-means algorithm. The dependence of classification errors on the GMM types and their orders has been investigated. In different experiments, the proposed method has shown low probability of classification errors (from 9 to 0%). This fact allows the conclusion about minor importance of the GMM order and type in comparison with a necessity of the diverse presenting of the speakers in the training data set. ru Інститут гідромеханіки НАН України Акустичний вісник Метод идентификации пола диктора на основе моделирования акустических параметров голоса гауссовыми смесями A method for speaker's gender identification on the basis of the Gaussian mixture modeling of voice acoustic parameters Article published earlier
spellingShingle	Метод идентификации пола диктора на основе моделирования акустических параметров голоса гауссовыми смесями Калюжный, А.Я. Семенов, В.Ю.
title	Метод идентификации пола диктора на основе моделирования акустических параметров голоса гауссовыми смесями
title_alt	A method for speaker's gender identification on the basis of the Gaussian mixture modeling of voice acoustic parameters
title_full	Метод идентификации пола диктора на основе моделирования акустических параметров голоса гауссовыми смесями
title_fullStr	Метод идентификации пола диктора на основе моделирования акустических параметров голоса гауссовыми смесями
title_full_unstemmed	Метод идентификации пола диктора на основе моделирования акустических параметров голоса гауссовыми смесями
title_short	Метод идентификации пола диктора на основе моделирования акустических параметров голоса гауссовыми смесями
title_sort	метод идентификации пола диктора на основе моделирования акустических параметров голоса гауссовыми смесями
url	https://nasplib.isofts.kiev.ua/handle/123456789/87277
work_keys_str_mv	AT kalûžnyiaâ metodidentifikaciipoladiktoranaosnovemodelirovaniâakustičeskihparametrovgolosagaussovymismesâmi AT semenovvû metodidentifikaciipoladiktoranaosnovemodelirovaniâakustičeskihparametrovgolosagaussovymismesâmi AT kalûžnyiaâ amethodforspeakersgenderidentificationonthebasisofthegaussianmixturemodelingofvoiceacousticparameters AT semenovvû amethodforspeakersgenderidentificationonthebasisofthegaussianmixturemodelingofvoiceacousticparameters

Метод идентификации пола диктора на основе моделирования акустических параметров голоса гауссовыми смесями

Репозитарії

Схожі ресурси