Урахування богатофакторності характеристик голосу в задачах ідентифікації диктора

При тестировании на специализированных базах данных наиболее совершенных систем идентификации диктора их минимальная эффективность, оцениваемая величиной вероятности ошибки в точке пересечения кривых ошибок, составляет лишь несколько процентов. Однако известно множество факторов, влияющих на вариати...

Ausführliche Beschreibung

Gespeichert in:

Bibliographische Detailangaben
Datum:	2021
Hauptverfasser:	Soloviev, Viktor, Rybalsky , Oleg, Zhuravel, Vadim, Shablya , Alexander, Timko , Evgeny
Format:	Artikel
Sprache:	Russian
Veröffentlicht:	V.M. Glushkov Institute of Cybernetics of NAS of Ukraine 2021
Schlagworte:	ймовірність часове вікно голосний звук диктор ідентифікація криві помилок спектр точка перетину фонограма експертиза ефективність
Online Zugang:	https://jais.net.ua/index.php/files/article/view/179
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:	Problems of Control and Informatics

Institution

Problems of Control and Informatics

Beschreibung
Zusammenfassung:	При тестировании на специализированных базах данных наиболее совершенных систем идентификации диктора их минимальная эффективность, оцениваемая величиной вероятности ошибки в точке пересечения кривых ошибок, составляет лишь несколько процентов. Однако известно множество факторов, влияющих на вариативность характеристик голоса диктора, каждый из которых имеет свое, отличное от других, влияние на результаты идентификации диктора по характеристикам голоса. Сложность создания и тестирования систем идентификации диктора заключается в необходимости количественной формализации ряда конкретных факторов, влияющих на характеристики его голоса. Рассмотрен предложенный метод учета множества факторов, влияющих на параметры характеристик голоса диктора, обеспечивающий принципиальную возможность косвенного учета их практически неограниченного количества. Согласно этому методу из речевых сигналов выделяются «атомарные» структуры, зависящие от совокупности основных факторов, влияющих на процесс идентификации диктора. По такому методу все существенные факторы, влияющие на характеристики голоса, будут косвенно учитываться на уровне этих структур. Экспертные решения принимаются по комбинаторной совокупности огромного числа этих «атомарных» структур. Под «атомарными» структурами речи понимаются спектры любых фрагментов гласных звуков, выделяемых во временном окне продолжительностью 20 мс. "Атомарные" структуры выделяются в автоматическом режиме. Предлагаемый метод обеспечивает рациональный учет богатофакторности влияния различных параметров, поскольку на спектры этих структур влияют все основные факторы, характеризующие индивидуальность голоса конкретного диктора. Решение об идентичности голосов дикторов, записанных на разных фонограммах, осуществляется на основе комбинаторики «атомарных» спектров гласных звуков в обоих фонограммах. Метод показал высокую эффективность при экспертизе фонограмм малой продолжительности.

Урахування богатофакторності характеристик голосу в задачах ідентифікації диктора

Institution

Ähnliche Einträge