Урахування богатофакторності характеристик голосу в задачах ідентифікації диктора

При тестировании на специализированных базах данных наиболее совершенных систем идентификации диктора их минимальная эффективность, оцениваемая величиной вероятности ошибки в точке пересечения кривых ошибок, составляет лишь несколько процентов. Однако известно множество факторов, влияющих на вариати...

Ausführliche Beschreibung

Gespeichert in:

Bibliographische Detailangaben
Datum:	2021
Hauptverfasser:	Soloviev, Viktor, Rybalsky , Oleg, Zhuravel, Vadim, Shablya , Alexander, Timko , Evgeny
Format:	Artikel
Sprache:	Russian
Veröffentlicht:	V.M. Glushkov Institute of Cybernetics of NAS of Ukraine 2021
Schlagworte:	ймовірність часове вікно голосний звук диктор ідентифікація криві помилок спектр точка перетину фонограма експертиза ефективність
Online Zugang:	https://jais.net.ua/index.php/files/article/view/179
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:	Problems of Control and Informatics

Institution

Problems of Control and Informatics

id	oai:ojs2.jais.net.ua:article-179
record_format	ojs
institution	Problems of Control and Informatics
baseUrl_str
datestamp_date	2024-03-14T10:55:26Z
collection	OJS
language	Russian
topic	ймовірність часове вікно голосний звук диктор ідентифікація криві помилок спектр точка перетину фонограма експертиза ефективність
spellingShingle	ймовірність часове вікно голосний звук диктор ідентифікація криві помилок спектр точка перетину фонограма експертиза ефективність Soloviev, Viktor Rybalsky , Oleg Zhuravel, Vadim Shablya , Alexander Timko , Evgeny Урахування богатофакторності характеристик голосу в задачах ідентифікації диктора
topic_facet	probability time window vowel sound speaker identification error curves spectrum intersection point phonogram expertise efficiency ймовірність часове вікно голосний звук диктор ідентифікація криві помилок спектр точка перетину фонограма експертиза ефективність вероятность временное окно гласный звук диктор идентификация кривые ошибок спектр точка пересечения фонограмма экспертиза эффективность
format	Article
author	Soloviev, Viktor Rybalsky , Oleg Zhuravel, Vadim Shablya , Alexander Timko , Evgeny
author_facet	Soloviev, Viktor Rybalsky , Oleg Zhuravel, Vadim Shablya , Alexander Timko , Evgeny
author_sort	Soloviev, Viktor
title	Урахування богатофакторності характеристик голосу в задачах ідентифікації диктора
title_short	Урахування богатофакторності характеристик голосу в задачах ідентифікації диктора
title_full	Урахування богатофакторності характеристик голосу в задачах ідентифікації диктора
title_fullStr	Урахування богатофакторності характеристик голосу в задачах ідентифікації диктора
title_full_unstemmed	Урахування богатофакторності характеристик голосу в задачах ідентифікації диктора
title_sort	урахування богатофакторності характеристик голосу в задачах ідентифікації диктора
title_alt	Учет многофакторности характеристик голоса в задачах идентификации диктора Taking into account the multifactorial character of voice characteristics in the problems of speaker identification
description	При тестировании на специализированных базах данных наиболее совершенных систем идентификации диктора их минимальная эффективность, оцениваемая величиной вероятности ошибки в точке пересечения кривых ошибок, составляет лишь несколько процентов. Однако известно множество факторов, влияющих на вариативность характеристик голоса диктора, каждый из которых имеет свое, отличное от других, влияние на результаты идентификации диктора по характеристикам голоса. Сложность создания и тестирования систем идентификации диктора заключается в необходимости количественной формализации ряда конкретных факторов, влияющих на характеристики его голоса. Рассмотрен предложенный метод учета множества факторов, влияющих на параметры характеристик голоса диктора, обеспечивающий принципиальную возможность косвенного учета их практически неограниченного количества. Согласно этому методу из речевых сигналов выделяются «атомарные» структуры, зависящие от совокупности основных факторов, влияющих на процесс идентификации диктора. По такому методу все существенные факторы, влияющие на характеристики голоса, будут косвенно учитываться на уровне этих структур. Экспертные решения принимаются по комбинаторной совокупности огромного числа этих «атомарных» структур. Под «атомарными» структурами речи понимаются спектры любых фрагментов гласных звуков, выделяемых во временном окне продолжительностью 20 мс. "Атомарные" структуры выделяются в автоматическом режиме. Предлагаемый метод обеспечивает рациональный учет богатофакторности влияния различных параметров, поскольку на спектры этих структур влияют все основные факторы, характеризующие индивидуальность голоса конкретного диктора. Решение об идентичности голосов дикторов, записанных на разных фонограммах, осуществляется на основе комбинаторики «атомарных» спектров гласных звуков в обоих фонограммах. Метод показал высокую эффективность при экспертизе фонограмм малой продолжительности.
publisher	V.M. Glushkov Institute of Cybernetics of NAS of Ukraine
publishDate	2021
url	https://jais.net.ua/index.php/files/article/view/179
work_keys_str_mv	AT solovievviktor učetmnogofaktornostiharakteristikgolosavzadačahidentifikaciidiktora AT rybalskyoleg učetmnogofaktornostiharakteristikgolosavzadačahidentifikaciidiktora AT zhuravelvadim učetmnogofaktornostiharakteristikgolosavzadačahidentifikaciidiktora AT shablyaalexander učetmnogofaktornostiharakteristikgolosavzadačahidentifikaciidiktora AT timkoevgeny učetmnogofaktornostiharakteristikgolosavzadačahidentifikaciidiktora AT solovievviktor urahuvannâbogatofaktornostíharakteristikgolosuvzadačahídentifíkacíídiktora AT rybalskyoleg urahuvannâbogatofaktornostíharakteristikgolosuvzadačahídentifíkacíídiktora AT zhuravelvadim urahuvannâbogatofaktornostíharakteristikgolosuvzadačahídentifíkacíídiktora AT shablyaalexander urahuvannâbogatofaktornostíharakteristikgolosuvzadačahídentifíkacíídiktora AT timkoevgeny urahuvannâbogatofaktornostíharakteristikgolosuvzadačahídentifíkacíídiktora AT solovievviktor takingintoaccountthemultifactorialcharacterofvoicecharacteristicsintheproblemsofspeakeridentification AT rybalskyoleg takingintoaccountthemultifactorialcharacterofvoicecharacteristicsintheproblemsofspeakeridentification AT zhuravelvadim takingintoaccountthemultifactorialcharacterofvoicecharacteristicsintheproblemsofspeakeridentification AT shablyaalexander takingintoaccountthemultifactorialcharacterofvoicecharacteristicsintheproblemsofspeakeridentification AT timkoevgeny takingintoaccountthemultifactorialcharacterofvoicecharacteristicsintheproblemsofspeakeridentification
first_indexed	2025-10-30T02:48:45Z
last_indexed	2025-10-30T02:48:45Z
_version_	1847373359145287680
spelling	oai:ojs2.jais.net.ua:article-1792024-03-14T10:55:26Z Учет многофакторности характеристик голоса в задачах идентификации диктора Урахування богатофакторності характеристик голосу в задачах ідентифікації диктора Taking into account the multifactorial character of voice characteristics in the problems of speaker identification Soloviev, Viktor Rybalsky , Oleg Zhuravel, Vadim Shablya , Alexander Timko , Evgeny probability time window vowel sound speaker identification error curves spectrum intersection point phonogram expertise efficiency ймовірність часове вікно голосний звук диктор ідентифікація криві помилок спектр точка перетину фонограма експертиза ефективність вероятность временное окно гласный звук диктор идентификация кривые ошибок спектр точка пересечения фонограмма экспертиза эффективность При тестировании на специализированных базах данных наиболее совершенных систем идентификации диктора их минимальная эффективность, оцениваемая величиной вероятности ошибки в точке пересечения кривых ошибок, составляет лишь несколько процентов. Однако известно множество факторов, влияющих на вариативность характеристик голоса диктора, каждый из которых имеет свое, отличное от других, влияние на результаты идентификации диктора по характеристикам голоса. Сложность создания и тестирования систем идентификации диктора заключается в необходимости количественной формализации ряда конкретных факторов, влияющих на характеристики его голоса. Рассмотрен предложенный метод учета множества факторов, влияющих на параметры характеристик голоса диктора, обеспечивающий принципиальную возможность косвенного учета их практически неограниченного количества. Согласно этому методу из речевых сигналов выделяются «атомарные» структуры, зависящие от совокупности основных факторов, влияющих на процесс идентификации диктора. По такому методу все существенные факторы, влияющие на характеристики голоса, будут косвенно учитываться на уровне этих структур. Экспертные решения принимаются по комбинаторной совокупности огромного числа этих «атомарных» структур. Под «атомарными» структурами речи понимаются спектры любых фрагментов гласных звуков, выделяемых во временном окне продолжительностью 20 мс. "Атомарные" структуры выделяются в автоматическом режиме. Предлагаемый метод обеспечивает рациональный учет богатофакторности влияния различных параметров, поскольку на спектры этих структур влияют все основные факторы, характеризующие индивидуальность голоса конкретного диктора. Решение об идентичности голосов дикторов, записанных на разных фонограммах, осуществляется на основе комбинаторики «атомарных» спектров гласных звуков в обоих фонограммах. Метод показал высокую эффективность при экспертизе фонограмм малой продолжительности. При тестуванні на спеціалізованих базах даних найбільш досконалих систем ідентифікації диктора їх мінімальна ефективність, що оцінюється величиною ймовірності помилки в точці перетину кривих помилок, становить лише кілька відсотків. Однак відомо безліч факторів, що впливають на варіативність характеристик голосу диктора, кожний з яких має свій, відмінний від інших, вплив на результати ідентифікації диктора за характеристиками голосу. Складність створення і тестування систем ідентифікації диктора полягає в необхідності кількісної формалізації ряду конкретних факторів, що впливають на характеристики його голосу. Розглянуто запропонований метод урахування безлічі чинників, які впливають на параметри характеристик голосу диктора, що забезпечує принципову можливість непрямого урахування їх практично необмеженої кількості. Відповідно до цього методу з мовних сигналів виділяються «атомарні» структури, які залежать від сукупності основних факторів, що впливають на процес ідентифікації диктора. За таким методом всі істотні фактори, що впливають на характеристики голосу, будуть побічно враховуватися на рівні цих структур. Експертні рішення приймаються за комбінаторною сукупністю величезного числа цих «атомарних» структур. Під «атомарними» структурами мовлення розуміються спектри будь-яких фрагментів голосних звуків, які виділяються в часовому вікні тривалістю 20 мс. «Атомарні» структури виділяються в автоматичному режимі. Запропонований метод забезпечує раціональне урахування богатофакторності впливу різних параметрів, оскільки на спектри цих структур впливають всі основні фактори, що характеризують індивідуальність голосу конкретного диктора. Рішення щодо ідентичності голосів дикторів, записаних на різних фонограмах, здійснюється на основі комбінаторики «атомарних» спектрів голосних звуків в обох фонограмах. Метод показав високу ефективність при експертизі фонограм малої тривалості. When testing the most advanced speaker identification systems on specialized databases, their minimum efficiency, estimated by the error probability at the point of intersection of the error curves, is only a few percent. However, many factors are known that affect the variability of the characteristics of the speaker's voice, each of which has its own, different from the others, influence on the results of the speaker's identification by the characteristics of the voice. The complexity of creating and testing speaker identification systems is the need to quantitatively formalize a number of specific factors that affect the characteristics of his voice. The article discusses the proposed method for accounting for a variety of factors affecting the parameters of the characteristics of the speaker's voice, which provides the fundamental possibility of indirectly accounting for their practically unlimited number. According to this method, «atomic» structures are distinguished from speech signals, which depend on the totality of the main factors that affect the speaker's identification process. With this method, all significant factors affecting the characteristics of the voice will be indirectly taken into account at the level of these structures. Subsequent decisions are made on the combinatorial set of a huge number of these «atomic» structures. «Atomic» speech structures are understood as the spectra of any fragments of any vowel sounds allocated in a time window of 20 ms. «Atomic» structures are selected automatically. The proposed method provides a rational consideration of the multifactorial influence of various parameters, since the spectra of these structures are influenced by all the main factors that characterize the individuality of the voice of a particular speaker. The decision on the identity of the voices of the announcers recorded on different phonograms is carried out on the basis of combinatorics of «atomic» spectra of vowel sounds in both phonograms. The method has shown high efficiency in the examination of phonograms of short duration. V.M. Glushkov Institute of Cybernetics of NAS of Ukraine 2021-07-05 Article Article application/pdf https://jais.net.ua/index.php/files/article/view/179 10.34229/1028-0979-2021-5-2 Міжнародний науково-технічний журнал "Проблеми керування та інформатики"; Том 66 № 5 (2021): Міжнародний науково-технічний журнал "Проблеми керування та інформатики"; 21-30 International Scientific Technical Journal "Problems of Control and Informatics; Том 66 № 5 (2021): International Scientific and Technical Journal "PROBLEMS OF CONTROL AND INFORMATICS"; 21-30 International Scientific Technical Journal "Problems of Control and Informatics"; Vol. 66 No. 5 (2021): International Scientific and Technical Journal "PROBLEMS OF CONTROL AND INFORMATICS"; 21-30 2786-6505 2786-6491 10.34229/1028-0979-2021-5 ru https://jais.net.ua/index.php/files/article/view/179/269 Copyright (c) 2021 Viktor Soloviev, Oleg Rybalsky , Vadim Zhuravel, Alexander Shablya , Evgeny Timko https://creativecommons.org/licenses/by-nc-nd/4.0

Урахування богатофакторності характеристик голосу в задачах ідентифікації диктора

Institution

Ähnliche Einträge