Использование малых речевых единиц при распознавании речи с помощью алгоритма DTW

Описана разработанная авторами техника автоматической сегментации речевых сигналов и DTW-распознавания русской речи с использованием малых речевых единиц. Предложено использовать дифоны, содержащие межфонемные переходы. Предлагаемые подходы реализованы в реальных программах распознавания, которые по...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Управляющие системы и машины
Datum:2015
Hauptverfasser: Шелепов, В.Ю., Ниценко, А.В.
Format: Artikel
Sprache:Russian
Veröffentlicht: Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України 2015
Schlagworte:
Online Zugang:https://nasplib.isofts.kiev.ua/handle/123456789/112655
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:Использование малых речевых единиц при распознавании речи с помощью алгоритма DTW / В.Ю. Шелепов, А.В. Ниценко // Управляющие системы и машины. — 2015. — № 6. — С. 74–77. — Бібліогр.: 19 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id nasplib_isofts_kiev_ua-123456789-112655
record_format dspace
spelling Шелепов, В.Ю.
Ниценко, А.В.
2017-01-25T19:18:57Z
2017-01-25T19:18:57Z
2015
Использование малых речевых единиц при распознавании речи с помощью алгоритма DTW / В.Ю. Шелепов, А.В. Ниценко // Управляющие системы и машины. — 2015. — № 6. — С. 74–77. — Бібліогр.: 19 назв. — рос.
0130-5395
https://nasplib.isofts.kiev.ua/handle/123456789/112655
004.934.2
Описана разработанная авторами техника автоматической сегментации речевых сигналов и DTW-распознавания русской речи с использованием малых речевых единиц. Предложено использовать дифоны, содержащие межфонемные переходы. Предлагаемые подходы реализованы в реальных программах распознавания, которые показывают достаточно высокий уровень надежности.
Описано розроблену авторами техніку автоматичної сегментації мовних сигналів і DTW-розпізнавання російської мови з використанням малих мовних одиниць. Запропоновано використовувати дифони, що містять міжфонемні переходи. Запропоновані підходи реалізовано в реальних програмах розпізнавання, які показують досить високий рівень надійності.
Introduction: The article describes a technique of automatic speech segmentation and DTW-recognition using minor language units, developed by the authors for Russian speech. The main tool for segmentation is a numerical analogue of the total variation. In [11, 17,19] the authors suggest using the diphones containing interphoneme transitions as the minor language units. The templates for these are used to synthesize the templates of the semantic units, i.e. words and phrases. Then the DTW algorithm (with its advantages) is applied to the recognition of a word as a whole. As the result of this procedure there is no need to pronounce the words of the vocabulary under recognition during the training, thus a possibility to set the vocabulary just in text form is created. Purpose: The purpose of the research is to reduce the size of the reference template database, and, as a consequence, the training time for a particular speaker. Results: An innovation of this research is the use of exclusively diphones, whose first sound is one of explosive (b, g, d, k, p, t), and the stationary parts of other sounds. A set of automatically generated vocabulary words’ transcriptions is organized in a tree structure, which considerably speeds up the process of recognition. The proposed approach is implemented in realrecognition software, demonstrating the high reliability.
ru
Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України
Управляющие системы и машины
Информационные речевые технологии
Использование малых речевых единиц при распознавании речи с помощью алгоритма DTW
Використання малих мовних одиниць при розпізнаванні мови за допомогою алгоритму DTW
Using Minor Language Units for Speech Recognition with the Help of DTW Algorithm
Article
published earlier
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
title Использование малых речевых единиц при распознавании речи с помощью алгоритма DTW
spellingShingle Использование малых речевых единиц при распознавании речи с помощью алгоритма DTW
Шелепов, В.Ю.
Ниценко, А.В.
Информационные речевые технологии
title_short Использование малых речевых единиц при распознавании речи с помощью алгоритма DTW
title_full Использование малых речевых единиц при распознавании речи с помощью алгоритма DTW
title_fullStr Использование малых речевых единиц при распознавании речи с помощью алгоритма DTW
title_full_unstemmed Использование малых речевых единиц при распознавании речи с помощью алгоритма DTW
title_sort использование малых речевых единиц при распознавании речи с помощью алгоритма dtw
author Шелепов, В.Ю.
Ниценко, А.В.
author_facet Шелепов, В.Ю.
Ниценко, А.В.
topic Информационные речевые технологии
topic_facet Информационные речевые технологии
publishDate 2015
language Russian
container_title Управляющие системы и машины
publisher Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України
format Article
title_alt Використання малих мовних одиниць при розпізнаванні мови за допомогою алгоритму DTW
Using Minor Language Units for Speech Recognition with the Help of DTW Algorithm
description Описана разработанная авторами техника автоматической сегментации речевых сигналов и DTW-распознавания русской речи с использованием малых речевых единиц. Предложено использовать дифоны, содержащие межфонемные переходы. Предлагаемые подходы реализованы в реальных программах распознавания, которые показывают достаточно высокий уровень надежности. Описано розроблену авторами техніку автоматичної сегментації мовних сигналів і DTW-розпізнавання російської мови з використанням малих мовних одиниць. Запропоновано використовувати дифони, що містять міжфонемні переходи. Запропоновані підходи реалізовано в реальних програмах розпізнавання, які показують досить високий рівень надійності. Introduction: The article describes a technique of automatic speech segmentation and DTW-recognition using minor language units, developed by the authors for Russian speech. The main tool for segmentation is a numerical analogue of the total variation. In [11, 17,19] the authors suggest using the diphones containing interphoneme transitions as the minor language units. The templates for these are used to synthesize the templates of the semantic units, i.e. words and phrases. Then the DTW algorithm (with its advantages) is applied to the recognition of a word as a whole. As the result of this procedure there is no need to pronounce the words of the vocabulary under recognition during the training, thus a possibility to set the vocabulary just in text form is created. Purpose: The purpose of the research is to reduce the size of the reference template database, and, as a consequence, the training time for a particular speaker. Results: An innovation of this research is the use of exclusively diphones, whose first sound is one of explosive (b, g, d, k, p, t), and the stationary parts of other sounds. A set of automatically generated vocabulary words’ transcriptions is organized in a tree structure, which considerably speeds up the process of recognition. The proposed approach is implemented in realrecognition software, demonstrating the high reliability.
issn 0130-5395
url https://nasplib.isofts.kiev.ua/handle/123456789/112655
fulltext
citation_txt Использование малых речевых единиц при распознавании речи с помощью алгоритма DTW / В.Ю. Шелепов, А.В. Ниценко // Управляющие системы и машины. — 2015. — № 6. — С. 74–77. — Бібліогр.: 19 назв. — рос.
work_keys_str_mv AT šelepovvû ispolʹzovaniemalyhrečevyhedinicpriraspoznavaniirečispomoŝʹûalgoritmadtw
AT nicenkoav ispolʹzovaniemalyhrečevyhedinicpriraspoznavaniirečispomoŝʹûalgoritmadtw
AT šelepovvû vikoristannâmalihmovnihodinicʹprirozpíznavannímovizadopomogoûalgoritmudtw
AT nicenkoav vikoristannâmalihmovnihodinicʹprirozpíznavannímovizadopomogoûalgoritmudtw
AT šelepovvû usingminorlanguageunitsforspeechrecognitionwiththehelpofdtwalgorithm
AT nicenkoav usingminorlanguageunitsforspeechrecognitionwiththehelpofdtwalgorithm
first_indexed 2025-11-25T20:43:27Z
last_indexed 2025-11-25T20:43:27Z
_version_ 1850535712222347264