Использование малых речевых единиц при распознавании речи с помощью алгоритма DTW
Описана разработанная авторами техника автоматической сегментации речевых сигналов и DTW-распознавания русской речи с использованием малых речевых единиц. Предложено использовать дифоны, содержащие межфонемные переходы. Предлагаемые подходы реализованы в реальных программах распознавания, которые по...
Збережено в:
Дата: | 2015 |
---|---|
Автори: | , |
Формат: | Стаття |
Мова: | Russian |
Опубліковано: |
Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України
2015
|
Назва видання: | Управляющие системы и машины |
Теми: | |
Онлайн доступ: | http://dspace.nbuv.gov.ua/handle/123456789/112655 |
Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
Цитувати: | Использование малых речевых единиц при распознавании речи с помощью алгоритма DTW / В.Ю. Шелепов, А.В. Ниценко // Управляющие системы и машины. — 2015. — № 6. — С. 74–77. — Бібліогр.: 19 назв. — рос. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraineid |
irk-123456789-112655 |
---|---|
record_format |
dspace |
spelling |
irk-123456789-1126552017-01-26T03:02:52Z Использование малых речевых единиц при распознавании речи с помощью алгоритма DTW Шелепов, В.Ю. Ниценко, А.В. Информационные речевые технологии Описана разработанная авторами техника автоматической сегментации речевых сигналов и DTW-распознавания русской речи с использованием малых речевых единиц. Предложено использовать дифоны, содержащие межфонемные переходы. Предлагаемые подходы реализованы в реальных программах распознавания, которые показывают достаточно высокий уровень надежности. Описано розроблену авторами техніку автоматичної сегментації мовних сигналів і DTW-розпізнавання російської мови з використанням малих мовних одиниць. Запропоновано використовувати дифони, що містять міжфонемні переходи. Запропоновані підходи реалізовано в реальних програмах розпізнавання, які показують досить високий рівень надійності. Introduction: The article describes a technique of automatic speech segmentation and DTW-recognition using minor language units, developed by the authors for Russian speech. The main tool for segmentation is a numerical analogue of the total variation. In [11, 17,19] the authors suggest using the diphones containing interphoneme transitions as the minor language units. The templates for these are used to synthesize the templates of the semantic units, i.e. words and phrases. Then the DTW algorithm (with its advantages) is applied to the recognition of a word as a whole. As the result of this procedure there is no need to pronounce the words of the vocabulary under recognition during the training, thus a possibility to set the vocabulary just in text form is created. Purpose: The purpose of the research is to reduce the size of the reference template database, and, as a consequence, the training time for a particular speaker. Results: An innovation of this research is the use of exclusively diphones, whose first sound is one of explosive (b, g, d, k, p, t), and the stationary parts of other sounds. A set of automatically generated vocabulary words’ transcriptions is organized in a tree structure, which considerably speeds up the process of recognition. The proposed approach is implemented in realrecognition software, demonstrating the high reliability. 2015 Article Использование малых речевых единиц при распознавании речи с помощью алгоритма DTW / В.Ю. Шелепов, А.В. Ниценко // Управляющие системы и машины. — 2015. — № 6. — С. 74–77. — Бібліогр.: 19 назв. — рос. 0130-5395 http://dspace.nbuv.gov.ua/handle/123456789/112655 004.934.2 ru Управляющие системы и машины Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України |
institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
collection |
DSpace DC |
language |
Russian |
topic |
Информационные речевые технологии Информационные речевые технологии |
spellingShingle |
Информационные речевые технологии Информационные речевые технологии Шелепов, В.Ю. Ниценко, А.В. Использование малых речевых единиц при распознавании речи с помощью алгоритма DTW Управляющие системы и машины |
description |
Описана разработанная авторами техника автоматической сегментации речевых сигналов и DTW-распознавания русской речи с использованием малых речевых единиц. Предложено использовать дифоны, содержащие межфонемные переходы. Предлагаемые подходы реализованы в реальных программах распознавания, которые показывают достаточно высокий уровень надежности. |
format |
Article |
author |
Шелепов, В.Ю. Ниценко, А.В. |
author_facet |
Шелепов, В.Ю. Ниценко, А.В. |
author_sort |
Шелепов, В.Ю. |
title |
Использование малых речевых единиц при распознавании речи с помощью алгоритма DTW |
title_short |
Использование малых речевых единиц при распознавании речи с помощью алгоритма DTW |
title_full |
Использование малых речевых единиц при распознавании речи с помощью алгоритма DTW |
title_fullStr |
Использование малых речевых единиц при распознавании речи с помощью алгоритма DTW |
title_full_unstemmed |
Использование малых речевых единиц при распознавании речи с помощью алгоритма DTW |
title_sort |
использование малых речевых единиц при распознавании речи с помощью алгоритма dtw |
publisher |
Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України |
publishDate |
2015 |
topic_facet |
Информационные речевые технологии |
url |
http://dspace.nbuv.gov.ua/handle/123456789/112655 |
citation_txt |
Использование малых речевых единиц при распознавании речи с помощью алгоритма DTW / В.Ю. Шелепов, А.В. Ниценко // Управляющие системы и машины. — 2015. — № 6. — С. 74–77. — Бібліогр.: 19 назв. — рос. |
series |
Управляющие системы и машины |
work_keys_str_mv |
AT šelepovvû ispolʹzovaniemalyhrečevyhedinicpriraspoznavaniirečispomoŝʹûalgoritmadtw AT nicenkoav ispolʹzovaniemalyhrečevyhedinicpriraspoznavaniirečispomoŝʹûalgoritmadtw |
first_indexed |
2024-03-30T09:23:24Z |
last_indexed |
2024-03-30T09:23:24Z |
_version_ |
1796149909587492864 |