Метод классификации вокальных звуков речи на основе саундлетной байесовской нейронной сети

Предложен метод классификации вокальных звуков речи, который базируется на авторской саундлетной байесовской нейронной сети и позволяет учитывать структуру квазипериодического сигнала и сопоставлять образцы вокальных звуков речи разной длины. Разработаны методы создания образцов, формирования опорны...

Повний опис

Збережено в:
Бібліографічні деталі
Дата:2015
Автор: Федоров, Е.Е.
Формат: Стаття
Мова:Russian
Опубліковано: Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України 2015
Назва видання:Управляющие системы и машины
Теми:
Онлайн доступ:http://dspace.nbuv.gov.ua/handle/123456789/112654
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Метод классификации вокальных звуков речи на основе саундлетной байесовской нейронной сети / Е.Е. Федоров // Управляющие системы и машины. — 2015. — № 6. — С. 78-83. — Бібліогр.: 8 назв. — рос.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id irk-123456789-112654
record_format dspace
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Russian
topic Информационные речевые технологии
Информационные речевые технологии
spellingShingle Информационные речевые технологии
Информационные речевые технологии
Федоров, Е.Е.
Метод классификации вокальных звуков речи на основе саундлетной байесовской нейронной сети
Управляющие системы и машины
description Предложен метод классификации вокальных звуков речи, который базируется на авторской саундлетной байесовской нейронной сети и позволяет учитывать структуру квазипериодического сигнала и сопоставлять образцы вокальных звуков речи разной длины. Разработаны методы создания образцов, формирования опорных образцов и модель их классификации.
format Article
author Федоров, Е.Е.
author_facet Федоров, Е.Е.
author_sort Федоров, Е.Е.
title Метод классификации вокальных звуков речи на основе саундлетной байесовской нейронной сети
title_short Метод классификации вокальных звуков речи на основе саундлетной байесовской нейронной сети
title_full Метод классификации вокальных звуков речи на основе саундлетной байесовской нейронной сети
title_fullStr Метод классификации вокальных звуков речи на основе саундлетной байесовской нейронной сети
title_full_unstemmed Метод классификации вокальных звуков речи на основе саундлетной байесовской нейронной сети
title_sort метод классификации вокальных звуков речи на основе саундлетной байесовской нейронной сети
publisher Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України
publishDate 2015
topic_facet Информационные речевые технологии
url http://dspace.nbuv.gov.ua/handle/123456789/112654
citation_txt Метод классификации вокальных звуков речи на основе саундлетной байесовской нейронной сети / Е.Е. Федоров // Управляющие системы и машины. — 2015. — № 6. — С. 78-83. — Бібліогр.: 8 назв. — рос.
series Управляющие системы и машины
work_keys_str_mv AT fedorovee metodklassifikaciivokalʹnyhzvukovrečinaosnovesaundletnojbajesovskojnejronnojseti
first_indexed 2024-03-30T09:23:24Z
last_indexed 2024-03-30T09:23:24Z
_version_ 1796149909480538112
spelling irk-123456789-1126542017-01-26T03:02:51Z Метод классификации вокальных звуков речи на основе саундлетной байесовской нейронной сети Федоров, Е.Е. Информационные речевые технологии Предложен метод классификации вокальных звуков речи, который базируется на авторской саундлетной байесовской нейронной сети и позволяет учитывать структуру квазипериодического сигнала и сопоставлять образцы вокальных звуков речи разной длины. Разработаны методы создания образцов, формирования опорных образцов и модель их классификации. Запропоновано метод класифікації вокальних звуків мовлення, який базується на авторській саундлетній байєсівській нейронній мережі та дозволяє враховувати структуру квазіперіодичного сигналу і зіставляти зразки вокальних звуків мовлення різної довжини. Розроблено методи створення зразків, формування опорних зразків і модель їх класифікації. The urgent task of developing a software component is a human speech recognition, using the intelligent computer systems. The basis of this problem is the construction of the effective methods, providing the high speed of the learning pattern recognition models as well as high probability, the adequacy and speed of speech signals recognition. The existing speech recognition system images using the following approaches: logical, metric, Bayesian, artificial neural network, structural. The existing methods and models is usually based on hidden Markov models, dynamic programming algorithm DTW. The artificial neural networks have the following disadvantages: while learning a few months; the retention of the large amount of reference patterns (sounds and words), as well as weighting coefficients; big time recognition; probability of detection is less than 95 %; the presence of hundreds of thousands of training patterns. To remedy these shortcomings, this article describes a method for the classification of vocal speech sounds on reference patterns on the basis of sound let. The work improves the approach to detection of the vocal sounds, which allows to generalize the single sound patterns of different lengths and different swing amplitudes, which increases the efficiency of the classification of vocal speech sounds. The author introduces the notion of a vocal sound sample and the method of its creation. Further development of the generating the plurality of the reference patterns method, which is characterized based on the soundlet and soundlet mappings collections, which increases the efficiency of the procedure of generating the reference patterns. On the basis of the sound let and sound let mappings collections, the method of the vocal sounds classification is improved, based on sound let Bayesian neural network (SBNN). The proposed model SBNN has the following characteristics: the neurons of the input layer correspond to the components of the vector that describes the test pattern; the neurons of the first (hidden) layer correspond to the reference patterns; the neurons of the second layer correspond to the sounds; adaptation to the voice characteristics of the particular operator is carried out by adding to the model vectors of the reference patterns; each neuron of the first (hidden) layer processes information based on normalized distances between the reference sound pattern and a test pattern of the sound; the weight of connections between neurons in the first (hidden) and second (output) layer is equal to 1 or 0 for these balances do not require the procedure of training; aggregation of outputs of neurons in the first (hidden) layer is performed on the basis of the maximum; in the second (output) layer are calculated posterior probabilities by Bayes formula, which allows to determine the probability that a test pattern vocal sound. The numerical studies are conducted on the vocal sounds of the TIMIT database. Were use such artificial neural networks like MLP, RBFNN, GRNN, PNN, RMLP and author SBNN. The study allows to conclude that the author's method provides the highest probability of classification. Algorithms can be used to solve the problems associated with the speech recognition in information systems, analysis of the vibration signal in intelligent systems technical diagnostics, the speaker identification in security systems and for the phonoscope examination. 2015 Article Метод классификации вокальных звуков речи на основе саундлетной байесовской нейронной сети / Е.Е. Федоров // Управляющие системы и машины. — 2015. — № 6. — С. 78-83. — Бібліогр.: 8 назв. — рос. 0130-5395 http://dspace.nbuv.gov.ua/handle/123456789/112654 004.934 ru Управляющие системы и машины Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України