Розпізнавання спонтанного мовлення на основі акустичних композитних моделей слів у реальному часі

У статті розглядається реалізація методів і алгоритмів розпізнавання злитого мовлення на основі композиції слів із акустичних генеративних моделей фонем. Аналізуються аспекти оцінки параметрів математичних моделей акустичної та лінгвістичної складових системи розпізнавання та перетворення графем на...

Повний опис

Збережено в:

Бібліографічні деталі
Опубліковано в: :	Штучний інтелект
Дата:	2012
Автори:	Робейко, В.В., Сажок, М.М.
Формат:	Стаття
Мова:	Українська
Опубліковано:	Інститут проблем штучного інтелекту МОН України та НАН України 2012
Теми:	Анализ и синтез коммуникационной информации
Онлайн доступ:	https://nasplib.isofts.kiev.ua/handle/123456789/57739
Теги:	Додати тег Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:	Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:	Розпізнавання спонтанного мовлення на основі акустичних композитних моделей слів у реальному часі / В.В. Робейко, М.М. Сажок // Штучний інтелект. — 2012. — № 4. — С. 253-263. — Бібліогр.: 14 назв. — укр.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine

_version_	1862560349018914816
author	Робейко, В.В. Сажок, М.М.
author_facet	Робейко, В.В. Сажок, М.М.
citation_txt	Розпізнавання спонтанного мовлення на основі акустичних композитних моделей слів у реальному часі / В.В. Робейко, М.М. Сажок // Штучний інтелект. — 2012. — № 4. — С. 253-263. — Бібліогр.: 14 назв. — укр.
collection	DSpace DC
container_title	Штучний інтелект
description	У статті розглядається реалізація методів і алгоритмів розпізнавання злитого мовлення на основі композиції слів із акустичних генеративних моделей фонем. Аналізуються аспекти оцінки параметрів математичних моделей акустичної та лінгвістичної складових системи розпізнавання та перетворення графем на фонеми, що поєднує обидві ці складові. Окрема увага приділяється прогнозуванню наголосів у словах та врахуванню ознак спонтанності. Базова експериментальна система розпізнавання злитого (у тому числі спонтанного) мовлення в реальному часі оперує словником до ста тисяч слів та дає змогу набирати текст під диктування. Аналізуються перспективи подальшого розширення словника та вдосконалення процедур оцінки параметрів моделей, обговорюються ергономічні питання. Рассматривается реализация методов и алгоритмов распознавания слитной речи на основе композиции слов из акустических генеративных моделей фонем. Анализируются аспекты оценки параметров математических моделей акустической и лингвистической составляющей системы распознавания и преобразования графем в фонемы, объединяющей обе эти составляющие. Отдельное внимание уделяется прогнозированию ударений в словах и учету признаков спонтанности. Базовая экспериментальная система распознавания слитной (в том числе спонтанной) речи в реальном времени оперирует словарем до ста тысяч слов, и позволяет набирать текст под диктовку. Анализируются перспективы дальнейшего расширения словаря и совершенствования процедур оценки параметров моделей, обсуждаются эргономические вопросы. This paper describes implementation of methods and algorithms for the automatic speech recognition based on word composition proceeding from acoustic phoneme models. Such a design of the speech-to-text decoder is conventional and most productive for Western languages. The aim is to explore this approach applied to the Ukrainian language that is highly inflective with relatively free word order. We use data-driven methods to estimate parameters for both acoustic and linguistic components of the mathematical model. The grapheme-to-phoneme conversion procedure takes into account word stress issue and spontaneous continuous speech features. The basic speech-to-text system is able to operate a 100k vocabulary in real-time. The prospective of dictionary and domain extension, parameter estimation improvement and ergonomic issues are discussed.
first_indexed	2025-11-25T23:07:15Z
format	Article
fulltext
id	nasplib_isofts_kiev_ua-123456789-57739
institution	Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn	1561-5359
language	Ukrainian
last_indexed	2025-11-25T23:07:15Z
publishDate	2012
publisher	Інститут проблем штучного інтелекту МОН України та НАН України
record_format	dspace
spelling	Робейко, В.В. Сажок, М.М. 2014-03-14T08:52:19Z 2014-03-14T08:52:19Z 2012 Розпізнавання спонтанного мовлення на основі акустичних композитних моделей слів у реальному часі / В.В. Робейко, М.М. Сажок // Штучний інтелект. — 2012. — № 4. — С. 253-263. — Бібліогр.: 14 назв. — укр. 1561-5359 https://nasplib.isofts.kiev.ua/handle/123456789/57739 004.934 У статті розглядається реалізація методів і алгоритмів розпізнавання злитого мовлення на основі композиції слів із акустичних генеративних моделей фонем. Аналізуються аспекти оцінки параметрів математичних моделей акустичної та лінгвістичної складових системи розпізнавання та перетворення графем на фонеми, що поєднує обидві ці складові. Окрема увага приділяється прогнозуванню наголосів у словах та врахуванню ознак спонтанності. Базова експериментальна система розпізнавання злитого (у тому числі спонтанного) мовлення в реальному часі оперує словником до ста тисяч слів та дає змогу набирати текст під диктування. Аналізуються перспективи подальшого розширення словника та вдосконалення процедур оцінки параметрів моделей, обговорюються ергономічні питання. Рассматривается реализация методов и алгоритмов распознавания слитной речи на основе композиции слов из акустических генеративных моделей фонем. Анализируются аспекты оценки параметров математических моделей акустической и лингвистической составляющей системы распознавания и преобразования графем в фонемы, объединяющей обе эти составляющие. Отдельное внимание уделяется прогнозированию ударений в словах и учету признаков спонтанности. Базовая экспериментальная система распознавания слитной (в том числе спонтанной) речи в реальном времени оперирует словарем до ста тысяч слов, и позволяет набирать текст под диктовку. Анализируются перспективы дальнейшего расширения словаря и совершенствования процедур оценки параметров моделей, обсуждаются эргономические вопросы. This paper describes implementation of methods and algorithms for the automatic speech recognition based on word composition proceeding from acoustic phoneme models. Such a design of the speech-to-text decoder is conventional and most productive for Western languages. The aim is to explore this approach applied to the Ukrainian language that is highly inflective with relatively free word order. We use data-driven methods to estimate parameters for both acoustic and linguistic components of the mathematical model. The grapheme-to-phoneme conversion procedure takes into account word stress issue and spontaneous continuous speech features. The basic speech-to-text system is able to operate a 100k vocabulary in real-time. The prospective of dictionary and domain extension, parameter estimation improvement and ergonomic issues are discussed. uk Інститут проблем штучного інтелекту МОН України та НАН України Штучний інтелект Анализ и синтез коммуникационной информации Розпізнавання спонтанного мовлення на основі акустичних композитних моделей слів у реальному часі Распознавание спонтанной речи на основе акустических композитных моделей слов в реальном времени Real-Time Spontaneous Speech Recognition Based on Word Acoustic Composite Models Article published earlier
spellingShingle	Розпізнавання спонтанного мовлення на основі акустичних композитних моделей слів у реальному часі Робейко, В.В. Сажок, М.М. Анализ и синтез коммуникационной информации
title	Розпізнавання спонтанного мовлення на основі акустичних композитних моделей слів у реальному часі
title_alt	Распознавание спонтанной речи на основе акустических композитных моделей слов в реальном времени Real-Time Spontaneous Speech Recognition Based on Word Acoustic Composite Models
title_full	Розпізнавання спонтанного мовлення на основі акустичних композитних моделей слів у реальному часі
title_fullStr	Розпізнавання спонтанного мовлення на основі акустичних композитних моделей слів у реальному часі
title_full_unstemmed	Розпізнавання спонтанного мовлення на основі акустичних композитних моделей слів у реальному часі
title_short	Розпізнавання спонтанного мовлення на основі акустичних композитних моделей слів у реальному часі
title_sort	розпізнавання спонтанного мовлення на основі акустичних композитних моделей слів у реальному часі
topic	Анализ и синтез коммуникационной информации
topic_facet	Анализ и синтез коммуникационной информации
url	https://nasplib.isofts.kiev.ua/handle/123456789/57739
work_keys_str_mv	AT robeikovv rozpíznavannâspontannogomovlennânaosnovíakustičnihkompozitnihmodeleislívurealʹnomučasí AT sažokmm rozpíznavannâspontannogomovlennânaosnovíakustičnihkompozitnihmodeleislívurealʹnomučasí AT robeikovv raspoznavaniespontannoirečinaosnoveakustičeskihkompozitnyhmodeleislovvrealʹnomvremeni AT sažokmm raspoznavaniespontannoirečinaosnoveakustičeskihkompozitnyhmodeleislovvrealʹnomvremeni AT robeikovv realtimespontaneousspeechrecognitionbasedonwordacousticcompositemodels AT sažokmm realtimespontaneousspeechrecognitionbasedonwordacousticcompositemodels

Розпізнавання спонтанного мовлення на основі акустичних композитних моделей слів у реальному часі

Репозитарії

Схожі ресурси