Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала

Описано формирование лингвистической модели для распознавания слитной речи на основе объединения слов в классы. Широко применяемый для этого метод кластеризации с учетом рекурсии частот слов обеспечивает приемлемую скорость при работе со славянскими языками из-за огромного обилия словоформ. Анализ п...

Повний опис

Збережено в:

Бібліографічні деталі
Опубліковано в: :	Кибернетика и вычислительная техника
Дата:	2012
Автор:	Сажок, Н.Н.
Формат:	Стаття
Мова:	Російська
Опубліковано:	Міжнародний науково-навчальний центр інформаційних технологій і систем НАН України та МОН України 2012
Теми:	Информационные технологии и системы
Онлайн доступ:	https://nasplib.isofts.kiev.ua/handle/123456789/45881
Теги:	Додати тег Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:	Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:	Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала / Н.Н. Сажок // Кибернетика и вычисл. техника. — 2012. — Вип. 170. — С. 59-66. — Бібліогр.: 8 назв. — рос.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine

_version_	1862545187834691584
author	Сажок, Н.Н.
author_facet	Сажок, Н.Н.
citation_txt	Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала / Н.Н. Сажок // Кибернетика и вычисл. техника. — 2012. — Вип. 170. — С. 59-66. — Бібліогр.: 8 назв. — рос.
collection	DSpace DC
container_title	Кибернетика и вычислительная техника
description	Описано формирование лингвистической модели для распознавания слитной речи на основе объединения слов в классы. Широко применяемый для этого метод кластеризации с учетом рекурсии частот слов обеспечивает приемлемую скорость при работе со славянскими языками из-за огромного обилия словоформ. Анализ построения критерия точности аппроксимации дал возможность ввести рекурсию в итерации кластеризации на уровне компонентов критерия, что привело к существенному уменьшению сложности вычислений. Впервые автоматически сформированные для лингвистической модели распознавания украинской речи классы слов обобщают грамматические, семантические и фонетические признаки. Описано формування лінгвістичної моделі для розпізнавання злитого мовлення на основі об’єднання слів у класи. Найбільш поширений для цього метод кластеризації з урахуванням рекурсії частот слів не забезпечує прийнятної швидкості при роботі зі слов’янськими мовами через величезний надмір словоформ. Аналіз побудови критерію точності апроксимації дав змогу ввести рекурсію в ітерації кластеризації на рівні компонент критерію, що привело до суттєвого зменшення складності обчислень. Уперше автоматично сформовані для лінгвістичної моделі розпізнавання українського мовлення класи слів узагальнюють граматичні, семантичні та фонетичні ознаки. Operating with word classes rather than words is a constructive advance in speech recognition linguistic component development. Formed classes generalize grammatical, semantic and phonetic word features. The proposed method showed essential word clustering acceleration that is an important step to covering the entire lexicon in continuous speech recognition systems for Ukrainian.
first_indexed	2025-11-25T05:40:17Z
format	Article
fulltext
id	nasplib_isofts_kiev_ua-123456789-45881
institution	Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn	0452-9910
language	Russian
last_indexed	2025-11-25T05:40:17Z
publishDate	2012
publisher	Міжнародний науково-навчальний центр інформаційних технологій і систем НАН України та МОН України
record_format	dspace
spelling	Сажок, Н.Н. 2013-06-19T20:41:25Z 2013-06-19T20:41:25Z 2012 Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала / Н.Н. Сажок // Кибернетика и вычисл. техника. — 2012. — Вип. 170. — С. 59-66. — Бібліогр.: 8 назв. — рос. 0452-9910 https://nasplib.isofts.kiev.ua/handle/123456789/45881 004.934 Описано формирование лингвистической модели для распознавания слитной речи на основе объединения слов в классы. Широко применяемый для этого метод кластеризации с учетом рекурсии частот слов обеспечивает приемлемую скорость при работе со славянскими языками из-за огромного обилия словоформ. Анализ построения критерия точности аппроксимации дал возможность ввести рекурсию в итерации кластеризации на уровне компонентов критерия, что привело к существенному уменьшению сложности вычислений. Впервые автоматически сформированные для лингвистической модели распознавания украинской речи классы слов обобщают грамматические, семантические и фонетические признаки. Описано формування лінгвістичної моделі для розпізнавання злитого мовлення на основі об’єднання слів у класи. Найбільш поширений для цього метод кластеризації з урахуванням рекурсії частот слів не забезпечує прийнятної швидкості при роботі зі слов’янськими мовами через величезний надмір словоформ. Аналіз побудови критерію точності апроксимації дав змогу ввести рекурсію в ітерації кластеризації на рівні компонент критерію, що привело до суттєвого зменшення складності обчислень. Уперше автоматично сформовані для лінгвістичної моделі розпізнавання українського мовлення класи слів узагальнюють граматичні, семантичні та фонетичні ознаки. Operating with word classes rather than words is a constructive advance in speech recognition linguistic component development. Formed classes generalize grammatical, semantic and phonetic word features. The proposed method showed essential word clustering acceleration that is an important step to covering the entire lexicon in continuous speech recognition systems for Ukrainian. ru Міжнародний науково-навчальний центр інформаційних технологій і систем НАН України та МОН України Кибернетика и вычислительная техника Информационные технологии и системы Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала Кластеризація слів при побудові лінгвістичної моделі для автоматичного розпізнавання мовленнєвого сигналу Word clustering for speech signal recognition language model development Article published earlier
spellingShingle	Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала Сажок, Н.Н. Информационные технологии и системы
title	Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала
title_alt	Кластеризація слів при побудові лінгвістичної моделі для автоматичного розпізнавання мовленнєвого сигналу Word clustering for speech signal recognition language model development
title_full	Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала
title_fullStr	Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала
title_full_unstemmed	Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала
title_short	Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала
title_sort	кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала
topic	Информационные технологии и системы
topic_facet	Информационные технологии и системы
url	https://nasplib.isofts.kiev.ua/handle/123456789/45881
work_keys_str_mv	AT sažoknn klasterizaciâslovpripostroeniilingvističeskoimodelidlâavtomatičeskogoraspoznavaniârečevogosignala AT sažoknn klasterizacíâslívpripobudovílíngvístičnoímodelídlâavtomatičnogorozpíznavannâmovlennêvogosignalu AT sažoknn wordclusteringforspeechsignalrecognitionlanguagemodeldevelopment

Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала

Репозитарії

Схожі ресурси