Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала

Описано формирование лингвистической модели для распознавания слитной речи на основе объединения слов в классы. Широко применяемый для этого метод кластеризации с учетом рекурсии частот слов обеспечивает приемлемую скорость при работе со славянскими языками из-за огромного обилия словоформ. Анализ п...

Повний опис

Збережено в:
Бібліографічні деталі
Дата:2012
Автор: Сажок, Н.Н.
Формат: Стаття
Мова:Russian
Опубліковано: Міжнародний науково-навчальний центр інформаційних технологій і систем НАН України та МОН України 2012
Назва видання:Кибернетика и вычислительная техника
Теми:
Онлайн доступ:http://dspace.nbuv.gov.ua/handle/123456789/45881
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала / Н.Н. Сажок // Кибернетика и вычисл. техника. — 2012. — Вип. 170. — С. 59-66. — Бібліогр.: 8 назв. — рос.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id irk-123456789-45881
record_format dspace
spelling irk-123456789-458812013-06-20T03:24:10Z Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала Сажок, Н.Н. Информационные технологии и системы Описано формирование лингвистической модели для распознавания слитной речи на основе объединения слов в классы. Широко применяемый для этого метод кластеризации с учетом рекурсии частот слов обеспечивает приемлемую скорость при работе со славянскими языками из-за огромного обилия словоформ. Анализ построения критерия точности аппроксимации дал возможность ввести рекурсию в итерации кластеризации на уровне компонентов критерия, что привело к существенному уменьшению сложности вычислений. Впервые автоматически сформированные для лингвистической модели распознавания украинской речи классы слов обобщают грамматические, семантические и фонетические признаки. Описано формування лінгвістичної моделі для розпізнавання злитого мовлення на основі об’єднання слів у класи. Найбільш поширений для цього метод кластеризації з урахуванням рекурсії частот слів не забезпечує прийнятної швидкості при роботі зі слов’янськими мовами через величезний надмір словоформ. Аналіз побудови критерію точності апроксимації дав змогу ввести рекурсію в ітерації кластеризації на рівні компонент критерію, що привело до суттєвого зменшення складності обчислень. Уперше автоматично сформовані для лінгвістичної моделі розпізнавання українського мовлення класи слів узагальнюють граматичні, семантичні та фонетичні ознаки. Operating with word classes rather than words is a constructive advance in speech recognition linguistic component development. Formed classes generalize grammatical, semantic and phonetic word features. The proposed method showed essential word clustering acceleration that is an important step to covering the entire lexicon in continuous speech recognition systems for Ukrainian. 2012 Article Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала / Н.Н. Сажок // Кибернетика и вычисл. техника. — 2012. — Вип. 170. — С. 59-66. — Бібліогр.: 8 назв. — рос. 0452-9910 http://dspace.nbuv.gov.ua/handle/123456789/45881 004.934 ru Кибернетика и вычислительная техника Міжнародний науково-навчальний центр інформаційних технологій і систем НАН України та МОН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Russian
topic Информационные технологии и системы
Информационные технологии и системы
spellingShingle Информационные технологии и системы
Информационные технологии и системы
Сажок, Н.Н.
Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала
Кибернетика и вычислительная техника
description Описано формирование лингвистической модели для распознавания слитной речи на основе объединения слов в классы. Широко применяемый для этого метод кластеризации с учетом рекурсии частот слов обеспечивает приемлемую скорость при работе со славянскими языками из-за огромного обилия словоформ. Анализ построения критерия точности аппроксимации дал возможность ввести рекурсию в итерации кластеризации на уровне компонентов критерия, что привело к существенному уменьшению сложности вычислений. Впервые автоматически сформированные для лингвистической модели распознавания украинской речи классы слов обобщают грамматические, семантические и фонетические признаки.
format Article
author Сажок, Н.Н.
author_facet Сажок, Н.Н.
author_sort Сажок, Н.Н.
title Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала
title_short Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала
title_full Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала
title_fullStr Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала
title_full_unstemmed Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала
title_sort кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала
publisher Міжнародний науково-навчальний центр інформаційних технологій і систем НАН України та МОН України
publishDate 2012
topic_facet Информационные технологии и системы
url http://dspace.nbuv.gov.ua/handle/123456789/45881
citation_txt Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала / Н.Н. Сажок // Кибернетика и вычисл. техника. — 2012. — Вип. 170. — С. 59-66. — Бібліогр.: 8 назв. — рос.
series Кибернетика и вычислительная техника
work_keys_str_mv AT sažoknn klasterizaciâslovpripostroeniilingvističeskojmodelidlâavtomatičeskogoraspoznavaniârečevogosignala
first_indexed 2023-10-18T18:03:52Z
last_indexed 2023-10-18T18:03:52Z
_version_ 1796143215680684032