Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала
Описано формирование лингвистической модели для распознавания слитной речи на основе объединения слов в классы. Широко применяемый для этого метод кластеризации с учетом рекурсии частот слов обеспечивает приемлемую скорость при работе со славянскими языками из-за огромного обилия словоформ. Анализ п...
Збережено в:
Дата: | 2012 |
---|---|
Автор: | |
Формат: | Стаття |
Мова: | Russian |
Опубліковано: |
Міжнародний науково-навчальний центр інформаційних технологій і систем НАН України та МОН України
2012
|
Назва видання: | Кибернетика и вычислительная техника |
Теми: | |
Онлайн доступ: | http://dspace.nbuv.gov.ua/handle/123456789/45881 |
Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
Цитувати: | Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала / Н.Н. Сажок // Кибернетика и вычисл. техника. — 2012. — Вип. 170. — С. 59-66. — Бібліогр.: 8 назв. — рос. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraineid |
irk-123456789-45881 |
---|---|
record_format |
dspace |
spelling |
irk-123456789-458812013-06-20T03:24:10Z Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала Сажок, Н.Н. Информационные технологии и системы Описано формирование лингвистической модели для распознавания слитной речи на основе объединения слов в классы. Широко применяемый для этого метод кластеризации с учетом рекурсии частот слов обеспечивает приемлемую скорость при работе со славянскими языками из-за огромного обилия словоформ. Анализ построения критерия точности аппроксимации дал возможность ввести рекурсию в итерации кластеризации на уровне компонентов критерия, что привело к существенному уменьшению сложности вычислений. Впервые автоматически сформированные для лингвистической модели распознавания украинской речи классы слов обобщают грамматические, семантические и фонетические признаки. Описано формування лінгвістичної моделі для розпізнавання злитого мовлення на основі об’єднання слів у класи. Найбільш поширений для цього метод кластеризації з урахуванням рекурсії частот слів не забезпечує прийнятної швидкості при роботі зі слов’янськими мовами через величезний надмір словоформ. Аналіз побудови критерію точності апроксимації дав змогу ввести рекурсію в ітерації кластеризації на рівні компонент критерію, що привело до суттєвого зменшення складності обчислень. Уперше автоматично сформовані для лінгвістичної моделі розпізнавання українського мовлення класи слів узагальнюють граматичні, семантичні та фонетичні ознаки. Operating with word classes rather than words is a constructive advance in speech recognition linguistic component development. Formed classes generalize grammatical, semantic and phonetic word features. The proposed method showed essential word clustering acceleration that is an important step to covering the entire lexicon in continuous speech recognition systems for Ukrainian. 2012 Article Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала / Н.Н. Сажок // Кибернетика и вычисл. техника. — 2012. — Вип. 170. — С. 59-66. — Бібліогр.: 8 назв. — рос. 0452-9910 http://dspace.nbuv.gov.ua/handle/123456789/45881 004.934 ru Кибернетика и вычислительная техника Міжнародний науково-навчальний центр інформаційних технологій і систем НАН України та МОН України |
institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
collection |
DSpace DC |
language |
Russian |
topic |
Информационные технологии и системы Информационные технологии и системы |
spellingShingle |
Информационные технологии и системы Информационные технологии и системы Сажок, Н.Н. Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала Кибернетика и вычислительная техника |
description |
Описано формирование лингвистической модели для распознавания слитной речи на основе объединения слов в классы. Широко применяемый для этого метод кластеризации с учетом рекурсии частот слов обеспечивает приемлемую скорость при работе со славянскими языками из-за огромного обилия словоформ. Анализ построения критерия точности аппроксимации дал возможность ввести рекурсию в итерации кластеризации на уровне компонентов критерия, что привело к существенному уменьшению сложности вычислений. Впервые автоматически сформированные для лингвистической модели распознавания украинской речи классы слов обобщают грамматические, семантические и фонетические признаки. |
format |
Article |
author |
Сажок, Н.Н. |
author_facet |
Сажок, Н.Н. |
author_sort |
Сажок, Н.Н. |
title |
Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала |
title_short |
Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала |
title_full |
Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала |
title_fullStr |
Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала |
title_full_unstemmed |
Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала |
title_sort |
кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала |
publisher |
Міжнародний науково-навчальний центр інформаційних технологій і систем НАН України та МОН України |
publishDate |
2012 |
topic_facet |
Информационные технологии и системы |
url |
http://dspace.nbuv.gov.ua/handle/123456789/45881 |
citation_txt |
Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала / Н.Н. Сажок // Кибернетика и вычисл. техника. — 2012. — Вип. 170. — С. 59-66. — Бібліогр.: 8 назв. — рос. |
series |
Кибернетика и вычислительная техника |
work_keys_str_mv |
AT sažoknn klasterizaciâslovpripostroeniilingvističeskojmodelidlâavtomatičeskogoraspoznavaniârečevogosignala |
first_indexed |
2023-10-18T18:03:52Z |
last_indexed |
2023-10-18T18:03:52Z |
_version_ |
1796143215680684032 |