Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала

Описано формирование лингвистической модели для распознавания слитной речи на основе объединения слов в классы. Широко применяемый для этого метод кластеризации с учетом рекурсии частот слов обеспечивает приемлемую скорость при работе со славянскими языками из-за огромного обилия словоформ. Анализ п...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Кибернетика и вычислительная техника
Datum:2012
1. Verfasser: Сажок, Н.Н.
Format: Artikel
Sprache:Russisch
Veröffentlicht: Міжнародний науково-навчальний центр інформаційних технологій і систем НАН України та МОН України 2012
Schlagworte:
Online Zugang:https://nasplib.isofts.kiev.ua/handle/123456789/45881
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала / Н.Н. Сажок // Кибернетика и вычисл. техника. — 2012. — Вип. 170. — С. 59-66. — Бібліогр.: 8 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1862545187834691584
author Сажок, Н.Н.
author_facet Сажок, Н.Н.
citation_txt Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала / Н.Н. Сажок // Кибернетика и вычисл. техника. — 2012. — Вип. 170. — С. 59-66. — Бібліогр.: 8 назв. — рос.
collection DSpace DC
container_title Кибернетика и вычислительная техника
description Описано формирование лингвистической модели для распознавания слитной речи на основе объединения слов в классы. Широко применяемый для этого метод кластеризации с учетом рекурсии частот слов обеспечивает приемлемую скорость при работе со славянскими языками из-за огромного обилия словоформ. Анализ построения критерия точности аппроксимации дал возможность ввести рекурсию в итерации кластеризации на уровне компонентов критерия, что привело к существенному уменьшению сложности вычислений. Впервые автоматически сформированные для лингвистической модели распознавания украинской речи классы слов обобщают грамматические, семантические и фонетические признаки. Описано формування лінгвістичної моделі для розпізнавання злитого мовлення на основі об’єднання слів у класи. Найбільш поширений для цього метод кластеризації з урахуванням рекурсії частот слів не забезпечує прийнятної швидкості при роботі зі слов’янськими мовами через величезний надмір словоформ. Аналіз побудови критерію точності апроксимації дав змогу ввести рекурсію в ітерації кластеризації на рівні компонент критерію, що привело до суттєвого зменшення складності обчислень. Уперше автоматично сформовані для лінгвістичної моделі розпізнавання українського мовлення класи слів узагальнюють граматичні, семантичні та фонетичні ознаки. Operating with word classes rather than words is a constructive advance in speech recognition linguistic component development. Formed classes generalize grammatical, semantic and phonetic word features. The proposed method showed essential word clustering acceleration that is an important step to covering the entire lexicon in continuous speech recognition systems for Ukrainian.
first_indexed 2025-11-25T05:40:17Z
format Article
fulltext
id nasplib_isofts_kiev_ua-123456789-45881
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 0452-9910
language Russian
last_indexed 2025-11-25T05:40:17Z
publishDate 2012
publisher Міжнародний науково-навчальний центр інформаційних технологій і систем НАН України та МОН України
record_format dspace
spelling Сажок, Н.Н.
2013-06-19T20:41:25Z
2013-06-19T20:41:25Z
2012
Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала / Н.Н. Сажок // Кибернетика и вычисл. техника. — 2012. — Вип. 170. — С. 59-66. — Бібліогр.: 8 назв. — рос.
0452-9910
https://nasplib.isofts.kiev.ua/handle/123456789/45881
004.934
Описано формирование лингвистической модели для распознавания слитной речи на основе объединения слов в классы. Широко применяемый для этого метод кластеризации с учетом рекурсии частот слов обеспечивает приемлемую скорость при работе со славянскими языками из-за огромного обилия словоформ. Анализ построения критерия точности аппроксимации дал возможность ввести рекурсию в итерации кластеризации на уровне компонентов критерия, что привело к существенному уменьшению сложности вычислений. Впервые автоматически сформированные для лингвистической модели распознавания украинской речи классы слов обобщают грамматические, семантические и фонетические признаки.
Описано формування лінгвістичної моделі для розпізнавання злитого мовлення на основі об’єднання слів у класи. Найбільш поширений для цього метод кластеризації з урахуванням рекурсії частот слів не забезпечує прийнятної швидкості при роботі зі слов’янськими мовами через величезний надмір словоформ. Аналіз побудови критерію точності апроксимації дав змогу ввести рекурсію в ітерації кластеризації на рівні компонент критерію, що привело до суттєвого зменшення складності обчислень. Уперше автоматично сформовані для лінгвістичної моделі розпізнавання українського мовлення класи слів узагальнюють граматичні, семантичні та фонетичні ознаки.
Operating with word classes rather than words is a constructive advance in speech recognition linguistic component development. Formed classes generalize grammatical, semantic and phonetic word features. The proposed method showed essential word clustering acceleration that is an important step to covering the entire lexicon in continuous speech recognition systems for Ukrainian.
ru
Міжнародний науково-навчальний центр інформаційних технологій і систем НАН України та МОН України
Кибернетика и вычислительная техника
Информационные технологии и системы
Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала
Кластеризація слів при побудові лінгвістичної моделі для автоматичного розпізнавання мовленнєвого сигналу
Word clustering for speech signal recognition language model development
Article
published earlier
spellingShingle Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала
Сажок, Н.Н.
Информационные технологии и системы
title Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала
title_alt Кластеризація слів при побудові лінгвістичної моделі для автоматичного розпізнавання мовленнєвого сигналу
Word clustering for speech signal recognition language model development
title_full Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала
title_fullStr Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала
title_full_unstemmed Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала
title_short Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала
title_sort кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала
topic Информационные технологии и системы
topic_facet Информационные технологии и системы
url https://nasplib.isofts.kiev.ua/handle/123456789/45881
work_keys_str_mv AT sažoknn klasterizaciâslovpripostroeniilingvističeskoimodelidlâavtomatičeskogoraspoznavaniârečevogosignala
AT sažoknn klasterizacíâslívpripobudovílíngvístičnoímodelídlâavtomatičnogorozpíznavannâmovlennêvogosignalu
AT sažoknn wordclusteringforspeechsignalrecognitionlanguagemodeldevelopment