Дослідження невідповідності шкали акустичної та лінгвістичної моделей розпізнавання злитого українського мовлення

У статті описується розробка експериментальної системи перетворення мовленнєвого сигналу на текст, що складається як зі слів, так і з субслівних елементів. Велику увагу приділено вибору навчальної вибірки для оцінки параметрів акустичної моделі розпізнавання. Зокрема розглядалися такі варіанти: моде...

Повний опис

Збережено в:
Бібліографічні деталі
Опубліковано в: :Штучний інтелект
Дата:2012
Автор: Васильєва, Н.Б.
Формат: Стаття
Мова:Ukrainian
Опубліковано: Інститут проблем штучного інтелекту МОН України та НАН України 2012
Теми:
Онлайн доступ:https://nasplib.isofts.kiev.ua/handle/123456789/57167
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Дослідження невідповідності шкали акустичної та лінгвістичної моделей розпізнавання злитого українського мовлення / Н.Б. Васильєва // Штучний інтелект. — 2012. — № 3. — С. 118-125. — Бібліогр.: 5 назв. — укр.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id nasplib_isofts_kiev_ua-123456789-57167
record_format dspace
spelling Васильєва, Н.Б.
2014-03-04T14:37:30Z
2014-03-04T14:37:30Z
2012
2012
Дослідження невідповідності шкали акустичної та лінгвістичної моделей розпізнавання злитого українського мовлення / Н.Б. Васильєва // Штучний інтелект. — 2012. — № 3. — С. 118-125. — Бібліогр.: 5 назв. — укр.
1561-5359
https://nasplib.isofts.kiev.ua/handle/123456789/57167
004.934
У статті описується розробка експериментальної системи перетворення мовленнєвого сигналу на текст, що складається як зі слів, так і з субслівних елементів. Велику увагу приділено вибору навчальної вибірки для оцінки параметрів акустичної моделі розпізнавання. Зокрема розглядалися такі варіанти: модель, побудована лише на злитому мовленні; модель, що об’єднує злите мовлення та ізольовані слова; модель, що не враховує наголошеність голосних; та модель, що враховує наголошеність лише голосних «и» та «е». Проводиться оцінка параметрів акустичної моделі на основі однодикторного мовленнєвого корпусу. Вибираються коефіцієнти, які компенсують невідповідності шкали акустичної та лінгвістичної складової моделі розпізнавання. Наводяться результати експериментальних досліджень.
В статье описывается разработка экспериментальной системы преобразования речевого сигнала в текст, который состоит как из слов, так и из субсловных элементов. Большое внимание уделено выбору обучающей выборки для оценки параметров акустической модели распознавания. В частности рассматривались такие варианты: акустическая модель, построенная только на слитной речи; модель, объединяющая слитую речь и изолированные слова; модель, не учитывающая ударность гласных; и модель, учитывающая ударность только гласных «ы» и «е». Проводится оценка параметров акустической модели на основе однодикторного речевого корпуса. Выбираются коэффициенты, компенсирующие несоответствия шкалы акустической и лингвистической составляющей модели распознавания. Приводятся результаты экспериментальных исследований.
This paper describes the development of experimental systems of speech signal to text conversion based on words and sub-words. Main attention is paid to selecting of training set for estimation of the parameters of acoustic recognition models. Particularly, the following options are considered: acoustic model based only on continuous speech, a model that integrates continuous speech and isolated words, a model that ignores stress vowels, and a model that takes into account only stress vowels “y” and “e”. The estimation of acoustic model parameters is based on mono-speaker speech corpus. The factors compensating the inconsistency of acoustic and linguistic component model scales are analyzed and their values are explored. The results of experimental research are discussed.
uk
Інститут проблем штучного інтелекту МОН України та НАН України
Штучний інтелект
Анализ и синтез коммуникационной информации
Дослідження невідповідності шкали акустичної та лінгвістичної моделей розпізнавання злитого українського мовлення
Исследование несоответствия шкалы акустической и лингвистической моделей распознавания слитой украинской речи
Exploration of Acoustic and Linguistic Models Scale Discrepancy for Continuous Ukrainian Speech Recognition
Article
published earlier
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
title Дослідження невідповідності шкали акустичної та лінгвістичної моделей розпізнавання злитого українського мовлення
spellingShingle Дослідження невідповідності шкали акустичної та лінгвістичної моделей розпізнавання злитого українського мовлення
Васильєва, Н.Б.
Анализ и синтез коммуникационной информации
title_short Дослідження невідповідності шкали акустичної та лінгвістичної моделей розпізнавання злитого українського мовлення
title_full Дослідження невідповідності шкали акустичної та лінгвістичної моделей розпізнавання злитого українського мовлення
title_fullStr Дослідження невідповідності шкали акустичної та лінгвістичної моделей розпізнавання злитого українського мовлення
title_full_unstemmed Дослідження невідповідності шкали акустичної та лінгвістичної моделей розпізнавання злитого українського мовлення
title_sort дослідження невідповідності шкали акустичної та лінгвістичної моделей розпізнавання злитого українського мовлення
author Васильєва, Н.Б.
author_facet Васильєва, Н.Б.
topic Анализ и синтез коммуникационной информации
topic_facet Анализ и синтез коммуникационной информации
publishDate 2012
language Ukrainian
container_title Штучний інтелект
publisher Інститут проблем штучного інтелекту МОН України та НАН України
format Article
title_alt Исследование несоответствия шкалы акустической и лингвистической моделей распознавания слитой украинской речи
Exploration of Acoustic and Linguistic Models Scale Discrepancy for Continuous Ukrainian Speech Recognition
description У статті описується розробка експериментальної системи перетворення мовленнєвого сигналу на текст, що складається як зі слів, так і з субслівних елементів. Велику увагу приділено вибору навчальної вибірки для оцінки параметрів акустичної моделі розпізнавання. Зокрема розглядалися такі варіанти: модель, побудована лише на злитому мовленні; модель, що об’єднує злите мовлення та ізольовані слова; модель, що не враховує наголошеність голосних; та модель, що враховує наголошеність лише голосних «и» та «е». Проводиться оцінка параметрів акустичної моделі на основі однодикторного мовленнєвого корпусу. Вибираються коефіцієнти, які компенсують невідповідності шкали акустичної та лінгвістичної складової моделі розпізнавання. Наводяться результати експериментальних досліджень. В статье описывается разработка экспериментальной системы преобразования речевого сигнала в текст, который состоит как из слов, так и из субсловных элементов. Большое внимание уделено выбору обучающей выборки для оценки параметров акустической модели распознавания. В частности рассматривались такие варианты: акустическая модель, построенная только на слитной речи; модель, объединяющая слитую речь и изолированные слова; модель, не учитывающая ударность гласных; и модель, учитывающая ударность только гласных «ы» и «е». Проводится оценка параметров акустической модели на основе однодикторного речевого корпуса. Выбираются коэффициенты, компенсирующие несоответствия шкалы акустической и лингвистической составляющей модели распознавания. Приводятся результаты экспериментальных исследований. This paper describes the development of experimental systems of speech signal to text conversion based on words and sub-words. Main attention is paid to selecting of training set for estimation of the parameters of acoustic recognition models. Particularly, the following options are considered: acoustic model based only on continuous speech, a model that integrates continuous speech and isolated words, a model that ignores stress vowels, and a model that takes into account only stress vowels “y” and “e”. The estimation of acoustic model parameters is based on mono-speaker speech corpus. The factors compensating the inconsistency of acoustic and linguistic component model scales are analyzed and their values are explored. The results of experimental research are discussed.
issn 1561-5359
url https://nasplib.isofts.kiev.ua/handle/123456789/57167
citation_txt Дослідження невідповідності шкали акустичної та лінгвістичної моделей розпізнавання злитого українського мовлення / Н.Б. Васильєва // Штучний інтелект. — 2012. — № 3. — С. 118-125. — Бібліогр.: 5 назв. — укр.
work_keys_str_mv AT vasilʹêvanb doslídžennânevídpovídnostíškaliakustičnoítalíngvístičnoímodeleirozpíznavannâzlitogoukraínsʹkogomovlennâ
AT vasilʹêvanb issledovanienesootvetstviâškalyakustičeskoiilingvističeskoimodeleiraspoznavaniâslitoiukrainskoireči
AT vasilʹêvanb explorationofacousticandlinguisticmodelsscalediscrepancyforcontinuousukrainianspeechrecognition
first_indexed 2025-12-02T03:57:59Z
last_indexed 2025-12-02T03:57:59Z
_version_ 1850861475375087616