Технология разметки звуковых файлов с использованием неточного текстового сопровождения

Описана технология разметки звуковых файлов с использованием неточного текстового сопровождения. Предварительно формируется система распознавания на основе речевых записей, размеченных экспертами. Новые речевые записи распознаются для выяснения временны́х границ слов. Процедура сравнения ответа расп...

Повний опис

Збережено в:

Бібліографічні деталі
Опубліковано в: :	Кибернетика и вычислительная техника
Дата:	2012
Автор:	Пилипенко, В.В.
Формат:	Стаття
Мова:	Російська
Опубліковано:	Міжнародний науково-навчальний центр інформаційних технологій і систем НАН України та МОН України 2012
Теми:	Информационные технологии и системы
Онлайн доступ:	https://nasplib.isofts.kiev.ua/handle/123456789/45873
Теги:	Додати тег Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:	Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:	Технология разметки звуковых файлов с использованием неточного текстового сопровождения / В.В. Пилипенко // Кибернетика и вычисл. техника. — 2012. — Вип. 169. — С. 67-77. — Бібліогр.: 7 назв. — рос.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine

_version_	1862620978813599744
author	Пилипенко, В.В.
author_facet	Пилипенко, В.В.
citation_txt	Технология разметки звуковых файлов с использованием неточного текстового сопровождения / В.В. Пилипенко // Кибернетика и вычисл. техника. — 2012. — Вип. 169. — С. 67-77. — Бібліогр.: 7 назв. — рос.
collection	DSpace DC
container_title	Кибернетика и вычислительная техника
description	Описана технология разметки звуковых файлов с использованием неточного текстового сопровождения. Предварительно формируется система распознавания на основе речевых записей, размеченных экспертами. Новые речевые записи распознаются для выяснения временны́х границ слов. Процедура сравнения ответа распознавания и неточного описания выявляет фрагменты звука, для которых есть точное соответствие. На основе автоматически полученной разметки строится новая, более точная система автоматического многодикторного распознавания спонтанной украинской речи с объемом словаря в 125 тысяч словоформ. Проведенные эксперименты показали пословную точность распознавания в 80 %. Описано технологію розмітки звукових файлів з використанням неточного текстового супроводження. Заздалегідь формується система розпізнавання мовлення на базі мовленнєвих записів, розмічених експертами. Нові мовленнєві записи розпізнаються для з’ясування меж слів у часовому просторі. Процедура порівняння відповіді розпізнавання і неточного текстового опису виявляє фрагменти звуку, для яких є точний збіг текстового опису зі звуковим сигналом. На базі автоматично отриманої розмітки будується нова більш точна система автоматичного багатодикторного розпізнавання спонтанної української мови з обсягом словника в 125 тисяч словоформ. Наведені результати експериментів, які показали точність 80 % послівного розпізнавання. This paper describes the speech labeling technology using an inexact text description. Preliminary there was built the speech recognition system based on the manually labeled corpus. This system is used to recognize new voice records and to determine the words temporal boundaries. A comparison of the recognition response and inexact text description identifies the audio chunks, where there is an exact match. The new more accurate large vocabulary continuous speech recognition system for Ukrainian is build by using the automatically labeled corpus. This approach can be useful for automatic labeling of large amount of partially annotated audio signals, so that the significantly reducing the cost of developing speech recognition systems is achieved. Experimental results show the effectiveness of the approach and reduce errors in speech recognition by 24.8 % so that the accuracy of 80 % by word recognition is achieved for broadcasts.
first_indexed	2025-12-07T13:22:58Z
format	Article
fulltext
id	nasplib_isofts_kiev_ua-123456789-45873
institution	Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn	0452-9910
language	Russian
last_indexed	2025-12-07T13:22:58Z
publishDate	2012
publisher	Міжнародний науково-навчальний центр інформаційних технологій і систем НАН України та МОН України
record_format	dspace
spelling	Пилипенко, В.В. 2013-06-19T18:21:39Z 2013-06-19T18:21:39Z 2012 Технология разметки звуковых файлов с использованием неточного текстового сопровождения / В.В. Пилипенко // Кибернетика и вычисл. техника. — 2012. — Вип. 169. — С. 67-77. — Бібліогр.: 7 назв. — рос. 0452-9910 https://nasplib.isofts.kiev.ua/handle/123456789/45873 004.934 Описана технология разметки звуковых файлов с использованием неточного текстового сопровождения. Предварительно формируется система распознавания на основе речевых записей, размеченных экспертами. Новые речевые записи распознаются для выяснения временны́х границ слов. Процедура сравнения ответа распознавания и неточного описания выявляет фрагменты звука, для которых есть точное соответствие. На основе автоматически полученной разметки строится новая, более точная система автоматического многодикторного распознавания спонтанной украинской речи с объемом словаря в 125 тысяч словоформ. Проведенные эксперименты показали пословную точность распознавания в 80 %. Описано технологію розмітки звукових файлів з використанням неточного текстового супроводження. Заздалегідь формується система розпізнавання мовлення на базі мовленнєвих записів, розмічених експертами. Нові мовленнєві записи розпізнаються для з’ясування меж слів у часовому просторі. Процедура порівняння відповіді розпізнавання і неточного текстового опису виявляє фрагменти звуку, для яких є точний збіг текстового опису зі звуковим сигналом. На базі автоматично отриманої розмітки будується нова більш точна система автоматичного багатодикторного розпізнавання спонтанної української мови з обсягом словника в 125 тисяч словоформ. Наведені результати експериментів, які показали точність 80 % послівного розпізнавання. This paper describes the speech labeling technology using an inexact text description. Preliminary there was built the speech recognition system based on the manually labeled corpus. This system is used to recognize new voice records and to determine the words temporal boundaries. A comparison of the recognition response and inexact text description identifies the audio chunks, where there is an exact match. The new more accurate large vocabulary continuous speech recognition system for Ukrainian is build by using the automatically labeled corpus. This approach can be useful for automatic labeling of large amount of partially annotated audio signals, so that the significantly reducing the cost of developing speech recognition systems is achieved. Experimental results show the effectiveness of the approach and reduce errors in speech recognition by 24.8 % so that the accuracy of 80 % by word recognition is achieved for broadcasts. ru Міжнародний науково-навчальний центр інформаційних технологій і систем НАН України та МОН України Кибернетика и вычислительная техника Информационные технологии и системы Технология разметки звуковых файлов с использованием неточного текстового сопровождения Технологія розмітки звукових файлів з використанням неточного текстового супроводження Speech labeling technology using inexact text description Article published earlier
spellingShingle	Технология разметки звуковых файлов с использованием неточного текстового сопровождения Пилипенко, В.В. Информационные технологии и системы
title	Технология разметки звуковых файлов с использованием неточного текстового сопровождения
title_alt	Технологія розмітки звукових файлів з використанням неточного текстового супроводження Speech labeling technology using inexact text description
title_full	Технология разметки звуковых файлов с использованием неточного текстового сопровождения
title_fullStr	Технология разметки звуковых файлов с использованием неточного текстового сопровождения
title_full_unstemmed	Технология разметки звуковых файлов с использованием неточного текстового сопровождения
title_short	Технология разметки звуковых файлов с использованием неточного текстового сопровождения
title_sort	технология разметки звуковых файлов с использованием неточного текстового сопровождения
topic	Информационные технологии и системы
topic_facet	Информационные технологии и системы
url	https://nasplib.isofts.kiev.ua/handle/123456789/45873
work_keys_str_mv	AT pilipenkovv tehnologiârazmetkizvukovyhfailovsispolʹzovaniemnetočnogotekstovogosoprovoždeniâ AT pilipenkovv tehnologíârozmítkizvukovihfailívzvikoristannâmnetočnogotekstovogosuprovodžennâ AT pilipenkovv speechlabelingtechnologyusinginexacttextdescription

Технология разметки звуковых файлов с использованием неточного текстового сопровождения

Репозитарії

Схожі ресурси