Голосовой калькулятор

Разработан метод генерация словаря распознавания в реальном времени в зависимости от
 предыдущих команд. Розроблено метод генерація словника розпізнавання в реальному часі залежно від попередніх команд. Developed a method for the generation of recognition vocabulary in real time according to...

Full description

Saved in:
Bibliographic Details
Published in:Искусственный интеллект
Date:2014
Main Authors: Азаренко, Д.С., Иванова, С.Б., Герасимов, И.Г.
Format: Article
Language:Russian
Published: Інститут проблем штучного інтелекту МОН України та НАН України 2014
Subjects:
Online Access:https://nasplib.isofts.kiev.ua/handle/123456789/85255
Tags: Add Tag
No Tags, Be the first to tag this record!
Journal Title:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Cite this:Голосовой калькулятор / Д.С. Азаренко, С.Б. Иванова, И.Г. Герасимов // Искусственный интеллект. — 2014. — № 2. — С. 46–50. — Бібліогр.: 5 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1860040812165857280
author Азаренко, Д.С.
Иванова, С.Б.
Герасимов, И.Г.
author_facet Азаренко, Д.С.
Иванова, С.Б.
Герасимов, И.Г.
citation_txt Голосовой калькулятор / Д.С. Азаренко, С.Б. Иванова, И.Г. Герасимов // Искусственный интеллект. — 2014. — № 2. — С. 46–50. — Бібліогр.: 5 назв. — рос.
collection DSpace DC
container_title Искусственный интеллект
description Разработан метод генерация словаря распознавания в реальном времени в зависимости от
 предыдущих команд. Розроблено метод генерація словника розпізнавання в реальному часі залежно від попередніх команд. Developed a method for the generation of recognition vocabulary in real time according to the preceding instructions.
first_indexed 2025-12-07T16:55:54Z
format Article
fulltext ISSN 1561-5359 «Искусственный интеллект» 2014 № 2 46 3А УДК 004.89:004.93 Д.С. Азаренко, С.Б. Иванова, И.Г. Герасимов Институт проблем искусственного интеллекта МОН Украины и НАН Украины, г. Донецк Украина, 83048, г. Донецк, ул. Артема, 118 б Голосовой калькулятор D.S. Azarenko, S.B. Ivanova, I.G. Gerasimov Institute of Artificial Intelligence MES Ukraine and NAS Ukraine, Donetsk Ukraine, 83048, Donetsk, st. Artem, 118-b Voice calculator Д.С. Азаренко, С.Б. Іванова, І.Г. Герасимов Інститут проблем штучного інтелекту МОН України і НАН України, м. Донецьк Україна, 83048, м. Донецьк, вул. Артема, 118-б Голосовий калькулятор Разработан метод генерация словаря распознавания в реальном времени в зависимости от предыдущих команд. Ключевые слова: голосовой калькулятор, математическая форма, голосовая команда, список распознавания. Developed a method for the generation of recognition vocabulary in real time according to the preceding instructions. Key words: voice calculator, mathematical form, voice command, recognition list. Розроблено метод генерація словника розпізнавання в реальному часі залежно від попередніх команд. Ключові слова: голосовий калькулятор, математична форма, голосова команда, список розпізнавання. Введение Программа «Голосовой калькулятор» (ГК) предназначена для голосового ввода и вычисления несложных математических выражений. Она может быть полезна для людей с ограниченными возможностями, а также лицам, которым необходимо производить вычисления, но нет возможности вводить формулы при помощи рук. Существует аналог данной программы для ОС Android «Счетовод» [1], существенным недостатком которой является использование он-лайн сервиса Google для распознавания голосовых команд, для чего необходимо постоянное подключение к интернету. Первоочередной задачей является улучшение качества распознавания команд. Решению этой задачи посвящена данная статья. Результаты исследования Программа позволяет производить вычисления математических выражений, введенных при помощи голоса. На рис. 1 представлена общая схема функционирова- ния программы ГК. Ядро ГК (ЯГК) передает для распознавания поступившую от пользователя «голосовую команду» в «модуль распознавания» вместе со «списком распознавания» Голосовой калькулятор «Штучний інтелект» 2014 № 2 47 3А (сформированный список текстовых команд, которые могут быть введены в данный момент). Для распознавания команд используется описанный в статьях [2-4] модуль распознавания голосовых команд, посредствам которого производится их преобразо- вание в текст. Результатом распознавания является текстовая команда, которая в ЯГК преобразуется в математическую форму (при помощи «вспомогательных таблиц»). Полученный результат ЯГК добавляет к ранее введенной информации и предостав- ляется пользователю на экране. Рисунок 1 – Схема функционирования программы «Голосовой калькулятор» С целью уменьшения общего числа команд разработан алгоритм автомати- ческого определения, какую скобку (открытую или закрытую) необходимо установить при вводе. Для ввода скобки в программе предусмотрена одна команда – «скобка». Программа автоматически определяет, какую из них необходимо поставить по сле- дующим правилам: в случае начала формулы или после любой математической операции ставится знак «(» (открытая скобка), а после числа ставится знак «)» (закрытая скобка). Все команды условно разделены на три группы (табл. 1), что обеспечивает воз- можность сокращения их числа в «списке распознавания». Сложные числа вводятся последовательно по одной цифре. Например, число «двенадцать» вводиться при помощи последовательности двух команд «один» и «два». В «списке распознавания» по умолчанию («исходный список распознавания» (ИСР)) присутствуют «числовые команды», «управляющие команды» и команда «скобка», так как эти команды необходимы на любом этапе работы, «Инженерные команды» добавляются в «список распознавания» только после ввода соответст- вующей команды. Количество всех команд используемых ГК составляет 40. Для уменьшения количества текстовых команд в «списке распознавания» разработан алгоритм, при помощи которого после ввода команды происходит его формирование на основании ранее введенных данных. При этом добавляются только те команды, которые могут следовать далее (например, после математической команды не может следовать еще одна математическая команда, после команды «плюс» не может следовать «минус»). Вспомогательные таблицы Модуль распознавания Ядро «Голосовой калькулятор» Текстовая команда Математическая форма Пользователь Результат Текстовая команда Голосовая команда Голосовая команда С писок распознавания Азаренко Д.С., Иванова С.Б., Герасимов И.Г. «Искусственный интеллект» 2014 № 2 48 3А В Таблица 1 – Группы команд «ГК» Группа «Команда» (математическая форма) Комментарий «числовые команды» «ноль» (0) «один» (1) «два» (2) «три» (3) «четыре» (4) «пять» (5) «шесть» (6) «семь» (7) «восемь» (8) «девять» (9) «точка» (.) команды ввода чисел «математические команды» арифметические инженерные «плюс» (+) «минус» (–) «умножить» (*) «разделить» (/) «равно» (=) «скобка» ( ) «квадрат» ( ) «куб» ( ) «степень» ( ) «корень» ( ) «кубический корень» «факториал» (!) «синус» (sin) «арксинус» (arcsin) «косинус» (cos) «арккосинус» (arccos) «тангенс» (tan) «арктангенс» (arctan) «логарифм» (l ) команды математических операций «управляющие команды» «инженерный» «калькулятор» «отменить» «обучить» «сбросить» «удалить» команды, при помощи которых производится обучение модуля распознавания и совершается навигация по веденной формуле Голосовой калькулятор «Штучний інтелект» 2014 № 2 49 3А На рис. 2 представлен алгоритм формирования «списка распознавания». Рисунок 2 – Алгоритм формирования «списка распознавания» Таким образом, количество команд в «списке распознавания», которые передаются в «модуль распознавания», колеблется от 10 до 20 при недоступных инженерных командах и от 28 до 40 при доступных «инженерных командах», из них в обоих случаях 5 управляющих. Работу алгоритма формирования «списка распознавания» рассмотрим на при- мере ввода выражения «2+3» (табл. 2). Таблица 2 – Пример формирования «списка распознавания». Шаг № Голосовая команда Команды, добавленные к ИСР Комментарий 1 «два» «минус» начало ввода формулы; к «исходному списку распознавания» добавляется команды «минус» 2 «плюс» «математические команды» на шаге 1 введена «числовая команда»; в «список распознавания» добавляются «математические команды» 3 «три» – на шаге 2 введена «математическая команда»; «список распознавания» приводится к исходному 4 «равно» «математические команды» на шаге 3 введена «числовая команда»; в список распознавания добавляются «математические команды» Добавление команды «минус» Добавление «математических команд» Начало «Исходный список распознавания» Конец Начало формулы нет да Предыдущая команда числовая нет да «Список распознавания» Азаренко Д.С., Иванова С.Б., Герасимов И.Г. «Искусственный интеллект» 2014 № 2 50 3А В Заключение Задача улучшения качества распознавания в программе ГК решена за счет уменьшения количества команд в списке распознавание. Благодаря предложенному алгоритму, список распознавания формируется динамически. В результате независи- мого тестирования качество распознавания составило (92  4) %. Список литературы 1. Режим доступа : https://play.google.com/store/apps/details?id=sds.voice.calcrus&hl=ru 2. Шелепов В.Ю. О распознавании речи на основе межфонемных переходов / В.Ю. Шелепов, Г.В. Дорохина, А.В. Ниценко // Искусственный интеллект. –2012. – № 1 – С. 132-139. 3. Шелепов В.Ю. К проблеме распознавания слитной речи / В.Ю. Шелепов, А.В. Ниценко // Искусственный интеллект. – 2012. – № 4 – С. 272-281. 4. Шелепов В.Ю. О некоторых вопросах, связанных с дифонным распознаванием и распознаванием слитной речи / В.Ю. Шелепов, А.В. Ниценко // Искусственный интеллект. – 2013. – № 3 – C. 209-216. 5. Ниценко А.В. Сегментация и дифонное распознавание речевых сигналов / А.В. Ниценко, В.Ю. Шелепов // Системы и средства искусственного интеллекта ССИИ-2013 : материалы Международной молодежной научной школы. – 2013. – С.163-166. References 1. https://play.google.com/store/apps/details?id=sds.voice.calcrus&hl=ru 2. Shelepov V.J, Dorokhina G.V, A.V Nicenko About speech recognition based interphoneme transitions // Artificial Intelligence . -2012 . - № 1 - p.132 -139 . 3. Shelepov V.J, Nicenko A.V On the problem of continuous speech recognition // Artificial Intelligence. - 2012 . - № 4 - p.272 -281 . 4. Shelepov V.J, Nicenko A.V On some issues related to the diphone recognition and continuous speech recognition / / Artificial Intelligence . - 2013 . - № 3 - C. 209-216. 5. Nicenko A.V, V.J Shelepov Segmentation and recognition diphone voice / / Proceedings of the International Youth Scientific School " systems and artificial intelligence SMAI 2013" . - 2013 . - P.163 - 166. RESUME D.S Azarenko, S.B. Ivanova, I.G. Gerasimov Voice calculator Background: Voice control computer is an urgent task. The "Voice Calculator" is designed for entering and calculating mathematical expressions using voice. Materials and methods: Voice commands spoken by the user. Supporting tables for converting text commands in mathematical format. Results: The algorithm of forming vocabulary voice commands and real-time program "Voice Calculator" which allows for voice input and calculation of simple mathematical expressions. Conclusion: As a result, independent testing was recognition quality (92  4) %. Статья поступила в редакцию 10.04.2014.
id nasplib_isofts_kiev_ua-123456789-85255
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 1561-5359
language Russian
last_indexed 2025-12-07T16:55:54Z
publishDate 2014
publisher Інститут проблем штучного інтелекту МОН України та НАН України
record_format dspace
spelling Азаренко, Д.С.
Иванова, С.Б.
Герасимов, И.Г.
2015-07-23T12:49:24Z
2015-07-23T12:49:24Z
2014
Голосовой калькулятор / Д.С. Азаренко, С.Б. Иванова, И.Г. Герасимов // Искусственный интеллект. — 2014. — № 2. — С. 46–50. — Бібліогр.: 5 назв. — рос.
1561-5359
https://nasplib.isofts.kiev.ua/handle/123456789/85255
004.89:004.93
Разработан метод генерация словаря распознавания в реальном времени в зависимости от
 предыдущих команд.
Розроблено метод генерація словника розпізнавання в реальному часі залежно від попередніх команд.
Developed a method for the generation of recognition vocabulary in real time according to the preceding instructions.
ru
Інститут проблем штучного інтелекту МОН України та НАН України
Искусственный интеллект
Анализ и синтез коммуникационной информации
Голосовой калькулятор
Голосовий калькулятор
Voice calculator
Article
published earlier
spellingShingle Голосовой калькулятор
Азаренко, Д.С.
Иванова, С.Б.
Герасимов, И.Г.
Анализ и синтез коммуникационной информации
title Голосовой калькулятор
title_alt Голосовий калькулятор
Voice calculator
title_full Голосовой калькулятор
title_fullStr Голосовой калькулятор
title_full_unstemmed Голосовой калькулятор
title_short Голосовой калькулятор
title_sort голосовой калькулятор
topic Анализ и синтез коммуникационной информации
topic_facet Анализ и синтез коммуникационной информации
url https://nasplib.isofts.kiev.ua/handle/123456789/85255
work_keys_str_mv AT azarenkods golosovoikalʹkulâtor
AT ivanovasb golosovoikalʹkulâtor
AT gerasimovig golosovoikalʹkulâtor
AT azarenkods golosoviikalʹkulâtor
AT ivanovasb golosoviikalʹkulâtor
AT gerasimovig golosoviikalʹkulâtor
AT azarenkods voicecalculator
AT ivanovasb voicecalculator
AT gerasimovig voicecalculator