Искусственный тональный язык акустической коммуникации роботов

Рассматривается задача коммуникации роботов на основе языка тональных акустических сигналов. Приведена формальная модель языка, в котором каждому символу языка соответствует последовательность акустических одночастотных сигналов, и рассмотрен алгоритм распознавания таких характерных звуков. Розгляда...

Full description

Saved in:
Bibliographic Details
Published in:Штучний інтелект
Date:2012
Main Authors: Павловский, В.Е., Кирков, А.Ю.
Format: Article
Language:Russian
Published: Інститут проблем штучного інтелекту МОН України та НАН України 2012
Subjects:
Online Access:https://nasplib.isofts.kiev.ua/handle/123456789/57754
Tags: Add Tag
No Tags, Be the first to tag this record!
Journal Title:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Cite this:Искусственный тональный язык акустической коммуникации роботов / В.Е. Павловский, А.Ю. Кирков // Штучний інтелект. — 2012. — № 4. — С. 440-459. — Бібліогр.: 4 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1859845336820875264
author Павловский, В.Е.
Кирков, А.Ю.
author_facet Павловский, В.Е.
Кирков, А.Ю.
citation_txt Искусственный тональный язык акустической коммуникации роботов / В.Е. Павловский, А.Ю. Кирков // Штучний інтелект. — 2012. — № 4. — С. 440-459. — Бібліогр.: 4 назв. — рос.
collection DSpace DC
container_title Штучний інтелект
description Рассматривается задача коммуникации роботов на основе языка тональных акустических сигналов. Приведена формальная модель языка, в котором каждому символу языка соответствует последовательность акустических одночастотных сигналов, и рассмотрен алгоритм распознавания таких характерных звуков. Розглядається задача комунікації роботів на ґрунті мови тональних акустичних сигналів. наведено формальну модель мови, в якій кожному символу мови відповідає послідовність акустичних одночастотних сигналів, і розглянуто алгоритм розпізнавання таких характерних звуків. The task of communication of robots on the basis of tone acoustic signals is the focus of this work. In the work, the language model is presented where each symbol is associated with a pattern of single-frequency tones supplied with an algorithm of identification of these tones.
first_indexed 2025-12-07T15:38:41Z
format Article
fulltext «Искусственный интеллект» 4’2012 440 5П УДК 004.896:534.4 В.Е. Павловский, А.Ю. Кирков Институт прикладной математики имени М.В. Келдыша РАН Россия, 125047, Москва, Миусская пл., 4 Искусственный тональный язык акустической коммуникации роботов V.E. Pavlovsky, A.Ju. Kirkov Keldysh Institute of Applied Mathematics of RAS (KIAM) Russia, 125047, Moscow, Miusskaya sq., 4 Artificial Tone Language for Acoustic Communication of Robots В.Є. Павловський, А.Ю. Кирков Інститут прикладної математики ім. М.В. Келдиша РАН Росія, 125047, Москва, Міуська пл., 4 Штучна тональна мова акустичної комунікації роботів Рассматривается задача коммуникации роботов на основе языка тональных акустических сигналов. Приведена формальная модель языка, в котором каждому символу языка соответствует последовательность акустических одночастотных сигналов, и рассмотрен алгоритм распознавания таких характерных звуков. Ключевые слова: акустическая коммуникация, разговор роботов, распознавание речи The task of communication of robots on the basis of tone acoustic signals is the focus of this work. In the work, the language model is presented where each symbol is associated with a pattern of single-frequency tones supplied with an algorithm of identification of these tones. Key Words: acoustic communication, conversation of robots, speech recognition. Розглядається задача комунікації роботів на ґрунті мови тональних акустичних сигналів. наведено формальну модель мови, в якій кожному символу мови відповідає послідовність акустичних одночастотних сигналів, і розглянуто алгоритм розпізнавання таких характерних звуків. Ключові слова: акустична комунікація, розмова роботів, розпізнавання мовлення Введение Цель работы – создание системы акустической коммуникации роботов для реализации их «разговора» в обычной внешней воздушной среде на акустических частотах, восприни- маемых человеком. Вообще говоря, малочастотный язык роботов не будет непосредственно понятен человеку, но для человека несложно подготовить соответствующий транслятор. При этом предлагаемая акустическая коммуникация может стать удобным средством допол- нительного контроля поведения роботов, сосуществующих с человеком в едином социуме. В настоящей работе коммуникация роботов основана на простых по своей струк- туре одно- и малочастотных сигналах, что делает методы спектрального анализа прак- тически идеальными для последующих алгоритмов распознавания. На базе таких сиг- налов строится базовый язык роботов. В работе реализована программная среда для Искусственный тональный язык акустической коммуникации роботов «Штучний інтелект» 4’2012 441 5П визуализации и анализа работы построенного алгоритма. Проведены эксперименты на основе созданных компьютерной и аппаратной моделей для анализа работоспособности построенных алгоритмов. Первый прототип описываемой системы был создан в 2007 – 2008 гг., он кратко опубликован в сборнике и на электронных ресурсах [1]. В последую- щее время выполнялись эксперименты по созданию нескольких различных реализаций и отработке языка. На рис. 1 показан мобильный робот «Аргонавт-2» семейства «Аргонавт», соз- данный в ИПМ им.М.В. Келдыша РАН. Робот оснащен приемной системой слуха, на этом роботе отрабатывались различные задачи акустической сигнальной обработки, в т.ч. базис (функции ввода, приема и передачи) описываемого языка. Рисунок 1 – Робот «Аргонавт-2» с системой слуха Укажем, что в 2004 году группой американских специалистов была создана и испы- тана аналогичная система [2], в которой символы кодируются стандартными DTMF-сигна- лами (сигналы класса телефонных, когда телефон переключен в тональный режим). В 2011 году по этой же теме появилась публикация [3] авторов из австралийского универ- ситета Квинсленда (Queensland). В отличие от указанных публикаций, в данной работе рассмотрена формальная мо- дель языка. В этом языке символы могут кодироваться не только частотами DTMF, а любой последовательностью частот. 1 Структура языка роботов Структура любого акустического языка состоит из алфавита и набора фонем, соот- ветствующих каждой букве (символу) этого алфавита. Фонема в данной работе делится на фрагменты. Фрагмент представляет собой произвольный одночастотный сигнал определенной длительности и амплитуды, т.е. элемент множества {( , , ) | , , }Frg amp frq dur amp N frq N dur N    Фрагменты играют роль неделимых частиц, атомов языка. Из фрагментов со- ставляются все другие конструкции языка. Поскольку фрагмент является одночас- тотным сигналом, будем называть систему одночастотной. Длительность фрагмента ),,( durfrqampfrg  будем обозначать durfrg || . Частоту фрагмента ),,( durfrqampfrg  будем обозначать frqfrg [] . Павловский В.Е., Кирков А.Ю. «Искусственный интеллект» 4’2012 442 5П Любое конечное подмножество 1 2{( , ,..., ) | , , 1, }n iF frg frg frg n N frg Frg i n    , множества конечных упорядоченных наборов элементов из Frg будем называть множе- ством фонем. Таким образом, любая фонема представляет собой последовательность одноча- стотных сигналов. В отличие от фрагмента, фонема является многочастотным сигна- лом. Пример аудиосигнала, соответствующего фонеме, графически изображен на рис. 2, на котором фонема состоит из фрагментов трех частот. Длительностью фонемы будем считать сумму длительностей всех входящих в неё фрагментов. Длительность фонемы ),...,( 1 nfrgfrgf  будем обозначать    n i ifrgf 1 |||| . Для получения k -го фрагмента kfrg фонемы ),..,,..,( 1 nk frgfrgfrgf  будем использовать запись kfrgkf ][ . Рисунок2 – Пример аудиосигнала, соответствующего фонеме 1 2 3( , , )f frg frg frg Наложим на множество фонем F несколько ограничений. Потребуем, чтобы ни одна фонема не являлась частью другой фонемы, т.е. для любой фонемы ),...,( 1 nfrgfrgf  не должно существовать такой фонемы ),...,( 2' kk frgfrgf q , что nkk  211 . Данное усло- вие будем называть ограничением вложенности фонем. Помимо этого будем считать, что любая последовательность из двух фонем не содержит никакой фонемы. Т.е. ни одна фонема не является концом одной и началом другой фонемы. Иными словами, для любых двух фонем Ffrgfrgf n  ),..,( 1 1 1 11 и Ffrgfrgf n  ),..,( 1 2 1 22 не существует фонемы Ff 3 , такой что ),..,,..( 211 2 1 2113 knk frgfrgfrgfrgf  для некоторых 221121 1,1,, nknkNkk  . Данное условие будем называть ограничением объединения фонем. Введем также понятие множества используемых фрагментов, как набора всех фрагментов, входящих хотя бы в одну фонему. 1{ | ( ,.., , .., ), , }k n k uFrg frg Frg f frg frg frg f F frg frg      Это множество конечно в силу конечности F . Аналогично рассмотрим множество используемых частот, как набора частот, вхо- дящих хотя бы в один фрагмент из множества uFrg  uu FrgfrgfrgfrqFrq  [], Искусственный тональный язык акустической коммуникации роботов «Штучний інтелект» 4’2012 443 5П Рассмотрим некоторое конечное множество B , которое будем называть алфавитом. Элемент этого множества будем называть буквой. Количество букв в алфавите, т.е. мощ- ность множества B , обозначим BN . Множество фонем разобьем на BN непересекающихся непустых подмножеств iF и каждой букве поставим в соответствие одно из них. Это соответствие обозначим R . Таким образом, любой букве соответствует как минимум одна уникальная последовательность одночастотных сигналов. Введем также специальный символ S , который будем называть пробелом. Поставим в соответствие этому символу некоторое число NdurS  , которое будем называть дли- тельностью пробела. Пробел в рассматриваемом акустическом языке будет соответ- ствовать тишине (сигналу с амплитудой ноль) длительностью не менее Sdur . Набор из символа пробела и его длительности обозначим },{* SdurSS  . Набор ),,,( *SRFBL  алфавита, множества фонем, соответствия между ними и пробела будем называть языком роботов. Таким образом, робот, произнося слово из алфавита, преобразует его в последова- тельность фонем, что в свою очередь представляет собой последовательность одночастот- ных сигналов. Задача другого робота – выделить из всего звукового потока характерные звуки, соответствующие фонемам языка и на выходе получить слово в соответствии с распознанными фонемами. 2 Исходные понятия и схема распознавания Целью алгоритма распознавания является поиск фонем в полученном роботом аудиосигнале. Как правило, робот на входе получает поток аудиоданных, которые сильно отличаются от исходных тональных сигналов. Пример аудиосигнала из экспе- римента показан на рис. рис. 3. В связи с этим поставим задачу построить алгоритм, позволяющий из всего потока данных выделить звуки, соответствующие фонемам языка робота. Рисунок3 – Пример аудио сигнала Введем вначале ряд базовых понятий. Аудиосигнал будем рассматривать как функцию ( )s t , заданную на некотором отрезке 1 2[ , ]t t . Будем предполагать, что ]),([ 212 ttLs . Задача распознавания за- ключается в определении всех интервалов ],[],[ 21 ''' tttt  , на которых была проиграна некоторая фонема Ff  . Базовый метод, который будем использовать, – метод спектрального анализа – позволяет на каждом интервале времени подсчитать амплитуду, соответствующую Павловский В.Е., Кирков А.Ю. «Искусственный интеллект» 4’2012 444 5П частоте любого фрагмента. Используя формулы этого метода, рассмотрим следующую функцию ,)2sin()( |],[| 1 )2cos()( |],[| 1,)( '' '' '' ''' ''' 22 ],,[ dttfrqts tt b dttfrqts tt aгдеbatsamp t t t tfrqtt t t t       ( 2.1) которая на интервале ],[],[ 21 ''' tttt  возвращает амплитуду аудиосигнала )(ts , соот- ветствующую частоте frq . Введем параметр  , значение которого будем рассматривать как параметр алгоритма. Будем выбирать  таким образом, что длительности всех фрагментов ufrg Frg будут кратными  . Такое значение обязательно найдется в силу конечности множества uFrg . Рассмотрим разбиение отрезка 1 2[ , ]t t точками 0 1 1, ,..., ,s st t t t , где 1 , 0, 1it t i i s     ,  1 2 , sss tttt , на отрезки 1[ , ], 1,i i it t t i s   . Множество точек разбиения отрезка 1 2[ , ]t t обозначим T .     1 21 10 ,,1,0,*,,...,, sssis ttttsiitttttT На каждом отрезке sit i ,1,  рассмотрим функцию )( fai , которая на этом отрезке будет определять громкость фонемы f . Данную функцию будем называть амплитудой фо- немы на отрезке it . Определим критерии вхождения фонемы в аудиосигнал на каждом отрезке sit i ,1,  . Для этого введем следующее определение. Фонему Ff  будем называть выделенной на отрезке sit i ,1,  по параметрам 10,min  Na , если одновременно выполняются следующие условия: 1. min)( afai  2. )(max)( , fafa iNEfFfi ii  (2. 2) Иными словами, фонему будем считать выделенной на отрезке времени sit i ,1,  , если на этом отрезке её амплитуда выше двух порогов: абсолютного и относительного. Абсолютный порог определяется первым условием (2.2) и задается некоторым зна- чением mina . Относительный порог следует из второго условия (2.2) и равен произве- дению максимальной амплитуды среди всех фонем Ff  на некоторое значение )1,0( . Значения mina и  являются параметрами алгоритма. Целью введения этих оценок (порогов) является фильтрация фонем. Абсолютный порог отсекает все «тихие» фонемы, тогда как относительный порог выделяет из «громких» фонем «наиболее громкие». Вышеуказанные критерии будут являться основными условиями вхождения фоне- мы в аудиосигнал. Множество выделенных фонем на отрезке sit i ,1,  обозначим iS . Отметим, что мно- жества siSi ,1,  зависят от функции амплитуды фонемы, которая пока не определена, т.е. siaSS iii ,1),('  (2. 3) Искусственный тональный язык акустической коммуникации роботов «Штучний інтелект» 4’2012 445 5П Для определения функции амплитуды фонемы введем ряд дополнительных понятий. Будем называть текущим временем распознавания фонемы Ff  к моменту вре- мени siTt i ,0,  максимальный отрезок до it , на котором фонема Ff  непрерывно входила в аудиосигнал, т.е. была выделенной на каждом из отрезков разбиения этого интервала. Текущее время распознавания фонемы характеризует, какое время фонема непрерывно проигрывалась до момента it . Нижеследующая формула определяет теку- щее время распознавания фонемы       случаяхостальныхв iиSfеслиfT fT ii C iC i ,0 1,)( )( 1  (2.4) Отметим, что текущее время распознавания фонемы к моменту времени it зависит от текущего времени распознавания фонемы на предыдущей точке разбиения T и от множества выделенных фонем iS на отрезке it . siSTfTfT i C i C i C i ,1),,,()( 1 '   (2. 5) Согласно формуле (1.4) к моменту времени 0t текущее время распознавания )(0 fT C произвольной фонемы Ff  равно нулю. Используя понятие текущего времени распознавания фонемы, введем понятие теку- щего фрагмента фонемы на отрезке sit i ,1,  . Текущий фрагмент фонемы Ff  будет характеризовать, какой именно фрагмент этой фонемы входит в аудиосигнал на отрезке sit i ,1,  в том случае, если фонема f входит в аудиосигнал. Иными словами, если фо- нема проигрывается, какой именно фрагмент проигрывается на отрезке it . Текущий фрагмент фонемы Ff  на отрезке sit i ,1,  будем обозначать ).( ffrg i C Для определения текущего фрагмента фонемы рассмотрим остаток от деления текущего времени распознавания фонемы на её длительность. ))((mod)(~ || fTfT c if C i  Определим функции NksifT k i  ,,1),(~ , которые для каждой фонемы Ff  , ),..,,..,( 1 nk frgfrgfrgf  на отрезке it будут равны сумме длительностей всех фрагмен- тов до k -го включительно.    k j jk i frgfT 1 ||)(~ Таким образом, текущим фрагментом фонемы будем называть фрагмент под но- мером k , если )(~)(~ fTfT C i k i  и, либо 1k , либо )(~)(~ 1 fTfT C i k i  . Ниже приводится общая формула для расчета текущего фрагмента. sifrgfrgfrgf fTfTjgjkгдеkfffrg nk C i j ijg i C ,1),,..,,..,( ),(~)(~)(),(min],[)( 1 110)(    (2.6 ) Отметим, что текущий фрагмент фонемы на отрезке it полностью определяется из текущего времени распознавания этой фонемы к моменту времени 1it . Павловский В.Е., Кирков А.Ю. «Искусственный интеллект» 4’2012 446 5П siTffrgffrg C i i C i C ,1),,()( 1 '   (2. 7) Поскольку начало проигрывания фонемы может не совпадать с точками разби- ения T , введем некоторую параметризованную функцию sifi ,1),,0[)(   , которая на каждом отрезке it будет равна смещению начала проигрывания фонемы f от бли- жайшей точки разбиения T в том случае, если фонема f проигрывается на этом отрезке. Введем обозначение отрезка разбиения со смещением. Ffsiftftft i i i ii   ,,1)],(),([)( 1  Теперь на основе введенных понятий определим функцию амплитуды фонемы. Будем считать амплитудой фонемы Ff  на отрезке it амплитуду частоты текущего фрагмента этой фонемы на отрезке )( ft i  , согласно формуле (2.1). sitsampfa i C i frgft i ,1),()( []),(    (2. 8) Отметим, что текущая амплитуда фонемы была определена с использованием определения текущего фрагмента фонемы и функции смещения на отрезке it . sifrqfafa i i Cii ,1),,,()( '   (2.9 ) Теперь определим критерий, который будет определять, была ли фонема проиг- рана на определенном отрезке времени. Для этого введем следующее определение. Фонему Ff  будем называть распознанной на отрезке Ttttt lklk ,],,[ , || ftt kl  , если текущее время распознавания фонемы к моменту времени lt положи- тельно и кратно длительности фонемы f , т.е. одновременно выполняются следующие два условия. 1. 0)( fT C l , 2. 0))((mod || fT c lf (2.1 0) Данное определение будем рассматривать в качестве критерия вхождения фонемы в аудиосигнал. Рассмотрим множества iR , которые для каждого отрезка sit i ,1,  будут содержать все фонемы Ff  , распознанные на некотором отрезке Ttttt lklk ,],,[ , который содер- жит ],[ lki ttt  . Множество iR будем называть множествами распознанных фонем на отрезке it . Введем понятие распознанного пробела. Пробел },{* SdurSS  будем называть распознанным на отрезке Ttttt lklk ,],,[ , если одновременно выполняются следующие условия 1. S kl durtt  || 2. lkiR i ,1,  3. slk  ,0 4. kR 5. 1lR (2.11) Искусственный тональный язык акустической коммуникации роботов «Штучний інтелект» 4’2012 447 5П Это понятие будет определять те отрезки времени, на которых был проигран сиг- нал, соответствующий символу пробела. Пробел будет распознан на тех отрезках времени, на которых не были распознаны фонемы и длительность которых не меньше длительности пробела. При этом справа и слева от такого интервала должны быть отрезки, на которых будет распознана некоторая фонема. Полученные ключевые понятия распознанной фонемы и распознанного пробела за- висят от функции )( fi , которая пока еще не определена. Рассмотрим теперь алгоритм определения начала фонемы и выведем формулу для )( fi . 3 Алгоритм определения начала фонемы Поскольку начало проигрывания фонемы может не совпадать с точками разби- ения T , поставим задачу определить смещение начала проигрывания фонемы относи- тельно ближайшей точки разбиения слева. Для этого определим функцию )( fi , которая для каждого отрезка sit i ,1,  будет совпадать с искомым смещением, если фонема была проиграна на этом отрезке. В силу того, что фонема начинает проигрываться с первого фрагмента, задача поиска начала фонемы сводится к поиску начала проигрывания частоты первого фрагмента. Для этого рассмотрим параметризованную функцию )(* frqi . Эта функция на отрезках sit i ,1,  будет равна смещению начала проигрывания частоты frq относительно бли- жайшей точки разбиения слева. Будем считать, что функция )(* frqi зависит исключи- тельно от частоты frq , аудиосигнала )(ts и параметров алгоритма. Используя )(* frqi , определим функцию смещения )( fi . Функция )( fi для каж- дой фонемы Ff  будет равна значению функции )(* frqi для частоты frq первого фрагмента фонемы f на тех отрезках, на которых фонема начинает проигрываться. Отрезки, на которых фонема f начинает проигрываться, будут определяться следующим образом. К их началу текущее время распознавания фонемы f будет равно нулю и амплитуда аудиосигнала, рассчитанная по формуле (2.1), на текущем отрезке разбиения it или на следующем будет больше значения параметра .mina Если же фонема проиг- рывалась на предыдущем отрезке разбиения, т.е. текущее время распознавания этой фо- немы к началу текущего отрезка разбиения больше нуля, вычислять значение )(* frqi нет необходимости. В этом случае значение функции )( fi берется из предыдущего отрезка. В том случае, если не выполняется ни одно из вышеуказанных условий, функ- ция )( fi будет равна нулю. Ниже приведена общая формула расчета функции )( fi . Павловский В.Е., Кирков А.Ю. «Искусственный интеллект» 4’2012 448 5П                      min , min , 1 11 min , min , 1 * )(,)(,0)(,0 0)(),( )()( 0)(],1[[],),( )( 1 1 atsampatsampfT fTf atsampилиatsamp иfTffrgfrgfrqfrq f ii ii tfrqtfrq C i C ii tfrqtfrq C ii i    (3.1) Отметим, что функция )( fi зависит от текущего времени распознавания фонемы к моменту времени 1it . siTff iii ,1),,()( 1 '   (3. 2) Однако для полного определения функции )( fi необходимо ввести формулу рас- чета функции )(* frqi . Ниже приводится алгоритм расчета функции )(* frqi . Данный алгоритм будет заключаться в поиске первого отрезка длительностью, равной длительности отрезка разбиения  , на котором полностью была проиграна искомая частота. На рис. 4 показан график изменения амплитуды, соответствующей частоте первого фрагмента фонемы из эксперимента. На графике амплитуда вычисляется через каждые 5 мс согласно формуле (2.1) по интервалу длительности 50 мс. На графике начало проигрывания фонемы указано вертикальной стрелкой. Сплошной жирной чертой отмечена ближайшая точка разбиения. Область графика справа от стрелки (между двумя пунктирными линиями) соответствует периоду, в течение которого фонема была проиграна. Сильное увеличение амплитуды до начала проигры- вания фонемы, объясняется тем, что интервалы, на которых считается эта амплитуда (50 мс), включает в себя часть периода проигрывания фонемы. Область графика после периода проигрывания фонемы соответствует эхо, которое является следствием отражения звуковых волн. Значение * между точкой разбиения (сплошная линия) и началом проигрывания фонемы (точка, отмеченная стрелкой) является искомым смещением. Рисунок4 – График изменения амплитуды Для вычисления значения * для произвольной частоты frq на отрезке it рас- смотрим следующие интервалы sittt iii ,1),,0(],,[ 1    Определим функцию ),( frqampi , которая для каждого ),0(   будет равна амплитуде частоты frq на отрезке it согласно формуле (2.1) sitsampfrqamp frqt i i ,1),,0(),(),( ,     Искусственный тональный язык акустической коммуникации роботов «Штучний інтелект» 4’2012 449 5П Рассмотрим некоторый параметр )1,0( , значение которого будет являться па- раметром алгоритма. Определим наименьшее значение * , для которого будет выпол- нено неравенство ),(max*),( )1,0( *   frqampfrqamp ii   Значение * будет являться искомым смещением. Ниже приведена общая форму- ла для расчета функции )(* frqi ),(max*),()(,)min()( ' )1,0()1,0(,0)( * '   frqampfrqampgгдеfrq ii g i   (3.3) Отметим, что согласно вышеуказанной формуле, )(* frqi зависит только от частоты frq , аудиосигнала )(ts и параметров алгоритма. Таким образом, ограничения, наложенные на функцию )(* frqi , выполняются. 4 Проверка корректности формул Ряд введенных функций и множеств в данной работе были определены «в рекур- рентном стиле» с использованием понятий, которые в свою очередь зависят от этих же функций и множеств. Например, для введения множества выделенных фонем iS исполь- зовались функции амплитуды фонемы )( fai , текущего фрагмента фонемы )( ffrg i C и текущего времени распознавания )( fT C i , которые в свою очередь были определены с использованием множества выделенных фонем. В связи с вышесказанным, необходимо проверить корректность введенных опреде- лений. Для проверки корректности покажем, что зная исходные данные на отрезке it и всех предыдущих, можно вычислить все функции и множества для этого отрезка, а также получить исходные данные на отрезке 1 it . В качестве исходных данных на отрезке it будем рассматривать функцию текущего времени распознавания фонемы )(1 fT C i . В силу того, что при 1i эта функция 0)(0 fT C известна, указанная проверка будет доказывать корректность введенных опре- делений. Последовательно покажем, что зная исходные данные на отрезке it и преды- дущих, можно определить функцию текущего фрагмента фонемы )( ffrg i C , функцию смещения фонемы )( fi , функцию амплитуды фонемы )( fai , множества выде-ленных фонем iS и исходные данные на отрезке 1 it , т.е. функцию текущего времени распо- знавания фонемы )( fT C i . Согласно (2.7), (3.2) текущий фрагмент фонемы )( ffrg i C и функция смещения )( fi уже зависят от исходных данных. siTffrgffrg C i i C i C ,1),,()( 1 '   siTff iii ,1),,()( 1 '   Последовательно используя равенства (2.9), (2.7), (3.2) получаем, что функция амплитуды фонемы на отрезке it зависит только от текущего времени распознавания фонемы к моменту 1it . Павловский В.Е., Кирков А.Ю. «Искусственный интеллект» 4’2012 450 5П siTfafrqfafa C iii i Cii ,1),,(),,()( 1 '''   (4 .1) Согласно (2.3) и (4.1) получаем равенство, которое доказывает справедливость определения множества выделенных фонем siTSaSS iiiii ,1),()( 1 '''   (4. 2) Таким образом, на отрезке it доказана зависимость всех функций и множеств исключительно от функции текущего времени распознавания фонемы к началу этого отрезка. Покажем теперь, что зная эту функцию к началу отрезка it , можно получить значения аналогичной функции к концу этого отрезка. Согласно (2.5), (4.2) получаем равенство, которое доказывает это утверждение. siTfTSTfTfT C i C ii C i C i C i ,1),,(),,()( 1 '' 1 '   (4 .3) Таким образом, показана зависимость исходных данных на отрезке 1 it от исход- ных данных на отрезке it и предыдущих. Следовательно, доказана корректность опреде- ления всех функций и множеств, рассмотренных в данной работе. 5 Алгоритм распознавания Процесс обработки аудиосигнала (распознавания) начинается с прослушивания аудиоданных длительностью 2 . Такой отрезок необходим для работы алгоритма определения начала фонемы. Далее аудиосигнал будем обрабатывать через каждый интервал длительностью  . На рис. 5 текущий интервал отмечен более жирной чертой, менее жирной чертой отмечены интервалы, которые прослушаны к этому моменту времени. Рисунок5 – Временные интервалы распознавания В качестве исходных данных на каждом отрезке it будем рассматривать значения функции )(1 fT C i текущего времени распознавания фонемы к началу этого отрезка. Отме- тим, что на первом отрезке исходные данные, 0)(0 fT C , Ff  , известны. Обработка аудиосигнала на каждом отрезке it будет заключаться в определении текущего времени распознавания )( fT C i каждой фонемы Ff  к концу этого отрезка. Рассмотрим процесс обработки аудиосигнала на произвольном отрезке kt . Как отмечалось, к началу этого отрезка нам известна функция )(1 fT C k . Согласно определению для вычисления текущего времени распознавания )( fT C k фонемы Ff  к концу отрезка необходимо проделать ряд следующих действий. 1. Определить текущий фрагмент )( ffrg k C каждой фонемы Ff  . Искусственный тональный язык акустической коммуникации роботов «Штучний інтелект» 4’2012 451 5П 2. Вычислить значение функции смещения )( fk для каждой Ff  . 3. Вычислить значение функции амплитуды фонемы )( fak для каждой Ff  . 4. Определить выделенные фонемы kS . Ниже представлено детальное описание каждого из вышеуказанных шагов. Определение текущего фрагмента. Текущий фрагмент )( ffrg k C фонемы Ff  на отрезке kt будем определять сог- ласно формуле (2.6). Для этого вычислим значение следующей функции. ))((mod)(~ 1||1 fTfT c kf C k   Далее определим наименьшее значение Nl  , для которого значение функции     l j l k jffT 1 1 |][|)(~ будет не меньше значения функции )(~ 1 fT C k . Фрагмент ][lf фонемы f под номе- ром l будем считать текущим фрагментом на отрезке kt . ][)( lfffrg k C  Определение функции смещения. Определив текущий фрагмент фонемы f , переходим к вычислению значения функ- ции смещения )( fk . Согласно формуле (3.1), если 0)(1  fT C k , в качестве значения функции )( fk бе- рется значение )(1 fk на предыдущем шаге. В том случае, если амплитуда частоты текущего фрагмента фонемы f , вычисленная согласно формуле (2.1), на отрезках kt и 1 kt не превосходит значение параметра mina , считаем 0)( fk . В противном случае )( fk будет равно значению функции )(* frqk для частоты frq текущего фрагмента фонемы f . Для вычисления )(* frqk методом стандартных отрезков рассмотрим интервалы 9,0],10/*,10/*[ 1   jjtjtt kkk j  и вычислим амплитуду аудиосигнала, соответствующую частоте frq текущего фрагмента )( ffrg k C фонемы f , на каждом из этих интервалов. 9,0),( 1,   jtsampamp frgt j k j Далее вычислим максимальное значение jamp амплитуды на этих интервалах и определим наименьшее значение *j , для которого будет выполнено неравенство )(max* 1 * ,9,0 tsampamp frgtjj k j   Значение 10/**  j будет являться искомым смещением. Павловский В.Е., Кирков А.Ю. «Искусственный интеллект» 4’2012 452 5П Определение амплитуды фонемы Определив текущий фрагмент )( ffrg k C и значение функции смещения )( fk для фонемы f , переходим к вычислению значения функции амплитуды фонемы )( fak . Согласно формуле (2.8) )( fak будет равна амплитуде аудиосигнала, соответствующей частоте текущего фрагмента этой фонемы, вычисленной на отрезке со смещением )](),([)( 1 ftftft k k k kk    , используя формулу (2.1). )()( )()[],( tsampfa ftffrg k kk C   Определение множества выделенных фонем. Вычислив значение функции амплитуды )( fak каждой фонемы Ff  , переходим к определению множеств выделенных фонем kS . Для этого, используя множества kE , kN , проверяем условия (2.2) определения выделенной фонемы для каждой Ff  . В том случае, если указанные условия удовлетворяются, считаем kSf  . Множество kS после работы алгоритмов корректировки смещения влево и кор- ректировки смещения направо будем считать итоговым множеством выделенных фонем. Используя это множество, определим текущее время распознавания )( fT C k каждой фоне- мы Ff  к концу отрезка kt . Получив множество выделенных фонем, переходим к определению текущего време- ни распознавания фонемы )( fT C k . Согласно формуле (2.4) текущее время распознава-ния )( fT C k фонемы Ff  будет равно значению )(1 fT C k на предыдущем отрезке плюс длина отрезка разбиения  в том случае, если f является выделенной фонемой, т.е. kSf  , и нулю, в противном случае. Определив текущее время распознавания )( fT C k каждой фонемы Ff  к концу отрезка kt , переходим поиску распознанных фонем. Проверяем условия (2.10) определения распознанной фонемы. В том случае, если для некоторой фонемы Ff  условия удовлетворяются, считаем фонему f распознан- ной на интервале ]|,|[ kk tft  . Будем обозначать ],[ )( 2 )( 1 )( iRiRiR ttt  интервалы, на которых были распознаны фо- немы. Значение i будем определять согласно очередности. Т.е. при определении пер-вого отрезка, на котором распознана некоторая фонема, значение i будет равно единице, второго – двум и так далее. Отрезки )(iRt будем называть распознанными. После определения второго и последующих интервалов, на которых некоторая фоне- ма будет распознанной, будем рассматривать отрезок ],[ )1( 1 )( 2 )(  iRiRiS ttt от конца преды- дущего распознанного отрезка до начала текущего. Данный отрезок проверяется на удов- летворение условий (2.11) определения распознанного пробела. В том случае, если условия удовлетворяются, пробел считается распознанным на отрезке )(iSt . 6 Калибровка Искусственный тональный язык акустической коммуникации роботов «Штучний інтелект» 4’2012 453 5П Как правило, частота, воспроизводимая одним роботом, отличается от частоты, которую воспринимает другой робот. На рис. 6 представлен график соответствия этих частот в проведенных экспериментах. Рисунок6 – Изменение частоты в «передающем тракте» В алгоритме для более качественного распознавания ставится задача получения соответствия между этими частотами. Определим функцию связи частот )(* frqKfqr  Данная функция будет, принимая значение частоты, которую проигрывает один робот, выдавать значение частоты, которую слышит другой. Эта функция определяется опытным путем и используется в алгоритме распознавания. 7 Анализ работы алгоритма Для реализации алгоритма разработана программная среда. При создании програм- мной среды использовались методы, описанные в [4]. Программная среда позволяет осу- ществлять и анализировать работу рассматриваемого алгоритма для системы, состоящей из двух роботов. Для тестирования системы в качестве алфавита рассмотрено множество букв рус- ского алфавита. Каждой букве поставлено в соответствие множество, состоящее из одной фонемы, которая в свою очередь состоит из двух фрагментов, одинаковой длительности и амплитуды. Таким образом, каждой букве алфавита соответствует двухчастотный сигнал. Час- тоты фрагментов, которые используются для каждой буквы, а также амплитуда и дли- тельность этих фрагментов, приведены в таблице табл. 1. Все параметры отобраны в результате нескольких серий тестов и в этом смысле являются наилучшими. Эти параметры вместе с выбором языка роботов подобраны экспериментальным путем и отвечали наилучшему качеству распознавания среди всех рассмотренных здесь параметров. В качестве входного аудиосигнала в программе используется 8-битный моносиг- нал с частотой дискретизации 12800 Гц. Выбор этих параметров соответствует техни- ческим характеристикам используемых в системе динамиков, микрофонов и аналого- цифровых преобразователей (АЦП). Анализ работы алгоритма заключался в проведении нескольких тестов. Тестирование проводилось на двух компьютерах, один из которых («проигрывающий») использовалась для проигрывания звуковых фрагментов, а другой («распознающий») – для выделения из пришедшего потока аудиоданных звуков, соответствующих буквам алфавита. Павловский В.Е., Кирков А.Ю. «Искусственный интеллект» 4’2012 454 5П Таблица 1 – Соответствие между буквами алфавита и параметрами сигнала Буква Амплитуда Частота 1-го фрагмента, Гц Частота 2-го фрагмента,Гц Длительность, Мсек а 100 400 2000 150 б 100 450 2050 150 в 100 500 2100 150 г 100 550 2150 150 д 100 600 2200 150 е 100 650 2250 150 ж 100 700 2300 150 з 100 750 2350 150 и 100 800 2400 150 й 100 850 2450 150 к 100 900 2500 150 л 100 950 2550 150 м 100 1000 2600 150 н 100 1050 2650 150 о 100 1100 2700 150 п 100 1150 2750 150 р 100 1200 2800 150 Искусственный тональный язык акустической коммуникации роботов «Штучний інтелект» 4’2012 455 5П Продолжение табл. 1 с 100 1250 2850 150 т 100 1300 2900 150 у 100 1350 2950 150 ф 100 1400 3000 150 х 100 1450 3050 150 ц 100 1500 3100 150 ч 100 1550 3150 150 ш 100 1600 3200 150 щ 100 1650 3250 150 ъ 100 1700 3300 150 ы 100 1750 3350 150 ь 100 1800 3400 150 э 100 1850 3450 150 ю 100 1900 3500 150 я 100 1950 3550 150 Параметры алгоритма: – 50 – 32min a – 0.9  – 7.0 Тест №1. На разных расстояниях от микрофона «распознающей» машины дина- миком «проигрывающей» машины один раз проигрывался звуковой сигнал, соответствую- щий фразе «абвгдежзийклмнопрстуфхцчшщъыьэюя». После чего результат распознавания сравнивался с исходной фразой. Результаты эксперимента представлены в таблице табл. 2 Таблица 2 – Результаты эксперимента №1 Расстояние, м. Распознанная фраза 0.5 абвгдежзийклмнопрстуфхцчшщъыьэюя 1 абвгдежзийклмнопрстуфхцчшщъыьэюя 1.5 абвгдежзийклмнопрстуфхцчшщъыьэюя 2 абвгдежзийклмнопрстуфхцчшщъыьэюя 2.5 абвгдезийклмнопстуфхцчшщъыьэюя 3 абвгдезийкмнопрстфхцчшщъыьэюя 3.5 абвгдезийклмнопрстуфхцчшъыьэюя 4 абвгдежзийклнопрстуфхцчшъыьэюя 4.5 абвгдезийклмнопрстуфхцчшъыьэюя 5 абвгдезийлмнопрстуфхчшъыьэюя 6 абвгдезиймнопрстуфхчшъыьэюя 7 абвгдезийкнопрстуфхчшъыьэюя 8 абвгдезийклнпрстуфхчшъьэюя 9 абвгдезийклнпсуфхшщъьэя 10 абвгдезийклнпсуфхшщъэя На рис. 7 изображен график зависимости процента распознавания от расстояния между коммуницирующими машинами. Павловский В.Е., Кирков А.Ю. «Искусственный интеллект» 4’2012 456 5П Рисунок7 – Процент распознавания как функция расстояния. Тест 1 Тест №2. На расстоянии двух метров от микрофона «распознающей» машины дина- миком «проигрывающей» машины десять раз проигрывался звуковой сигнал, соот- ветствующий фразе «абвгдежзийклмнопрстуфхцчшщъыьэюя». На рис. 8 изображен гра- фик зависимости процента удачного распознавания от номера эксперимента. Рисунок8 – Тест повторного проигрывания-распознавания. Тест 2 Тест №3. На расстоянии двух метров от микрофона «распознающей» машины динамиком «проигрывающей» машины проигрывался звуковой сигнал, соответствующий разному количеству букв «а». График зависимости процента удачного распознавания от количества букв «а» представлен на рис. 9. Рисунок9 – Тест повторного проигрывания-распознавания. Тест 3 Укажем здесь, что данные тесты выполнялись неоднократно, в разных состояниях внешней среды (температура, соответствующее давление воздуха, небольшая зашум- ленность). Во всех экспериментах результаты получались идентичными приведенным. Как видно из тестов на расстоянии до двух метров распознавание четкое (надежное), а далее возникают небольшие отклонения. 8 Схема использования языка с подкрепляющим диалогом Рассмотрим следующий модельный пример применения системы тональной акустиче- ской коммуникации. На площадке квадратной формы, разбитой на 64 ячейки как шахматная доска, находятся два робота. Каждая ячейка окрашена некоторым цветом (рис. 10). Каждый робот может передвигаться по ячейкам площадки и способен определить цвет ячейки, на которой он находится в данный момент. Роботы общаются между собой, используя тональный акустический язык. Искусственный тональный язык акустической коммуникации роботов «Штучний інтелект» 4’2012 457 5П Передвигаясь по ячейкам площадки, роботы сообщают друг другу информацию о цве- те ячеек. При этом они используют следующую терминологию. Оказавшись на новой, не- исследованной ячейке робот говорит фразу «Нахожусь в ячейке с координатами X Y цвет такой-то». При коммуникации существенно используется словарь возможных слов, опи- сывающих координаты (целые числа) и цвета. В случае если второй робот «понял» первого, он ничего не отвечает. В обратном случае второй робот произносит фразу «не понял повтори» и первый должен повторить сказанную фразу. Рисунок10 – Площадка для исследования роботами Рассмотрим результаты эксперимента в тех случаях, когда роботы находятся в ячейках на расстояниях 2 и 4 метра. Робот, находясь в ячейке с координатами (2, 1), говорит следу- ющую фразу: «нахожусь в ячейке два один цвет желтый». График и спектрограмма исход- ного сигнала, соответствующего данной фразе, изображены на рис. 11. На графике изобра- жены чистые гармоники с очень большой периодичностью. Второй робот, находясь на расстоянии два метра, слушает этот сигнал. На рис. 12 изо- бражен аудиосигнал, который принял второй робот. В результате эксперимента второй робот распознал фразу полностью. Далее роботы находятся на расстоянии четыре метра, и первый робот произносит ту же самую фразу. Второй робот слушает первого и получает аудиосигнал, который изобра- жен на рис. 13. Фраза, которую распознал второй робот следующая «нахожусь в ячейке два дин цвет желты». Фраза распознана не полностью, правильная фраза по-прежнему «нахожусь в ячейке два один цвет желтый», и второй робот просит первого повторить, произнося фразу «не понял повтори». Первый робот вновь произносит фразу, и теперь вто- рой робот распознает её полностью. Рисунок11 – Исходный аудиосигнал Рисунок12 – Аудиосигнал, полученный с расстояния 2 метра Павловский В.Е., Кирков А.Ю. «Искусственный интеллект» 4’2012 458 5П Рисунок13 – Аудиосигнал, полученный с расстояния 4 метра Рассмотренный практический пример реализации диалога двух роботов на базе тонального акустического языка и диалог с подтверждением повышают надежность пе- редачи и распознавания информации. Заключение В работе выполнено построение модели акустического тонального языка роботов и разработан алгоритм выделения звуков, соответствующих фонемам этого языка. Данная система позволяет осуществлять коммуникацию роботов на основе акустических сиг- налов. В основе метода распознавания лежит программная реализация спектрального ана- лиза аудиосигнала. Выполнена реализация программной среды моделирования. Программная среда позволяет определять и анализировать параметры, характеризующие аудиосигнал. Эти параметры в дальнейшем будут использоваться для доработки данного алгоритма с целью достижения лучшего качества распознавания. Моделирование показало работоспособность созданной схемы управления. Ее отра- ботка будет продолжена на макетах подвижных роботов. Отметим, что передача акустических сигналов во многих отношениях, таких как на- дежность, скорость, уступает передаче данных по радиоканалу. Однако данная система может использоваться в тех случаях, где неприменимы радиосигналы, например, в усло- виях значительных радиопомех. Также она может быть интересна при использовании в таком окружении, когда коммуникация роботов должна быть наглядной. В дальнейшем планируется создать версии акустического языка, в которых каждый символ будет кодироваться не одно-, а двух- и/или трехчастотным сигналом. Цель – созда- ние таких языков, которые будут более устойчивы к помехам. Также планируется ввести некоторый понятийный словарь (тезаурус), которым будут пользоваться роботы. Для этого словаря будут созданы правила составления пред- ложений, каждое из которых будет уже иметь какой-то смысл. Алгоритмы распо- знавания будут дополнены анализом этих предложений. Будет создан инструмент для пополнения данного словаря. Таким образом, на основе такого языка можно будет осуществить смысловой диалог роботов. Литература 1. Динамика, моделирование, управление мобильными роботами / [Павловский В.Е., Евграфов В.В., Павловский В.В., Петровская Н.В.] // Искусственный интеллект – проблемы и перспективы. Политехнические чтения (3. Поспеловские чт-я) : сборник статей. – М.м: Изд. Политехнического музея, – 2008.; Режим доступа : http://posp.raai.org/info.php?view=17 2. Tho Nguyen and Linda G.Bushnell, Dept of EE, University of Washington, April, 2006. “Feasibility Study of DTMF Communications for Robots” [Электронный ресурс]. – Режим доступа : https://www.ee.washington.edu/techsite/papers/documents/UWEETR-2004-0013.pdf 3. Lingodroids: Studies in Spatial Cognition and Language / [Schulz R., Glover A., Milford M.] // Proc. 2011 IEEE International Conference on Robotics and Automation (ICRA-2011) (May 9-13, 2011, Shanghai, China). – Р. 178-183. 4. Секунов Н. Обработка звука на PC / Секунов Н. – СПб., 2001. – 1248 с. Искусственный тональный язык акустической коммуникации роботов «Штучний інтелект» 4’2012 459 5П Literatura 1. Pavlovskij V.E. V sb. “Iskusstvennyj intellekt - problemy i perspektivy”. Politehnicheskie chtenija (3 Pos- pelovskie cht-ja). 2008. M.: Izd. Politehnicheskogo muzeja. http://posp.raai.org/info.php?view=17 http://www.umlab.ru/index/download/evgrafov_ipm.pdf 2. Tho Nguyen and Linda G.Bushnell, Dept of EE. University of Washington. April. 2006. “Feasibility Study of DTMF Communications for Robots”. https://www.ee.washington.edu/techsite/papers/documents/UWEETR- 2004-0013.pdf 3. Schulz R. Proc. 2011 IEEE International Conference on Robotics and Automation (ICRA-2011). May 9-13. 2011. Shanghai. China. P. 178-183. 4. Sekunov N. “Obrabotka zvuka na PC”. SPb. 2001.1248 s. RESUME V.E. Pavlovsky, A.Ju. Kirkov Artificial Tone Language for Acoustic Communication of Robots The work deals with creation of system of acoustic communication of robots for realization of their conversation in the usual external (air) environment on the typical acoustic frequencies perceived by the human. Generally speaking, low-frequency language of robots won’t be directly clear to the person, but as for the person it is simple to prepare the corresponding translator. Thus, offered acoustic communication can become the convenient means of additional control of behavior of the robots coexisting with the human beings in uniform society. In the work, communication of robots is based on simple structure of one- and low- frequency signals that does methods of the spectral analysis almost ideal for the subsequent algorithms of recognition. On the basis of such signals, base language of robots is under construction. The language can include any number of the elementary symbols realized by the mono- or polyfrequency of artificial phonemes. In the work, the formal model of the language is entered, the program environment for visualization and the analysis of work of the constructed algorithm is realized. Experiments on the basis of the created computer and hardware models for the analysis of operability of the constructed algorithms are made. The first prototype of described system was created in 2007-2008. During the subsequent time, experiments on creation of several various realization and language working off were carried out. The experiments showed the sufficient efficiency of the created acoustical system. Статья поступила в редакцию 16.07.2012
id nasplib_isofts_kiev_ua-123456789-57754
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 1561-5359
language Russian
last_indexed 2025-12-07T15:38:41Z
publishDate 2012
publisher Інститут проблем штучного інтелекту МОН України та НАН України
record_format dspace
spelling Павловский, В.Е.
Кирков, А.Ю.
2014-03-14T13:36:47Z
2014-03-14T13:36:47Z
2012
Искусственный тональный язык акустической коммуникации роботов / В.Е. Павловский, А.Ю. Кирков // Штучний інтелект. — 2012. — № 4. — С. 440-459. — Бібліогр.: 4 назв. — рос.
1561-5359
https://nasplib.isofts.kiev.ua/handle/123456789/57754
004.896:534.4
Рассматривается задача коммуникации роботов на основе языка тональных акустических сигналов. Приведена формальная модель языка, в котором каждому символу языка соответствует последовательность акустических одночастотных сигналов, и рассмотрен алгоритм распознавания таких характерных звуков.
Розглядається задача комунікації роботів на ґрунті мови тональних акустичних сигналів. наведено формальну модель мови, в якій кожному символу мови відповідає послідовність акустичних одночастотних сигналів, і розглянуто алгоритм розпізнавання таких характерних звуків.
The task of communication of robots on the basis of tone acoustic signals is the focus of this work. In the work, the language model is presented where each symbol is associated with a pattern of single-frequency tones supplied with an algorithm of identification of these tones.
ru
Інститут проблем штучного інтелекту МОН України та НАН України
Штучний інтелект
Интеллектуальные робототехнические системы
Искусственный тональный язык акустической коммуникации роботов
Штучна тональна мова акустичної комунікації роботів
Artificial Tone Language for Acoustic Communication of Robots
Article
published earlier
spellingShingle Искусственный тональный язык акустической коммуникации роботов
Павловский, В.Е.
Кирков, А.Ю.
Интеллектуальные робототехнические системы
title Искусственный тональный язык акустической коммуникации роботов
title_alt Штучна тональна мова акустичної комунікації роботів
Artificial Tone Language for Acoustic Communication of Robots
title_full Искусственный тональный язык акустической коммуникации роботов
title_fullStr Искусственный тональный язык акустической коммуникации роботов
title_full_unstemmed Искусственный тональный язык акустической коммуникации роботов
title_short Искусственный тональный язык акустической коммуникации роботов
title_sort искусственный тональный язык акустической коммуникации роботов
topic Интеллектуальные робототехнические системы
topic_facet Интеллектуальные робототехнические системы
url https://nasplib.isofts.kiev.ua/handle/123456789/57754
work_keys_str_mv AT pavlovskiive iskusstvennyitonalʹnyiâzykakustičeskoikommunikaciirobotov
AT kirkovaû iskusstvennyitonalʹnyiâzykakustičeskoikommunikaciirobotov
AT pavlovskiive štučnatonalʹnamovaakustičnoíkomuníkacíírobotív
AT kirkovaû štučnatonalʹnamovaakustičnoíkomuníkacíírobotív
AT pavlovskiive artificialtonelanguageforacousticcommunicationofrobots
AT kirkovaû artificialtonelanguageforacousticcommunicationofrobots