Автоматизированная система стенографирования

В статье рассматривается проблема построения автоматизированной системы стенографирования, предназначенной для оптимизации работы операторов-стенографистов в организациях и учреждениях, где требуется ведение текстовых стенограмм заседаний, собраний, докладов, конференций. Авторами рассмотрены преиму...

Full description

Saved in:
Bibliographic Details
Date:2009
Main Authors: Кривонос, Ю.Г., Крак, Ю.В., Бармак, А.В., Загваздин, А.С.
Format: Article
Language:Russian
Published: Інститут проблем штучного інтелекту МОН України та НАН України 2009
Subjects:
Online Access:https://nasplib.isofts.kiev.ua/handle/123456789/8481
Tags: Add Tag
No Tags, Be the first to tag this record!
Journal Title:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Cite this:Автоматизированная система стенографирования / Ю.Г. Кривонос, Ю.В. Крак, А.В. Бармак, А.С. Загваздин // Штучний інтелект. — 2009. — № 3. — С. 228-233. — Бібліогр.: 4 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1859766606518812672
author Кривонос, Ю.Г.
Крак, Ю.В.
Бармак, А.В.
Загваздин, А.С.
author_facet Кривонос, Ю.Г.
Крак, Ю.В.
Бармак, А.В.
Загваздин, А.С.
citation_txt Автоматизированная система стенографирования / Ю.Г. Кривонос, Ю.В. Крак, А.В. Бармак, А.С. Загваздин // Штучний інтелект. — 2009. — № 3. — С. 228-233. — Бібліогр.: 4 назв. — рос.
collection DSpace DC
description В статье рассматривается проблема построения автоматизированной системы стенографирования, предназначенной для оптимизации работы операторов-стенографистов в организациях и учреждениях, где требуется ведение текстовых стенограмм заседаний, собраний, докладов, конференций. Авторами рассмотрены преимущества и недостатки существующих программных продуктов и систем и предложен прототип системы автоматизированного стенографирования. У статті розглядається проблема побудови автоматизованої системи стенографування, що призначена для оптимізації роботи операторів-стенографістів в організаціях і установах, де необхідне ведення текстових стенограм засідань, доповідей, конференцій. Авторами розглядаються переваги і недоліки існуючих систем і пропонується прототип системи автоматизованого стенографування. The paper is devoted to problem of automated transcription system construction intended to optimize the transcription processes involving transcription operators in organizations where transcription is required for meetings, reports, conferences. Authors analyze pros and cons of existing systems and suggest a prototype of automated transcription system.
first_indexed 2025-12-02T06:11:12Z
format Article
fulltext «Искусственный интеллект» 3’2009 228 5К УДК 004.89:004.93 Ю.Г. Кривонос, Ю.В. Крак, А.В. Бармак, А.С. Загваздин Институт кибернетики им. В.М. Глушкова НАН Украины, г. Киев, Украина yuriy.krak@gmail.com Автоматизированная система стенографирования В статье рассматривается проблема построения автоматизированной системы стенографирования, предназначенной для оптимизации работы операторов-стенографистов в организациях и учреждениях, где требуется ведение текстовых стенограмм заседаний, собраний, докладов, конференций. Авторами рассмотрены преимущества и недостатки существующих программных продуктов и систем и предложен прототип системы автоматизированного стенографирования. Введение Текстовая стенограмма заседания является необходимой составляющей в работе многих организаций. Как правило, процесс создания и расшифровки стенограмм достаточно продолжителен и попытки его ускорения путем расширения персонала, вовлеченного в процесс, представляются неэффективными. Для автоматизации про- цесса создания стенограмм заседаний предлагается рассматриваемая система распре- деленного компьютерного документирования. Поскольку стенографирование заседаний является задачей, которая может быть достаточно просто распределена между многими исполнителями, система распреде- ленного стенографирования должна поддерживать однопользовательский и многополь- зовательский режимы работы. На сегодняшний день в мире существует несколько систем распределенного документирования, однако практически всем им свойственнен ряд недостатков, от которых авторы стремились избавить предложенную систему. Основным недостатком существующих систем стенографирования заседаний является то, что они предъявляют высокие требования к аппаратному обеспечению, на котором рабо- тает серверная часть системы и существенные затраты на внедрение системы в целом. Такие системы зачастую требуют постоянного системного администрирования [1-3], что ограничивает внедрение подобных систем стенографирования в небольших орга- низациях, организациях с ограниченным ИТ бюджетом, а также для индивидуальных пользователей. Наличие серверной части также делает практически невозможной мо- бильную работу с системой и требует постоянного подключения к локальной сети. Предложенная в статье система распределенного стенографирования предназначена автоматизировать и упростить работу индивидуальных операторов-стенографистов и групп стенографистов в организациях различного уровня и является продолжением работы над системой автоматизированного стенографирования [4]. Очевидным является факт, что навыки работы с компьютером операторов-стенографистов в большинстве организаций являются относительно ограниченными, что накладывает особые требования на пользовательский интерфейс и эргономику системы автоматизированного стенографирования. В частности, как можно большая часть операций в такой системе Автоматизированная система стенографирования «Штучний інтелект» 3’2009 229 5К должна быть автоматизирована и не требовать каких-либо действий от пользователя, а набор операций, где действие пользователя необходимо, должен быть ограниченным и состоять из небольшого числа простых и понятных операций. При этом система должна оставаться гибкой и поддерживать достаточно большое количество настроек, чтобы сделать работу оператора как можно более простой. Требования к системе распределенного стенографирования и характеристики предложенной системы Эффективная система автоматизированного стенографирования должна удовле- творять следующим требованиям:  Получать и сохранять звуковой сигнал с речью, предназначенной для стенографи- рования, поддерживать значительную часть современных форматов хранения звуковой информации.  Реализовывать предварительную цифровую обработку звукового сигнала, в част- ности обесшумливание сигнала.  Выполнять автоматическую разбивку сигнала на сегменты, продолжительность которых была бы максимально удобной для обработки стенографистом.  Поддерживать однопользовательский и многопользовательский режимы работы системы, при этом не требуя комплексного внедрения и сопровождения в рамках организации.  В многопользовательском режиме эффективно распределять сегменты речевого сигнала между операторами-стенографистами. Очевидным является факт о том, что уровень компьютерной грамотности опе- раторов-стенографистов традиционно не высок, что предъявляет особые требования к эргономике системы и удобству пользовательского интерфейса. Рассматриваемая система обладает следующими характеристиками:  Пользовательский интерфейс соответствует основным требованиям, которые тра- диционно предъявляются к эргономике и интерфейсу программного продукта. В част- ности, согласно классическому исследованию Д. Миллера про кратковременную память человека, который утверждает, что человек может одновременно концентрировать вни- мание лишь на 7+/-2 объектах, количество основных команд, доступных пользова- телю при работе с речевым сигналом, сведено к 8, а оптимальная продолжитель- ность сегмента звукового сигнала определена на уровне 5 – 9 слов. К тому же для всех основных команд в интерфейсе реализованы «горячие клавиши», с целью дать пользователю возможность управлять программным продуктом, не отрывая рук от кла- виатуры и не прекращая набора текста стенограммы.  Система выполняет эффективную разбивку звукового сигнала на эквивалентные сегменты. Такая разбивка реализовывается согласно следующему принципу: алгоритм разбивки проходит по сигналу окном заданной длины и определяет фрагменты сигнала, соответствующие паузам в речевом потоке (среднеквадратичное отклонение в таких сегментах не превышает заданной пороговой величины). Согласно найденным паузам определяются границы сегмента с условием, что продолжительность сегмента должна быть не меньше заданной величины и чтобы количество пауз в рамках сегмента соответствовало оптимальному количеству слов в сегменте. Паузы, продолжительность которых превышает заданный порог, вырезаются из рассматриваемого сигнала. Кривонос Ю.Г., Крак Ю.В., Бармак А.В., Загваздин А.С. «Искусственный интеллект» 3’2009 230 5К  Система работает как в однопользовательском, так и в многопользовательском режимах.  Среди объединенных в сеть компьютеров, на которых установлена система, один определяется как главный. Он выполняет роль сервера, обеспечивает получение сигнала, его предварительную цифровую обработку, разбивку сигнала на сегменты и распределение сегментов между остальными компьютерами. Таким образом система практически не требует внедрения и администрирования.  При предварительной обработке звукового сигнала система изменяет амплитуду звукового сигнала, чтобы уровень громкости оставался комфортным для стенографи- рования, изменяет частоту основного тона и скорость воспроизведения сигнала.  В многопользовательском режиме система эффективно распределяет сегменты между операторами-стенографистами. На главном компьютере сегменты, полученные в результате предварительной обработки, организованы в виде очереди, при освобождении оператора система направляет ему следующий в очереди сегмент, нуждающийся в расшифровке. Интерфейс АРМ оператора-стенографиста представлен на рис. 1. Рисунок 1 – Интерфейс АРМ оператора-стенографиста Предварительная цифровая обработка сигнала Важным аспектом для системы автоматизированного стенографирования является возможность изменения скорости воспроизведения звукового сигнала, возможность воспроизведения звукового сигнала быстрее или медленнее без утраты его основных акустических характеристик: частоты основного тона и амплитуды. Для манипуляций над частотой основного тона и продолжительностью сигнала для создания эффектов медленного или быстрого воспроизведения в данной работе предлагается использование PSOLA-подобных алгоритмов. Для реализации таких алгоритмов сперва решается задача обнаружения периодов псевдопериодичности в звуковом сигнале (рис. 2). Для этого исходный звуковой сигнал пропускается через низкочастотный и высокочастотный фильтры с конечными импульсными характеристиками. Результат применения такого рода фильтров к звуковому сигналу, соответствующему слогу «ма», приведен на рис. 3. Автоматизированная система стенографирования «Штучний інтелект» 3’2009 231 5К Рисунок 2 – Слог «ма» до применения фильтров Рисунок 3 – Слог «ма» после фильтрации Далее для сглаживания сигнала каждый элемент вектора исходного сигнала заменяется на взвешенное среднее четырех окружающих его элементов по формуле: 10 ]2[3]1[]1[]2[3][   ixixixixid . (1) К полученному сигналу применяется медианное сглаживание порядка 199n , (каждый элемент вектора заменяется на медиану вектора, состоящего из n элементов, окружающих текущий элемент). Вид сигнала после сглаживания представлен на рис. 4. Рисунок 4 – Слог «ма» после фильтрации и медианного сглаживания После этого в полученном сигнале обнаруживаются точки, где последователь- ность, состоящая из элементов вектора сигнала, изменяет знак с – на + и такие точки обозначаются как границы питч-периодов. Среди определенных таким образом гра- ниц обнаруживаются и исключаются точки, расположенные слишком близко друг к другу, а для участков сигнала, где нет явной псевдопериодичности, назначаются услов- ные границы с некоторым постоянным интервалом. После определения границ периодов псевдопериодичности можно изменять акустические характеристики сигнала. Исходный сигнал можно представить в виде функции периодов основного тона ][nxi :     i ai itnxnx ]][[][ , (2) Кривонос Ю.Г., Крак Ю.В., Бармак А.В., Загваздин А.С. «Искусственный интеллект» 3’2009 232 5К где ][ita – границы периодов псевдопериодичности сигнала, т.е. разница между двумя соседними границами ]1[][][  ititiP aaa равняется периоду основного тона в момент времени ][ita . Питч-период определим через исходный сигнал, помноженный на оконную функцию: ][][][ nxnwnx ii  , (3) где окна iw удовлетворяют условию:     i ai itnw 1]][[ , (4) что достигается использованием оконных функций типа Хэннинга или трапециевидным окном длиной в два периода основного тона. В результате работы алгоритма необходимо получить сигнал ][ny , который имеет одинаковые с ][nx спектральные характеристики, но отличается от него основным то- ном и/или продолжительностью. Чтобы достичь этого, заменяем аналитические гра- ницы питч-периодов ][ita границами ][itb , а аналитические периоды основного тона ][nxi периодами ][nyi согласно     j bj jtnyny ]][[][ . (5) Таким образом, теперь достаточно лишь задать границы ][it b , которые соответ- ствуют продолжительности и основному тону, которые необходимо получить. Резуль- тирующий период основного ][ny i тона получаем подстановкой ближайшего соот- ветствующего аналитического периода ][nxi . Графически работа алгоритма представ- лена на рис. 5. Рисунок 5 – Схема работы алгоритма для модификации продолжительности и основного тона Автоматизированная система стенографирования «Штучний інтелект» 3’2009 233 5К Выводы После реализации прототипа системы был проведен эксперимент, целью которого было сравнение эффективности работы одного стенографиста и группы стенографистов при использовании предложенной системы и без такового, то есть при использовании лишь традиционных средств (таких как Windows Media Player для воспроизведения звукового сигнала и Microsoft Office Word для набора текста стенограммы). В качестве входящего речевого сигнала для эксперимента была выбрана запись заседания специ- ализированного ученого совета по поводу защиты диссертации продолжительностью около 2 часов. В результате эксперимента получены следующие результаты:  При работе одного оператора-стенографиста на стенографирование записи с исполь- зованием предложенной системы было потрачено около 4 часов. Для стенографи- рования этой же записи при использовании стандартных средств оператор тратит в среднем 12 – 16 часов.  Группе стенографистов из 5 человек для обработки записи понадобилось около 40 минут, после чего полученный текст стенограммы был направлен на обработку кор- ректору. Вместе с коррекцией в общей сложности расшифровка стенограммы заняла около 1 часа. Проведенный эксперимент демонстрирует эффективность предложенной системы в сравнении с традиционными средствами. Вместе с остальными преимуществами, среди которых отсутствие необходимости администрирования и внедрения, простота в использовании и качественная предварительная обработка сигнала, предложенная система является достаточно эффективным средством для автоматизации процесса создания и расшифровки стенограмм заседаний для небольших и крупных организаций, а также для индивидуальных пользователей. Литература 1. Система распределенного компьютерного документирования устных выступлений и фонограмм речи Нестор [Электронний ресурс]. – Режим доступа : http://www.speechpro.ru/rus/products/doc- systems/nestor/ 2. Комплекс оперативного стенографирования «SRS Report 2002» [Электронний ресурс]. – Режим доступа : http://srs.kiev.ua/ index.php?pg=2&lang=rus&tov=23 3. The meeting recorder project – [Электронний ресурс]. – Режим доступа : http://www.icsi.berkeley.edu/Speech/mr/mtgrcdr.html 4. Кривонос Ю.Г. Система автоматизації отримання стенограм засідань / Ю.Г. Кривонос, Ю.В. Крак, О.В. Бармак, О.С. Загваздін // Штучний інтелект. – 2008. Ю.Г. Кривонос, Ю.В. Крак, О.В. Бармак, О.С. Загваздін Автоматизована система стенографування У статті розглядається проблема побудови автоматизованої системи стенографування, що призначена для оптимізації роботи операторів-стенографістів в організаціях і установах, де необхідне ведення текстових стенограм засідань, доповідей, конференцій. Авторами розглядаються переваги і недоліки існуючих систем і пропонується прототип системи автоматизованого стенографування. Yu.G. Kryvonos, Yu.V. Krak, O.V. Barmak, O.S. Zagvazdin Automated Transcription System The paper is devoted to problem of automated transcription system construction intended to optimize the transcription processes involving transcription operators in organizations where transcription is required for meetings, reports, conferences. Authors analyze pros and cons of existing systems and suggest a prototype of automated transcription system. Статья поступила в редакцию 09.06.2009.
id nasplib_isofts_kiev_ua-123456789-8481
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 1561-5359
language Russian
last_indexed 2025-12-02T06:11:12Z
publishDate 2009
publisher Інститут проблем штучного інтелекту МОН України та НАН України
record_format dspace
spelling Кривонос, Ю.Г.
Крак, Ю.В.
Бармак, А.В.
Загваздин, А.С.
2010-06-01T10:34:38Z
2010-06-01T10:34:38Z
2009
Автоматизированная система стенографирования / Ю.Г. Кривонос, Ю.В. Крак, А.В. Бармак, А.С. Загваздин // Штучний інтелект. — 2009. — № 3. — С. 228-233. — Бібліогр.: 4 назв. — рос.
1561-5359
https://nasplib.isofts.kiev.ua/handle/123456789/8481
004.89:004.93
В статье рассматривается проблема построения автоматизированной системы стенографирования, предназначенной для оптимизации работы операторов-стенографистов в организациях и учреждениях, где требуется ведение текстовых стенограмм заседаний, собраний, докладов, конференций. Авторами рассмотрены преимущества и недостатки существующих программных продуктов и систем и предложен прототип системы автоматизированного стенографирования.
У статті розглядається проблема побудови автоматизованої системи стенографування, що призначена для оптимізації роботи операторів-стенографістів в організаціях і установах, де необхідне ведення текстових стенограм засідань, доповідей, конференцій. Авторами розглядаються переваги і недоліки існуючих систем і пропонується прототип системи автоматизованого стенографування.
The paper is devoted to problem of automated transcription system construction intended to optimize the transcription processes involving transcription operators in organizations where transcription is required for meetings, reports, conferences. Authors analyze pros and cons of existing systems and suggest a prototype of automated transcription system.
ru
Інститут проблем штучного інтелекту МОН України та НАН України
Интеллектуальные системы автоматизации научных исследований, проектирования и управления
Автоматизированная система стенографирования
Автоматизована система стенографування
Automated Transcription System
Article
published earlier
spellingShingle Автоматизированная система стенографирования
Кривонос, Ю.Г.
Крак, Ю.В.
Бармак, А.В.
Загваздин, А.С.
Интеллектуальные системы автоматизации научных исследований, проектирования и управления
title Автоматизированная система стенографирования
title_alt Автоматизована система стенографування
Automated Transcription System
title_full Автоматизированная система стенографирования
title_fullStr Автоматизированная система стенографирования
title_full_unstemmed Автоматизированная система стенографирования
title_short Автоматизированная система стенографирования
title_sort автоматизированная система стенографирования
topic Интеллектуальные системы автоматизации научных исследований, проектирования и управления
topic_facet Интеллектуальные системы автоматизации научных исследований, проектирования и управления
url https://nasplib.isofts.kiev.ua/handle/123456789/8481
work_keys_str_mv AT krivonosûg avtomatizirovannaâsistemastenografirovaniâ
AT krakûv avtomatizirovannaâsistemastenografirovaniâ
AT barmakav avtomatizirovannaâsistemastenografirovaniâ
AT zagvazdinas avtomatizirovannaâsistemastenografirovaniâ
AT krivonosûg avtomatizovanasistemastenografuvannâ
AT krakûv avtomatizovanasistemastenografuvannâ
AT barmakav avtomatizovanasistemastenografuvannâ
AT zagvazdinas avtomatizovanasistemastenografuvannâ
AT krivonosûg automatedtranscriptionsystem
AT krakûv automatedtranscriptionsystem
AT barmakav automatedtranscriptionsystem
AT zagvazdinas automatedtranscriptionsystem