Автоматизированная система стенографирования
В статье рассматривается проблема построения автоматизированной системы стенографирования, предназначенной для оптимизации работы операторов-стенографистов в организациях и учреждениях, где требуется ведение текстовых стенограмм заседаний, собраний, докладов, конференций. Авторами рассмотрены преиму...
Saved in:
| Date: | 2009 |
|---|---|
| Main Authors: | , , , |
| Format: | Article |
| Language: | Russian |
| Published: |
Інститут проблем штучного інтелекту МОН України та НАН України
2009
|
| Subjects: | |
| Online Access: | https://nasplib.isofts.kiev.ua/handle/123456789/8481 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| Journal Title: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Cite this: | Автоматизированная система стенографирования / Ю.Г. Кривонос, Ю.В. Крак, А.В. Бармак, А.С. Загваздин // Штучний інтелект. — 2009. — № 3. — С. 228-233. — Бібліогр.: 4 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| _version_ | 1859766606518812672 |
|---|---|
| author | Кривонос, Ю.Г. Крак, Ю.В. Бармак, А.В. Загваздин, А.С. |
| author_facet | Кривонос, Ю.Г. Крак, Ю.В. Бармак, А.В. Загваздин, А.С. |
| citation_txt | Автоматизированная система стенографирования / Ю.Г. Кривонос, Ю.В. Крак, А.В. Бармак, А.С. Загваздин // Штучний інтелект. — 2009. — № 3. — С. 228-233. — Бібліогр.: 4 назв. — рос. |
| collection | DSpace DC |
| description | В статье рассматривается проблема построения автоматизированной системы стенографирования, предназначенной для оптимизации работы операторов-стенографистов в организациях и учреждениях, где требуется ведение текстовых стенограмм заседаний, собраний, докладов, конференций. Авторами рассмотрены преимущества и недостатки существующих программных продуктов и систем и предложен прототип системы автоматизированного стенографирования.
У статті розглядається проблема побудови автоматизованої системи стенографування, що призначена для оптимізації роботи операторів-стенографістів в організаціях і установах, де необхідне ведення текстових стенограм засідань, доповідей, конференцій. Авторами розглядаються переваги і недоліки існуючих систем і пропонується прототип системи автоматизованого стенографування.
The paper is devoted to problem of automated transcription system construction intended to optimize the transcription processes involving transcription operators in organizations where transcription is required for meetings, reports, conferences. Authors analyze pros and cons of existing systems and suggest a prototype of automated transcription system.
|
| first_indexed | 2025-12-02T06:11:12Z |
| format | Article |
| fulltext |
«Искусственный интеллект» 3’2009 228
5К
УДК 004.89:004.93
Ю.Г. Кривонос, Ю.В. Крак, А.В. Бармак, А.С. Загваздин
Институт кибернетики им. В.М. Глушкова НАН Украины, г. Киев, Украина
yuriy.krak@gmail.com
Автоматизированная система
стенографирования
В статье рассматривается проблема построения автоматизированной системы стенографирования,
предназначенной для оптимизации работы операторов-стенографистов в организациях и учреждениях,
где требуется ведение текстовых стенограмм заседаний, собраний, докладов, конференций. Авторами
рассмотрены преимущества и недостатки существующих программных продуктов и систем и предложен
прототип системы автоматизированного стенографирования.
Введение
Текстовая стенограмма заседания является необходимой составляющей в работе
многих организаций. Как правило, процесс создания и расшифровки стенограмм
достаточно продолжителен и попытки его ускорения путем расширения персонала,
вовлеченного в процесс, представляются неэффективными. Для автоматизации про-
цесса создания стенограмм заседаний предлагается рассматриваемая система распре-
деленного компьютерного документирования.
Поскольку стенографирование заседаний является задачей, которая может быть
достаточно просто распределена между многими исполнителями, система распреде-
ленного стенографирования должна поддерживать однопользовательский и многополь-
зовательский режимы работы. На сегодняшний день в мире существует несколько
систем распределенного документирования, однако практически всем им свойственнен
ряд недостатков, от которых авторы стремились избавить предложенную систему.
Основным недостатком существующих систем стенографирования заседаний является то,
что они предъявляют высокие требования к аппаратному обеспечению, на котором рабо-
тает серверная часть системы и существенные затраты на внедрение системы в целом.
Такие системы зачастую требуют постоянного системного администрирования [1-3],
что ограничивает внедрение подобных систем стенографирования в небольших орга-
низациях, организациях с ограниченным ИТ бюджетом, а также для индивидуальных
пользователей. Наличие серверной части также делает практически невозможной мо-
бильную работу с системой и требует постоянного подключения к локальной сети.
Предложенная в статье система распределенного стенографирования предназначена
автоматизировать и упростить работу индивидуальных операторов-стенографистов и
групп стенографистов в организациях различного уровня и является продолжением
работы над системой автоматизированного стенографирования [4]. Очевидным является
факт, что навыки работы с компьютером операторов-стенографистов в большинстве
организаций являются относительно ограниченными, что накладывает особые
требования на пользовательский интерфейс и эргономику системы автоматизированного
стенографирования. В частности, как можно большая часть операций в такой системе
Автоматизированная система стенографирования
«Штучний інтелект» 3’2009 229
5К
должна быть автоматизирована и не требовать каких-либо действий от пользователя,
а набор операций, где действие пользователя необходимо, должен быть ограниченным и
состоять из небольшого числа простых и понятных операций. При этом система должна
оставаться гибкой и поддерживать достаточно большое количество настроек, чтобы
сделать работу оператора как можно более простой.
Требования к системе распределенного
стенографирования и характеристики
предложенной системы
Эффективная система автоматизированного стенографирования должна удовле-
творять следующим требованиям:
Получать и сохранять звуковой сигнал с речью, предназначенной для стенографи-
рования, поддерживать значительную часть современных форматов хранения звуковой
информации.
Реализовывать предварительную цифровую обработку звукового сигнала, в част-
ности обесшумливание сигнала.
Выполнять автоматическую разбивку сигнала на сегменты, продолжительность
которых была бы максимально удобной для обработки стенографистом.
Поддерживать однопользовательский и многопользовательский режимы работы
системы, при этом не требуя комплексного внедрения и сопровождения в рамках
организации.
В многопользовательском режиме эффективно распределять сегменты речевого
сигнала между операторами-стенографистами.
Очевидным является факт о том, что уровень компьютерной грамотности опе-
раторов-стенографистов традиционно не высок, что предъявляет особые требования к
эргономике системы и удобству пользовательского интерфейса.
Рассматриваемая система обладает следующими характеристиками:
Пользовательский интерфейс соответствует основным требованиям, которые тра-
диционно предъявляются к эргономике и интерфейсу программного продукта. В част-
ности, согласно классическому исследованию Д. Миллера про кратковременную память
человека, который утверждает, что человек может одновременно концентрировать вни-
мание лишь на 7+/-2 объектах, количество основных команд, доступных пользова-
телю при работе с речевым сигналом, сведено к 8, а оптимальная продолжитель-
ность сегмента звукового сигнала определена на уровне 5 – 9 слов. К тому же для
всех основных команд в интерфейсе реализованы «горячие клавиши», с целью дать
пользователю возможность управлять программным продуктом, не отрывая рук от кла-
виатуры и не прекращая набора текста стенограммы.
Система выполняет эффективную разбивку звукового сигнала на эквивалентные
сегменты. Такая разбивка реализовывается согласно следующему принципу: алгоритм
разбивки проходит по сигналу окном заданной длины и определяет фрагменты сигнала,
соответствующие паузам в речевом потоке (среднеквадратичное отклонение в таких
сегментах не превышает заданной пороговой величины). Согласно найденным паузам
определяются границы сегмента с условием, что продолжительность сегмента должна
быть не меньше заданной величины и чтобы количество пауз в рамках сегмента
соответствовало оптимальному количеству слов в сегменте. Паузы, продолжительность
которых превышает заданный порог, вырезаются из рассматриваемого сигнала.
Кривонос Ю.Г., Крак Ю.В., Бармак А.В., Загваздин А.С.
«Искусственный интеллект» 3’2009 230
5К
Система работает как в однопользовательском, так и в многопользовательском
режимах.
Среди объединенных в сеть компьютеров, на которых установлена система, один
определяется как главный. Он выполняет роль сервера, обеспечивает получение
сигнала, его предварительную цифровую обработку, разбивку сигнала на сегменты и
распределение сегментов между остальными компьютерами. Таким образом система
практически не требует внедрения и администрирования.
При предварительной обработке звукового сигнала система изменяет амплитуду
звукового сигнала, чтобы уровень громкости оставался комфортным для стенографи-
рования, изменяет частоту основного тона и скорость воспроизведения сигнала.
В многопользовательском режиме система эффективно распределяет сегменты между
операторами-стенографистами. На главном компьютере сегменты, полученные в
результате предварительной обработки, организованы в виде очереди, при освобождении
оператора система направляет ему следующий в очереди сегмент, нуждающийся в
расшифровке.
Интерфейс АРМ оператора-стенографиста представлен на рис. 1.
Рисунок 1 – Интерфейс АРМ оператора-стенографиста
Предварительная цифровая обработка сигнала
Важным аспектом для системы автоматизированного стенографирования является
возможность изменения скорости воспроизведения звукового сигнала, возможность
воспроизведения звукового сигнала быстрее или медленнее без утраты его основных
акустических характеристик: частоты основного тона и амплитуды. Для манипуляций
над частотой основного тона и продолжительностью сигнала для создания эффектов
медленного или быстрого воспроизведения в данной работе предлагается использование
PSOLA-подобных алгоритмов. Для реализации таких алгоритмов сперва решается
задача обнаружения периодов псевдопериодичности в звуковом сигнале (рис. 2). Для
этого исходный звуковой сигнал пропускается через низкочастотный и высокочастотный
фильтры с конечными импульсными характеристиками. Результат применения такого
рода фильтров к звуковому сигналу, соответствующему слогу «ма», приведен на рис. 3.
Автоматизированная система стенографирования
«Штучний інтелект» 3’2009 231
5К
Рисунок 2 – Слог «ма» до применения фильтров
Рисунок 3 – Слог «ма» после фильтрации
Далее для сглаживания сигнала каждый элемент вектора исходного сигнала
заменяется на взвешенное среднее четырех окружающих его элементов по формуле:
10
]2[3]1[]1[]2[3][
ixixixixid . (1)
К полученному сигналу применяется медианное сглаживание порядка 199n ,
(каждый элемент вектора заменяется на медиану вектора, состоящего из n элементов,
окружающих текущий элемент). Вид сигнала после сглаживания представлен на рис. 4.
Рисунок 4 – Слог «ма» после фильтрации и медианного сглаживания
После этого в полученном сигнале обнаруживаются точки, где последователь-
ность, состоящая из элементов вектора сигнала, изменяет знак с – на + и такие точки
обозначаются как границы питч-периодов. Среди определенных таким образом гра-
ниц обнаруживаются и исключаются точки, расположенные слишком близко друг к
другу, а для участков сигнала, где нет явной псевдопериодичности, назначаются услов-
ные границы с некоторым постоянным интервалом.
После определения границ периодов псевдопериодичности можно изменять
акустические характеристики сигнала. Исходный сигнал можно представить в виде
функции периодов основного тона ][nxi :
i
ai itnxnx ]][[][ , (2)
Кривонос Ю.Г., Крак Ю.В., Бармак А.В., Загваздин А.С.
«Искусственный интеллект» 3’2009 232
5К
где ][ita – границы периодов псевдопериодичности сигнала, т.е. разница между
двумя соседними границами ]1[][][ ititiP aaa равняется периоду основного тона
в момент времени ][ita . Питч-период определим через исходный сигнал, помноженный
на оконную функцию:
][][][ nxnwnx ii , (3)
где окна iw удовлетворяют условию:
i
ai itnw 1]][[ , (4)
что достигается использованием оконных функций типа Хэннинга или трапециевидным
окном длиной в два периода основного тона.
В результате работы алгоритма необходимо получить сигнал ][ny , который имеет
одинаковые с ][nx спектральные характеристики, но отличается от него основным то-
ном и/или продолжительностью. Чтобы достичь этого, заменяем аналитические гра-
ницы питч-периодов ][ita границами ][itb , а аналитические периоды основного тона
][nxi периодами ][nyi согласно
j
bj jtnyny ]][[][ . (5)
Таким образом, теперь достаточно лишь задать границы ][it b , которые соответ-
ствуют продолжительности и основному тону, которые необходимо получить. Резуль-
тирующий период основного ][ny i тона получаем подстановкой ближайшего соот-
ветствующего аналитического периода ][nxi . Графически работа алгоритма представ-
лена на рис. 5.
Рисунок 5 – Схема работы алгоритма для модификации продолжительности
и основного тона
Автоматизированная система стенографирования
«Штучний інтелект» 3’2009 233
5К
Выводы
После реализации прототипа системы был проведен эксперимент, целью которого
было сравнение эффективности работы одного стенографиста и группы стенографистов
при использовании предложенной системы и без такового, то есть при использовании
лишь традиционных средств (таких как Windows Media Player для воспроизведения
звукового сигнала и Microsoft Office Word для набора текста стенограммы). В качестве
входящего речевого сигнала для эксперимента была выбрана запись заседания специ-
ализированного ученого совета по поводу защиты диссертации продолжительностью
около 2 часов. В результате эксперимента получены следующие результаты:
При работе одного оператора-стенографиста на стенографирование записи с исполь-
зованием предложенной системы было потрачено около 4 часов. Для стенографи-
рования этой же записи при использовании стандартных средств оператор тратит в
среднем 12 – 16 часов.
Группе стенографистов из 5 человек для обработки записи понадобилось около
40 минут, после чего полученный текст стенограммы был направлен на обработку кор-
ректору. Вместе с коррекцией в общей сложности расшифровка стенограммы заняла
около 1 часа.
Проведенный эксперимент демонстрирует эффективность предложенной системы
в сравнении с традиционными средствами. Вместе с остальными преимуществами,
среди которых отсутствие необходимости администрирования и внедрения, простота
в использовании и качественная предварительная обработка сигнала, предложенная
система является достаточно эффективным средством для автоматизации процесса
создания и расшифровки стенограмм заседаний для небольших и крупных организаций,
а также для индивидуальных пользователей.
Литература
1. Система распределенного компьютерного документирования устных выступлений и фонограмм
речи Нестор [Электронний ресурс]. – Режим доступа : http://www.speechpro.ru/rus/products/doc-
systems/nestor/
2. Комплекс оперативного стенографирования «SRS Report 2002» [Электронний ресурс]. – Режим доступа :
http://srs.kiev.ua/ index.php?pg=2&lang=rus&tov=23
3. The meeting recorder project – [Электронний ресурс]. – Режим доступа :
http://www.icsi.berkeley.edu/Speech/mr/mtgrcdr.html
4. Кривонос Ю.Г. Система автоматизації отримання стенограм засідань / Ю.Г. Кривонос, Ю.В. Крак,
О.В. Бармак, О.С. Загваздін // Штучний інтелект. – 2008.
Ю.Г. Кривонос, Ю.В. Крак, О.В. Бармак, О.С. Загваздін
Автоматизована система стенографування
У статті розглядається проблема побудови автоматизованої системи стенографування, що призначена
для оптимізації роботи операторів-стенографістів в організаціях і установах, де необхідне ведення
текстових стенограм засідань, доповідей, конференцій. Авторами розглядаються переваги і недоліки
існуючих систем і пропонується прототип системи автоматизованого стенографування.
Yu.G. Kryvonos, Yu.V. Krak, O.V. Barmak, O.S. Zagvazdin
Automated Transcription System
The paper is devoted to problem of automated transcription system construction intended to optimize the
transcription processes involving transcription operators in organizations where transcription is required for
meetings, reports, conferences. Authors analyze pros and cons of existing systems and suggest a prototype of
automated transcription system.
Статья поступила в редакцию 09.06.2009.
|
| id | nasplib_isofts_kiev_ua-123456789-8481 |
| institution | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| issn | 1561-5359 |
| language | Russian |
| last_indexed | 2025-12-02T06:11:12Z |
| publishDate | 2009 |
| publisher | Інститут проблем штучного інтелекту МОН України та НАН України |
| record_format | dspace |
| spelling | Кривонос, Ю.Г. Крак, Ю.В. Бармак, А.В. Загваздин, А.С. 2010-06-01T10:34:38Z 2010-06-01T10:34:38Z 2009 Автоматизированная система стенографирования / Ю.Г. Кривонос, Ю.В. Крак, А.В. Бармак, А.С. Загваздин // Штучний інтелект. — 2009. — № 3. — С. 228-233. — Бібліогр.: 4 назв. — рос. 1561-5359 https://nasplib.isofts.kiev.ua/handle/123456789/8481 004.89:004.93 В статье рассматривается проблема построения автоматизированной системы стенографирования, предназначенной для оптимизации работы операторов-стенографистов в организациях и учреждениях, где требуется ведение текстовых стенограмм заседаний, собраний, докладов, конференций. Авторами рассмотрены преимущества и недостатки существующих программных продуктов и систем и предложен прототип системы автоматизированного стенографирования. У статті розглядається проблема побудови автоматизованої системи стенографування, що призначена для оптимізації роботи операторів-стенографістів в організаціях і установах, де необхідне ведення текстових стенограм засідань, доповідей, конференцій. Авторами розглядаються переваги і недоліки існуючих систем і пропонується прототип системи автоматизованого стенографування. The paper is devoted to problem of automated transcription system construction intended to optimize the transcription processes involving transcription operators in organizations where transcription is required for meetings, reports, conferences. Authors analyze pros and cons of existing systems and suggest a prototype of automated transcription system. ru Інститут проблем штучного інтелекту МОН України та НАН України Интеллектуальные системы автоматизации научных исследований, проектирования и управления Автоматизированная система стенографирования Автоматизована система стенографування Automated Transcription System Article published earlier |
| spellingShingle | Автоматизированная система стенографирования Кривонос, Ю.Г. Крак, Ю.В. Бармак, А.В. Загваздин, А.С. Интеллектуальные системы автоматизации научных исследований, проектирования и управления |
| title | Автоматизированная система стенографирования |
| title_alt | Автоматизована система стенографування Automated Transcription System |
| title_full | Автоматизированная система стенографирования |
| title_fullStr | Автоматизированная система стенографирования |
| title_full_unstemmed | Автоматизированная система стенографирования |
| title_short | Автоматизированная система стенографирования |
| title_sort | автоматизированная система стенографирования |
| topic | Интеллектуальные системы автоматизации научных исследований, проектирования и управления |
| topic_facet | Интеллектуальные системы автоматизации научных исследований, проектирования и управления |
| url | https://nasplib.isofts.kiev.ua/handle/123456789/8481 |
| work_keys_str_mv | AT krivonosûg avtomatizirovannaâsistemastenografirovaniâ AT krakûv avtomatizirovannaâsistemastenografirovaniâ AT barmakav avtomatizirovannaâsistemastenografirovaniâ AT zagvazdinas avtomatizirovannaâsistemastenografirovaniâ AT krivonosûg avtomatizovanasistemastenografuvannâ AT krakûv avtomatizovanasistemastenografuvannâ AT barmakav avtomatizovanasistemastenografuvannâ AT zagvazdinas avtomatizovanasistemastenografuvannâ AT krivonosûg automatedtranscriptionsystem AT krakûv automatedtranscriptionsystem AT barmakav automatedtranscriptionsystem AT zagvazdinas automatedtranscriptionsystem |