Реалізація методу потокового введення документів, що зберігаються в електронному вигляді

Розглянуто питання потокового введення інформації. Запропоновано реалізацію методу потокового введення документів, що перебувають в електронному вигляді. Рассмотрены вопросы потокового ввода информации. Предложена реализация усовершенствованного метода потокового ввода документов, хранящихся в элект...

Повний опис

Збережено в:
Бібліографічні деталі
Опубліковано в: :Реєстрація, зберігання і обробка даних
Дата:2009
Автори: Коваль, О.В., Карабчук, О.В.
Формат: Стаття
Мова:Ukrainian
Опубліковано: Інститут проблем реєстрації інформації НАН України 2009
Теми:
Онлайн доступ:https://nasplib.isofts.kiev.ua/handle/123456789/50389
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Реалізація методу потокового введення документів, що зберігаються в електронному вигляді / О.В. Коваль, О.В. Карабчук // Реєстрація, зберігання і обробка даних. — 2009. — Т. 11, № 3. — С. 34-41. — Бібліогр.: 6 назв. — укр.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id nasplib_isofts_kiev_ua-123456789-50389
record_format dspace
spelling Коваль, О.В.
Карабчук, О.В.
2013-10-16T22:07:23Z
2013-10-16T22:07:23Z
2009
Реалізація методу потокового введення документів, що зберігаються в електронному вигляді / О.В. Коваль, О.В. Карабчук // Реєстрація, зберігання і обробка даних. — 2009. — Т. 11, № 3. — С. 34-41. — Бібліогр.: 6 назв. — укр.
1560-9189
https://nasplib.isofts.kiev.ua/handle/123456789/50389
681.3
Розглянуто питання потокового введення інформації. Запропоновано реалізацію методу потокового введення документів, що перебувають в електронному вигляді.
Рассмотрены вопросы потокового ввода информации. Предложена реализация усовершенствованного метода потокового ввода документов, хранящихся в электронном виде.
The questions of stream information input are considered. The advanced method of stream input of documents which are in an electronic form is offered.
uk
Інститут проблем реєстрації інформації НАН України
Реєстрація, зберігання і обробка даних
Інформаційно-аналітичні системи обробки даних
Реалізація методу потокового введення документів, що зберігаються в електронному вигляді
Реализация метода потокового ввода документов, хранящихся в электронном виде
Implementation of a Method of Stream Input of Documents being Saved in an Electronic Form
Article
published earlier
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
title Реалізація методу потокового введення документів, що зберігаються в електронному вигляді
spellingShingle Реалізація методу потокового введення документів, що зберігаються в електронному вигляді
Коваль, О.В.
Карабчук, О.В.
Інформаційно-аналітичні системи обробки даних
title_short Реалізація методу потокового введення документів, що зберігаються в електронному вигляді
title_full Реалізація методу потокового введення документів, що зберігаються в електронному вигляді
title_fullStr Реалізація методу потокового введення документів, що зберігаються в електронному вигляді
title_full_unstemmed Реалізація методу потокового введення документів, що зберігаються в електронному вигляді
title_sort реалізація методу потокового введення документів, що зберігаються в електронному вигляді
author Коваль, О.В.
Карабчук, О.В.
author_facet Коваль, О.В.
Карабчук, О.В.
topic Інформаційно-аналітичні системи обробки даних
topic_facet Інформаційно-аналітичні системи обробки даних
publishDate 2009
language Ukrainian
container_title Реєстрація, зберігання і обробка даних
publisher Інститут проблем реєстрації інформації НАН України
format Article
title_alt Реализация метода потокового ввода документов, хранящихся в электронном виде
Implementation of a Method of Stream Input of Documents being Saved in an Electronic Form
description Розглянуто питання потокового введення інформації. Запропоновано реалізацію методу потокового введення документів, що перебувають в електронному вигляді. Рассмотрены вопросы потокового ввода информации. Предложена реализация усовершенствованного метода потокового ввода документов, хранящихся в электронном виде. The questions of stream information input are considered. The advanced method of stream input of documents which are in an electronic form is offered.
issn 1560-9189
url https://nasplib.isofts.kiev.ua/handle/123456789/50389
citation_txt Реалізація методу потокового введення документів, що зберігаються в електронному вигляді / О.В. Коваль, О.В. Карабчук // Реєстрація, зберігання і обробка даних. — 2009. — Т. 11, № 3. — С. 34-41. — Бібліогр.: 6 назв. — укр.
work_keys_str_mv AT kovalʹov realízacíâmetodupotokovogovvedennâdokumentívŝozberígaûtʹsâvelektronnomuviglâdí
AT karabčukov realízacíâmetodupotokovogovvedennâdokumentívŝozberígaûtʹsâvelektronnomuviglâdí
AT kovalʹov realizaciâmetodapotokovogovvodadokumentovhranâŝihsâvélektronnomvide
AT karabčukov realizaciâmetodapotokovogovvodadokumentovhranâŝihsâvélektronnomvide
AT kovalʹov implementationofamethodofstreaminputofdocumentsbeingsavedinanelectronicform
AT karabčukov implementationofamethodofstreaminputofdocumentsbeingsavedinanelectronicform
first_indexed 2025-11-25T13:51:25Z
last_indexed 2025-11-25T13:51:25Z
_version_ 1850516145415651328
fulltext Інформаційно-аналітичні системи обробки даних 34 УДК 681.3 О. В. Коваль, О. В. Карабчук Інститут проблем реєстрації інформації НАН України вул. М. Шпака, 2, 03113 Київ, Україна e-mail: svr@cki.ipri.kiev.ua Реалізація методу потокового введення документів, що зберігаються в електронному вигляді Розглянуто питання потокового введення інформації. Запропоновано реалізацію методу потокового введення документів, що перебувають в електронному вигляді. Ключові слова: системи автоматизації документообігу, реєстрацій- на карта документа, потокове введення документів, електронний ар- хів, інформаційне сховище. Вступ Потоки вхідної інформації корпоративних інформаційно-аналітичних систем (КІАС) надзвичайно різноманітні за джерелами і формами її подання. Вхідну ін- формацію за формою збереження можна умовно класифікувати на електронні до- кументи і паперові. Під терміном «електронний документ» зазвичай розуміється текстовий файл, документ MS Word, електронна таблиця MS Excel, графічний файл, кілька взаємозалежних файлів різних форматів тощо. Прийом вхідної інфо- рмації в КІАС базується, як правило, на використанні засобів електронного доку- ментообігу [1, 2], у тому числі систем автоматизації документообігу (САД) [3] і систем потокового сканування-розпізнавання. САД здійснюють інтеграцію в інформаційне сховище (ІС) КІАС електронних документів, які надходять із використанням електронної пошти, Інтранет-техно- логій та інше. Під інтеграцією у даному контексті слід розуміти виконання таких основних етапів автоматизованої обробки документів, що надходять до КІАС: прийом, реєстрація (формування реєстраційної картки) та розміщення даних про документ (метаданих) у документальній базі даних. Самі електронні документи зберігаються в спеціальних інформаційних сховищах чи у файлах операційної си- стеми. На сьогоднішній день САД в Україні досить широко представлені як укра- їнськими розробниками програмних комплексів, так і закордонними [1]. САД на- дає широкі пошукові можливості для швидкого та зручного одержання будь-якої © О. В. Коваль, О. В. Карабчук Реалізація методу потокового введення документів, що зберігаються в електронному вигляді ISSN 1560-9189 Реєстрація, зберігання і обробка даних, 2009, Т. 11, № 3 35 інформації про електронні документи, накопичені й збережені в інформаційному сховищі КІАС. Однак, якщо документи надходять у паперовому вигляді, то інтеграція доку- ментів у ІС КІАС реалізується за допомогою систем потокового сканування-роз- пізнавання, які базуються на технології потокового введення документів (ПВД). Потокове введення документів — це процес отримання графічного образу папе- рового документа у форматі електронного документа та подальшої роботи з ним у залежності від поставлених задач [4]. На відміну від САД системи потокового сканування-розпізнавання забезпечують можливість збереження графічного обра- зу документа в базі даних. Процес інтеграції документів із використанням ПВД в ІС КІАС [5] включає в себе наступну послідовність дій: 1) підготовку до сканування — розшивку, сортування документів, підготов- ку листів нестандартних розмірів і пошкоджених документів; 2) сканування — підбір параметрів сканування для отримання максимально чіткого зображення, фільтрацію фону для старих архівних документів, сортування різноформатних документів, вирівнювання листів, повторне сканування у випадку недостатньої якості зображення; 3) обробку — повнотекстове розпізнавання, зональне розпізнавання, іден- тифікацію форм; 4) атрибутування — формування метаданих (атрибутів) про документ; 5) верифікацію — перевірку атрибутів, що вводяться, незалежну перевірку двома операторами; 6) контроль якості — на цьому етапі проходить ручний розбір документа, при неможливості автоматичної обробки, або зміна документа; 7) експорт — формування шаблону документа (отримання графічного обра- зу паперового документа у форматі електронного документа) в залежності від си- стеми управління базами даних або САД, що використовуються, та розміщення його у відповідне інформаційне сховище із забезпеченням доступу до нього. На сьогоднішній день вже існує багато систем, в яких інтеграція документів у ІС КІАС реалізується за допомогою систем потокового сканування-розпізнавання, які базуються на технології ПВД. Серед найбільш відомих, що були досліджені, можна назвати такі як ABBYY FineReader Банк, FormReader, система «ДЕЛО», система групи компаній «Ланит». Але наявні системи орієнтовані лише на роботу з паперовими документами, повністю виключаючи можливість роботи з електро- нними копіями паперового документа. Виходячи із зазначених вище процесів інтеграції документів у ІС КІАС із ви- користанням САД і ПВД, можна зробити висновок, що вони не забезпечують ін- теграцію графічного образу паперового документа у форматі електронного доку- мента, якщо такий електронний документ вже існує до процесу інтеграції. А, вра- ховуючи те, що в сучасних КІАС практично стандартом стає забезпечення досту- пу до графічного образу паперового документа, що інтегруються в КІАС, тобто створення інформаційного сховища документів — програмно-апаратного компле- ксу, що вирішує задачі введення і зберігання електронних графічних образів до- кументів, а також доступу до них, то постає задача створення засобів інтеграції графічного образу паперового документа, що існує в форматі електронного доку- мента, в КІАС. О. В. Коваль, О. В. Карабчук 36 Метод потокового введення документів, що зберігаються в електронному вигляді, до корпоративних інформаційно-аналітичних систем Вирішити зазначену задачу можливо, використовуючи ті підходи, що реалі- зовані в САД і ПВД. Пропонується удосконалений метод ПВД, суть якого полягає в тому, що такі етапи ПВД як підготовка до сканування, сканування та обробка документа виключаються, а натомість впроваджується розширений етап автома- тизованої обробки електронних документів, подібний наявному в САД. За удосконаленим методом ПВД здійснюється обробка електронних докуме- нтів, які існують у вигляді файлів наступних форматів: doc, docx, xls, xslx, txt, rtf, rar, pdf, djvu, jpg, gif, bmp та ін. Для кожного формату файлів розроблені відповід- ні сценарії їхньої обробки. Під сценарієм ми розуміємо послідовність виконання дій, що необхідні для реалізації визначених завдань, у нашому випадку, виконан- ня наступних операцій (рис. 1): *. doc, *.docx, *.txt *. xls, *.xlsx *. pdf, *.djvu *.rar Інший файл *.jpg, *.bmp, *.gif Архівування Перегляд, відкриття Зміна типу Редагування ІС КІАС Сценарії Рис. 1. Схема автоматизованої обробки електронних документів Реалізація методу потокового введення документів, що зберігаються в електронному вигляді ISSN 1560-9189 Реєстрація, зберігання і обробка даних, 2009, Т. 11, № 3 37 1) архівування — архівація файлів, розархівування файлів; 2) редагування — відкриття документа для внесення змін; 3) перегляду — відкриття файлу, зчитування метаданих файлу та занесення їх та електронного графічного образу документа до ІС КІАС; 4) зміни типу — зміна формату файлу. Для прикладу розглянемо сценарій перегляду файлів. Для даного сценарію був розроблений відповідний алгоритм його реалізації, тобто кінцевий опис конк- ретної послідовності дій, що потрібно виконати за певний час для досягнення ре- зультату вирішення задач [6]. Спочатку користувач вибирає необхідний файл, після чого в автоматичному режимі зчитується інформація про цей файл, а саме: дата створення, розмір фай- лу, дата останнього відкриття файлу, формат файлу, його фізична адреса, та відо- бражається ця інформація на екрані автоматизованого робочого міста користува- ча. Це досягається завдяки розробленому алгоритму зчитування атрибутів файлу. У разі, якщо користувач відкриває файл для перегляду, файл відкривається авто- матично у тій програмі, в якій файли даного формату відкриваються за замовчан- ням. Для реалізації даної можливості був розроблений алгоритм завантаження не- обхідних бібліотек для відкриття файлу перед користувачем. У разі, якщо формат файлу невідомий, користувачеві пропонується самостійно вибрати необхідну про- граму для відкриття та перегляду файлу. На базі удосконаленого методу ПВД розроблений програмний комплекс, що працює згідно такого алгоритму (рис. 2): 1) користувачеві пропонується вибрати необхідний файл (див. рис. 3); 2) перевіряється наявність вибраного файлу, зчитуються його атрибути, ви- значається формат файлу; 3) користувач може переглянути атрибути вибраного файлу або перейти до вибору сценаріїв (див. рис. 4); 4) визначається сценарій, який можна застосувати до цього формату файлу; 5) користувач обирає доступні сценарії обробки файлу, або може вибрати інший файл; 6) у тому випадку, якщо був вибраний один із сценаріїв обробки файлу, проводиться обробка файлу за заданим сценарієм, записується інформація до бази даних і виводиться службова інформація про хід виконання того чи іншого сцена- рію; 7) після успішної чи невдалої роботи сценарію, пропонується вибрати інший файл чи закінчити роботу. Нижче наведені приклади екранних форм інтерфейсу користувача розробле- ного програмного комплексу, а саме: екранна форма вибору файлу для подальшої інтеграції до ІС КІАС (рис. 3) та екранна форма відображення атрибутів вибрано- го файлу (рис. 4). О. В. Коваль, О. В. Карабчук 38 Рис. 2. Алгоритм функціонування програмного комплексу, що реалізує запропонований удосконалений метод ПВД Реалізація методу потокового введення документів, що зберігаються в електронному вигляді ISSN 1560-9189 Реєстрація, зберігання і обробка даних, 2009, Т. 11, № 3 39 Рис. 3. Приклад екранних форм інтерфейсу користувача програмного комплексу. Вибір файлу користувачем Рис. 4. Приклад екранних форм інтерфейсу користувача програмного комплексу. Відображення атрибутів вибраного файлу Для реалізації програмного комплексу на базі удосконаленого методу ПВД була розроблена база даних (рис. 5), в якій у таблицях «Файл_зображення», «Файл_doc_txt», «Файл_rar», «Файл_pdf», «Файл_інше», зберігаються електронні копії документів. Таким чином, після визначення типу файлу, він автоматично заноситься до тієї таблиці, в якій зберігаються файли відповідного типу. Як при- клад файл у форматі «doc», буде занесено в таблицю «Файл_doc_txt». Натомість у таблиці «Документ» зберігаються метадані документів. Такий варіант реалізації необхідний для реалізації сценаріїв обробки файлів і забезпечує оперативність пошуку необхідного документа, що відповідно зменшує навантаження на БД. Усі О. В. Коваль, О. В. Карабчук 40 інші таблиці БД є інформаційно-довідковими. Таблиці «Логін» і «Пароль» забез- печують регламент доступу до програмного комплексу. Логин PK Логін Пароль FK1 Код_роботи Дата_реєстрації Тип_роботи PK Код Назва Опис Логін Співробітники PK,FK1 Код Прізвище Ім'я По-батькові Телефон Посада Тип_Файлів PK,FK1,FK2,FK3,FK4,FK5 Код Назва Опис Документ PK Номер Код_органу Дата_реєстрац ії Тема Зміст Текст Код_підпису Код_виконавця Код_файлу FK1,FK2,FK3,FK4,FK5 Код Код_документу Орган PK,FK1 Код Назва Опис Керівник PK,FK1 Код Ім'я Прізвище Орган Посада Номер номер Файл_Зображення PK Код Код_типу Файл Опис Дата_створення Власник Дата_зміни Файл_pdf PK Код Код_типу Файл Опис Дата_створення Власник Дата_зміни Файл_rar PK Код Код_типу Файл Опис Дата_створення Власник Дата_зміни Файл_інше PK Код Код_типу Файл Опис Дата_створення Власник Дата_зміни Файл_doc_txt PK Код Код_типу Файл Опис Дата_створення Власник Дата_зміни Документи PK,FK1 Код Назва Опис Рис. 5. Структура бази даних Програмний комплекс був впроваджений як компонент КІАС АТ «Брокбізне- сбанк». Він дозволив створити електронний архів нормативних документів банку, які вже існували у форматі електронних документів. На цей час програмний ком- плекс успішно використовується в роботі управління ризик-менеджменту АТ «Брокбізнесбанк», що значно спрощує пошук документів і дає змогу співробітни- Реалізація методу потокового введення документів, що зберігаються в електронному вигляді ISSN 1560-9189 Реєстрація, зберігання і обробка даних, 2009, Т. 11, № 3 41 кам управління ризик-менеджменту АТ «Брокбізнесбанк» оперативно знаходити необхідні документи, таким чином заощаджуючи робочий час працівників. Висновки Запропоновано удосконалений метод потокового введення документів, який вирішує задачу інтеграції до КІАС документів, графічні образи яких існують ли- ше у форматі електронного документа. На базі цього методу розроблено алгоритм автоматизованої обробки зазначеного електронного документа та збереження ме- таданих і графічного образу документа в інформаційному сховищі КІАС. Доку- менти розпізнаються та зберігаються як файли різних форматів. Було розроблено програмний комплекс, який реалізує зазначений алгоритм і використовується як компонент відповідної КІАС. 1. Нестеренко О.В. Основи побудови автоматизованих інформаційно-аналітичних систем органів державної влади / О.В. Нестеренко. — К.: Наук. думка, 2005. — 628 с. 2. Электронные документы в корпоративных сетях: второе пришествие Гутенберга / [Кли- менко С.В., Крохин И.В., Кущ В.М., Гагутин Ю.Л.]. — Москва: Анкей: Экотрендз, 1999. — 271 с. — (Технологии электронных коммуникаций). 3. Пашков Д.В. Обзор современных систем автоматизации делопроизводства и документо- оборота / Д.В. Пашков // Документооборот и Делопроизводство. — 2004. — № 5. — С. 10–19. 4. Хашковский В.В. Разработка и исследование методов организации параллельно-кон- вейерных систем массового ввода / В.В. Хашковский. — Таганрог: ООО «Антон», 2002. — 166 с. 5. Юмин И.Ф. Электронные документы и архивы: теория и практика / И.Ф. Юмин // Отеч. арх. — 1999. — № 3. — С. 109–112 . 6. Англо-український тлумачний словник з обчислювальної техніки, Інтернету і програму- вання. [авт.-уклад. Е.М. Пройдаков, Л.А. Теплицкий]. — К.: Видавничий дім «СофтПрес», 2006. — 824 с. Надійшла до редакції 17.06.2009