Реалізація методу потокового введення документів, що зберігаються в електронному вигляді
Розглянуто питання потокового введення інформації. Запропоновано реалізацію методу потокового введення документів, що перебувають в електронному вигляді. Рассмотрены вопросы потокового ввода информации. Предложена реализация усовершенствованного метода потокового ввода документов, хранящихся в элект...
Збережено в:
| Опубліковано в: : | Реєстрація, зберігання і обробка даних |
|---|---|
| Дата: | 2009 |
| Автори: | , |
| Формат: | Стаття |
| Мова: | Ukrainian |
| Опубліковано: |
Інститут проблем реєстрації інформації НАН України
2009
|
| Теми: | |
| Онлайн доступ: | https://nasplib.isofts.kiev.ua/handle/123456789/50389 |
| Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Цитувати: | Реалізація методу потокового введення документів, що зберігаються в електронному вигляді / О.В. Коваль, О.В. Карабчук // Реєстрація, зберігання і обробка даних. — 2009. — Т. 11, № 3. — С. 34-41. — Бібліогр.: 6 назв. — укр. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraine| id |
nasplib_isofts_kiev_ua-123456789-50389 |
|---|---|
| record_format |
dspace |
| spelling |
Коваль, О.В. Карабчук, О.В. 2013-10-16T22:07:23Z 2013-10-16T22:07:23Z 2009 Реалізація методу потокового введення документів, що зберігаються в електронному вигляді / О.В. Коваль, О.В. Карабчук // Реєстрація, зберігання і обробка даних. — 2009. — Т. 11, № 3. — С. 34-41. — Бібліогр.: 6 назв. — укр. 1560-9189 https://nasplib.isofts.kiev.ua/handle/123456789/50389 681.3 Розглянуто питання потокового введення інформації. Запропоновано реалізацію методу потокового введення документів, що перебувають в електронному вигляді. Рассмотрены вопросы потокового ввода информации. Предложена реализация усовершенствованного метода потокового ввода документов, хранящихся в электронном виде. The questions of stream information input are considered. The advanced method of stream input of documents which are in an electronic form is offered. uk Інститут проблем реєстрації інформації НАН України Реєстрація, зберігання і обробка даних Інформаційно-аналітичні системи обробки даних Реалізація методу потокового введення документів, що зберігаються в електронному вигляді Реализация метода потокового ввода документов, хранящихся в электронном виде Implementation of a Method of Stream Input of Documents being Saved in an Electronic Form Article published earlier |
| institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| collection |
DSpace DC |
| title |
Реалізація методу потокового введення документів, що зберігаються в електронному вигляді |
| spellingShingle |
Реалізація методу потокового введення документів, що зберігаються в електронному вигляді Коваль, О.В. Карабчук, О.В. Інформаційно-аналітичні системи обробки даних |
| title_short |
Реалізація методу потокового введення документів, що зберігаються в електронному вигляді |
| title_full |
Реалізація методу потокового введення документів, що зберігаються в електронному вигляді |
| title_fullStr |
Реалізація методу потокового введення документів, що зберігаються в електронному вигляді |
| title_full_unstemmed |
Реалізація методу потокового введення документів, що зберігаються в електронному вигляді |
| title_sort |
реалізація методу потокового введення документів, що зберігаються в електронному вигляді |
| author |
Коваль, О.В. Карабчук, О.В. |
| author_facet |
Коваль, О.В. Карабчук, О.В. |
| topic |
Інформаційно-аналітичні системи обробки даних |
| topic_facet |
Інформаційно-аналітичні системи обробки даних |
| publishDate |
2009 |
| language |
Ukrainian |
| container_title |
Реєстрація, зберігання і обробка даних |
| publisher |
Інститут проблем реєстрації інформації НАН України |
| format |
Article |
| title_alt |
Реализация метода потокового ввода документов, хранящихся в электронном виде Implementation of a Method of Stream Input of Documents being Saved in an Electronic Form |
| description |
Розглянуто питання потокового введення інформації. Запропоновано реалізацію методу потокового введення документів, що перебувають в електронному вигляді.
Рассмотрены вопросы потокового ввода информации. Предложена реализация усовершенствованного метода потокового ввода документов, хранящихся в электронном виде.
The questions of stream information input are considered. The advanced method of stream input of documents which are in an electronic form is offered.
|
| issn |
1560-9189 |
| url |
https://nasplib.isofts.kiev.ua/handle/123456789/50389 |
| citation_txt |
Реалізація методу потокового введення документів, що зберігаються в електронному вигляді / О.В. Коваль, О.В. Карабчук // Реєстрація, зберігання і обробка даних. — 2009. — Т. 11, № 3. — С. 34-41. — Бібліогр.: 6 назв. — укр. |
| work_keys_str_mv |
AT kovalʹov realízacíâmetodupotokovogovvedennâdokumentívŝozberígaûtʹsâvelektronnomuviglâdí AT karabčukov realízacíâmetodupotokovogovvedennâdokumentívŝozberígaûtʹsâvelektronnomuviglâdí AT kovalʹov realizaciâmetodapotokovogovvodadokumentovhranâŝihsâvélektronnomvide AT karabčukov realizaciâmetodapotokovogovvodadokumentovhranâŝihsâvélektronnomvide AT kovalʹov implementationofamethodofstreaminputofdocumentsbeingsavedinanelectronicform AT karabčukov implementationofamethodofstreaminputofdocumentsbeingsavedinanelectronicform |
| first_indexed |
2025-11-25T13:51:25Z |
| last_indexed |
2025-11-25T13:51:25Z |
| _version_ |
1850516145415651328 |
| fulltext |
Інформаційно-аналітичні системи
обробки даних
34
УДК 681.3
О. В. Коваль, О. В. Карабчук
Інститут проблем реєстрації інформації НАН України
вул. М. Шпака, 2, 03113 Київ, Україна
e-mail: svr@cki.ipri.kiev.ua
Реалізація методу потокового введення документів,
що зберігаються в електронному вигляді
Розглянуто питання потокового введення інформації. Запропоновано
реалізацію методу потокового введення документів, що перебувають
в електронному вигляді.
Ключові слова: системи автоматизації документообігу, реєстрацій-
на карта документа, потокове введення документів, електронний ар-
хів, інформаційне сховище.
Вступ
Потоки вхідної інформації корпоративних інформаційно-аналітичних систем
(КІАС) надзвичайно різноманітні за джерелами і формами її подання. Вхідну ін-
формацію за формою збереження можна умовно класифікувати на електронні до-
кументи і паперові. Під терміном «електронний документ» зазвичай розуміється
текстовий файл, документ MS Word, електронна таблиця MS Excel, графічний
файл, кілька взаємозалежних файлів різних форматів тощо. Прийом вхідної інфо-
рмації в КІАС базується, як правило, на використанні засобів електронного доку-
ментообігу [1, 2], у тому числі систем автоматизації документообігу (САД) [3] і
систем потокового сканування-розпізнавання.
САД здійснюють інтеграцію в інформаційне сховище (ІС) КІАС електронних
документів, які надходять із використанням електронної пошти, Інтранет-техно-
логій та інше. Під інтеграцією у даному контексті слід розуміти виконання таких
основних етапів автоматизованої обробки документів, що надходять до КІАС:
прийом, реєстрація (формування реєстраційної картки) та розміщення даних про
документ (метаданих) у документальній базі даних. Самі електронні документи
зберігаються в спеціальних інформаційних сховищах чи у файлах операційної си-
стеми. На сьогоднішній день САД в Україні досить широко представлені як укра-
їнськими розробниками програмних комплексів, так і закордонними [1]. САД на-
дає широкі пошукові можливості для швидкого та зручного одержання будь-якої
© О. В. Коваль, О. В. Карабчук
Реалізація методу потокового введення документів, що зберігаються в електронному вигляді
ISSN 1560-9189 Реєстрація, зберігання і обробка даних, 2009, Т. 11, № 3 35
інформації про електронні документи, накопичені й збережені в інформаційному
сховищі КІАС.
Однак, якщо документи надходять у паперовому вигляді, то інтеграція доку-
ментів у ІС КІАС реалізується за допомогою систем потокового сканування-роз-
пізнавання, які базуються на технології потокового введення документів (ПВД).
Потокове введення документів — це процес отримання графічного образу папе-
рового документа у форматі електронного документа та подальшої роботи з ним у
залежності від поставлених задач [4]. На відміну від САД системи потокового
сканування-розпізнавання забезпечують можливість збереження графічного обра-
зу документа в базі даних. Процес інтеграції документів із використанням ПВД в
ІС КІАС [5] включає в себе наступну послідовність дій:
1) підготовку до сканування — розшивку, сортування документів, підготов-
ку листів нестандартних розмірів і пошкоджених документів;
2) сканування — підбір параметрів сканування для отримання максимально
чіткого зображення, фільтрацію фону для старих архівних документів, сортування
різноформатних документів, вирівнювання листів, повторне сканування у випадку
недостатньої якості зображення;
3) обробку — повнотекстове розпізнавання, зональне розпізнавання, іден-
тифікацію форм;
4) атрибутування — формування метаданих (атрибутів) про документ;
5) верифікацію — перевірку атрибутів, що вводяться, незалежну перевірку
двома операторами;
6) контроль якості — на цьому етапі проходить ручний розбір документа,
при неможливості автоматичної обробки, або зміна документа;
7) експорт — формування шаблону документа (отримання графічного обра-
зу паперового документа у форматі електронного документа) в залежності від си-
стеми управління базами даних або САД, що використовуються, та розміщення
його у відповідне інформаційне сховище із забезпеченням доступу до нього.
На сьогоднішній день вже існує багато систем, в яких інтеграція документів у
ІС КІАС реалізується за допомогою систем потокового сканування-розпізнавання,
які базуються на технології ПВД. Серед найбільш відомих, що були досліджені,
можна назвати такі як ABBYY FineReader Банк, FormReader, система «ДЕЛО»,
система групи компаній «Ланит». Але наявні системи орієнтовані лише на роботу
з паперовими документами, повністю виключаючи можливість роботи з електро-
нними копіями паперового документа.
Виходячи із зазначених вище процесів інтеграції документів у ІС КІАС із ви-
користанням САД і ПВД, можна зробити висновок, що вони не забезпечують ін-
теграцію графічного образу паперового документа у форматі електронного доку-
мента, якщо такий електронний документ вже існує до процесу інтеграції. А, вра-
ховуючи те, що в сучасних КІАС практично стандартом стає забезпечення досту-
пу до графічного образу паперового документа, що інтегруються в КІАС, тобто
створення інформаційного сховища документів — програмно-апаратного компле-
ксу, що вирішує задачі введення і зберігання електронних графічних образів до-
кументів, а також доступу до них, то постає задача створення засобів інтеграції
графічного образу паперового документа, що існує в форматі електронного доку-
мента, в КІАС.
О. В. Коваль, О. В. Карабчук
36
Метод потокового введення документів, що зберігаються
в електронному вигляді, до корпоративних
інформаційно-аналітичних систем
Вирішити зазначену задачу можливо, використовуючи ті підходи, що реалі-
зовані в САД і ПВД. Пропонується удосконалений метод ПВД, суть якого полягає
в тому, що такі етапи ПВД як підготовка до сканування, сканування та обробка
документа виключаються, а натомість впроваджується розширений етап автома-
тизованої обробки електронних документів, подібний наявному в САД.
За удосконаленим методом ПВД здійснюється обробка електронних докуме-
нтів, які існують у вигляді файлів наступних форматів: doc, docx, xls, xslx, txt, rtf,
rar, pdf, djvu, jpg, gif, bmp та ін. Для кожного формату файлів розроблені відповід-
ні сценарії їхньої обробки. Під сценарієм ми розуміємо послідовність виконання
дій, що необхідні для реалізації визначених завдань, у нашому випадку, виконан-
ня наступних операцій (рис. 1):
*. doc,
*.docx,
*.txt
*. xls,
*.xlsx
*. pdf,
*.djvu
*.rar
Інший
файл
*.jpg,
*.bmp,
*.gif
Архівування
Перегляд,
відкриття
Зміна типу
Редагування
ІС
КІАС
Сценарії
Рис. 1. Схема автоматизованої обробки електронних документів
Реалізація методу потокового введення документів, що зберігаються в електронному вигляді
ISSN 1560-9189 Реєстрація, зберігання і обробка даних, 2009, Т. 11, № 3 37
1) архівування — архівація файлів, розархівування файлів;
2) редагування — відкриття документа для внесення змін;
3) перегляду — відкриття файлу, зчитування метаданих файлу та занесення
їх та електронного графічного образу документа до ІС КІАС;
4) зміни типу — зміна формату файлу.
Для прикладу розглянемо сценарій перегляду файлів. Для даного сценарію
був розроблений відповідний алгоритм його реалізації, тобто кінцевий опис конк-
ретної послідовності дій, що потрібно виконати за певний час для досягнення ре-
зультату вирішення задач [6].
Спочатку користувач вибирає необхідний файл, після чого в автоматичному
режимі зчитується інформація про цей файл, а саме: дата створення, розмір фай-
лу, дата останнього відкриття файлу, формат файлу, його фізична адреса, та відо-
бражається ця інформація на екрані автоматизованого робочого міста користува-
ча. Це досягається завдяки розробленому алгоритму зчитування атрибутів файлу.
У разі, якщо користувач відкриває файл для перегляду, файл відкривається авто-
матично у тій програмі, в якій файли даного формату відкриваються за замовчан-
ням. Для реалізації даної можливості був розроблений алгоритм завантаження не-
обхідних бібліотек для відкриття файлу перед користувачем. У разі, якщо формат
файлу невідомий, користувачеві пропонується самостійно вибрати необхідну про-
граму для відкриття та перегляду файлу.
На базі удосконаленого методу ПВД розроблений програмний комплекс, що
працює згідно такого алгоритму (рис. 2):
1) користувачеві пропонується вибрати необхідний файл (див. рис. 3);
2) перевіряється наявність вибраного файлу, зчитуються його атрибути, ви-
значається формат файлу;
3) користувач може переглянути атрибути вибраного файлу або перейти до
вибору сценаріїв (див. рис. 4);
4) визначається сценарій, який можна застосувати до цього формату файлу;
5) користувач обирає доступні сценарії обробки файлу, або може вибрати
інший файл;
6) у тому випадку, якщо був вибраний один із сценаріїв обробки файлу,
проводиться обробка файлу за заданим сценарієм, записується інформація до бази
даних і виводиться службова інформація про хід виконання того чи іншого сцена-
рію;
7) після успішної чи невдалої роботи сценарію, пропонується вибрати інший
файл чи закінчити роботу.
Нижче наведені приклади екранних форм інтерфейсу користувача розробле-
ного програмного комплексу, а саме: екранна форма вибору файлу для подальшої
інтеграції до ІС КІАС (рис. 3) та екранна форма відображення атрибутів вибрано-
го файлу (рис. 4).
О. В. Коваль, О. В. Карабчук
38
Рис. 2. Алгоритм функціонування програмного комплексу, що реалізує запропонований
удосконалений метод ПВД
Реалізація методу потокового введення документів, що зберігаються в електронному вигляді
ISSN 1560-9189 Реєстрація, зберігання і обробка даних, 2009, Т. 11, № 3 39
Рис. 3. Приклад екранних форм інтерфейсу користувача програмного комплексу.
Вибір файлу користувачем
Рис. 4. Приклад екранних форм інтерфейсу користувача програмного комплексу.
Відображення атрибутів вибраного файлу
Для реалізації програмного комплексу на базі удосконаленого методу ПВД
була розроблена база даних (рис. 5), в якій у таблицях «Файл_зображення»,
«Файл_doc_txt», «Файл_rar», «Файл_pdf», «Файл_інше», зберігаються електронні
копії документів. Таким чином, після визначення типу файлу, він автоматично
заноситься до тієї таблиці, в якій зберігаються файли відповідного типу. Як при-
клад файл у форматі «doc», буде занесено в таблицю «Файл_doc_txt». Натомість у
таблиці «Документ» зберігаються метадані документів. Такий варіант реалізації
необхідний для реалізації сценаріїв обробки файлів і забезпечує оперативність
пошуку необхідного документа, що відповідно зменшує навантаження на БД. Усі
О. В. Коваль, О. В. Карабчук
40
інші таблиці БД є інформаційно-довідковими. Таблиці «Логін» і «Пароль» забез-
печують регламент доступу до програмного комплексу.
Логин
PK Логін
Пароль
FK1 Код_роботи
Дата_реєстрації
Тип_роботи
PK Код
Назва
Опис
Логін
Співробітники
PK,FK1 Код
Прізвище
Ім'я
По-батькові
Телефон
Посада
Тип_Файлів
PK,FK1,FK2,FK3,FK4,FK5 Код
Назва
Опис
Документ
PK Номер
Код_органу
Дата_реєстрац ії
Тема
Зміст
Текст
Код_підпису
Код_виконавця
Код_файлу
FK1,FK2,FK3,FK4,FK5 Код
Код_документу
Орган
PK,FK1 Код
Назва
Опис
Керівник
PK,FK1 Код
Ім'я
Прізвище
Орган
Посада
Номер
номер
Файл_Зображення
PK Код
Код_типу
Файл
Опис
Дата_створення
Власник
Дата_зміни
Файл_pdf
PK Код
Код_типу
Файл
Опис
Дата_створення
Власник
Дата_зміни
Файл_rar
PK Код
Код_типу
Файл
Опис
Дата_створення
Власник
Дата_зміни
Файл_інше
PK Код
Код_типу
Файл
Опис
Дата_створення
Власник
Дата_зміни
Файл_doc_txt
PK Код
Код_типу
Файл
Опис
Дата_створення
Власник
Дата_зміни
Документи
PK,FK1 Код
Назва
Опис
Рис. 5. Структура бази даних
Програмний комплекс був впроваджений як компонент КІАС АТ «Брокбізне-
сбанк». Він дозволив створити електронний архів нормативних документів банку,
які вже існували у форматі електронних документів. На цей час програмний ком-
плекс успішно використовується в роботі управління ризик-менеджменту АТ
«Брокбізнесбанк», що значно спрощує пошук документів і дає змогу співробітни-
Реалізація методу потокового введення документів, що зберігаються в електронному вигляді
ISSN 1560-9189 Реєстрація, зберігання і обробка даних, 2009, Т. 11, № 3 41
кам управління ризик-менеджменту АТ «Брокбізнесбанк» оперативно знаходити
необхідні документи, таким чином заощаджуючи робочий час працівників.
Висновки
Запропоновано удосконалений метод потокового введення документів, який
вирішує задачу інтеграції до КІАС документів, графічні образи яких існують ли-
ше у форматі електронного документа. На базі цього методу розроблено алгоритм
автоматизованої обробки зазначеного електронного документа та збереження ме-
таданих і графічного образу документа в інформаційному сховищі КІАС. Доку-
менти розпізнаються та зберігаються як файли різних форматів. Було розроблено
програмний комплекс, який реалізує зазначений алгоритм і використовується як
компонент відповідної КІАС.
1. Нестеренко О.В. Основи побудови автоматизованих інформаційно-аналітичних систем
органів державної влади / О.В. Нестеренко. — К.: Наук. думка, 2005. — 628 с.
2. Электронные документы в корпоративных сетях: второе пришествие Гутенберга / [Кли-
менко С.В., Крохин И.В., Кущ В.М., Гагутин Ю.Л.]. — Москва: Анкей: Экотрендз, 1999. — 271 с.
— (Технологии электронных коммуникаций).
3. Пашков Д.В. Обзор современных систем автоматизации делопроизводства и документо-
оборота / Д.В. Пашков // Документооборот и Делопроизводство. — 2004. — № 5. — С. 10–19.
4. Хашковский В.В. Разработка и исследование методов организации параллельно-кон-
вейерных систем массового ввода / В.В. Хашковский. — Таганрог: ООО «Антон», 2002. — 166 с.
5. Юмин И.Ф. Электронные документы и архивы: теория и практика / И.Ф. Юмин // Отеч.
арх. — 1999. — № 3. — С. 109–112 .
6. Англо-український тлумачний словник з обчислювальної техніки, Інтернету і програму-
вання. [авт.-уклад. Е.М. Пройдаков, Л.А. Теплицкий]. — К.: Видавничий дім «СофтПрес», 2006. —
824 с.
Надійшла до редакції 17.06.2009
|