Analysis of formal models and standards for structured electronic document in corporate informational system

Permanent acceleration of development of information technologies and the resulting changes in typical business processes of organizations create new forms of complexity of electronic document flow while creating modern corporate information systems. The main task in mapping structured documents to...

Повний опис

Збережено в:
Бібліографічні деталі
Дата:2018
Автори: Sharypanov, A.V., Shchetynin, I.E., Ivanov, S.M.
Формат: Стаття
Мова:Ukrainian
Опубліковано: Інститут програмних систем НАН України 2018
Теми:
Онлайн доступ:https://pp.isofts.kiev.ua/index.php/ojs1/article/view/250
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Problems in programming
Завантажити файл: Pdf

Репозитарії

Problems in programming
id pp_isofts_kiev_ua-article-250
record_format ojs
resource_txt_mv ppisoftskievua/7a/75e3fe8a866e14eee2489b385b384d7a.pdf
spelling pp_isofts_kiev_ua-article-2502024-04-28T11:34:16Z Analysis of formal models and standards for structured electronic document in corporate informational system Анализ формальных моделей и стандартов описания структуриро-ванного электронного документа в корпоративной информационной системе Аналіз формальних моделей та стандартів опису структурованого електронного документа в корпоративній інформаційній системі Sharypanov, A.V. Shchetynin, I.E. Ivanov, S.M. structured electronic document; electronic document flow; corporate information system UDC 004.62, 004.63 структурированный электронный документ, электронный документооборот; корпоративная информационная система УДК 004.62, 004.63 структурований електронний документ; електронний документообіг; корпоративна інформаційна система УДК 004.62, 004.63 Permanent acceleration of development of information technologies and the resulting changes in typical business processes of organizations create new forms of complexity of electronic document flow while creating modern corporate information systems. The main task in mapping structured documents to electronic form is to define the universal mechanism of document markup and to determine its specific information fragments for correct interpretation in software applications. A comparative overview of the existing languages for describing structured electronic documents and the standards on which they are based is provided. The advantages and disadvantages of their use for addressing typical tasks of electronic document flow organization that arise while developing corporate information systems are determined.Problems in programming 2018; 1: 128-146 Постоянное ускорение развития информационных технологий и вызванные этим изменения в типовых бизнес-процессах организаций порождают новые формы сложности электронного документооборота при создании современных корпоративных информационных систем. Основной задачей при отображении структурированных документов в электронную форму является определение универсального механизма разметки документа и выделение его отдельных информационных фрагментов для правильной интерпретации в программных приложениях. Представлен сравнительный обзор существующих языков описания структурированных электронных до­кументов и стандартов, на которых они основаны. Определяются преимущества и недостатки их использования применительно к типовым задачам организации электронного документооборота, возникающим при проектировании корпоративных информационных систем.Problems in programming 2018; 1: 128-146 Постійне прискорення розвитку інформаційних технологій та викликані цим зміни у типових бізнес-процесах організацій породжують нові форми складності електронного документообігу при створенні сучасних корпоративних інформаційних систем. Основним завданням при відображенні структурованих документів у електронну форму є визначення універсального механізму розмітки документа та виділення його окремих інформаційних фрагментів для правильної їх інтерпретації в програмних застосунках. Надається порівняльний огляд існуючих мов опису структурованих електронних документів та стандартів, на яких вони засновані. Визначаються переваги і недоліки їх застосування відповідно до типових задач організації електронного документообігу, що виникають при проектуванні корпоративної інформаційної системи.Problems in programming 2018; 1: 128-146 Інститут програмних систем НАН України 2018-10-09 Article Article application/pdf https://pp.isofts.kiev.ua/index.php/ojs1/article/view/250 10.15407/pp2018.01.128 PROBLEMS IN PROGRAMMING; No 1 (2018); 128-146 ПРОБЛЕМЫ ПРОГРАММИРОВАНИЯ; No 1 (2018); 128-146 ПРОБЛЕМИ ПРОГРАМУВАННЯ; No 1 (2018); 128-146 1727-4907 10.15407/pp2018.01 uk https://pp.isofts.kiev.ua/index.php/ojs1/article/view/250/246 Copyright (c) 2018 PROBLEMS OF PROGRAMMING
institution Problems in programming
baseUrl_str https://pp.isofts.kiev.ua/index.php/ojs1/oai
datestamp_date 2024-04-28T11:34:16Z
collection OJS
language Ukrainian
topic structured electronic document
electronic document flow
corporate information system
UDC 004.62
004.63
spellingShingle structured electronic document
electronic document flow
corporate information system
UDC 004.62
004.63
Sharypanov, A.V.
Shchetynin, I.E.
Ivanov, S.M.
Analysis of formal models and standards for structured electronic document in corporate informational system
topic_facet structured electronic document
electronic document flow
corporate information system
UDC 004.62
004.63
структурированный электронный документ
электронный документооборот; корпоративная информационная система
УДК 004.62
004.63
структурований електронний документ
електронний документообіг
корпоративна інформаційна система
УДК 004.62
004.63
format Article
author Sharypanov, A.V.
Shchetynin, I.E.
Ivanov, S.M.
author_facet Sharypanov, A.V.
Shchetynin, I.E.
Ivanov, S.M.
author_sort Sharypanov, A.V.
title Analysis of formal models and standards for structured electronic document in corporate informational system
title_short Analysis of formal models and standards for structured electronic document in corporate informational system
title_full Analysis of formal models and standards for structured electronic document in corporate informational system
title_fullStr Analysis of formal models and standards for structured electronic document in corporate informational system
title_full_unstemmed Analysis of formal models and standards for structured electronic document in corporate informational system
title_sort analysis of formal models and standards for structured electronic document in corporate informational system
title_alt Анализ формальных моделей и стандартов описания структуриро-ванного электронного документа в корпоративной информационной системе
Аналіз формальних моделей та стандартів опису структурованого електронного документа в корпоративній інформаційній системі
description Permanent acceleration of development of information technologies and the resulting changes in typical business processes of organizations create new forms of complexity of electronic document flow while creating modern corporate information systems. The main task in mapping structured documents to electronic form is to define the universal mechanism of document markup and to determine its specific information fragments for correct interpretation in software applications. A comparative overview of the existing languages for describing structured electronic documents and the standards on which they are based is provided. The advantages and disadvantages of their use for addressing typical tasks of electronic document flow organization that arise while developing corporate information systems are determined.Problems in programming 2018; 1: 128-146
publisher Інститут програмних систем НАН України
publishDate 2018
url https://pp.isofts.kiev.ua/index.php/ojs1/article/view/250
work_keys_str_mv AT sharypanovav analysisofformalmodelsandstandardsforstructuredelectronicdocumentincorporateinformationalsystem
AT shchetyninie analysisofformalmodelsandstandardsforstructuredelectronicdocumentincorporateinformationalsystem
AT ivanovsm analysisofformalmodelsandstandardsforstructuredelectronicdocumentincorporateinformationalsystem
AT sharypanovav analizformalʹnyhmodelejistandartovopisaniâstrukturirovannogoélektronnogodokumentavkorporativnojinformacionnojsisteme
AT shchetyninie analizformalʹnyhmodelejistandartovopisaniâstrukturirovannogoélektronnogodokumentavkorporativnojinformacionnojsisteme
AT ivanovsm analizformalʹnyhmodelejistandartovopisaniâstrukturirovannogoélektronnogodokumentavkorporativnojinformacionnojsisteme
AT sharypanovav analízformalʹnihmodelejtastandartívopisustrukturovanogoelektronnogodokumentavkorporativníjínformacíjníjsistemí
AT shchetyninie analízformalʹnihmodelejtastandartívopisustrukturovanogoelektronnogodokumentavkorporativníjínformacíjníjsistemí
AT ivanovsm analízformalʹnihmodelejtastandartívopisustrukturovanogoelektronnogodokumentavkorporativníjínformacíjníjsistemí
first_indexed 2024-09-16T04:07:39Z
last_indexed 2024-09-16T04:07:39Z
_version_ 1818527840917782528
fulltext Методи, моделі та стандарти створення структурованих електронних документів © А.В. Шарипанов, І.Є. Щетинін, С.М. Іванов, 2018 128 ISSN 1727-4907. Проблеми програмування. 2018. № 1 УДК 004.62, 004.63 А.В. Шарипанов, І.Є. Щетинін, С.М. Іванов АНАЛІЗ ФОРМАЛЬНИХ МОДЕЛЕЙ ТА СТАНДАРТІВ ОПИСУ СТРУКТУРОВАНОГО ЕЛЕКТРОННОГО ДОКУМЕНТА В КОРПОРАТИВНІЙ ІНФОРМАЦІЙНІЙ СИСТЕМІ Постійне прискорення розвитку інформаційних технологій та викликані цим зміни у типових бізнес- процесах організацій породжують нові форми складності електронного документообігу при створенні сучасних корпоративних інформаційних систем. Основним завданням при відображенні структурова- них документів у електронну форму є визначення універсального механізму розмітки документа та ви- ділення його окремих інформаційних фрагментів для правильної їх інтерпретації в програмних засто- сунках. Надається порівняльний огляд існуючих мов опису структурованих електронних документів та стандартів, на яких вони засновані. Визначаються переваги і недоліки їх застосування відповідно до типових задач організації електронного документообігу, що виникають при проектуванні корпоратив- ної інформаційної системи. Ключові слова: структурований електронний документ, електронний документообіг, корпоративна ін- формаційна система. Вступ Використання розподілених (кор- поративних) обчислювальних мереж і ін- ших засобів, притаманних сучасним інфо- рмаційним технологіям, породжує нові форми складності електронного докумен- тообігу (ЕДО) – це, в тому числі, і розгор- тання ЕДО в умовах географічно та тери- торіально розподілених робочих груп у рамках одного життєвого циклу обробки документів, пов'язаного з різними аспек- тами (видами) діяльності. Основним завданням при створенні формату зберігання структурованих доку- ментів є визначення універсального меха- нізму розмітки документа та виділення окремих інформаційних фрагментів для правильної їх інтерпретації у програмному застосунку, який обробляє документ. Слід зауважити, що обмін структу- рованими документами може відбуватися не тільки в межах власної організації, а й з великою кількістю інших організацій. Оскільки електронні документи (ЕД) мо- жуть зберігатися в архівах протягом три- валого часу, постає задача забезпечення інваріантності відображення документа відносно використовуваних технологій роботи з ЕД. Для успішного вирішення цих задач виникає необхідність стандартизувати фо- рмат розмітки документа з метою ство- рення умов для ефективного ЕДО між ін- формаційними системами всіх його учас- ників. Цього можна досягти, наприклад, за допомогою гармонізації методів і засобів взаємодії між інформаційними системами різних виробників та уніфікації існуючих форматів ЕД. Одним з основних завдань стандар- тизації у цій галузі є створення відкритих форматів ЕД. Відкритий формат – це формат ЕД, що дозволяє переносити цей документ не тільки між різними організаціями, а навіть між різними програмними платформами без спотворення його форми, структури, змісту та продовження роботи з ним. Відк- риті стандарти – це стандарти, які дозво- ляють взаємодіяти різним системам через інтерфейси, встановлені міжнародними консорціумами, які розробляють ці стан- дарти. Найважливішою особливістю збері- гання документів, що відповідають відкри- тим стандартам, є те, що для їх обробки використовуються програми які реалізу- ють ці відкриті стандарти. При цьому фо- Методи, моделі та стандарти створення структурованих електронних документів 129 рмат дозволяє об'єднати в одному докуме- нті як неструктуровані, навіть нередагова- ні фрагменти, так і елементи структурова- ної форми. Таким чином, один формат зберігання може об’єднувати в собі всі вищеописані способи представлення до- кумента в інформаційній технології – від плоского неструктурованого документа до жорстко структурованої електронної фор- ми. Еволюція опису електронних документів В еволюції опису ЕД можна виділи- ти наступні етапи. До 1969 р. використовувалася про- цедура розмітки документів, за якою файл даних містив текстову інформацію, а та- кож інструкції для форматування та відо- браження цієї інформації на екрані. Наві- гація файлом здійснювалася методом вве- дення номерів потрібних рядків. У 1969 р. Чарльз Гольдфарб (Charles F. Goldfarb), Эд Мошер (Ed Mosher) та Рей Лорі (Ray Lorie) розробили концепцію мови розмітки GML [1] для вирішення задач відображення тек- стової інформації. GML була логічним поданням для обґрунтування подальшої обробки тексту, а не лише ще однією аль- тернативою процедурній розмітці. За ре- зультатами подальших досліджень у 1973 р. Чарльз Гольдфарб опублікував звіт, в якому було вказано, що : «...можлива розробка узагальненої мови розмітки, яка стане корисною для більш ніж одного застосунку чи комп’ютерної системи. Така мова обмежить розмітку в середині документу до визначення струк- тури документа та інших атрибутів, на- приклад, за допомогою «тегів». Визначен- ня типу компонента буде мати лише те значення, що його буде оброблено так са- мо, як і інші компоненти того ж типу. Про- те самі команди обробки не будуть місти- тись у тексті, оскільки вони можуть відріз- нятися у різних застосунках та системах оброблення» [2]. У 1975 р. IBM випустила до проми- слової експлуатації комерційний застосу- нок «Document Composing Facility» у яко- му використовувалася GML як мова опису документів, а в 1978 р. опубліковано «Ке- рівництво користувача GML», яке стало базовим документом для розробки станда- рту SGML. Стандарт ISO 8879:1986 «Стандарт- на узагальнена мова розмітки (SGML)» було видано у 1986 р. Поправки та допов- неннями до стандарту вносилися у 1988, 1996 та 1999 рр. і в такому вигляді він діє до цього часу. Останній раз його було пе- реглянуто у 2008 р. [3]. 1989–2000 рр. – Tim Berners–Lee, CERN розробив концепцію розподіленої інформаційної системи для внутрішнього використання в Лабораторії. Система при- значалася для централізованого обліку та зберігання всілякої інформації за експери- ментами, від наукової до адміністративної і мала працювати в режимі з багатьма ко- ристувачами [4]. Вважалося, що структура документів не повинна бути ієрархічною, а документи в новій системі мають містити гіпертекстові посилання (термін «гіпер- текст» – текстові документи, що пов’язані між собою без будь-яких обмежень – ввів ще в 50-х рр. Ted Nelson). Tim Berners–Lee вже мав досвід розробки гіпертекстових систем зберігання даних («Enquire», поча- ток 80-х рр.), однак у новій системі він пропонував не обмежуватися лише тексто- вим вмістом, а говорити про мультимедій- ні документи (для майбутніх реалізацій), які могли би окрім тексту містити графіку, звук та відео. Мовою опису сторінок у но- вій системі стала HTML – мова розмітки гіпертекстового документа для передачі в комп’ютерній мережі, яка була застосун- ком SGML. Після реалізації внутрівідомча інформаційна система набула широкого розповсюдження в академічних колах і за межами CERN – поступово почало розви- ватися те, що нам нині відомо як World Wide Web. В грудні 1994 р. CERN офіцій- но передав на подальший розвиток WWW консорціуму W3C, який було створено кількома місяцями раніше і який очолив Tim Berners–Lee. Кількість користувачів WWW, серверів та сторінок на них стрімко зростала, мова розмітки сторінок також еволюціонувала та набувала нових функ- ціональних властивостей. Виникла необ- хідність стандартизувати мову, що існува- ла у вигляді неформальних специфікацій. Методи, моделі та стандарти створення структурованих електронних документів 130 У 1993 р. один за одним були запропоно- вані 2 незалежних проекти, на базі яких у 1994 р. була створена робоча група при IETF, яка розробила та опублікувала у 1995 р. рекомендацію RFC1866 «Hypertext Markup Language – 2.0». Номер версії було обрано спеціально, щоб відрізняти нову специфікацію від усіх попередніх. До но- вої специфікації увійшли функціональні можливості мови станом на 1994 р. [5]. Через конфлікт інтересів подальша робота щодо стандартизації HTML в робочій гру- пі при IETF зупинилася, тому була органі- зована нова робоча група при W3C, за- вданням якої стала розробка подальших специфікацій HTML. Оновлені версії 3.2, 4.0, 4.01 були опубліковані відповідно у січні 1997 р., грудні 1997 р. та листопаді 1999 р. У 2000 р. за запитом робочої групи із HTML при W3C, IETF випустила спе- цифікацію RFC2854. Ця специфікація не визначала нових стандартів, а була покли- кана відмінити попередні специфікації IETF стосовно HTML, дати посилання на свіжі специфікації W3C з цієї області та видалити HTML з лінійки стандартів, що підтримуються IETF. В тому ж році на під- ставі рекомендації W3C для HTML 4.01 опубліковано міжнародний стандарт ISO/IEC 15445:2000 HyperText Markup Language (HTML). Починаючи з 1996 р. в робочій гру- пі при W3C проводилась адаптація мови SGML для використання в WWW поруч із HTML, результатом якої у 1998 р. став опис мови XML версії 1.0 у вигляді реко- мендації W3C. XML успадкувала від SGML велику кількість рис без змін: роз- поділ фізичної та логічної структури (еле- менти та сутності), можливість перевірки за допомогою граматик, розподіл даних та метаданих (елементи та атрибути), розпо- діл обробки та подання (інструкції для об- робки), синтаксис із застосуванням куто- вих дужок. Будучи застосунком SGML, XML має деякі відмінності, а також міс- тить деякі обмеження, які відсутні в SGML: чутливі до регістру імена елемен- тів; використання в іменах символів Unicode окрім символів ASCII; заборонено використовувати не закриті початкові та кінцеві теги; значення атрибутів вказують- ся напряму (без “ ”), а не як літерали; та інші. З повним переліком відмінностей можна ознайомитися в [6]. За конструкці- єю документи XML відповідають специфі- кації SGML. Стандарт було перевидано 5 разів (останнього разу в 2008 р.) з незнач- ними змінами, що дозволило не збільшу- вати номер його версії. Він на сьогодні актуальний та рекомендується для загаль- ного застосування. У період з 1998 – 2003 роки W3C майже повністю зупинила роботу над HTML та спрямувала зусилля на користь використання XML у веб-технологіях. Але роботи над API HTML продовжували лише окремі виробники веб-браузерів, тим не менш, ці напрацювання пройшли специфікацію та були опубліковані як DOM Level 1 (1998 р.), DOM Level 2 Core и DOM Level 2 HTML (2000–2003 рр.) [7]. Для врахування змін у деяких стан- дартах, на яких спирався XML 1.0 у 2004 р. видано опис мови XML версії 1.1. (перевидано в 2006 р.) [8]. Порівняно з виданням XML 1.0, що існував на той час, в іменах та назвах атрибутів додано підт- римку символів у форматі Unicode 3.2 та наступних версій, змінено підхід до фор- мування імен (в іменах дозволили будь-які символи, що явно не заборонені), уточнено список символів, які розпізнаються як пе- реведення рядка, в документі дозволено використання керуючих символів, які ра- ніше були заборонені, а до цілої низки си- мволів заборонено звернення напряму, тільки за посиланням (кодом). Введено поняття «повної нормалізації документа XML» (канонізації) – переліку обов’язко- вих правил, яких мають додержуватися творці документів, а оброблюючи програ- ми мають їх перевіряти. Використання повної нормалізації дозволяє проводити порівняння імен, значень атрибутів і текс- тового вмісту як бінарне порівняння рядків в Unicode. Версію стандарту було змінено, оскільки нововведення торкнулися визна- чення документів, що раніше вважалися правильно сформованими. Оброблювачі XML-документів версії 1.0, як і раніше мають відкидати документи з новими сим- волами, новими позначеннями кінця ряд- ків та посилань на знову дозволені керуючі Методи, моделі та стандарти створення структурованих електронних документів 131 символи. Вказівка на використання XML- документа стандарту 1.1 міститься в заго- ловній частині визначення документа. Протягом десяти років (2000–2010) робочою групою W3C видано декілька версій стандарту XHTML (остання версія 1.1). XHTML 1.0 переформулює існуючий стандарт HTML 4.01 мовою XML. Таким чином XML-документи з інших застосун- ків можуть мати включення XHTML, а документи XHTML можуть містити части- ни з використанням інших мов розмітки. XHTML 1.0 мав 3 відгалуження: transitional, strict та formset [9]. Відгалу- ження transitional з деякими застереження- ми відповідало HTML 4.01. В процесі ро- боти помічено, що різні організації змі- нюють HTML та XHTML, для отримання нової функціональності за допомогою но- вих тегів. Частіше за все такий підхід при- зводив до повної несумісності отриманих діалектів. Щоб уникнути втрати сумісності в майбутньому, запропонована концепція модульності мови (XHTML Modulariza- tion): мова XHTML розбивається на абст- рактні модулі, з яких можна вибрати необ- хідні при визначенні похідної мови. XHTML 1.0 була перероблена з урахуван- ням цієї концепції, а стандарт отримав но- ву версію 1.1 [10]. Також на базі цієї кон- цепції розроблена рекомендація XHTML Basic, де визначено мінімально необхідний перелік модулів мови для використання на різних мобільних пристроях та з іншими агентами, яким не потрібні всі можливості мови. Одним з вдалих застосувань XHTML Modularization можна вважати похідну мову XHTML+RDFa, що використовується при створенні сторінок для Semantic Web. У відповідності до обраної онтології роз- мічається вміст сторінки і в подальшому смислове наповнення сторінки можна ви- користовувати для різних операцій, напри- клад, для поліпшення результатів пошуку. Проводилася розробка версії стандарту 2.0, опубліковано його робочий варіант, однак W3C вирішив зупинити цей проект на користь роботи над HTML 5.0. Опублікування у 2003 р. запропо- нованої на зміну Web Forms технології XForms викликало новий інтерес до розви- тку самого HTML замість пошуку заміни для нього. Інтерес з’явився в наслідок ус- відомлення, що розгортання XML як веб- технології більше підходить для повністю нових сервісів (наприклад, RSS, пізніше Atom), а не заміни вже працюючих техно- логій (як HTML). Ідею щодо продовження розвитку HTML було розглянуто на семі- нарі W3C у 2004 р. Mozilla й Opera подали декілька головних принципів роботи HTML5 разом з проектом пропозиції сто- совно тільки форм. Пропозиція була від- кинута як така, що суперечить раніше об- раному напрямку розвитку веб-технологій. Співробітники та члени W3C проголосува- ли за продовження оновлення елементів з використанням XML. Незабаром Apple, Mozilla та Opera спільно анонсували свій намір продовжити роботу над HTML5 під юрисдикцією WHATWG. WHATWG спи- ралася на декілька принципів: технології мають бути зворотно сумісними, специфі- кації та реалізації мають збігатися, навіть якщо це потребує змінити специфікацію для відповідності існуючим де-факто реа- лізаціям та специфікації мають бути насті- льки деталізованими, щоб одразу отриму- вати повністю сумісні реалізації, без деко- мпіляції та вивчення кожного окремого рішення для досягнення цього. Остання вимога означала, що до складу специфіка- ції HTML5 необхідно було залучити вміст інших документів: HTML4, XHTML1 та DOM2 HTML. Також це потребувало включення більшої кількості подробиць, ніж вважалося нормальним на той час. В 2006 р. W3C виявила зацікавленість до HTML5 та в 2007 р. створила робочу групу для співробітництва з WHATWG у розро- бці специфікації HTML5. Apple, Mozilla та Opera дозволили W3C опублікувати спе- цифікацію (остання версія від 2014 р.) [7], залишивши версію з менш обмеженою ліцензією на сайті WHATWG, яка постійно оновлюється [11]. Перехід до відкритих форматів представлення ЕД з метою обробки доку- ментів із різнотипним вмістом поступово відбувався і в середовищі офісних засто- сунків. Адже універсальність – це головна перевага такого підходу: при пересиланні документа в певному форматі в будь-яку організацію є впевненість, що його зміст Методи, моделі та стандарти створення структурованих електронних документів 132 буде однозначно інтерпретовано, а при зверненні до ЕД через тривалий час можна забезпечити його відображення у тому самому вигляді, який він мав під час ство- рення. Слід зазначити, що спроби розв'яза- ти проблему створення відкритого форма- ту ЕД були зроблені ще до появи мови XML. У 1993 р. фірма Adobe з метою ви- ключення операції проміжного роздруку- вання документа з типового циклу доку- ментообігу випустила застосунок для створення та обміну ЕД – Adobe Acrobat [12]. Разом з цим застосунком запропоно- вано новий формат опису ЕД, PDF 1.0, специфікація якого одразу була опубліко- вана, а також безкоштовну програму пере- гляду PDF-файлів – Acrobat Reader. Цей формат базувався на спрощеному варіанті процедурної розмітки мовою PostScript, зберігав всі використані при формуванні документа шрифти, міг включати елементи растрової і векторної графіки (можливість додавати анотації, метадані, мультимедійні фрагменти з’явилась згодом) [13, 14]. Ко- жний бажаючий міг ознайомитися з пов- ною версією Специфікації та реалізувати її, але право вносити до неї зміни Adobe тривалий час лишала за собою. Згодом виявилися суттєві недоліки такого (хоча і дуже прогресивного на той час) підходу. По-перше, Специфікація як набір правил не містила конкретних варіантів щодо реа- лізації створення вмісту PDF сторінок. По- друге, Специфікація в деяких частинах була неоднозначною, недостатньо висвіт- лювала окремі питання, а деякі з них вза- галі не розглядала. Це спричинило появу великої кількості документів PDF, які пов- ністю відповідали Специфікації, але могли по-різному (іноді взагалі не правильно) оброблятися існуючим програмним забез- печенням, у тому числі й від Adobe. Такі ситуації враховувалися новими правила, які додавалися до Специфікації, і згодом навіть реалізація Adobe почала відхиляти- ся від опублікованих правил. Оскільки файли PDF мали відображатися однаково на екрані та після роздрукування на папері незалежно від платформи, було прийнято рішення підтримувати всі варіації PDF- файлів у програмі Acrobat Reader. Цей крок спричинив появу ще одного феноме- ну: програма Acrobat Reader (а не формат PDF) стала стандартом “de facto”, з яким почали звірятися виробники програмного забезпечення, де підтримувався формат PDF [15]. У рамках продовження політики переходу до відкритих стандартів предста- влення ЕД, у 2007 р. Adobe передала акту- альну на той час специфікацію PDF 1.7 до ISO, де у 2008 р. видано новий відкритий стандарт ISO 32000-1:2008 “Document management – Portable document format – Part 1: PDF 1.7” [16]. На той час стандарт ще містив окремі частини, захищені патен- тами Adobe (надано публічну ліцензію на їх використання) і реалізованими лише в Adobe, але у наступній версії стандарту, ISO 32000-2:2017 “Document management – Portable document format – Part 2: PDF 2.0” ці частини були повністю вилучені. Нова редакція також описує методи перевірки відповідності стандарту файлів PDF та програм для їх обробки, [17] що має зняти проблему появи діалектів формату та пра- вильного відображення файлів PDF різни- ми застосунками, описану вище. Вперше підмножина PDF/A (А означає «архівний») була стандартизована на рівні ISO у 2005 р. [18]. Цей формат був розроблений відповідно до специфікації PDF 1.4 та призначався для довгостроко- вого зберігання документів з можливістю відтворювати і обробляти їх у майбутньо- му із передбачуваним результатом. Про- грамне забезпечення PDF, що надійно ві- дображає документи у форматі PDF/A, є вільним і доступним. PDF/A є похідним від формату PDF, з якого виключені деякі особливості, що не підходять для довгострокового архівного зберігання документів. Його реалізовано аналогічно визначенню підмножини PDF/X (сімейство стандартів ISO 15930) для цілей друку і поліграфії. Стандарт додатково визначає неве- лику кількість вимог до програмних про- дуктів, які читають файли формату PDF/A. «Сумісний редактор» має дотримуватися певних правил, включаючи керування ко- льором, використання впроваджених шри- фтів при візуалізації документа і створення Методи, моделі та стандарти створення структурованих електронних документів 133 вмісту анотацій, що доступне користува- чам. Стандарт не визначає стратегію зберігання або цілі системи архівування. Він визначає «профіль» – сукупність пара- метрів для ЕД, які гарантують, що доку- мент може бути відтворений у тому само- му вигляді і через декілька років. Ключо- вий елемент відтворюваності документів у форматі PDF/A полягає у вимозі бути на 100 % самодостатніми. Вся інформація, яка необхідна для того, щоб кожен раз ві- дображати документ у незмінному вигляді, впроваджена в файл. Сюди входить (не обмежуючись лише цим) весь візуальний контент документа: текст, растрові зобра- ження і векторна графіка, шрифти й інфо- рмація про колір. Документи формату PDF/A не можуть використовувати зовні- шні посилання на контент (як то аудіо, відео, впровадження коду на JavaScript і команд на запуск виконуваних файлів, шрифтові програми або гіперпосилання). Всі шрифти мають бути впроваджені для необмеженого універсального відображен- ня. Це так само стосується і так званих стандартних шрифтів PostScript, таких як Times або Helvetica. Не дозволено шифру- вання, що зумовлює необмеженість PDF/A, він має бути відкритий та доступний будь-якій людині і програмному продукту, що відтворюють файл. Ідентифікатори користувачів і паролі неприпустимо вбу- довувати. Контроль доступу виконується поза форматом файлу системою керування контентом або системою керування запи- сами [19]. Перші спроби застосування мови XML у офісних застосунках зробила фірма Microsoft у 1998 р., в бета-версії свого па- кета Office 2000: для векторної розмітки (VML), метаданих, файлу маніфесту в прихованому каталозі з ресурсами HTML- сторінки (thicket manifest) та інформації про візуальне подання (presentational information) [20]. В бета-версії Office XP (2000 р.) додано новий формат файлів еле- ктронних таблиць, заснований на XML – spreadsheetML. Цей формат залишився і в офіційному випуску пакета у 2001 р. В 2003 р. вийшов Office 2003 де було пред- ставлено новий формат текстових докуме- нтів, WordprocessingML. Дослухаючись до рекомендацій Європейського Союзу від 24 травня 2004 р. [21] в листопаді 2005 р. Microsoft передала свої XML формати на подальший розгляд та стандартизацію в ECMA International. В квітні 2006 р. техні- чним комітетом ECMA TC45 (до складу якого входять Apple, Barclays Capital, BP, The British Library, Essilor, The Gnome Foundation, Intel, The Library of Congress, Microsoft, NextPage, Novell, Statoil та Toshiba) було підготовлено проект нового стандарту для публічного ознайомлення, а в грудні 2006 р. остаточний варіант проек- ту було прийнято як стандарт ECMA–376 «Office Open XML File Formats» та переда- но для міжнародної стандартизації в ISO. В серпні 2007 р. cпроба провести прийнят- тя стандарту за прискореною процедурою ISO (без його опрацювання в підкомітеті) зірвалася – проект не набрав достатньої кількості голосів на обох стадіях голосу- вання [22] та був відправлений на доопра- цювання у JTC1. Змінений проект було подано на розгляд за прискореною проце- дурою у квітні 2008 р., прийнято і опублі- ковано як стандарт ISO\IEC 29500:2008 «Office Open XML File Formats», у чоти- рьох частинах. Частини стандарту переви- давалися окремо в 2011, 2012, 2015 та 2016 рр. Подальші версії стандарту ECMA–376 приводились у відповідність із діючим стандартом ISO, його п’ята версія відповідає діючому стандарту ISO\IEC 29500 [23]. StarDivision, виробник офісного пакета StarOffice, почала розробку нового формату файлів на базі XML у 1999 р. з метою позбутися обмежень бінарного формату, впровадити підтримку Unicode та отримати відкритий формат, який змогли б використовувати й інші розроб- ники програмного забезпечення. В тому ж році StarDivision придбана Sun Micro- systems, а восени 2000 р. Sun Microsystems запустила новий проект з відкритим ко- дом, OpenOffice.org, в рамках якого про- довжилася робота над відкритим форма- том на базі XML. В 2002 р. вийшов OpenOffice.org 1.0, а новий XML-формат документів став для нього форматом за замовченням. З 2002 р. роботу над новим Методи, моделі та стандарти створення структурованих електронних документів 134 форматом веде створений при OASIS (бе- руть участь IBM, Microsoft, Novell, KDE e.V., Nokia Corporation, Oracle, The Boeing Company та інші) технічний комітет. Фор- мат отримав назву «ОpenDocument Format», його версія 1.0 прийнята як стан- дарт OASIS в 2005 р. [24, 25]. В 2006 р. ODF 1.0 було затверджено ISO як ISO/IEC 26300:2006 "Open Document Format for Office Applications (OpenDocument) v1.0". ODF 1.1 затверджено як стандарт OASIS в 2007 р., прийнято та опубліковано як стан- дарт ISO/IEC 26300:2006/Amd 1:2012 «Open Document Format for Office Applications (OpenDocument) v1.1» в бере- зні 2012 р. Поточна версія стандарту, ODF 1.2, затверджена як стандарт OASIS на- прикінці 2011 р. та опублікована 11.01.2012 р. У 2015 р. ODF 1.2 затвердже- на як стандарт ISO 26300:2015. Підтримку стандарту здійснює Document Foundation. [26]. У 2002 р. в Китаї створена робоча група для розробки проекту відкритого національного стандарту подання офіс- них документів на базі XML-формату – UOF. Необхідність розробки виходила з міркувань поліпшення сумісності між офісними програмами місцевих виробни- ків та підвищенням їх конкурентоспро- можності на внутрішньому ринку. До складу робочої групи увійшли представ- ники місцевих розробників офісних про- грамних пакетів, системних інтеграторів, користувачів та дослідницькі інститути [27]. В 2005–2006 рр. в університеті Пекі- на розроблявся проект з конвертації з UOF до ODF при підтримці спеціалістів з ODF із IBM, опубліковано порівняння обох фо- рматів [28]. Команда проекту також прий- мала участь у засіданнях робочої групи, яка розробляла стандарт, а внесені нею пропозиції допомогли покращити суміс- ність форматів UOF та ODF. У травні 2007 р. попередній варіант стандарту прийнято як національний стандарт КНР. Перший офісний пакет, EIOffice 2009, в якому UOF був основним форматом, ви- пущено в липні 2008 р. [29]. Зручність використання специфіка- ції мови XML 1.0 в орієнтованих на оброб- ку даних застосунках стало відправною точкою для робіт у напрямку створення скорочених специфікацій мови, із мініма- льно необхідним набором мовних конс- трукцій та одночасно повністю таких, що відповідають вихідній специфікації. У 1999 р. групою експертів в області XML- технологій запропонована така специфіка- ція: MinML. Однак після декількох циклів обговорень її розробники дійшли згоди, що розвиток нової специфікації як підм- ножини XML є скоріше недоліком, ніж перевагою, оскільки багато вже існуючих програмних засобів виявилися несумісни- ми з новою специфікацією. Кларк Еванс (Clark Evans) запропонував змінити сам підхід до створення мови опису даних для обміну структурованою інформацією: збе- регти зручне для людини текстове подання інформації, відмовитися від синтаксису XML в описі елементів, використовувати конструкції мов програмування (списки, асоціативні масиви, скалярні дані) [30]. В 2001 р. на розгляд співтовариства експер- тів подано попередній варіант специфіка- ції. Виявилося, що в тому ж напрямку пра- цював ще один фахівець, Ingy döt Net. То- му після нетривалих переговорів вони по- єднали зусилля в роботі над новою специ- фікацією, а нову мову було названо YAML. На даний момент актуальна спе- цифікація YAML 1.2 версія 3. В 2001 р. Дуглас Крокфорд (Douglas Crockford) розробив та почав використову- вати текстовий формат для зберігання та обміну структурованими даними, заснова- ний на конструкціях мови програмування JavaScript із стандарту ECMA-262. ECMA Script Language Specification, видання 3. Нову мову JSON було описано в специфі- кації RFC4627 в 2006 р., а в 2009 р. його опис також було включено в стандарт ECMA-262 “ECMAScript Language Specification” видання 5. З 2002 р. стандарт ECMA-262 офіційно прийнято як стандарт ISO/IEC 16262 ECMAScript language specification [31]. Опис JSON винесено у окремий стандарт ECMA-404 у 2013 р. [32], який передано до публікації як стан- дарт ISO 21778 22.10.2017 р. [33]. Наведена хронологія та встановлені зв’язки між технологіями дозволяють отримати графічне подання (рис. 1), яке Методи, моделі та стандарти створення структурованих електронних документів 135 Рис. 1. Еволюція опису ЕД наочно відображає розвиток структурова- ного опису ЕД. З рис. 1 видно, що узагаль- нені мови розмітки уточнювалися під пот- реби конкретних задач. Також наголосимо, що поняття мови розмітки виникло саме під час розв’язання задачі уніфікованого подання ЕД текстових процесорів на різ- них платформах. Однак слід зазначити, що не завжди новий стандарт передував реалі- зації. Прикладом є мова HTML, коли пере- вірений часом галузевий стандарт “de facto” офіційно проходив стандартизацію в міжнародних установах значно пізніше. З діаграми видно, що стандартиза- цію на рівні ISO (рік прийняття першої версії стандарту ISO для технології вказа- но у дужках) проходять не всі формати та мови опису ЕД. Для більшої частини тех- нологій достатньою є стандартизація на рівні галузевих консорціумів. Такий підхід забезпечує швидке уточнення та оновлен- ня стандартів на підставі змін в основопо- ложних документах, відгуків зацікавлених учасників, незалежних експертів та швид- ке виправлення знайдених помилок. Також видно, що в структуровано- му описі ЕД особливе місце займає техно- логія XML (мова розмітки у поєднанні з додатковими специфікаціями для роботи з цими документами). Таким чином при ро- зробці нових застосунків замість проекту- вання “з нуля” внутрішнього формату по- дання даних та реалізації операцій із ним можна використовувати вже існуючу, де- тально специфіковану, мета-мову і зосере- дити увагу на розробці схем опису даних свого застосунка. Необхідність в міжнаро- дній стандартизації мови XML відсутня, оскільки вона є підкласом SGML – вже стандартизованої мови, а документи XML відповідають специфікації SGML. Особливе місце серед стандартизо- ваних форматів опису ЕД займають фор- мати, які не базуються на формальних мо- делях опису ЕД. Сімейство форматів PDF останніх версій підтримує структурований опис ЕД (анотації, метадані), має всесвітнє визнання, але за більше ніж 20 років існу- вання специфікацій досі не має надійного вирішення проблеми перевірки відповід- ності PDF-файлів та застосунків, які ці файли створюють, до стандарту. Пропону- ється встановлювати відповідність станда- рту шляхом порівняння результату оброб- ки PDF-файлів з еталонними зображення- ми, які є копіями екранів з результатами Методи, моделі та стандарти створення структурованих електронних документів 136 роботи еталонної програми відтворення [15]. Тобто не повністю виключається си- туація, коли придатний з точки зору стан- дарту документ буде не правильно відоб- ражений на екрані. Очевидно, такий спосіб програє у надійності методам перевірки відповідності стандарту документів, за- снованих на формальних моделях опису. У останньому випадку треба перевіряти до- кумент лише відносно формальної грама- тики, яка обов’язково входить до специфі- кації таких стандартів. Ця перевірка може бути легко реалізована у застосунку, який обробляє документи, з метою відкидання файлів, що не пройдуть перевірку. Віднос- но формату PDF/A також залишається ба- гато питань обробки, які не регулюються стандартом [19]. Тому при використанні цього формату для довгострокового збері- гання ЕД доведеться приймати додаткові внутрішні регламенти на рівні корпорації. Опис закритих офісних форматів мовою XML та створення відкритих стан- дартів для них визначили новий напрямок в обробці структурно описаних ЕД, в рам- ках якого стало можливим використовува- ти існуючі в світі напрацювання по офіс- ним системам для розв’язання задач дов- гострокового зберігання документів, їх редагування, гарантованого однакового відображення на різних платформах й без- болісного обміну інформацією між офіс- ними застосунками конкуруючих компа- ній, а також вводити в офісні документи розмітку з визначеною користувачем се- мантикою, тобто створювати структурова- ні ЕД. В напрямку розв’язання задач ви- ключно обміну структурованою інформа- цією також з’явилися свої формати з від- мінним від XML синтаксисом та підтрим- кою основних структур даних мов програ- мування. Розглянемо означені вище напрям- ки більш детально. Відкриті офісні формати Як вже було зазначено, спочатку офісні документи зберігалися як пряме відображення структур даних офісних програм на диск. Це дозволяло компактно зберігати дані та швидко завантажувати їх до програми для продовження роботи. По- стійне зростання обчислювальної потуж- ності апаратного забезпечення, пропускної здатності комп’ютерних мереж та виник- нення нових стандартів опису інформації (а саме мови XML) дозволило розпочати розробку нових відкритих форматів збері- гання офісних документів. Метою ство- рення таких форматів є виключення зале- жності документів від застосунків, надан- ня можливості використовувати новий формат різним розробникам програмного забезпечення у своїх продуктах та на різ- них платформах (наприклад, в мобільних пристроях), не лише для обробки та довго- строкового зберігання документів, а й для вирішення задач автоматизації генеруван- ня нових документів з бізнес-даних, авто- матичного витягу даних з документів з наступною передачею в інші застосунки і т. ін. З рис. 1 видно, що при створенні но- вих застосунків, пов’язаних з обробкою та візуалізацією структурованої інформації доцільно використовувати один з актуаль- них міжнародних стандартів: OOXML чи ODF. Нажаль UOF, скоріш за все, зали- шиться лише національним стандартом через низьку зацікавленість у ньому між- народної спільноти, що в першу чергу зу- мовлено використанням ієрогліфів у роз- мітці (рис. 2). OOXML засновано на моделях да- них офісних програм Microsoft, підтримує всі можливості, які існують в їх бінарних форматах зберігання даних. Базовий рівень міжплатформової взаємодії забезпечується повною відповідністю OOXML діючим відкритим стандартам W3C XML 1.0 та XML Namespaces (простору імен XML) – [34–36]. В документах OOXML максима- льно виключено звернення до властивос- тей, залежних від поточного оточення. Якщо така властивість використовується, то її значення у системі, в якій створений документ, може бути збережено в докуме- нті (наприклад, при використанні констан- ти кольору в документі також можна збе- регти і значення, яке вона мала при ство- ренні документа). Доступна можливість використовувати схеми користувача Методи, моделі та стандарти створення структурованих електронних документів 137 Рис. 2. Використання ієрогліфів в іменах атрибутів та тегів документа UOF (визначати простори імен) в форматі XSD та обробляти документи без участі засто- сунка де вони були створені (наприклад, за допомогою перетворень XSLT). OOXML не накладає обмежень на використання сервісів безпеки, таких як XML Digital Signature та XML Encryption. В рамках OOXML розрізняють від- повідність стандарту документа та відпо- відність стандарту застосунка. Споживаю- чий застосунок відповідає стандарту якщо він не відкидає документи очікуваного формату, що відповідають стандарту. Створюючий застосунок відповідає стан- дарту, якщо він здатен створювати доку- менти, що відповідають стандарту. В стан- дарті введено поняття суворого (Strict) та перехідного (Transitional) форматів, які мають різні простори імен, щоб розрізняти документи в цих форматах поміж собою та відрізняти від документів у стандарті ECMA 376 першого видання, які фактично відповідають формату Transitional. Формат Transitional додано для сумісності з доку- ментами та застосунками, що вже існували на той час. Нові документи мають створю- ватися в форматі Strict, якщо вони прого- лошують відповідність до стандарту IS29500. Додатково підтримуються такі мови розмітки: DrawingML (для подання графі- чних об’єктів у документі), VML (подання векторної графіки, залишено для зворотної сумісності та буде замінено на DrawingML), мови розмітки Math, Metadata, Custom XML, Bybliography, а загалом модель документів формату OOXML показана на рис. 3. В OOXML використовуються схеми XSD, схеми RelaxNG мають інформатив- ний характер. Стандарт ISO\IEC 29500 «Office Open XML File Formats» складається з чо- тирьох частин: - базові поняття та довідкове ке- рівництво з мови розмітки. Містить всю необхідну інформацію щодо створення нових документів формату Strict [35]; - погодження щодо упаковки ча- стин документів. Описано вимоги до фор- мування файлу-контейнера та його струк- тура; - сумісність та розширюваність розмітки. Сформульовані правила визна- чення сумісності, описано підходи до за- безпечення сумісності розмітки з майбут- німи версіями стандарту, подано інструкції щодо роботи з невідомими (цій версії спе- цифікації) просторами імен або їх елемен- тами; - особливості міграції у перехід- ний формат. Надано вказівки щодо висо- коякісної міграції з бінарних форматів до- кументів Microsoft до документів формату OOXML Transitional. Відповідність документа стандарту ODF: - документи можуть містити елементи з зовнішніх просторів імен; - споживаючий застосунок має прочитати (або записати) документ який був би відповідним, якщо з нього видалити всю зовнішню розмітку; - споживаючі застосунки мають зберігати зовнішню розмітку. В ODF схеми описуються за допо- могою RelaxNG. Стандартом ODF передбачена мож- ливість зберігання документів як у вигляді <字:句 uof:locID="t0085"> <字:句属性 uof:locID="t0086" uof:attrList="式样引用" 字:式样引用="Standard"/> <字:文本串 uof:locID="t0109" uof:attrList="标识符">Фрагмент текстового документа в UOF.</字:文本串> </字:句> Методи, моделі та стандарти створення структурованих електронних документів 138 Рис. 3. Загальна модель документів OOXML єдиного файлу XML, так і у вигляді декі- лькох XML-файлів в контейнері (ZIP- архів). У випадку використання контейне- ра документ розбивається на структурні частини з власними кореневими елемента- ми для подання змістовної частини, мета- даних, стилів та налаштувань [37]. Для порівняння моделей документів ODF та OOXML розглянемо саме цей спосіб збері- гання документа ODF (рис. 4). В документах ODF розрізняють зу- мовлені метадані та метадані користувача (входять до елемента «метадані»). Так са- мо як і в OOXML зумовлені метадані ви- користовують напрацювання Dublin Core Metadata Initiative у вигляді множини еле- ментів для опису документа (ресурсу) із наперед заданою семантикою [38], що та- кож відображено у стандарті ISO 15836:2009 «The Dublin Core metadata element set». Метадані користувача можуть описувати будь-які додаткові властивості документа. Починаючи з версії 1.2 в стан- дарт ODF також інтегровано підтримку опису елементів метаданих за допомогою RDF, що дозволило використовувати еле- менти метаданих у змістовній частині до- кумента та в частині, яка містить стилі. Налаштування документа подані у вигляді множини, елементами якої можуть бути: - поодинокі елементи – для збері- гання конкретних налаштувань; - множини елементів – перелік елементів у довільній послідовності; - індексовані масиви елементів – доступ до елементів за індексом; - асоціативні масиви елементів – доступ до елементів за ім’ям. Останні три форми подання налаш- тувань є контейнерами та застосовуються для групування однотипних налаштувань. Для контейнерів, які належать кореневому елементу налаштувань, має бути вказано назву простору імен, що однозначно ви- значає належність налаштувань тому чи іншому застосунку. З рис. 3 та 4 видно, що моделі до- кументів у форматах ODF та OOXML сут- тєво відрізняються. В стандарті OOXML існує декілька типів документів: тексто- вий, електронна таблиця, презентація із власними мовами розмітки. Вони розроб- лялися в різний час і мають небагато спі- льного. В ODF визначено єдину мову роз- мітки в якій описано всі елементи докуме- нта та атрибути цих елементів. Документи ODF мають єдину загальну структуру. Елементи тіла документа, що визначають тип документа та відображають його спе- цифіку, обов’язково мають власні дочірні елементи “атрибути”, “пролог”, “основна частина” та “епілог” з відповідними префі- ксами, їх наповнення залежить від типу документа. Типові конструкції основної частини тіла документа (текст, таблиці, Методи, моделі та стандарти створення структурованих електронних документів 139 Рис. 4. Загальна модель документів стандарту ODF рисунки тощо) формалізовані для спільно- го використання у будь-якому з докумен- тів, але від типу документа залежить, які елементи можуть у ньому з’явитися і в яких комбінаціях. Документи обох стандартів підтри- муються провідними офісними пакетами: Microsoft Office, OpenOffice, LibreOffice, KOffice, Google Docs, IBM Lotus Symphony, Corel WordPerfect Office, де- якими іншими. Документи у форматі OOXML Strict можуть читати лише LibreOffice з версії 4.3.2 та Microsoft Office починаючи з версії 2010. Записувати у фо- рматі OOXML Strict може лише Microsoft Office починаючи з версії 2013. Застосунки інших виробників використовують формат OOXML Transitional навіть тоді, коли до- кумент не містить несумісних із форматом OOXML Strict частин [39]. Одним з важливих напрямків робо- ти над розглянутими стандартами є їх га- рмонізація, яка має полегшити конверта- цію з одного формату до іншого. В першу чергу це прискорить та здешевить процес розробки програмного забезпечення, оскі- льки покращить сумісність застосунків, які мають справу з обміном документами у різних форматах, експортом чи імпор- том даних з них. В стандарті ISO/IEC TR 29166:2011 “Керівні вказівки щодо пере- міщення між форматами документів ISO/IEC 26300 та ISO/IEC 29500” [40] проводиться аналіз основоположних кон- цепцій в обох стандартах документів. На підґрунті ретельного вивчення кожного стандарту визначається наявність спіль- них рис та розбіжностей документів, по- будовано таксономію властивостей доку- мента взагалі. Шляхом порівняння оціню- ється ступінь точності переміщення між документами в кожному зі стандартів та у разі можливості детально розглядається, як важлива функціональність одного фо- рмату документів може бути подана в ін- шому. Вивчаються саме стандарти, а не їх реалізації в застосунках, оскільки реаліза- ції можуть породжувати додаткові питан- ня сумісності [41]. Методи, моделі та стандарти створення структурованих електронних документів 140 Структуровані формати для обміну даними Основними критеріями викорис- тання спеціалізованих мов опису даних у задачах обміну структурованими даними без необхідності їх візуального подання є простота та зручність перегляду. Проана- лізуємо на відповідність цим критеріям мов опису структурованих даних JSON та YAML. Обидві мови не містять спеціалі- зованих тегів розмітки для позначення елементів структурованої інформації. Ін- формаційна модель цих мов гранично проста. Документ YAML являє собою спрямований граф, вершинами якого мо- жуть бути колекції, списки, скалярні зна- чення, порожні значення, що визначають типи даних в мові. Синтаксис для опису вузлів графа документа YAML мінімаль- ний – «:» розділяє пари «ключ-значення», «%» вказує, що далі йде опис деякого структурованого типу («колекції»), який складається з неупорядкованих пар «ключ-значення» з унікальним ключем, «@» означає початок списку вузлів. Еле- ментами списку може бути будь-який з дозволених типів даних. Входження пар «ключ-значення» в колекції, а також вхо- дження елементів в список визначається відступом всередині рядка (кількістю пробілів перед елементом). В JSON ви- значені 2 типи елементів документа. Ко- лекція – складається з одної чи більше пар виду «ключ-значення». Синтаксично за- дається за допомогою «{» та «}», ключ і значення в парах відокремлюються «:», самі пари відокремлюються «,». Список (масив) впорядковано містить будь-який з дозволених типів (список, колекція, ря- док, число). Початок та кінець масиву позначається «[» та «]», перелік ведеться через «,». Вочевидь інформаційні моделі цих мов дуже схожі, однак модель збереження даних в YAML дозволяє визначати поси- лання на елементи документа («&») та в подальшому звертатися до цих елементів за посиланням («*»), що сприяє суттєвому скороченню обсягу інформації для пере- дачі та зниженню ймовірності виникнення помилки при створенні часто повторюва- них даних. Крім цього в YAML існує так званий «скорочений запис», який збіга- ється з синтаксисом JSON. Таким чином в окремих випадках документ YAML при використанні скороченого запису може ставати допустимим документом JSON. На користь вибору JSON як спрощеного формату обміну структурованою інфор- мацією говорить і те, що він пройшов стандартизацію у ISO та підтримується у бібліотеках багатьох популярних середо- вищ розробки. Висновок В результаті проведеного аналізу встановлено, що провідне положення се- ред способів подання структурованих електронних документів (СЕД) займає мова XML 1.0. Основними критеріями такого вибору є простота сприйняття лю- диною текстової інформації, чітка форма- лізація мови, а також спирання цієї мови на міжнародний стандарт SGML. До пе- реваг XML також можна віднести наяв- ність формалізованих програмних інтер- фейсів DOM, SAX та StAX [42] – механі- змів, що дозволяють будь-який XML- документ представити у вигляді програм- ного об'єкта, через який із структурою та/або даними документа може працювати будь-який програмний застосунок. Будь- яке сучасне програмне середовище має у своєму складі спеціальні програмні ком- поненти для роботи з XML-документами. XML досить добре пристосований для зберігання посилань, ієрархічних, таблич- них і бінарних даних. Це дозволяє вико- ристовувати його для зберігання найріз- номанітніших типів інформації. Найваж- ливішою особливістю XML є його розши- рюваність: у разі необхідності обміну якимись специфічними документами мо- жливо розробити власний діалект мови XML, створити файл з його описом (XSD- документ) та поширити його між усіма учасниками документообігу. Цього буде достатньо для правильної обробки доку- ментів такого типу. Є величезна різнома- нітність діалектів XML для опису доку- ментів у самих різних предметних облас- тях і каталоги подібного роду описів (на- приклад, XBRL [43], ті ж самі OOXML та ODF). Ще однією важливою особливістю Методи, моделі та стандарти створення структурованих електронних документів 141 XML саме в контексті ЕДО є можливість легкого перетворення будь-якого XML- документа в звичайний, легкий для чи- тання HTML-документ за допомогою XSLT-перетворення. В корпоративних інформаційних системах використання відкритих форма- тів офісних документів, заснованих на мо- ві XML, яка є стандартом «де факто», до- зволяє вирішити задачі: - довгострокового зберігання до- кументів – гарантується можливість корек- тного відображення документів не тільки поточними версіями офісних пакетів, а й майбутніми; - обміну документами; - однакового відображення до- кумента на різних платформах, в тому чи- слі і на мобільних приладах; - обробки СЕД засобами тексто- вого редактора чи табличного процесора з метою автоматичного отримання потрібної інформації для подальшого внесення її до бази даних; - автоматичне формування СЕД з результатів запиту до бази даних; - захисту документа за допомо- гою цифрового підпису; - збереження разом із основною інформацією додаткової інформації, що відображає семантику документа. Стандарти на обидва розглянутих відкритих формати (OOXML та ODF) представлення офісних документів мають детальний опис їх структури, тому вони можуть бути використані як внутрішній формат подання даних у корпоративній інформаційній системі. Це дозволить ско- ротити витрати часу на розробку та підт- римку власного формату даних та повніс- тю зосередитися на архітектурі майбут- ньої системи. Використання стандартизо- ваних форматів дає ще одну перевагу: оскільки вони спираються на інші міжна- родні стандарти, з’являється можливість залучити до роботи найкращі з існуючих їхніх реалізацій. Розглянуті структуровані формати подання даних у вигляді тексту в корпора- тивній інформаційній системі доцільно використовувати для внутрішніх комуні- кацій між частинами системи. Література 1. Goldfarb C.F. The Roots of SGML – A Personal Recollection [Електронний ре- сурс]. 1996. Режим доступу: http://www.sgmlsource.com/history/roots.ht m. – Назва з екрана. 2. Goldfarb C.F. Design Considerations for Integrated Text Processing Systems. [Елект- ронний ресурс]. IBM. Cambridge Scientific Center Technical Report G320–2094. 1973. Режим доступу: https://web.archive.org/web/2004062705003 6/http://www.sgmlsource.com:80/history/G3 20-2094/G320-2094.htm. – Назва з екрана. 3. Information processing – Text and office systems – Standard Generalized Markup Language (SGML) : ISO 8879:1986 [Елект- ронний ресурс]. International Organization for Standardization. 1986. Режим доступу: https://www.iso.org/standard/16387.html. Назва з екрана. 4. Berners–Lee T. Information Management: A Proposal [Електронний ресурс]. CERN. 1989. Режим доступу: http://www.w3.org/ History/1989/proposal.html. Назва з екрана. 5. Berners–Lee T., Connolly D. Hypertext Markup Language – 2.0 : RFC1866 [Елект- ронний ресурс]. November 1995. Режим доступу: http://www.rfc-editor.org/rfc/ rfc1866.txt. Назва з екрана. 6. Clark J. Comparison of SGML and XML : World Wide Web Consortium Note 15– December–1997 [Електронний ресурс]. W3C. 1997. Режим доступу: http://www.w3.org/TR/NOTE–sgml–xml– 971215. Назва з екрана. 7. Berjon R. HTML5 : A vocabulary and associated APIs for HTML and XHTML : W3C Recommendation 28 October 2014 [Електронний ресурс]. W3C. 2014. Режим доступу: http://www.w3.org/TR/html5/. На- зва з екрана. 8. Bray T. Extensible Markup Language (XML) 1.1 (Second Edition): W3C Recommendation 16 August 2006, edited in place 29 September 2006 [Електронний ресурс]. W3C. 2006. Режим доступу: http://www.w3.org/TR/2006/REC-xml11- 20060816/. Назва з екрана. Методи, моделі та стандарти створення структурованих електронних документів 142 9. Pemberton S. XHTML™ 1.0 The Extensible HyperText Markup Language (Second Edition) : A Reformulation of HTML 4 in XML 1.0 : W3C Recommendation 26 January 2000, revised 1 August 2002 [Елек- тронний ресурс]. W3C. 2002. Режим дос- тупу: http://www.w3.org/TR/xhtml1/. Назва з екрана. 10. Pemberton S. XHTML2 Working Group Home Page [Електронний ресурс]. W3C. 2007. Режим доступу: http://www.w3.org/ MarkUp/. Назва з екрана. 11. HTML : Living Standard — Last Updated 22 November 2017 [Електронний ресурс]. – [WHATWG]. [2006?]. Режим доступу: https://html.spec.whatwg.org/multipage/. На- зва з екрана. 12. Adobe Acrobat 1.0 - Product brochure [Еле- ктронний ресурс]. Adobe Systems. 1993. Режим доступу: http://www.planetpdf.com/ planetpdf/pdfs/adobe_acrobat1_broch.pdf. Назва з екрана. 13. Warnock J. The Camelot Project [Електрон- ний ресурс]. 1990. Режим доступу: http://www.planetpdf.com/planetpdf/pdfs/wa rnock_camelot.pdf. Назва з екрана. 14. Wootton A.T. How was the PDF format created? [Електронний ресурс]. Quora. 2014. Режим доступу: https://www.quora.com/PDF-file- format/How-was-the-PDF-format-created. Назва з екрана. 15. Johnson D. Is PDF an Open Standard? [Еле- ктронний ресурс]. 2010. Режим доступу: https://talkingpdf.org/is-pdf-an-open- standard/. Назва з екрана. 16. Document management – Portable document format. Part 1: PDF 1.7 : ISO 32000-1:2008 [Електронний ресурс]. International Organization for Standardization. 2008. Ре- жим доступу: https://www.iso.org/standard/ 51502.html. Назва з екрана. 17. Document management – Portable document format. Part 2: PDF 2.0 : ISO 32000-2:2017 [Електронний ресурс]. International Organization for Standardization. 2017. Ре- жим доступу: https://www.iso.org/standard/ 63534.html. Назва з екрана. 18. Document management – Electronic document file format for long-term preservation. Part 1: Use of PDF 1.4 (PDF/A- 1) : ISO 19005-1:2005 [Електронний ре- сурс]. International Organization for Standardization. 2005. Режим доступу: https://www.iso.org/standard/38920.html. Назва з екрана. 19. Johnson D. White Paper: How to Implement PDF/A [Електронний ресурс]. 2010. Режим доступу:https://talkingpdf.org/white-paper- how-to-implement-pdfa/. Назва з екрана. 20. Jones B. Open XML timeline [Електронний ресурс]. Brian Jones. 2007. Режим доступу: https://blogs.msdn.microsoft.com/brian_jone s/2007/07/09/open-xml-timeline/. Назва з екрана. 20. TAC approval on conclusions and recommendations on open document formats [Електронний ресурс]. IDABC: [Interoperable Delivery of European eGovernment Services to public Administrations, Businesses and Citizens]. 2006. Режим доступу: http://web.archive. org/web/20060720005118/http://ec.europa.eu /idabc/en/document/2592/5588. Назва з ек- рана. 21. Sayer P. “ISO Rejects Microsoft's OOXML as Standard” [Електронний ресурс]. PCWorld: IDG News Service. 2007: [04.09.2007]. Режим доступу: http://www.pcworld.com/article/136711/iso_ rejects_microsofts_ooxml_as_standard.html. Назва з екрана. 22. Standard ECMA-376 : Office Open XML File Formats [Електронний ресурс]. ECMA International. 2006. Режим доступу: http://www.ecma-international.org/ publications/standards/Ecma-376.htm. Назва з екрана. 23. History of OpenDocument [Електронний ресурс]. 2006. Режим доступу: http://opendocument.xml.org/milestones. На- зва з екрана. 24. Cover R. OpenOffice.org XML File Format [Електронний ресурс]. OASIS. 2006. Ре- жим доступу: http://xml.coverpages.org/ starOfficeXML.html. Назва з екрана. 25. Durusau P. Developing an XML-based file format specification for office applications [Електронний ресурс]. OASIS Open Document Format for Office Applications (OpenDocument) TC. [2005?]. Режим дос- тупу: https://www.oasis-open.org/ committees/tc_home.php?wg_abbrev=office. Назва з екрана. 26. Updegrove A. Another Open Document Format – From China [Електронний ре- сурс]. The Standards Blog. 2006. Режим до- ступу: http://www.consortiuminfo.org/ standardsblog/article.php?story=2006110806 164573. Назва з екрана. 27. Zhong Chen, Liyong Tang, Huiping Sun et al. ODF–UOF Converter [Електронний Методи, моделі та стандарти створення структурованих електронних документів 143 ресурс]. 2006. Режим доступу: http://odf- to-uof.sourceforge.net/overview.html. Назва з екрана. 28. Updegrove A. Don't Forget UOF: Here Comes EIOffice 2009 (Updated 2X [Елект- ронний ресурс]. The Standards Blog. 2008: [21.07.2008]. Режим доступу: http://www.consortiuminfo.org/standardsblog /article.php?story=20080721140512962. На- зва з екрана. 29. Ingerson B., Clark Evans & Oren Ben-Kiki. Yet Another Markup Language (YAML) 1.0 : Working Draft 01 Aug 2001 [Електронний ресурс]. 2001. Режим доступу: http://web.archive.org/web/20070217091403/ http://yaml.org:80/spec/history/2001-08- 01.html. Назва з екрана. 30. Standard ECMA–262 : ECMAScript 2017 Language Specification [Електронний ре- сурс]. ECMA International. 2017. Режим доступу: http://www.ecma-international.org/ publications/standards/Ecma-262.htm. Назва з екрана. 31. Standard ECMA-404: The JSON Data Interchange Format [Електронний ресурс]. ECMA International. 2013. Режим доступу: http://www.ecma-international.org/ publications/standards/Ecma-404.htm. Назва з екрана. 32. Information technology – The JSON data interchange syntax: ISO/IEC 21778:2017 [Електронний ресурс]. International Organization for Standardization. 2017. Ре- жим доступу: https://www.iso.org/standard/ 71616.html. Назва з екрана. 33. Ngo T. Office Open XML overview [Елект- ронний ресурс]. ECMA International. [2006?]. Режим доступу: http://www.ecma- international.org/news/TC45_current_work/ OpenXML%20White%20Paper.pdf. – Назва з екрана. 34. Information technology – Document description and processing languages – Office Open XML File Formats – Part 1: Fundamentals and Markup Language Reference: ISO/IEC 29500–1:2016 [Елект- ронний ресурс]. International Organization for Standardization. – 2016. – Режим досту- пу: https://www.iso.org/standard/71691.html. Назва з екрана. 35. Weir R. A technical comparison: ISO/IEC 26300 vs. Microsoft Office Open XML [Електронний ресурс]. OpenOffice.org Conference (OOoCon 2006): September 11 – 13 2006. Lyon, France. 2006. (Доклад). 2006. Режим доступу: http://www.openoffice.org/marketing/ooocon 2006/presentations/wednesday_o3.pdf. На- зва з екрана. 36. ISO/IEC 26300-1:2015: Information technology – Open Document Format for Office Applications (OpenDocument) v1.2. Part 1: OpenDocument Schema [Електрон- ний ресурс]. International Organization for Standardization. 2015. Режим доступу: https://www.iso.org/standard/66363.html. Назва з екрана. 37. Kunze J., Baker T. The Dublin Core Metadata Element Set [Електронний ресурс Request for Comments 5013]. The IETF Trust. 2007. Режим доступу: http://www.ietf.org/rfc/rfc5013.txt. Назва з екрана. 38. Sustainability of Digital Formats: Planning for Library of Congress Collections [Елект- ронний ресурс]. [Library of Congress, U.S.?]. [2017?]. Режим доступу: https://www.loc.gov/preservation/digital/for mats/fdd/fdd000401.shtml. Назва з екрана. 39. ISO/IEC TR 29166:2011 : Information technology – Document description and processing languages – Guidelines for translation between ISO/IEC 26300 and ISO/IEC 29500 document formats [Елект- ронний ресурс]. International Organization for Standardization. 2011. Режим доступу: https://www.iso.org/standard/45245.html. Назва з екрана. 40. Eckert Klaus Peter, Goluchowicz Kerstin, Gauch Stephan, Kirchhoff Björn. Feature Based Document Profiling – a Key For Document Interoperability? [Електронний ресурс]. Fraunhofer FOKUS, Berlin. 2012. Режим доступу: https://cdn1.scrvt.com/ fokus/403d3c76ef3c1e76/ea5963383889/Feat ure_Based_Document_Profiling.pdf. Назва з екрана. – ISBN 978-3-00-038675-6 41. Sanaulla M. Parsing XML using DOM, SAX and StAX Parser in Java [Електронний ре- сурс]. 2013. Режим доступу: https://sanaulla.info/2013/05/23/parsing-xml- using-dom-sax-and-stax-parser-in-java/. На- зва з екрана. 42. Engel P., Hamscher Walter et al. Extensible Business Reporting Language (XBRL) 2.1 : Recommendation 31 December 2003 with errata corrections to 20 February 2013 [Еле- ктронний ресурс]. XBRL International. 2013. Режим доступу: http://www.xbrl.org/ Specification/XBRL-2.1/REC-2003-12- 31/XBRL-2.1-REC-2003-12-31+corrected- errata-2013-02-20.html. Назва з екрана. Методи, моделі та стандарти створення структурованих електронних документів 144 References 1. Goldfarb C. F. The Roots of SGML – A Personal Recollection. 1996. [Electronic resource]. Mode of access: http://www.sgmlsource.com/history/roots.htm 2. Goldfarb C. F. Design Considerations for Integrated Text Processing Systems. IBM. Cambridge Scientific Center Technical Report G320–2094. 1973. [Electronic resource]. Mode of access: https://web.archive.org/web/2004062705003 6/http://www.sgmlsource.com:80/history/G3 20-2094/G320-2094.htm 3. Information processing -- Text and office systems -- Standard Generalized Markup Language (SGML) : ISO 8879:1986. International Organization for Standardization. 1986. [Electronic resource]. Mode of access: https://www.iso.org/standard/16387.html 4. Berners–Lee T. Information Management: A Proposal. CERN. 1989. [Electronic resource]. Mode of access: http://www.w3.org/History/1989/proposal.ht ml 5. Berners–Lee T. Hypertext Markup Language – 2.0 : RFC1866. November 1995. [Electronic resource]. Mode of access: http://www.rfc-editor.org/rfc/rfc1866.txt 6. Clark J.Comparison of SGML and XML : World Wide Web Consortium Note 15– December–1997. W3C. 1997. [Electronic resource]. Mode of access: http://www.w3.org/TR/NOTE–sgml–xml– 971215 7. Berjon R. HTML5 : A vocabulary and associated APIs for HTML and XHTML : W3C Recommendation 28 October 2014. W3C. 2014. [Electronic resource]. Mode of access: http://www.w3.org/TR/html5/ 8. Bray T. Extensible Markup Language (XML) 1.1 (Second Edition) : W3C Recommendation 16 August 2006, edited in place 29 September 2006. W3C. 2006. [Electronic resource]. Mode of access: http://www.w3.org/TR/2006/REC-xml11- 20060816/ 9. Pemberton S. XHTML™ 1.0 The Extensible HyperText Markup Language (Second Edition) : A Reformulation of HTML 4 in XML 1.0 : W3C Recommendation 26 January 2000, revised 1 August 2002. W3C. 2002. [Electronic resource]. Mode of access: http://www.w3.org/TR/xhtml1/ 10. Pemberton S. XHTML2 Working Group Home Page. W3C. 2007. [Electronic resource]. Mode of access: http://www.w3.org/MarkUp/ 11. HTML : Living Standard — Last Updated 22 November 2017. [WHATWG]. [2006?]. [Electronic resource]. Mode of access: https://html.spec.whatwg.org/multipage/ 12. Adobe Acrobat 1.0 - Product brochure. Adobe Systems. 1993. [Electronic resource]. Mode of access: http://www.planetpdf.com/planetpdf/pdfs/ado be_acrobat1_broch.pdf 13. Warnock J. The Camelot Project. 1990. [Electronic resource]. Mode of access: http://www.planetpdf.com/planetpdf/pdfs/wa rnock_camelot.pdf 14. Wootton A.T. How was the PDF format created?. Quora. 2014. [Electronic resource]. Mode of access: https://www.quora.com/PDF-file- format/How-was-the-PDF-format-created 15. Johnson D. Is PDF an Open Standard?. 2010. [Electronic resource]. Mode of access: https://talkingpdf.org/is-pdf-an-open- standard/ 16. Document management – Portable document format -- Part 1: PDF 1.7 : ISO 32000-1:2008 [Електронний ресурс]. – International Organization for Standardization. – 2008. – Режим доступу: https://www.iso.org/standard/51502.html. – Назва з екрана. 17. Document management – Portable document format -- Part 2: PDF 2.0 : ISO 32000- 2:2017. International Organization for Standardization. 2017. [Electronic resource]. Mode of access: https://www.iso.org/standard/63534.html 18. Document management -- Electronic document file format for long-term preservation -- Part 1: Use of PDF 1.4 (PDF/A-1) : ISO 19005-1:2005. International Organization for Standardization. 2005. [Electronic resource]. Mode of access: https://www.iso.org/standard/38920.html 19. Johnson D. White Paper: How to Implement PDF/A. 2010. [Electronic resource]. Mode of access: https://talkingpdf.org/white-paper- how-to-implement-pdfa/. – Назва з екрана. 20. Jones B. Open XML timeline. 2007. [Electronic resource]. Mode of access: https://blogs.msdn.microsoft.com/brian_jone s/2007/07/09/open-xml-timeline/ 21. TAC approval on conclusions and recommendations on open document formats. IDABC : [Interoperable Delivery of Методи, моделі та стандарти створення структурованих електронних документів 145 European eGovernment Services to public Administrations, Businesses and Citizens]. 2006. [Electronic resource]. Mode of access: http://web.archive.org/web/20060720005118/ http://ec.europa.eu/idabc/en/document/2592/ 5588 22. Sayer P. “ISO Rejects Microsoft's OOXML as Standard”. PCWorld : IDG News Service. 2007. [Electronic resource]. Mode of access: http://www.pcworld.com/article/136711/iso_ rejects_microsofts_ooxml_as_standard.html 23. Standard ECMA-376 : Office Open XML File Formats. ECMA International. 2006. [Electronic resource]. Mode of access: http://www.ecma- international.org/publications/standards/Ecm a-376.htm 24. History of OpenDocument. 2006. [Electronic resource]. Mode of access: http://opendocument.xml.org/milestones 25. Cover R. OpenOffice.org XML File Format. OASIS. 2006. [Electronic resource]. Mode of access: http://xml.coverpages.org/starOfficeXML.ht ml 26. Durusau P. Developing an XML-based file format specification for office applications. OASIS Open Document Format for Office Applications (OpenDocument) TC. [2005?]. [Electronic resource]. Mode of access: https://www.oasis- open.org/committees/tc_home.php?wg_abbre v=office 27. Updegrove A. Another Open Document Format – From China. The Standards Blog. 2006. [Electronic resource]. Mode of access: http://www.consortiuminfo.org/standardsblog /article.php?story=2006110806164573 28. Zhong C. ODF–UOF Converter. 2006. [Electronic resource]. Mode of access: http://odf-to- uof.sourceforge.net/overview.html 29. Updegrove A. Don't Forget UOF: Here Comes EIOffice 2009 (Updated 2X. The Standards Blog. 2008. [Electronic resource]. Mode of access: http://www.consortiuminfo.org/standardsblog /article.php?story=20080721140512962 30. Ingerson B. Yet Another Markup Language (YAML) 1.0 : Working Draft 01 Aug 2001. 2001. [Electronic resource]. Mode of access: http://web.archive.org/web/20070217091403/ http://yaml.org:80/spec/history/2001-08- 01.html 31. Standard ECMA–262 : ECMAScript 2017 Language Specification. ECMA International. 2017. [Electronic resource]. Mode of access: http://www.ecma- international.org/publications/standards/Ecm a-262.htm 32. Standard ECMA-404 : The JSON Data Interchange Format. ECMA International. 2013. [Electronic resource]. Mode of access: http://www.ecma- international.org/publications/standards/Ecm a-404.htm 33. Information technology -- The JSON data interchange syntax : ISO/IEC 21778:2017. International Organization for Standardization. 2017. [Electronic resource]. Mode of access: https://www.iso.org/standard/71616.html 34. Ngo T. Office Open XML overview. ECMA International. [2006?]. [Electronic resource]. Mode of access: http://www.ecma- international.org/news/TC45_current_work/ OpenXML%20White%20Paper.pdf 35. Information technology -- Document description and processing languages -- Office Open XML File Formats -- Part 1: Fundamentals and Markup Language Reference : ISO/IEC 29500–1:2016. International Organization for Standardization. 2016. [Electronic resource]. Mode of access: https://www.iso.org/standard/71691.html 36. Weir R. A technical comparison: ISO/IEC 26300 vs. Microsoft Office Open XML // OpenOffice.org Conference (OOoCon 2006) : September 11 - 13 2006 – Lyon, France. 2006. [Electronic resource]. Mode of access: http://www.openoffice.org/marketing/ooocon 2006/presentations/wednesday_o3.pdf 37. ISO/IEC 26300-1:2015 : Information technology -- Open Document Format for Office Applications (OpenDocument) v1.2 -- Part 1: OpenDocument Schema. International Organization for Standardization. 2015. [Electronic resource]. Mode of access: https://www.iso.org/standard/66363.html 38. Kunze J. The Dublin Core Metadata Element Set Request for Comments 5013. The IETF Trust. 2007. [Electronic resource]. Mode of access: http://www.ietf.org/rfc/rfc5013.txt 39. Sustainability of Digital Formats: Planning for Library of Congress Collections. [Library of Congress, U.S.?]. [2017?]. [Electronic resource]. Mode of access: https://www.loc.gov/preservation/digital/for mats/fdd/fdd000401.shtml 40. ISO/IEC TR 29166:2011 : Information technology -- Document description and processing languages -- Guidelines for translation between ISO/IEC 26300 and Методи, моделі та стандарти створення структурованих електронних документів 146 ISO/IEC 29500 document formats. International Organization for Standardization. 2011. [Electronic resource]. Mode of access: https://www.iso.org/standard/45245.html 41. Eckert K.-P. Feature Based Document Profiling ‐ a Key For Document Interoperability?. Fraunhofer FOKUS, Berlin. 2012. [Electronic resource]. Mode of access: https://cdn1.scrvt.com/fokus/403d3c76ef3c1e 76/ea5963383889/Feature_Based_Document _Profiling.pdf. ISBN 978-3-00-038675-6 42. Sanaulla M. Parsing XML using DOM, SAX and StAX Parser in Java. 2013. [Electronic resource]. Mode of access: https://sanaulla.info/2013/05/23/parsing-xml- using-dom-sax-and-stax-parser-in-java/ 43. Engel P. Extensible Business Reporting Language (XBRL) 2.1 : Recommendation 31 December 2003 with errata corrections to 20 February 2013. XBRL International. 2013. [Electronic resource]. Mode of access: http://www.xbrl.org/Specification/XBRL- 2.1/REC-2003-12-31/XBRL-2.1-REC-2003- 12-31+corrected-errata-2013-02-20.html Одержано 09.01.2018 Про авторів: Шарипанов Антон Веніамінович, молодший науковий співробітник. Кількість наукових публікацій в українських виданнях – 7. Кількість наукових публікацій в зарубіжних виданнях – 5, Індекс Хірша – 2. https://orcid.org/0000-0001-6804-0533. Щетинін Ігор Євгенович, кандидат технічних наук, старший науковий співробітник, т.в.о. завідувача відділу. Кількість наукових публікацій в українських виданнях – більше 30. https://orcid.org/0000-0002-9131-4405. Іванов Сергій Миколайович, молодший науковий співробітник. Кількість наукових публікацій в українських виданнях - 7. https://orcid.org/0000-0002-2003-8538. Місце роботи авторів: Інститут кібернетики імені В.М. Глушкова НАН України, 03187, м. Київ-187, проспект Глушкова, 40. Тел.: +38(044) 526 4568. E-mail: _sha_@ukr.net, shchet@nas.gov.ua