Scientific documents metadata as a component of the system of the “open science” information resources
Open science is a movement that aims to make research results more accessible, including code, data, and scientific papers. It covers many different but often related aspects affecting the entire research life cycle, including open access to publications, open data of research, open source software,...
Збережено в:
Дата: | 2023 |
---|---|
Автор: | |
Формат: | Стаття |
Мова: | Ukrainian |
Опубліковано: |
Інститут програмних систем НАН України
2023
|
Теми: | |
Онлайн доступ: | https://pp.isofts.kiev.ua/index.php/ojs1/article/view/591 |
Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
Назва журналу: | Problems in programming |
Завантажити файл: |
Репозитарії
Problems in programmingid |
pp_isofts_kiev_ua-article-591 |
---|---|
record_format |
ojs |
resource_txt_mv |
ppisoftskievua/00/0ae49368303e3e9490f70cd7a33cd800.pdf |
spelling |
pp_isofts_kiev_ua-article-5912024-04-26T21:18:21Z Scientific documents metadata as a component of the system of the “open science” information resources Метадані наукових документів як складова системи інформаційних ресурсів «відкритої науки» Zakharova, O.V. metadata of scientific documents; metadata schema; metadata of scientific publications UDC 004.94 метадані наукових документів; схеми метаданих; метадані наукових публікацій УДК 004.94 Open science is a movement that aims to make research results more accessible, including code, data, and scientific papers. It covers many different but often related aspects affecting the entire research life cycle, including open access to publications, open data of research, open source software, open workflows, public science, open educational resources and alternative methods of the research evaluation, including open peer review, expert reviews, etc. The key to effective application and integration of open science resources is their structured description based on the principles of completeness and necessity of meta-information, ease of use and interoperability. The units of such description are metadata. In fact, the quality of open resources begins with the quality of its metadata.This study does not cover the entire wide spectrum of open science resources. Its purposes are to define the system of characteristics that describe general and specific features of various types of scientific documents as a significant part of scientific knowledge of Open Science.To achieve the goal of the research it is defined a taxonomy of resources of open scientific documents and proposes an integrated system of their metadata. Proposed system of metadata is based on several classifier sets. It includes three major groups: internal characteristics – description of explicit features of the object of open knowledge (for example, the size or the type of the file), administrative characteristics – information about the object (authors, executers, etc.) and descriptive characteristics - information about the object’s content, its special features, links to other objects related to this.The metadata system is built based on the analysis of the existing metadata schemas and standards, search engines and digital libraries, and it takes into account similarity and specificity of each type of open documents.Prombles in programming 2023; 4: 27-38 Відкрита наука – це рух, мета якого полягає в отриманні більш доступних результатів досліджень, включаючи код, дані та наукові документи. Він охоплює багато різних, але часто пов’язаних аспектів, що впливають на весь життєвий цикл дослідження, включно із відкритим доступом до публікацій, дослідницькими даними, програмним забезпеченням з відкритим кодом і робочими процесами, суспільною наукою, із відкритими освітніми ресурсами та альтернативними методами оцінки досліджень. А також із відкритим рецензуванням, експертними оцінками тощо. Тобто, створюється наука, заснована на спільних принципах, які забезпечують порівняльність, сумісність і користь для всіх досліджень на планеті. Запорукою ефективного застосування та інтеграції ресурсів відкритої науки є їх структурований опис, що базується на принципах повноти та необхідності метаінформації, зручності її використання та інтероперабельності. Одиницями такого опису є метадані.Дане дослідження не охоплює всього широкого спектру ресурсів відкритої науки. Його метою є структуризація та формалізація лише описів наукових документів як значущої частини наукових знань відкритої науки. Для реалізації поставленої цілі в статті визначено таксономію ресурсів відкритих наукових документів та запропоновано єдину інтегровану систему їхніх метаданих, яка містить як множину загальних характеристик, притаманних усім типам наукових документів, незалежно від їх призначення, форми чи формату представлення, так і ієрархічно поширювану систему специфічних ознак окремих типів ресурсів.Prombles in programming 2023; 4: 27-38 Інститут програмних систем НАН України 2023-12-18 Article Article application/pdf https://pp.isofts.kiev.ua/index.php/ojs1/article/view/591 10.15407/pp2023.04.027 PROBLEMS IN PROGRAMMING; No 4 (2023); 27-38 ПРОБЛЕМЫ ПРОГРАММИРОВАНИЯ; No 4 (2023); 27-38 ПРОБЛЕМИ ПРОГРАМУВАННЯ; No 4 (2023); 27-38 1727-4907 10.15407/pp2023.04 uk https://pp.isofts.kiev.ua/index.php/ojs1/article/view/591/640 Copyright (c) 2023 PROBLEMS IN PROGRAMMING |
institution |
Problems in programming |
baseUrl_str |
https://pp.isofts.kiev.ua/index.php/ojs1/oai |
datestamp_date |
2024-04-26T21:18:21Z |
collection |
OJS |
language |
Ukrainian |
topic |
metadata of scientific documents metadata schema metadata of scientific publications UDC 004.94 |
spellingShingle |
metadata of scientific documents metadata schema metadata of scientific publications UDC 004.94 Zakharova, O.V. Scientific documents metadata as a component of the system of the “open science” information resources |
topic_facet |
metadata of scientific documents metadata schema metadata of scientific publications UDC 004.94 метадані наукових документів схеми метаданих метадані наукових публікацій УДК 004.94 |
format |
Article |
author |
Zakharova, O.V. |
author_facet |
Zakharova, O.V. |
author_sort |
Zakharova, O.V. |
title |
Scientific documents metadata as a component of the system of the “open science” information resources |
title_short |
Scientific documents metadata as a component of the system of the “open science” information resources |
title_full |
Scientific documents metadata as a component of the system of the “open science” information resources |
title_fullStr |
Scientific documents metadata as a component of the system of the “open science” information resources |
title_full_unstemmed |
Scientific documents metadata as a component of the system of the “open science” information resources |
title_sort |
scientific documents metadata as a component of the system of the “open science” information resources |
title_alt |
Метадані наукових документів як складова системи інформаційних ресурсів «відкритої науки» |
description |
Open science is a movement that aims to make research results more accessible, including code, data, and scientific papers. It covers many different but often related aspects affecting the entire research life cycle, including open access to publications, open data of research, open source software, open workflows, public science, open educational resources and alternative methods of the research evaluation, including open peer review, expert reviews, etc. The key to effective application and integration of open science resources is their structured description based on the principles of completeness and necessity of meta-information, ease of use and interoperability. The units of such description are metadata. In fact, the quality of open resources begins with the quality of its metadata.This study does not cover the entire wide spectrum of open science resources. Its purposes are to define the system of characteristics that describe general and specific features of various types of scientific documents as a significant part of scientific knowledge of Open Science.To achieve the goal of the research it is defined a taxonomy of resources of open scientific documents and proposes an integrated system of their metadata. Proposed system of metadata is based on several classifier sets. It includes three major groups: internal characteristics – description of explicit features of the object of open knowledge (for example, the size or the type of the file), administrative characteristics – information about the object (authors, executers, etc.) and descriptive characteristics - information about the object’s content, its special features, links to other objects related to this.The metadata system is built based on the analysis of the existing metadata schemas and standards, search engines and digital libraries, and it takes into account similarity and specificity of each type of open documents.Prombles in programming 2023; 4: 27-38 |
publisher |
Інститут програмних систем НАН України |
publishDate |
2023 |
url |
https://pp.isofts.kiev.ua/index.php/ojs1/article/view/591 |
work_keys_str_mv |
AT zakharovaov scientificdocumentsmetadataasacomponentofthesystemoftheopenscienceinformationresources AT zakharovaov metadanínaukovihdokumentívâkskladovasistemiínformacíjnihresursívvídkritoínauki |
first_indexed |
2024-09-16T04:08:50Z |
last_indexed |
2024-09-16T04:08:50Z |
_version_ |
1818568513441234944 |
fulltext |
Моделі та засоби систем баз даних і знань
27
© О.В. Захарова, 2023
ISSN 1727-4907. Проблеми програмування. 2023. №4
УДК 004.94 http://doi.org/10.15407/pp2023.04.027
О. Захарова
МЕТАДАНІ НАУКОВИХ ДОКУМЕНТІВ ЯК СКЛАДОВА
СИСТЕМИ ІНФОРМАЦІЙНИХ РЕСУРСІВ
«ВІДКРИТОЇ НАУКИ»
Відкрита наука – це рух, мета якого полягає в отриманні більш доступних результатів досліджень,
включаючи код, дані та наукові документи. Він охоплює багато різних, але часто пов’язаних аспектів,
що впливають на весь життєвий цикл дослідження, включно із відкритим доступом до публікацій, до-
слідницькими даними, програмним забезпеченням з відкритим кодом і робочими процесами, суспіль-
ною наукою, із відкритими освітніми ресурсами та альтернативними методами оцінки досліджень. А
також із відкритим рецензуванням, експертними оцінками тощо. Тобто, створюється наука, заснована
на спільних принципах, які забезпечують порівняльність, сумісність і користь для всіх досліджень на
планеті. Запорукою ефективного застосування та інтеграції ресурсів відкритої науки є їх структурова-
ний опис, що базується на принципах повноти та необхідності метаінформації, зручності її використан-
ня та інтероперабельності. Одиницями такого опису є метадані.
Дане дослідження не охоплює всього широкого спектру ресурсів відкритої науки. Його метою є струк-
туризація та формалізація лише описів наукових документів як значущої частини наукових знань відк-
ритої науки. Для реалізації поставленої цілі в статті визначено таксономію ресурсів відкритих наукових
документів та запропоновано єдину інтегровану систему їхніх метаданих, яка містить як множину зага-
льних характеристик, притаманних усім типам наукових документів, незалежно від їх призначення, фо-
рми чи формату представлення, так і ієрархічно поширювану систему специфічних ознак окремих ти-
пів ресурсів.
Ключові слова: ресурси відкритої науки, відкриті наукові знання, метадані наукових документів, схеми
метаданих, метадані наукових публікацій, метадані освітніх матеріалів, таксономія понять відкритої
науки, інфраструктура відкритої науки, тип відкритого ресурсу, метадані дисертацій, метадані моног-
рафій, формати представлення наукових ресурсів.
Вступ
Інституціоналізація відкритої науки
зародилася кілька десятиріч тому як політи-
ка перетворення наукової практики з метою
адаптації до змін, викликів, можливостей та
ризиків цифрової ери та підсилення впливу
науки на суспільство. Для забезпечення ко-
лективного розуміння його наслідків в
усьому світі, Організація Об’єднаних Націй
з питань освіти, науки та культури
(ЮНЕСКО) в листопаді 2021 року ухвалила
набір рекомендацій для міжнародної основи
політики й практики відкритої науки із зага-
льними цінностями, принципами та станда-
ртами. ЮНЕСКО визначає відкриту науку
як «інклюзивну конструкцію, яка поєднує
різні рухи та практики, спрямовані на те,
щоб зробити багатомовні наукові знання
відкритими, доступними та придатними для
повторного використання, розширити нау-
кове співробітництво й обмін інформацією
для блага науки й суспільства, а також відк-
рити процеси створення, оцінки й передачі
наукових знань представникам суспільства
за межами традиційної наукової спільноти».
Тобто відкрита наука – це прозорі
та доступні знання, що розповсюджуються
та розвиваються через спільні мережі. Але
слід зазначити, що відкритий підхід не
лише надає різні типи знань, що є у віль-
ному доступі для всіх учасників спільноти
для повторного використання, а й забезпе-
чує цілісну інфраструктуру сумісних, ста-
ндартизованих послуг та апаратних засо-
бів. Це сприяє дефрагментації, підтримці
та спрощенню наукових практик і послуг,
цілісності досліджень і наукової диплома-
тії в цілому, а також міжнародному науко-
вому співробітництву. Створюється наука,
заснована на спільних принципах, які за-
безпечують порівняльність, сумісність і
користь для всіх досліджень на планеті.
Сховища, ресурси, бази даних і сервіси
проєкту стають актуальними для вчених у
географічному масштабі за межами регіо-
ну, в якому вони розташовані, що приво-
дить до розвитку потенціалу в глобально-
му масштабі.
Відкрита наука – це рух, метою яко-
го є отримання більш доступних результа-
тів досліджень, включно із кодом, даними
та науковими паперами. Він охоплює бага-
то різних, але часто пов’язаних аспектів,
Моделі та засоби систем баз даних і знань
28
що впливають на весь життєвий цикл дос-
лідження, включно із відкритим доступом
до публікацій, дослідницькими даними,
програмним забезпеченням з відкритим
кодом і робочими процесами, суспільною
наукою, із відкритими освітніми ресурса-
ми та альтернативними методами оцінки
досліджень. А також із відкритим рецензу-
ванням, експертними оцінками тощо.
Загальна таксономія понять Відкри-
тої науки [1] наведена на рис.1.
Для забезпечення доступу до науко-
вих знань вводиться поняття «інфраструкту-
ра відкритої науки». Мається на увазі вірту-
альна або фізична дослідницька інфраструк-
тура загального користування включно із
основним науковим обладнанням та набо-
ром інструментів, таких як колекції, журна-
ли та платформи відкритого доступу до пуб-
лікацій, сховища, архіви та наукові дані. А
також сучасні інформаційні та відкриті нау-
кометричні системи, що використовуються
для оцінки та аналізу різних галузей науки.
Крім того відкрита інфраструктура для об-
числень та обробки даних дозволяє здійс-
нювати колективний і мультидисциплінар-
ний аналіз даних, вивчати об'єкти цифрової
інфраструктури, які необхідні для підтримки
відкритої науки і задоволення потреб різних
товариств. Різні сховища даних мають бути
адаптовані до конкретних характеристик
об'єктів, розміщених в них (публікацій, да-
них або кодів), до місцевих умов, потреб
користувачів та вимог дослідницьких спіль-
нот, але водночас вони повинні застосовува-
ти стандарти функціональної сумісності та
передові методи роботи для забезпечення
належної перевірки тих матеріалів, що роз-
міщуються в сховищах та для полегшення їх
пошуку й повторного використання. Але,
одразу зазначимо, що відкрите апаратне за-
безпечення та інфраструктура, яка забезпе-
чує доступ до відкритих знань, виходять за
межі цього дослідження.
Відкритий доступ
Відкрите відтворюване
дослідження
Оцінки Відкритої науки
Політики Відкритої науки
Засоби Відкритої науки
Визначення Відкритого доступу
Ініціативи Відкритого доступу
Визначення Відкритої науки
Проекти Відкритої науки
Шляхи Відкритого доступу
Використання та повторне використання Відкритого доступу
Відкриті Великі дані
Журнали Відкритих даних
Визначення Відкритих даних
Стандарти Відкритих даних
Використання та повторне використання Відкритих даних
Відкриті державні дані
Визначення Відкритих відтворюваних досліджень
Дослідження невідтворюваності
Відкриті лабораторні/конспекти
Робочі процеси Відкритої науки
Відкриті джерела у Відкритій науці
Рекомендації відтворюваності
Рекомендації Відкритої науки
Тестування відтворюваності
Відкриті метрики та вплив
Відкриті репозиторії
Відкриті сервіси
Відкриті інструменти робочих процесів
Відкрита наука
Відкриті дані
Відкриті рецензії
Альтметрики
Бібліометрики
Семантометрики
Вебометрики
Організаційні мандати
Тематичні політики
Політики донорів
Державні політики
Інституційні політики
Політики Відкритого доступу
Політики Відкритих даних
Рис.1. Таксономія Відкритої науки
Моделі та засоби систем баз даних і знань
29
Фокусом даного дослідження є лише
структуризація та формалізація описів науко-
вих документів як значущої частини науко-
вих знань (ресурсів) відкритої науки за допо-
могою створення системи їхніх метаданих.
Таксономія ресурсів
«відкриті знання»
Насамперед, слід визначитися, що ж
саме ми будемо розуміти під науковими
знаннями. Тобто, які типи ресурсів відкритої
науки створюють «відкриті наукові знання».
Загалом, під науковим знанням ро-
зуміють набір надійної інформації про
Світ, отриманої в процесі збору даних,
експериментів та аналізу, досягнутих за
допомогою наукових досліджень. На мак-
ро рівні всі типи наукових знань можна
розділити на кілька великих груп: наукові
документи, науковці (фізичні та юридичні
особи), експонати (макети, моделі), науко-
ві програми досліджень та наукові заходи.
Аналіз джерел наукових знань дозволив
детальніше класифікувати основні типи
ресурсів відкритої науки у такий спосіб:
− Наукові документи
o Наукові публікації
▪ Монографії
▪ Дисертації
▪ Препринти
▪ Автореферати
▪ Наукові реферативні
огляди
▪ Тези
• Бакалаврські
• Магістерські
• Кандидатські
• Докторські
▪ Інтернет-ресурси
▪ Наукові звіти
▪ Аналітичні огляди
▪ Наукові видання (жу-
рнали, збірники тощо)
▪ Статті
• З журналів
• Зі збірників
• З газет
o Матеріали форумів, конфе-
ренцій, семінарів тощо
▪ Наукові доповіді
▪ Тези доповідей
▪ Презентації
▪ Матеріали стендів
o Освітні матеріали
▪ Матеріали курсів
▪ Підручники
▪ Лекції
▪ Методичні та дидак-
тичні матеріали
▪ Презентації
▪ Реферати
o Патенти
o Програмне забезпечення (ПЗ)
▪ Проєкти, схеми, мо-
делі даних, процесів
тощо
▪ Програмні застосунки
та бібліотеки
▪ Відкритий вихідний
код ПЗ
▪ Ліцензії
▪ Набори даних
▪ Івенти у програмних
застосунках
o Експертні оцінки
o Рецензії
o Свідоцтва про реєстрацію
авторських прав
o Інтерактивні ресурси
o Мапи
o Музичні нотатки
o Аудіо матеріали
o Зображення
▪ Статичні рисунки
▪ Відеоматеріали
o Протоколи випробувань
o Статистична інформація
різних типів
▪ Міжнародна музейна
статистика
o Закони, нормативні акти тощо
− Експонати, моделі, макети, істори-
чні і культурні пам’ятки (цифрові
описи з фотоматеріалами), матеріа-
ли музейних і бібліотечних архівів
− Експозиції, виставки
− Наукові програми
Моделі та засоби систем баз даних і знань
30
o Освітні
o Дослідницькі
o Експериментальні
− Наукові заходи
o Конференції
o Симпозіуми
o Семінари
o Наради
o Випробування
o Виставки
− Наукові дослідники (фізичні
та юридичні особи)
o Науковці/дослідники
(фізичні особи)
o Наукові установи
▪ Науково – дослідни-
цькі інститути
▪ Учбові центри
▪ Конструкторські бюро
▪ Університети
▪ Музеї
▪ Виставкові центри
▪ Архіви
▪ Наукові бібліотеки
▪ Інші дослідницькі
організації
Наукові документи є відкритими, до
них забезпечується безкоштовний доступ,
вони можуть багаторазово використовува-
тися, зберігатися та повторно поширюватись
будь-якою особою за умови зазначення дже-
рела. Для програмного забезпечення відкри-
тий вихідний код в людино– і машино–
читаному форматі надається користувачам у
зручній для них формі відповідно до відкри-
тої ліцензії. Це дає третім особам право дос-
тупу, зміни, доповнення, вивчення, викорис-
тання та/або розповсюдження програмного
забезпечення і його вихідного коду, дизайну
або концепції, а також створення на їхній
основі похідних робіт. Найважливіші аспек-
ти відкритих даних пов’язані з їхнім змістом
та внутрішньою організацією. В деяких си-
туаціях також важливу роль відіграє третій
аспект відкритих даних – їх оточення. Це
найскладніший, але дуже важливий аспект
для стратегічного й тематичного розвитку
аналітики й пошуку знань, особливо з підк-
люченням суміжної проблематики. В прос-
торі відкритих даних контекстом для зада-
ного набору є всі інші дані, з якими їх змо-
жуть коректно зв’язати аналітики з тих чи
інших підстав. Правильно визначити кон-
текст можна лише, якщо для основних да-
них правильно задана предметна область
(ПО) та їхнє призначення. Це досягається
через опис даних набором спеціальних хара-
ктеристик – метаданих.
Якість відкритих даних починається
з якості їхніх метаданих. Зазвичай схеми
метаданих визначаються, виходячи, перш
за все, з таких аспектів даних, як сенс,
структура та формат.
Метою даного дослідження є ви-
значення схем метаданих для ресурсів «ві-
дкритих наукових документів» як складо-
вої інфраструктури відкритих ресурсів на
основі існуючих схем та стандартів мета-
даних. Для кожної з виділених груп можна
виокремити загальні метадані, які можуть
бути використані для опису ресурсів усіх
типів групи, та більш специфічні, що вра-
ховують особливисті окремих типів.
Різновиди і типи метаданих
Загалом, у поняття метаданих
вкладається додатковий опис якогось –
об'єкту або процесу. В ракурсі даних дос-
ліджень такими об’єктами/процесами є
різноманітні компоненти відкритих нау-
кових знань. Сам об'єкт метаданих може
мати різні форми і класифікуватись за
певними ознаками. Наприклад, зміст –
опис шуканого об'єкта у вигляді розміру й
типу файлу, інформації про вміст ресурсу,
ставлення до ресурсу або його компонен-
тів – базова інформація про об'єкт тощо.
Будь-яка інформаційна система за-
звичай передбачає класифікацію метада-
них на три великі головні групи: внутріш-
ні – опис явних ознак самого об'єкту (роз-
мір або тип файлу); адміністративні – ін-
формація про об'єкт (автор, виконавець
тощо); описові – інформація про природу
об'єкту, його особливі ознаки, посилання
на інші об'єкти, пов'язані з шуканим [2].
Формат метаданих являє собою
уніфіковану форму опису властивостей
об'єкта, що дозволяє отримати більш повне
уявлення про цей об’єкт. На сьогодні роз-
роблено велику кількіть стандартів мета-
Моделі та засоби систем баз даних і знань
31
даних для об’єктів різних типів, призна-
чення та форматів представлення. Найпо-
ширенішими є:
– MARC та його різновиди – стан-
дарт, в основному застосовується для книг
і бібліографічних ресурсів із зазначенням
назви, автора, року написання або виходу.
– DCMI – стандарт, прийнятий для
опису інтернет-об'єктів, електронних до-
кументів, ресурсів тощо.
– FOAF і vCard – опис персоніфі-
кованих даних людей і організацій (у фор-
маті vCard при експорті з мобільних при-
строїв зберігаються списки контактів).
– CDWA – стандарт для опису іс-
торичних або музейних цінностей.
– ONIX і PRISM – інформація про
видавництво.
– CIF – кристалографія;
– VICAR – обробка зображень,
отриманих із супутників.
– NewsXML – новинні метадані
тощо.
Цей список можна продовжувати до
нескінченності, оскільки для будь-якого
аспекту людської діяльності сьогодні мо-
жна знайти єдиний підхід в описі. Тому
мета даного дослідження – на основі за-
пропонованої вище (з можливим розши-
ренням) класифікації ресурсів відкритої
науки та на підставі аналізу існуючих схем
метаданих, пошукових систем, стандартів
опису, так чи інакше пов’язаних з тим чи
іншим об’єктом наукових знань, сформу-
вати єдині системи метаданих для кожної з
груп наукових документів як ресурсів від-
критої науки.
Базові аспекти побудови схеми
метаданих наукових документів
Наукові публікації не лише скла-
дають більшу частину контенту відкритих
документів просто за його обсягом, а й
посідають центральне місце серед ресур-
сів даного типу. Адже зазвичай містять
опис результатів наукових досліджень, а,
отже, й нові наукові знання. Метадані на-
укових публікацій також є важливою час-
тиною наукового дослідження, оскільки
від них залежить показник цитування пу-
блікації. Українські та міжнародні журна-
ли існують з відкритою, закритою та змі-
шаною політикою доступу. В наукомет-
ричних базах даних, зокрема, Scopus та
Web of Science, незалежно від рівня дос-
тупу, назва, анотація та ключові слова
завжди відображаються вичерпно. Вони
повинні виконувати функцію реклами,
оскільки із загальної кількості публікацій,
представлених у реферативних базах да-
них, дослідник обере саме інформативну.
Більшість наукових публікацій являють
собою різновиди бібліографічних ресур-
сів, для опису яких найпоширенішими
стандартами, на сьогодні, лишається
MARC [14] та його різновиди. Також, як і
для решти типів контентів та інтернет-
ресурсів, значущими лишаються загальні
характеристики, визначені DCMI (Dublin
Core Metadata Initiative) стандартом.
Але, зрозуміло, що цілісність науко-
вих знань не можлива без усього широкого
спектру наукових документів. Так аналітич-
ні звіти та огляди не є опублікованими мате-
ріалами, але зазвичай містять більш ємні та
детальні описи результатів, ніж опубліковані
за темою статті, препринти, монографії то-
що. Дисертаційні роботи також мають особ-
ливості, як підсумок дослідження, проведе-
ного з метою здобуття наукового ступеню
автором. Зокрема, їх опис має враховувати
вимоги та стандартні протоколи, застосовані
до робіт даного типу. Недарма, в цифрових
наукових бібліотеках дисертаційні роботи та
автореферати до них виділяються в окремі
репозиторії та пов’язані з певними критері-
ями пошуку у сховищі.
На відміну від дисертації або нау-
кового звіту, які є суто науковою публіка-
цією, монографії [21] належать до науко-
во-популярної або навчально-методичної
літератури. Розділи монографії можуть
містити наукові положення, як-от, дисер-
тації, але, водночас, монографія адресова-
на ширшій аудиторії, а не лише фахівцям з
теми. Тож має бути адаптована для читача
і, за можливості, викладена простішою та
зрозумілішою мовою.
Препринти щодо інших наукових,
науково-популярних та навчально– мето-
дичних публікацій (статей, тез, монографій
тощо), фактично є попереднім варіантом
наукового видання, яке публікують ще до
Моделі та засоби систем баз даних і знань
32
випуску офіційного кінцевого варіанту
матеріалу. Це роботи без рецензії та публі-
кації в журналі. Їх ніяк не враховують у
звітах, статистиці, вони не впливають на
науковометричні показники вченого. Еле-
ктронні препринти розміщені в Інтернеті,
називаються "E-принтом". Із 2017 року
препринти введені до профілю Scopus [24].
На відміну від книжок (монографій) для
препринту обов’язковими характеристи-
ками є код та установа, де відбуваються
відповідні дослідження.
Однак більшість наукових публіка-
цій все ж вимагають попереднього рецен-
зування науковими експертами. Такі реце-
нзії виявляють актуальність досліджень,
напрямки розвитку й зауваження до них, і
самі є науково змістовними та у поєднанні
з об’єктом рецензування значущими еле-
менами наукових знань. Їхні описові хара-
ктеристики мають формуватися, виходячи
з вимог щодо наукового рецензування, та
враховувати загальноприйняту структуру
побудови наукової рецензії.
Особливої уваги заслуговують та-
кож архівні документи, що складають чи-
малу частину наукових знань та є підгрун-
тям сучасних знань. Основний міжнарод-
ний стандарт архівного опису – ISAD(G)
[12]. Даний стандарт вводить правила бага-
торівневого опису архівних документів,
визначає базову термінологію опису та
пропонує систему характеристик, організо-
ваних у сім груп описової інформації (оди-
ницею опису в даному випадку є документ
будь-якого типу чи група документів, що
розглядається як єдине ціле). Слід зазначи-
ти, що стандарт спрямований саме на опис
архівних документів, тому містить також
характеристики, які визначають фонди,
архівну інформацію тощо.
Окрему групу наукових публікацій
складають освітні матеріали, до яких нале-
жать: курси лекцій, матеріали навчальних
курсів, підручники, е-підручники, методич-
ні та дидактичні матеріали, презентації,
реферати тощо. Частина з перелічених ти-
пів ресурсів, таких, як підручники, методи-
чні та дидактичні матеріали тощо, передба-
чають наявність паперового варіанту. Реш-
та зазвичай існує лише в цифровому предс-
тавленні. Для освітніх матеріалів, що мають
паперове та цифрове представлення, засто-
совуватиметься більшість метаданих, що є
дійсними для монографій та статей. А для
існуючих лише у цифровому представлені,
– ті, що визначаються для інтернет-
ресурсів, зокрема, е-підручників [19, 20].
Окрім специфіки, пов’язаної з ти-
пом відкритого ресурсу, певні особливості
можуть бути обумовлені форматом його
представлення. Головні три форми пред-
ставлення наукових документів – це текст,
зображення та презентації. Так, зокрема,
діаграмам, схемам, фотоматеріалам, рису-
нкам, що можуть бути як окремими пов-
ноцінними об’єктами наукових докумен-
тів, так і приєднаним вкладенням або час-
тиною більш складного об’єкта (наукової
роботи), притаманні метадані зображень.
Усі ці особливості обумовлюють ви-
значення специфічних метаданих для різних
типів ресурсів у межах групи «науковий
документ», разом із загальними описовими
характеристиками, притаманними всьому
спектру відкритих ресурсів цієї групи.
Отож, система метаданих «відкритих
наукових документів» буде базуватися на:
– стандартах загального опису до-
кументів, головним з яких досі є DCMI
(Dublin Core Metadata Initiative) [3]
– аналізі систем описових характе-
ристик існуючих цифрових бібліотек, зок-
рема, описів дисертаційних робіт та авто-
рефератів, електронних підручників, моно-
графій тощо, та наборах критеріїв пошуку
в них [15-17, 20]
– стандартах із бібліотечної справи
та суміжних областей [23],
– загальному аналітичному аналізі
існуючих міжнародних дескриптивних
стандартів [13],
– аналізі систем індексації публіка-
цій науковометричними базами даних
Scopus [18], Web of Science тощо,
– міжнародному стандарті архівно-
го опису – ISAD(G),
– стандартах і схемах метаданих
зображень [4], таких як EXIF [5], DCF [6],
IPTC, XMP [7 – 9], ISO 16684-2:2014,
– вивченні особливостей системи
індексації монографій [22].
Необхідно усвідомлювати, що пе-
релічені типи ресурсів тісно пов’язані з
Моделі та засоби систем баз даних і знань
33
іншими різновидами відкритих ресурсів,
які також можна розглядати як різновиди
відкритих наукових знань та з їх описами.
Такими ресурсами, наприклад, є наукові
видання, фізичні та юридичні особи – нау-
ковці тощо. Із побудовою єдиної системи
метаданих відкритої науки такі взає-
мозв’язки дозволять повніше та багатог-
ранніше здійснити опис відкритого науко-
вого ресурсу. Так, наприклад, посилання
на автора в метаописі наукової публікації
дозволить отримати доступ до вичерпного
метаопису даного науковця. Розгорнута
система характеристик видання, де опублі-
ковано наукову роботу, також може свід-
чити щонайменше про її важливість. Це
павутиння розширюється зв’язками з відк-
ритими ресурсами інших типів, як-от, нау-
кові заходи, апаратне обладнання тощо.
Метадані відкритих наукових
документів
Базуючись на вище викладених ас-
пектах, існуючих стандартах та цифрових
системах роботи з інформацією (пошуко-
вих системах, цифрових бібліотеках тощо),
пропонується схема метаданих наукових
документів, класифікованих за спільними
та особливими ознаками типів ресурсів,
поєднаних поняттям «відкритий науковий
документ». Загальні метадані притаманні
всім типам інформаційних ресурсів, що
розглядаються.
Загальні метадані відкритих нау-
кових документів:
− ідентифікатор інформаційного ресурсу
(посилання на ресурс);
− назва ресурсу;
− тип ресурсу (наукова публікація/освітні
матеріали/діаграма/модель тощо);
− дата останнього оновлення метаданих
інформаційного ресурсу;
− дата реєстрації інформаційного ресурсу;
− служба, що реєструє інформаційний
ресурс;
− інформація про власника ресурсу;
o ПІБ рідною мовою;
o ім’я та прізвище англійською мо-
вою;
− консультант – особа, до якої можна
звертатися за додатковою інформацією;
− інформація про авторів (може співпа-
дати з власником)/співавторів
o ПІБ рідною мовою;
o ім’я та прізвище англійською мо-
вою;
o посада;
o звання;
o наукова ступінь;
o посада, звання, науковий ступінь
авторів англійською мовою (пере-
клад згідно з міжнародними стан-
дартами);
o міжнародні ідентифікатори (коди)
вчених:
▪ ORCID ID;
▪ Scopus ID;
▪ Researcher ID;
▪ h-індекс;
− додаткові відомості про авторів/
співавторів:
o місце роботи:
▪ назва установи;
▪ адреса;
o контактні телефони;
o електронна адреса;
o кількість публікацій:
▪ в українських виданнях;
▪ в зарубіжних виданнях;
− коди рубрикатора – тематика ресурсу,
що виражена кодами стандартного пе-
реліку тематичних рубрик;
− ключові слова;
− стислий опис (зміст ресурсу, влючно із
анотацією чи рефератом, або опис кон-
тенту візуальних, аудіо– або мульти-
медійних ресурсів);
− фінансування – форма фінансування
під час створення та введення ресурсу;
− дата створення/подання або останнього
оновлення контенту;
− період оновлення;
− чи існує паперовий варіант;
− інформація про інтернет –ресурс,
де опубліковано (цифрова бібліотека/
електронний журнал тощо);
− інформація про файл ресурсу:
o розмір;
o формат;
o місце зберігання у файловому
сховищі;
− посилання на ресурс в мережі;
Моделі та засоби систем баз даних і знань
34
− метричні показники документу:
o розмір сторінки;
o шаблон;
o кількість сторінок у документі.
Метадані текстових ресурсів:
− мова (для текстового ресурсу);
− УДК (код класифікатора);
− анотація мовою оригіналу;
− анотація англійською мовою;
− ключові слова рідною та англійською
мовами;
− список використаних джерел (references):
o посилання;
o статус (закрите, відкрите, обмеже-
не);
− відсоток відкритих посилань (open
references), тобто доступних усім кори-
стувачам усіх API та сервісів Crossref;
− Funder Registry ID (назва та ідентифіка-
тор организації, яка фінансує дослі-
дження та є у спеціальному реєстрі
Crossref);
− Funding Award Numbers (інформація
щодо фінансування дослідження, на-
приклад, номеру грантів або премій,
пов’язаних з науковим дослідженням);
− чи застосовується сервіс, що відслідко-
вує зміни статті після публікації;
− повнотекстове посилання для серві-
су Crossref Similarity Check (перевірка
подібності, перевірка на плагіат);
− повнотекстове посилання для антивіру-
сної бази iThenticate;
− посилання у списках літератури
(Citation);
− додаткові метричні показники:
o номери сторінок у журна-
лі/збірнику;
o кількість використаних джерел;
o обсяг приєднаного матеріалу:
▪ графічного (кількість рисун-
ків);
▪ таблиць;
▪ формул;
▪ схем;
− структура матеріалу (зміст):
o глави/розділи/лекції;
o додатки.
Додаткові метадані, специфічні для
тез/дисертацій/авторефератів/дипломних
робіт:
− на здобуття якого ступеня (кандидатсь-
кий, докторський, магістерський тощо);
− код спеціальності ВАК;
− керівник досліджень;
− перелік друкованих робіт за темою до-
сліджень;
− інформація про джерела фінансування
дослідження (грант, стипендія тощо);
− дата захисту (для дисертації);
− місце захисту (для дисертації);
− дата присвоєння наукового ступеня
(для дисертації);
− інформація про практичне впрова-
дження;
− список використаних джерел англійсь-
кою мовою (references);
− політика доступу;
− посилання на автореферат (дисертації).
Метадані, специфічні для звітів
про науково-дослідну роботу:
− тип звіту (анотований, остаточний, річ-
ний тощо);
− період виконання досліджень;
− назва проєкту, в межах якого викону-
ються дослідження;
− кількість наукових робіт, опублікова-
них у рамках звітного періоду.
Додаткові метадані для наукових
робіт, що мають паперовий варіант:
− видавництво, що опубліковало статтю
(не визначається для інтернет-
ресурсів);
− інформація про видання/журнал/газету
(де опубліковано);
− дата публікації.
Специфічні метадані матеріалів
конференцій/семенарів/форумів:
− тип події (конференція, семінар, форум
тощо);
− назва події;
− назва матеріалів (збірника матеріалів);
− регулярність проведення;
− дата проведення події;
− місце проведення події:
o країна;
o місто;
o установа;
o адреса;
− загальна наукова спрямованість;
− інформація про наукові розділи:
Моделі та засоби систем баз даних і знань
35
o назва розділу;
o кількість доповідей в розділі;
o інформація про доповіді:
▪ назва;
▪ інформація про доповідача;
▪ відомості про співавторів;
▪ тип доповіді (стендова, пові-
домлення, повноцінна тощо);
▪ анотація;
▪ тези доповіді;
▪ посилання на повний текст до-
повіді;
▪ посидання на аудіозапис/відео-
запис доповіді;
▪ приєднані матеріали:
• наявність;
• тип (презентації, додатки,
роздаткові матеріали, стен-
дові матеріали тощо);
• назва;
• посилання на приєднані ма-
теріали.
Специфічні метадані для публіка-
цій (монографій/підручників/препринтів):
− рецензенти:
o посада;
o вчене звання;
o науковий ступінь;
o місце роботи;
o ПІБ;
− рекомендація до видання;
− знак охорони авторського права;
− унікальний ідентифікатор DOI (роботи
в цілому або розділів монографії).
Метадані, специфічні лише для
препринтів:
− код препринту;
− установа.
Додаткові метадані, притаманні
для освітніх матеріалів:
− тип матеріалу (підручник, методичні
вказівки тощо);
− тип представлення (текст/ презента-
ція/відео тощо);
− міністерство (чи інша керуюча устано-
ва);
− назва навчального закладу;
− до якого освітнього курсу належить;
− вихідні відомості.
Метадані, специфічні для рецензій:
− назва рецензованої роботи;
− посилання на науковий матеріал, що
рецензується;
− дата рецензії;
− дані про автора рецензії:
o посада;
o вчене звання;
o науковий ступінь;
o місце роботи;
o ПІБ;
− висновок (позитивний/негативний);
− посилання на повний текст рецензії;
− стислий зміст:
o переваги рецензованої роботи;
o зауваження до роботи.
Метадані, специфічні для архів-
них документів:
− характеристики ідентифікації:
o рівень структури документа (на-
приклад, збірка робіт, матеріали
конференції чи стаття, опис коле-
кції чи конкретного експонату);
o носій, де зберігається документ;
− характеристики контексту:
o біографічні дані автора;
o архівна історія документу (для ар-
хівних документів);
o безпосереднє джерело комплекту-
вання або переклад (джерело, звід-
ки було отримано документ, або
дата та/або спосіб комплектування,
якщо ця інформація частково або
повністю конфеденційна);
− характеристики змісту та структури:
o рамки (період часу, географія то-
що) та зміст (форма документа,
тема тощо) документа відповідно
до рівня опису;
o інформація щодо оцінювання,
знищення документу або плану-
вання відповідних дій;
o подальші поповнення (доповнен-
ня) одиниці опису;
− характеристики доступу та використання:
o правила доступу (правовий статус
або інші правила, що регламенту-
ють доступ до документу);
o умови відтворення документу;
o фізичні характеристики та техніч-
ні умови (апаратні та програми,
необхідні для доступу до докуме-
нту, вимоги до зберігання тощо);
Моделі та засоби систем баз даних і знань
36
o науково-довідковий апарат (поси-
лання на наявні довідкові засоби,
які містять інформацію із контекс-
ту та змісту документу);
− характеристики взаємопов’язаних ма-
теріалів:
o наявність та місце розміщення
оригіналу документу;
o наявність та місцезнаходження ко-
пій;
o пов’язані документи;
o примітки про наявні публікації
(публікації, що присвячені даній
одиниці опису або засновані на її
використанні);
− примітки (інформація про документ,
що не може бути подана в інших хара-
ктеристиках);
− характеристики контролю опису:
o примітки архівіста (як і ким було
створено опис документу);
o правила, за якими створений опис;
o дати створення опису.
Метадані зображень:
− розмір зображення в пікселях;
− тип зображення (цифрова фотографія,
рисунок, схема, діаграма, мапа);
− опис зображення;
− коментарі користувача;
− права доступу до інформаційного
об’єкту;
− приєднане аудіо (якщо є, ідентифіка-
тор, назва та посилання);
− приєднана анотація (якщо є, ідентифі-
катор, назва та посилання);
− кольорове/чорно-біле;
− характеристики, притаманні лише циф-
ровим фотографіям [10]:
o параметри фотокамери, з якої бу-
ло зроблено фотографію (з повним
переліком можна ознайомитися в
описі EXIF-схеми):
▪ модель;
▪ виробник;
▪ діафрагма;
▪ витримка;
▪ швидкість;
▪ експокорекція;
▪ фокусна відстань;
▪ світлосила;
▪ експозамір;
▪ відстань до об’єкта;
▪ спалах режим;
▪ спалах енергія;
▪ тощо;
o геолокація, де була зроблена фо-
тографія;
− семантичні текстові анотації:
o текстові мітки, приєднані до зо-
браження;
o назва рисунку, що виводиться на
самому зображенні чи приєднана
до нього;
o розширений опис;
o опис основних елементів зобра-
ження;
− характеристики візуалізації:
o набір візуальних слів [11].
Метадані, що специфічні для пре-
зентацій:
− кількість слайдів;
− шаблон презентації, що використову-
ється;
− розширений опис;
− пов’язаний файл доповіді;
− подія, до якої стосується презентація;
− спецефекти, що використовуються для
слайд-шоу в цілому;
− метадані слайдів:
o номер слайду;
o тема слайду;
o текстові мітки, приєднані до
слайду;
o рисунки/діаграми/таблиці, встав-
лені в слайд;
o використані спецефекти.
Висновки
Мета дослідження полягає у розро-
бці єдиної схеми метаданих ресурсів відк-
ритої науки. Зокрема, фокусом даної робо-
ти є визначення системи характеристик,
які описують загальні та специфічні озна-
ки різних типів наукових документів як
значущої частини наукових знань відкри-
тої науки.
В результаті досліджень:
1) здійснено аналіз головних понять,
визначень та потреб відкритої нау-
ки;
2) на базі цього аналізу виокремлені
ресурси відкритої науки, що фор-
Моделі та засоби систем баз даних і знань
37
мують клас «відкриті наукові знан-
ня», та запропоновано таксономію
цих ресурсів;
3) здійснено аналіз ресурсів у межах
визначеної ієрархії «відкриті науко-
ві знання» та базі цього аналізу за-
пропоновано систему схем метада-
них таких ресурсів.
Напрямки подальших досліджень
полягають у вдосконаленні запропонова-
них схем метаданих і проведенні всебічно-
го аналізу програмних засобів створення,
управління та інтеграції метаданих для
ресурсів відкритої науки та визначення
можливості й ефективності їх застосування
для тих чи інших груп ресурсів.
Література
1. https://www.fosteropenscience.eu/content/ope
n-science-training-handbook
2. https://hi-news.pp.ua/tehnka-tehnologyi/7373-
metadan-ce-viznachennya-vidi-ta-varanti-
vikoristannya-metadanih-u-prikladnomu-
programuvann.html
3. https://www.dublincore.org/
4. https://habr.com/ru/post/93119/
5. https://www.exif.org/category/specifications
6. http://exif.org/dcf.PDF
7. https://helpx.adobe.com/after-
effects/using/xmp-metadata.html
8. ISO 16684-1:2012, Graphic technology –
Extensible metadata platform (XMP) specifi-
cation – Part 1: Data model, serialization and
core properties
9. https://www.adobe.com/devnet/xmp.html
10. https://www.ixbt.com/digimage/metadxph.sht
ml
11. J. Sivic and A. Zisserman. Video google: A
text retrieval approach to object matching in
videos. In Proc. of 9th IEEE Int'l Conf. on
Computer Vision, Vol. 2, 2003.
12. 1999_ISAD_G.pdf (archives.gov.ua)
13. https://undiasd.archives.gov.ua/doc/ao-
deskreptyvni%20standarty.pdf
14. https://www.loc.gov/marc/
15. https://nim.media/articles/shcho-take-
metadani-statti-yak-voni-vplivayut-na-yiyi-
indeksatsiyu
16. http://openscience.in.ua/key-metadata-
elements.html
17. http://www.4author.com/ru/blog/story/metada
nnye-nauchnoi-stati-osnova-raboty-kotoruiu-
budut-tcitirovat
18. http://www.library.univ.kiev.ua/ukr/res/scopu
s_author.pdf
19. https://dspace.uzhnu.edu.ua/jspui/handle/lib/3
8156
20. Каталоги – НБУВ Національна бібліотека
України імені В. І. Вернадського (irbis-
nbuv.gov.ua)
21. https://ukrlogos.in.ua/ua_monographie.php
22. https://isg-konf.com/uk/indeksatsiya-
monografij-ukr/
23. http://www.nbuv.gov.ua/sites/default/files/bas
icpage_files/202107_basicpage_files_mat/per
elik_standartiv-_2021.07.01.pdf
24. https://nim.media/articles/nova-funktsiya-v-
scopus---preprinti
References
1. https://www.fosteropenscience.eu/content/ope
n-science-training-handbook
2. https://hi-news.pp.ua/tehnka-tehnologyi/7373-
metadan-ce-viznachennya-vidi-ta-varanti-
vikoristannya-metadanih-u-prikladnomu-
programuvann.html
3. https://www.dublincore.org/
4. https://habr.com/ru/post/93119/
5. https://www.exif.org/category/specifications
6. http://exif.org/dcf.PDF
7. https://helpx.adobe.com/after-
effects/using/xmp-metadata.html
8. ISO 16684-1:2012, Graphic technology –
Extensible metadata platform (XMP) specifi-
cation – Part 1: Data model, serialization and
core properties
9. https://www.adobe.com/devnet/xmp.html
10. https://www.ixbt.com/digimage/metadxph.sht
ml
11. J. Sivic and A. Zisserman. Video google: A
text retrieval approach to object matching in
videos. In Proc. of 9th IEEE Int'l Conf. on
Computer Vision, Vol. 2, 2003.
12. 1999_ISAD_G.pdf (archives.gov.ua)
13. https://undiasd.archives.gov.ua/doc/ao-
deskreptyvni%20standarty.pdf
14. https://www.loc.gov/marc/
15. https://nim.media/articles/shcho-take-
metadani-statti-yak-voni-vplivayut-na-yiyi-
indeksatsiyu
16. http://openscience.in.ua/key-metadata-
elements.html
17. http://www.4author.com/ru/blog/story/metada
nnye-nauchnoi-stati-osnova-raboty-kotoruiu-
budut-tcitirovat
18. http://www.library.univ.kiev.ua/ukr/res/scopu
s_author.pdf
19. https://dspace.uzhnu.edu.ua/jspui/handle/lib/3
8156
Моделі та засоби систем баз даних і знань
38
20. Catalogs – NBUV National Library of
Ukraine named after V. I. Vernadskyi (irbis-
nbuv.gov.ua)
21. https://ukrlogos.in.ua/ua_monographie.php
22. https://isg-konf.com/uk/indeksatsiya-
monografij-ukr/
23. http://www.nbuv.gov.ua/sites/default/files/bas
icpage_files/202107_basicpage_files_mat/per
elik_standartiv-_2021.07.01.pdf
24. https://nim.media/articles/nova-funktsiya-v-
scopus---preprinti
Одержано: 24.10.2023
Про автора:
Захарова Ольга Вікторівна,
кандидат технічних наук,
старший науковий співробітник.
Кількість наукових публікацій
в українських виданнях – 35.
http://orcid.org/0000-0002-9579-2973.
Місце роботи автора:
Інститут програмних систем
НАН України,
проспект Академіка Глушкова, 40.
Тел.: 526 5139.
E-mail: ozakharova68@gmail.com.
Моб.тел.: +38(068)594756
|