Інструкція провайдерам даних по підключенню до Харвестеру відкритої науки НАН України

Ця інструкція допоможе провайдерам даних оптимізувати доставку ваших даних через інтерфейс OAI у Харвестер. Якщо ви дотримуватиметесь цих правил, безпроблемне і швидке індексування в Харвестер гарантоване. Документи з вашого джерела будуть оптимально і повно представлені в Харвестері, і, відповідно, всі інші сервіси, які індексують дані через ваш інтерфейс OAI, також виграють від цього.

Вступ

Ми індексуємо метадані всіх видів академічно релевантних ресурсів ‒ таких як журнали, інституційні репозитарії, цифрові колекції тощо, які надають інтерфейс OAI та використовують протокол Open Archives Initiative Protocol for Metadata Harvesting[1] (OAI-PMH) для надання свого контенту. Проіндексовані дані зберігаються на серверах Інституту програмних систем НАНУ.

Ця інструкція допоможе вам оптимізувати доставку ваших даних через інтерфейс OAI у Харвестер. Якщо ви дотримуватиметесь цих правил, безпроблемне і швидке індексування в Харвестер гарантоване. Документи з вашого джерела будуть оптимально і повно представлені в Харвестері, і, відповідно, всі інші сервіси, які індексують дані через ваш інтерфейс OAI, також виграють від цього.

Ви можете перевірити деякі з перелічених тут пунктів за допомогою валідаторів OVAL[2] або OAI-PMH Validator[3].

Якщо ваше джерело не має інтерфейсу OAI, пряме індексування вашого джерела наразі неможливе. У цьому випадку завантажуйте документи в агрегатори, наприклад, DataCite[4] або Zenodo[5], або в спеціалізовані репозитарії, які вже проіндексовані в Харвестері (див. наш список постачальників контенту), або зареєструйте свій журнал відкритого доступу в DOAJ[6]. Ми регулярно індексуємо цих постачальників контенту. Якщо ваші документи містяться в такому агрегаторі, їх, як правило, вже можна знайти в Харвестері. Окрема реєстрація вашого джерела в Харвестер не потрібна.

Однак найкращим способом для того, щоб ваші документи були проіндексовані нами і знайдені в Харвестері, є використання вашого власного інтерфейсу OAI. Тільки тоді ваше джерело з'явиться окремим рядком у списку постачальників контенту.

Ми також індексуємо контент з відкритим доступом від академічних видавництв, який доступний через видавничу платформу Crossref[7]. У цьому випадку, будь ласка, повідомте нам назву вашого джерела та ідентифікатор Crossref через контактну форму. Ми перевіримо, чи можлива індексація вашого джерела.




[1]      https://www.openarchives.org/OAI/openarchivesprotocol.html


[2]      http://oval.base-search.net


[3]      https://validator.oaipmh.com


[4]      https://datacite.org/


[5]      https://zenodo.org/


[6]      https://doaj.org/


[7]      https://www.crossref.org

1. Вимоги до постачальників контенту

Загальні вимоги провайдера сервісу до провайдера даних охоплюють різні аспекти, включно з якістю даних, доступністю, безпекою та дотриманням стандартів і нормативів. Ці вимоги допомагають забезпечити надійну та ефективну взаємодію між сервісами та джерелами даних, яка відповідатиме очікуванням користувачів. Ось ключові аспекти цих вимог:

Якість даних. Провайдер даних повинен забезпечувати високу якість даних, що передаються, включно з точністю, актуальністю та повнотою інформації. Повинні дотримуватися стандарти і норми для форматування і структурування даних.

Доступність і надійність. Дані мають бути доступні для запитів у будь-який час із мінімальними простоями. Провайдер даних зобов'язаний забезпечити надійне зберігання даних і їх резервне копіювання для запобігання втрат.

Безпека. Необхідно гарантувати безпеку даних, включно із захистом від несанкціонованого доступу, злому і витоків інформації. Повинні бути реалізовані механізми аутентифікації та авторизації доступу до даних.

Дотримання законодавства. Провайдер даних зобов'язаний дотримуватися чинного законодавства в галузі захисту даних. Повинні бути передбачені механізми для захисту персональних даних і конфіденційної інформації.

Інтероперабельність. Дані мають бути надані в стандартизованих форматах, що підтримують легку інтеграцію та обмін даними між різними системами і сервісами. Бажана підтримка відкритих стандартів і API для спрощення інтеграції.

Технічна підтримка та служба підтримки. Провайдер даних повинен надавати якісну технічну підтримку для вирішення питань, що виникають, і проблем. Бажані регулярні оновлення даних і покращення сервісу.

Гнучкість і масштабованість. Система має бути здатна адаптуватися до мінливих вимог і обсягів даних. Повинна бути передбачена можливість масштабування сервісу відповідно до зростаючих потреб.

2. Як стати постачальником контенту

Виконайте наступні кроки, щоб запропонувати джерело/постачальника контенту, який ще не індексується в Харвестері.

Якщо ваше джерело вже проіндексоване як постачальник контенту і ви хочете повідомити нас про суттєві зміни у вашому джерелі (наприклад, про зміну URL-адреси інтерфейсу OAI), будь ласка, надішліть нам повідомлення через  контактну форму, або на поштову адресу harvest@nas.giv.ua.

2. Як стати постачальником контенту

2.1. Чи джерело вже проіндексоване?

Багато різних джерел (електронних журналів, інституційних репозитаріїв тощо) вже індексуються в Харвестерs. Перш за все, перевірте, чи джерело – або документи з нього – вже включені в Харвестер.

image.pngРис. 1 - Контактна форма

Якщо ви знайшли документи з джерела, але маєте питання щодо індексування, ознайомтеся з нашою інструкцією про те, як ми індексуємо / оновлюємо контент.

2. Як стати постачальником контенту

2.2. Джерело ще не проіндексоване?

Ви не знайшли жодного документа з джерела? Існують певні вимоги для індексації джерела в Харвестер:

– Джерело має містити академічний контент.

– Принаймні деякі документи з джерела доступні у відкритому доступі (повні тексти безкоштовно, без реєстрації).

– Метадані документів надаються через валідний інтерфейс OAI-PMH.

Перевірте інтерфейс OAI джерела за допомогою  валідатора OAI-PMH. Якщо виникають повідомлення про помилки (не лише попередження), індексування джерела може бути неможливим. Якщо ви отримуєте помилки або попередження, наші рекомендації  для менеджерів репозиторіїв можуть бути корисними для оптимізації роботи з джерелом.

2. Як стати постачальником контенту

2.3. Валідація пройшла успішно?

Інтерфейс OAI успішно пройшов валідацію, а джерело ще не проіндексовано? Тепер ви можете запропонувати джерело для індексації Харвестер.

3. Загальний інтерфейс OAI

Даний розділ описує загальний інтерфейс ОАІ

3. Загальний інтерфейс OAI

3.1. Функціонування інтерфейсу OAI

Ваш інтерфейс OAI є вільно доступним, стабільним і постійно реагує на запити. Запит  ListRecords у форматі oai_dc повертає результати без таймауту або помилок виводу. Ви повинні регулярно перевіряти функціональність вашого інтерфейсу OAI, наприклад, за допомогою браузера. Якщо ваш інтерфейс OAI не працює належним чином, індексування джерела неможливе. Формат oai_dc також є обов'язковим. Формат oai_dc це простий формат метаданих, заснований на стандарті Dublin Core[1] (DC), який використовується в протоколі OAI-PMH для обміну метаданими. Використання формату метаданих є мінімальною вимогою для сумісності з OAI-PMH.




[1]http://purl.org/dc/elements/1.1/

 

3. Загальний інтерфейс OAI

3.2. Кількість записів на сторінку

Для кожної відповіді ListRecords вашого інтерфейсу OAI ви повинні надати від 50 до 1000 записів на сторінку. Так званий resumptionToken в кінці файлу відповіді OAI-PMH працює і надає наступні від 50 до 1000 записів.

Якщо на сторінці буде менше 50 записів, це призведе до великої кількості окремих запитів, коли ми будемо збирати ваше джерело. З іншого боку, понад 1000 записів на сторінку роблять доставлені файли відносно великими і збільшують ризик переривань під час збору записів. Якщо токен resumptionToken не працює, повна індексація неможлива.

3. Загальний інтерфейс OAI

3.3. Контактні особи

У розділі Ідентифікаційні дані вашого інтерфейсу OAI у полі adminEmail вказано адресу електронної пошти, за якою можна зв'язатися з технічним оператором інтерфейсу OAI. Адреса електронної пошти доступна на головній сторінці вашого джерела, що гарантує прямий контакт з оператором постачальника контенту.

4. Зміни/Видалення/Оновлення

4. Зміни/Видалення/Оновлення

4.1. Ідентифікація змін у метаданих окремих записів

Кожна наступна зміна запису має бути позначена у вашому інтерфейсі OAI шляхом доставки змінених записів під час інкрементального збору. Як правило, під час інкрементального збору даних слід доставляти лише ті записи, які були нещодавно створені, змінені або видалені.

Усі постачальники даних регулярно оновлюються в індексі Харвестер. Це означає, що ми перевіряємо ваш інтерфейс OAI на наявність оновлень з моменту останнього запуску індексування за допомогою запиту дати (from). Якщо новостворені, змінені або видалені записи доставлені некоректно, оновлення в індексі Харвестер неможливе, і документ, наприклад, не індексується, залишається незмінним, тобто некоректним в індексі, або не видаляється з індексу.

Якщо, з іншого боку, ваш інтерфейс OAI завжди повторно доставляє всі записи під час інкрементальної вибірки тобто також записи даних, до яких не було внесено жодних змін час індексування в результаті значно збільшується. В такому випадку ми можемо оновлювати ваше джерело  через більші проміжки часу.

4. Зміни/Видалення/Оновлення

4.2. Видалення записів

Якщо документ видаляється з вашого джерела, запис має бути позначений як видалений в інтерфейсі OAI і має бути доставлений під час інкрементального збору. За жодних обставин запис не можна повністю видаляти з інтерфейсу OAI.

Якщо документ не доставлено і не позначено як видалений під час інкрементального збору, видалення запису в індексі Харвестер неможливе, і документ залишається некоректним в індексі. У цьому випадку його можна видалити лише шляхом повторного збору та повної переіндексації джерела. Це можна зробити лише через більші проміжки часу.

4. Зміни/Видалення/Оновлення

4.3. Інформація про фундаментальні зміни

Якщо назва постачальника контенту або URL-адреса інтерфейсу OAI має змінитися (наприклад, у зв'язку з переходом на іншу систему), будь ласка, повідомте нам про це через нашу контактну форму. Якщо необхідно, повідомте нам стару і нову URL-адресу постачальника контенту і, якщо можливо, назву колекції вашого джерела в Харвестер (ви можете знайти її в нашому списку постачальників контенту).

Ми перевіряємо всіх постачальників контенту через нерегулярні проміжки часу і, за необхідності, виправляємо інформацію (назву, систему, URL-адресу). Якщо ви активно інформуєте нас про зміни, переконайтеся, що ваше джерело завжди повністю і правильно фіксується та індексується Харвестер.

5. Контент/Метадані

5. Контент/Метадані

5.1. Кодування символів

Весь вміст вашого інтерфейсу OAI (заголовки, імена авторів, анотації) кодується в UTF-8. Інші кодування або дублювання кодувань спричиняють помилки у відображенні результатів пошуку з вашого джерела.

5. Контент/Метадані

5.2. Розділення кількох записів у полі метаданих

Якщо ви вказуєте кілька записів у полі метаданих (наприклад, ім'я автора та його ідентифікатор ORCID), розділяйте їх пробілами, крапкою з комою та пробілами. Таке розділення дозволяє нам індексувати інформацію окремо і зробити її доступною для пошуку.

5. Контент/Метадані

5.3. Повнота метаданих

Харвестер збирає метадані вашого джерела у стандартному форматі oai_dc. Формат oai_dc це простий формат метаданих, заснований на стандарті Dublin Core, який використовується в протоколі OAI-PMH. Кожний запис вашого OAI-інтерфейсу повинен мати максимально повні метадані про документ і використовувати стандартизовані словники. Вказівка діючої URL-адреси в <dc:ідентифікатор> є обов'язковою.

Чим повніші метадані ви надасте, тим легше буде знайти документи з вашого джерела в Харвестер. Стандартизовані словники допомагають нам віднести документи з вашого джерела, наприклад, до правильного типу документа або до прав подальшого використання. Документи, які не мають URL в ідентифікаторі, не індексуються.

5. Контент/Метадані

5.4. Примітки щодо окремих полів метаданих

image.png

1.1.1.         URL публікації <dc:identifier>

Кожний запис містить робочу URL-адресу в полі <dc:ідентифікатор> (починаючи з http:, https:, doi: або urn:nbn:de:). Вона веде, якщо це можливо, на титульну сторінку документа (інформаційну сторінку з бібліографічною інформацією та посиланням на повний текст) або безпосередньо до повного тексту у форматі PDF у відкритому доступі. Якщо запис має кілька <dc:ідентифікатор>, або якщо повний текст не пропонується у поширеному форматі (HTML, PDF), або якщо він не є у "Відкритому доступі", перший ідентифікатор завжди повинен вести на титульну сторінку документа.

Надавайте постійні ідентифікатори (DOI, handle, URN), які продовжуватимуть функціонувати, навіть якщо сервер буде переміщено і змінено URL-адресу. Переконайтеся, що DOI тощо зареєстровані і працюють з відповідним реєстраційним агентством. Особливо ідентифікатор handle має бути налаштований для інсталяцій DSpace, інакше це призведе до "фіктивної URL-адреси" (handle.net/123456789), яка генерує повідомлення про помилку[1] .

Індексуються лише ті документи, ідентифікатори яких починаються з http:, https:, doi: або urn:nbn:de: і не ведуть на "фіктивну URL" (123456789). Якщо DOI ще не зареєстровано, документ індексується, але посилання в Харвестер призводить до повідомлення про помилку. Контент-провайдери, у яких більшість посилань не працює, можуть бути вилучені з індексу.

Приклади

<dc:identifier>http://jnas.nbuv.gov.ua/article/UJRN-0001342848 </dc:identifier>

<dc:identifier>http://hdl.handle.net/10760/12746</dc:identifier>

<dc:identifier>https://doi.org/10.1108/07378830610715473</dc:identifier>

<dc:identifier>doi:10.1108/07378830610715473</dc:identifier>

<dc:identifier>https://nbn-resolving.de/urn:nbn:de:0070-pub-27663089</dc:identifier>

<dc:identifier>urn:nbn:de:0070-pub-27663089</dc:identifier>

Примітка щодо ISBN, ISSN та ін.

Рекомендується додавати таку інформацію, як ISBN або ISSN, у поле <dc:ідентифікатор>. Однак наразі в Харвестер у полі <dc:ідентифікатор> індексуються лише URL-адреси. Інші специфікації без URL не індексуються і тому не можуть бути знайдені, якщо ці специфікації вказані лише в полі <dc:ідентифікатор>. Якщо ви хочете працювати з такими даними, вставляйте такі специфікації, як ISBN, і в <dc:identifier>, і в <dc:source>.

1.1.2.         Назва <dc:title>

Введіть назву в полі <dc:title>, як в оригіналі. Якщо публікація має кілька назв (наприклад, різними мовами), повторіть поле.

Приклад

<dc:title>The Heat Unit Types and the Firing Temperature in the People of Romny Culture </dc:title>

1.1.3.         Автор <dc:creator>

Вказати в <dc:creator> тих осіб або установи, які є авторами публікації. Імена авторів вказуйте за зразком Прізвище, Ім'я, По батькові. Вказуйте ідентифікатор ORCID як частину імені автора.

Заохочуйте поширення ідентифікаторів ORCID (та інших ідентифікаторів особи, якщо це можливо), щоб зробити авторів унікально ідентифікованими (навіть якщо вони мають однакові імена). Заохочуйте авторів, які публікуються у вашому джерелі, реєструватися в ORCID, щоб отримати ідентифікатор ORCID, і додавайте ідентифікатори ORCID у метадані безпосередньо до автора. Вказуйте ідентифікатор ORCID через пробіл, крапку з комою, пробіл від автора і вставте перед номером "orcid:" або повну URL-адресу ідентифікатора. Якщо ідентифікатор ORCID існує, автори також можуть бути знайдені за цим ідентифікатором під час пошуку в Харвестер.

Приклади

<dc:creator>Smit, J.H. (John) de</dc:creator>

<dc:creator>Utrecht University. Department of Computer Sciences</dc:creator>

<dc:creator>Summann, Friedrich ; orcid:0000-0002-6297-3348</dc:creator>

<dc:creator>Summann, Friedrich ; https://orcid.org/0000-0002-6297-3348</dc:creator>

1.1.4.         Тип публікації <dc:type>

У полі <dc:type> введіть тип публікації документа (наприклад, стаття, глава). Якщо можливо, використовуйте стандартизований словник, наприклад, словник типів публікацій info:eu-repo[2] або словник типів ресурсів COAR[3]. Позначення, які використовує ваше джерело, повинні бути відомі Харвестер, щоб ми могли правильно віднести ваші документи до наших типів документів.

Приклади

<dc:type>info:eu-repo/semantics/article</dc:type>

<dc:type>journal article</dc:type>

<dc:type>http://purl.org/coar/resource_type/c_6501</dc:type>

1.1.5.         Дата публікації <dc:date>

Кожний запис повинен містити в полі <dc:date> рік публікації або дату документа у форматі ISO 8601[4] (за григоріанським календарем[5]). Інакше  для вашого джерела обмеження/сортування за роками публікації в Харвестер не працюватиме коректно.

Поле <dc:date> слід заповнювати лише один раз. Якщо немає конкретної дати публікації, вкажіть приблизну. Неточні дані, такі як 17 століття, слід вказувати як 1650 рік.

Приклади

<dc:date>2000-12-25</dc:date>

<dc:date>1978-02</dc:date>

<dc:date>1650</dc:date>

1.1.6.         Мова документа <dc:language>

У полі <dc:language> ви вказуєте інформацію про мову документа згідно з ISO 639[6] (2- або 3-літерний код). Інакше інформація про мову не буде виведена в Харвестер для документів з вашого джерела або буде виведена некоректно, а обмеження однією мовою для вашого джерела працюватиме некоректно.

Приклади

<dc:language>eng</dc:language>

<dc:language>deu</dc:language>

<dc:language>en</dc:language>

<dc:language>de</dc:language>

<dc:language>nld/dut</dc:language>

1.1.7.         Права на доступ та повторне використання <dc:rights>

Права доступу (Статус доступу)

Поле <dc:rights> містить інформацію про права доступу до повного тексту згідно зі словником info-eu-repo-Access-Rights[7] або словником COAR-Access-Rights[8]. Альтернативою є наступне: Документи відкритого доступу доступні у власному наборі OAI. Назва цього набору міститься в полі setSpec для кожного запису. Назвіть набір якомога унікальніше, наприклад, open access.

Для наших користувачів інформація про доступ до документа переліку полів dc має особливе значення. Якщо цієї інформації немає або вона недостатня, інформація про доступ до документів з вашого джерела виводиться неповно, не виводиться взагалі або некоректно, а обмеження на певні типи доступу для вашого джерела працює некоректно.

Приклади

<dc:rights>info:eu-repo/semantics/openAccess</dc:rights>

<dc:rights>closed access</dc:rights>

<dc:rights>http://purl.org/coar/access_right/c_abf2</dc:rights>

 

Права на подальше використання (ліцензії)

Пропонуйте своїм авторам можливість розміщувати документи під ліцензією. Використовуйте ліцензії, які мають якомога ширше розповсюдження, наприклад, ліцензії Creative Commons[9]. Введіть відповідну ліцензію у вашому інтерфейсі OAI в іншому полі <dc:rights>.

Якщо ця інформація відсутня або недостатньо доступна, інформація про повторне використання документів з вашого джерела виводиться неповністю, не виводиться взагалі або неправильно, а обмеження на варіанти повторного використання працює некоректно для вашого джерела.

Приклади

<dc:rights>http://creativecommons.org/licenses/by-sa/2.0/uk/</dc:rights>

<dc:rights>https://creativecommons.org/licenses/by/4.0/</dc:rights>

1.1.8.          Посилання / Цитування <dc:source>

Інформацію про джерело або цитування (наприклад, для статей назву, том, випуск журналу) можна знайти в <dc:source>. Зверніть особливу увагу на ISSN журналу, який містить ISSN. Ця інформація дозволяє користувачам краще знаходити ваші документи в Харвестер.

Приклади

<dc:source>Ecology Letters (1461023X) vol.4 (2001)</dc:source>

<dc:source>ISSN: 0928-0987</dc:source>

<dc:source>Pieper D, Summann F.: Bielefeld Academic Search Engine (BASE). An end-user oriented institutional repository search service. Library Hi Tech. 2006; 24(4):614–619. ISSN 0737-8831.</dc:source>

Примітка щодо ISBN, ISSN та ін.

Рекомендується додавати таку інформацію, як ISBN або ISSN, у поле <dc:ідентифікатор>. Однак наразі в Харвестер у полі <dc:ідентифікатор> індексуються лише URL-адреси. Інші специфікації без URL не індексуються і тому не можуть бути знайдені, якщо ці специфікації вказані лише в полі <dc:ідентифікатор>. Якщо ви хочете працювати з такими даними, вставляйте такі специфікації, як ISBN, і в <dc:identifier>, і в <dc:source>.

1.1.9.         Інші особи, які брали участь у публікації <dc:contributor>

У розділі <dc:contributor> вкажіть осіб та установи, які зробили внесок у публікацію, не будучи її автором (наприклад, редактор, рецензент). Застосовуються рекомендації, наведені в розділі Автор <dc:creator>.

1.1.10.     Формат файлу <dc:format>

У <dc:format> слід вказати формат файлу публікації. Найкраще використовувати для цього типи інтернет-медіа (MIME-типи), які використовує IANA[10] (Internet Assigned Numbers Authority). Повний список можна знайти за посиланням[11].

Приклади

<dc:format>video/quicktime</dc:format>

<dc:format>application/pdf</dc:format>

1.1.11.     Опис <dc:description>

Використовуйте <dc:description> для опису змісту публікації (анотації).

1.1.12.     Ключові слова <dc:subject>

У полі <subject> можуть бути вказані як ключові слова, так і позначення класифікацій. Якщо використовуються позначення, слід також вказати відповідну схему класифікації (бажано у вигляді URI). В іншому полі <dc:subject> слід також подати короткий зміст у вигляді тексту, придатного для читання людиною, бажано англійською мовою.

Приклади

<dc:subject>info:eu-repo/classification/ddc/641</dc:subject>

<dc:subject>Anatomy</dc:subject>

Якщо не потрібно використовувати специфічну лексику, ми рекомендуємо використовувати загальну десяткову класифікацію Дьюї[12] (DDC).

1.1.13.     Видавець <dc:publisher>

Поле <dc:publisher> вказує на видавця публікації, яким може бути як установа, так і фізична особа. Для  дисертацій у цьому полі вказується назва інституту або університету. Якщо організація має ієрархічну структуру, різні ієрархічні рівні повинні бути відокремлені один від одного крапками.

Приклади

<dc:publisher>Peter Langford</dc:publisher>

<dc:publisher>Springer Fachmedien</dc:publisher>

<dc:publisher>Loughborough University. Department of Computer Science</dc:publisher>

1.1.14.     Пов'язані документи <dc:relation>

У полі <dc:relation> вказуються пов'язані/цитовані публікації.

Приклади

<dc:relation>http://hdl.handle.net/10</dc:relation>

1.1.15.     Границі контенту <dc:coverage>

Поле <dc:coverage> використовується для опису просторових і часових обмежень предмета публікації. Це може бути інформація про місцезнаходження, геокоординати, час або зазначення юрисдикції.

Приклади

<dc:coverage>Netherlands</dc:coverage>

<dc:coverage>name=Western Australia; northlimit=-13.5; southlimit=-35.5; westlimit=112.5; eastlimit=129</dc:coverage>

<dc:coverage>1800-1850</dc:coverage>

<dc:coverage>52.031629, 8.541202</dc:coverage>




[1]      https://www.handle.net/hnr_documentation.html


[2]https://wiki.surfnet.nl/display/standards/info-eu-repo#infoeurepo-Publicationtypes


[3]https://vocabularies.coar-repositories.org/resource_types/


[4]https://en.wikipedia.org/wiki/ISO_8601


[5]https://en.wikipedia.org/wiki/Gregorian_calendar


[6]https://en.wikipedia.org/wiki/List_of_ISO_639_language_codes


[7]https://wiki.surfnet.nl/display/standards/info-eu-repo#infoeurepo-AccessRights


[8]https://vocabularies.coar-repositories.org/documentation/access_rights/


[9]https://creativecommons.org/


[10]https://www.iana.org/


[11]http://www.iana.org/assignments/media-types


[12]https://www.oclc.org/en/dewey/resources.html

6. Додаткові рекомендації постачальникам контенту

6. Додаткові рекомендації постачальникам контенту

6.1. Веб-адреса репозиторію

Якщо можливо, запропонуйте стартову сторінку під своїм субдоменом (без порту та підкаталогу). Якщо стартова сторінка постачальника контенту  доступна через порт (наприклад, repository.domain.com:8080) або підкаталог (repository.domain.com/xmlui), створіть перенаправлення з піддомену (repository.domain.com).

Кожна зміна в порту або підкаталозі призводить до того, що посилання на постачальника контенту у списку постачальників контенту більше не працює.

6. Додаткові рекомендації постачальникам контенту

6.2. Загальні імена для піддоменів

Використовуйте загальні імена для піддоменів. Уникайте номерів версій в іменах субдоменів або каталогів (наприклад, наприклад ojs3.domain.com або ojs.domain.com/ojs-3/).

Кожне оновлення програмного забезпечення може призвести до зміни URL-адреси або до того, що ваша URL-адреса міститиме невірний номер версії. наприклад, наприклад, якщо ви оновили програмне забезпечення з версії 2 до версії 3, але URL-адреса, як і раніше, залишається ojs2.domain.com. Як згадувалося в попередньому пункті, будь-яка зміна URL-адреси призведе до того, що посилання на постачальника контенту перестануть працювати.

6. Додаткові рекомендації постачальникам контенту

6.3. Зміна URL домену

Якщо URL (домен/субдомен) змінився, встановіть переадресацію. У разі зміни інтернет-адреси вашого джерела (навіть якщо вона всього лише символ), встановіть переадресацію зі старої адреси на нову. Також переконайтеся, що інтерфейс OAI, як і раніше, доступний, налаштувавши переадресацію.

Відсутня переадресація, посилання ведуть у порожнечу. Ми регулярно перевіряємо адреси постачальників індексованого контенту. Якщо ми зустрінемо помилкові посилання і переадресація відсутня, ми в окремих випадках проведемо короткий пошук нової адреси контент-провайдера. Якщо це не вдасться, постачальника контенту буде видалено з індексу. Інші пошукові системи також видаляють зі свого індексу джерела, які більше не доступні.

6. Додаткові рекомендації постачальникам контенту

6.4. Назва репозитарію/журналу

Назва репозитарію або назва журналу завжди повинні бути присутніми у  коді вашого сайту у певному місці у вигляді простого тексту, або в <title>, або в заголовку (<h1>), або у вигляді альтернативного тексту логотипу.

Якщо назва відсутня у вигляді простого тексту, коректне введення назви в нашу базу даних є громіздким. Крім того, відсутність назви у вигляді простого тексту призводить до того, що пошукові системи, такі як Google, не можуть знайти ваше джерело взагалі або знаходять його за назвою в недостатній мірі.

6. Додаткові рекомендації постачальникам контенту

6.5. Вимоги до стартової сторінки

Запропонуйте принаймні стартову сторінку вашого репозиторію англійською мовою. Харвестер має глобальну спільноту користувачів. Завдяки англомовному веб-сайту ви можете надати міжнародній аудиторії простий доступ до ваших документів.

Якщо стартова сторінка англійською мовою недоступна, ми зазвичай залежимо від служб автоматичного перекладу, які інформують нас про зміст вашого джерела. Англомовна стартова сторінка також сприяє кращому пошуку вашого джерела, як у нашому списку постачальників контенту, так і в інших загальних пошукових системах.

6. Додаткові рекомендації постачальникам контенту

6.6. Посилання "Контакти"

На початковій сторінці вашого джерела є посилання на пункт "Контакти"  з активною адресою електронної пошти. Там вказана актуальна адреса електронної пошти відповідальної особи. Електронні листи, надіслані на ці адреси, регулярно читаються і відповідальні особи відповідають на них.

Якщо таке посилання відсутнє або електронні листи не читаються, навряд чи буде можливо зв'язатися з вами, якщо виникнуть проблеми, наприклад, з індексуванням вашого джерела або якщо з'являться будь-які питання. Це може призвести до того, що ваше джерело не буде проіндексоване.

6. Додаткові рекомендації постачальникам контенту

6.7. Поширення в інших пошукових системах

Зареєструйте своє джерело в каталогах OAI (наприклад, OpenDOAR, ROAR, re3data або Open Archives) і оновлюйте інформацію в каталогах у разі внесення змін. Таким чином ви зробите своє джерело відомим у всьому світі і дозволите іншим пошуковим системам індексувати документи з вашого джерела.

Використовуйте "дружню до пошукових систем" структуру папок. Запропонуйте, наприклад, карту сайту, за допомогою якої всі документи (Frontdoor/PDF) будуть безпосередньо доступні, і оголосіть цю карту сайту в пошукових системах, таких як Google, через відповідні інструменти реєстрації. Використовуйте метатеги, зручні для пошукових систем (наприклад, метатеги Google Scholar).

Хороша доступність вашого джерела в загальних і академічних пошукових системах сприятиме тому, що документи з вашого джерела будуть частіше знаходитися і використовуватися. Якщо ми ще не знаємо ваше джерело, ми також можемо знайти його під час пошуку в каталогах або пошукових системах OAI. Після цього, якщо це технічно можливо, ваші джерела будуть активно вноситися до нашої бази даних та індексуватися.

7. Індексація контенту

7. Індексація контенту

7.1. Яким критеріям має відповідати постачальник контенту, щоб бути доданим до індексу Харвестеру?

Існує три критерії:

1.      Джерело містить лише академічний контент.

2.      Принаймні деякі документи з джерела доступні у відкритому доступі (повні тексти безкоштовно, без реєстрації).

3.      Метадані документів надаються через валідний інтерфейс OAI-PMH.

Ми також регулярно вивчаємо каталоги репозитаріїв, такі як OpenArchives, ROAR та OpenDOAR, або списки відповідних програмних інсталяцій, таких як DSpace чи OJS, а також видавничу платформу Crossref, і збираємо та індексуємо вміст відповідних джерел.

7. Індексація контенту

7.2. Як можна порекомендувати нового постачальника контенту для індексації?

Перейдіть на сторінку додати постачальника контенту і перевірте, чи контент вашого джерела вже індексується в Харвестер і (якщо не індексується) чи відповідає він нашим критеріям. Після цього ви можете заповнити форму і запропонувати нам своє джерело. Ми також регулярно спостерігаємо за кількома каталогами репозитаріїв, такими як OpenArchives, ROAR і OpenDOAR, каталогами програмного забезпечення для репозитаріїв, такими як DSpace або OJS, або видавничою платформою Crossref, та індексуємо вміст відповідних джерел.

7. Індексація контенту

7.3. Чи можна завантажити документ безпосередньо до Харвестер?

Завантажувати документи до Харвестеру неможливо. Харвестер це не предметна база даних або система управління публікаціями, а пошукова система. Щоб  публікація була проіндексована Харвестер, її треба завантажити до постачальника контенту (інститутський репозитарій або загальнодоступний репозитарій, наприклад,  Zenodo) або до журналу, який індексується Харвестер (див. наш список індексованих постачальників контенту).

7. Індексація контенту

7.4. Налаштування інтерфейсу OAI, щоб моє джерело могло бути проіндексоване Харвестер

Програмне забезпечення для репозитаріїв, таке як DSpace, Eprints або OJS (для журналів), надає інтерфейс OAI за замовчуванням. Іноді його потрібно активувати або налаштувати. Ознайомтесь з нашими інструкцією для менеджерів репозитаріїв. Вони можуть бути корисними для оптимізації вашого інтерфейсу OAI. Ви також можете налаштувати інтерфейс OAI самостійно. Посібник з впровадження можна знайти на сайті Ініціативи відкритих архівів. Ви можете знайти більш загальну інформацію про OAI на OpenArchives.org та у Вікіпедії. За допомогою нашого валідатора OAI OVAL ви можете легко перевірити, чи відповідає ваше джерело вимогам Харвестер.

7. Індексація контенту

7.5. Моє джерело не має інтерфейсу OAI. Чи можна все ж таки індексувати документи в Харвестері?

Якщо ваше джерело не має інтерфейсу OAI і ви не можете його налаштувати, завантажте документи до агрегаторів, таких як DataCite або Zenodo, до предметних репозитаріїв, таких як arXiv.org, або додайте свій журнал відкритого доступу до DOAJ. Ми регулярно індексуємо цих постачальників контенту. Однак найкращий спосіб проіндексувати ваші документи в Харвестер це надати інтерфейс OAI в цьому випадку ми можемо гарантувати швидку і безперебійну індексацію вашого джерела, а дані з нього будуть представлені повністю і в найкращому вигляді.

8. Оновлення/видалення контенту

8. Оновлення/видалення контенту

8.1. Частота оновлення

Як часто ви оновлюєте вміст проіндексованих постачальників контенту? Ми оновлюємо всі проіндексовані постачальники контенту двічі на місяць. З більшими інтервалами весь вміст повністю збирається і переіндексується.

8. Оновлення/видалення контенту

8.2. Неповна індексація

Чому джерело проіндексовано неповністю? Індексація запису/документа, який додається до інтерфейсу OAI постачальника контенту, в Харвестер може зайняти до 6 тижнів. Якщо дані не оновлюються протягом тривалого періоду часу, це, як правило, пов'язано з проблемами в інтерфейсі OAI постачальника контенту.  Також може статися так, що записи постачальника контенту надаються неправильно або взагалі не надаються через інтерфейс OAI постачальника контенту. Документи можуть бути надані коректно/повністю через веб-інтерфейс постачальника контенту, але оскільки ми індексуємо лише метадані OAI, веб-інтерфейс не має для нас значення. Ви можете повідомити про помилки за допомогою нашої контактної форми. Якщо ви є менеджером постачальника контенту, будь ласка, використовуйте наш валідатор OAI OVAL для перевірки на відповідність та дотримуйтесь наших золотих правил для менеджерів репозитаріїв.

8. Оновлення/видалення контенту

8.3. Не працює автоматичне оновлення

Не працює автоматичне оновлення доданих документів або журналів. Мій журнал вже індексується в Харвестер. Чи потрібно мені надсилати вам повідомлення про публікацію нової статті/випуску?

Ні, контент всіх індексованих постачальників контенту автоматично оновлюється на регулярній основі. Новий випуск/стаття, опублікований у джерелі, що вже індексується в Харвестер, індексується автоматично. Якщо він не був проіндексований через 6 тижнів, то, як правило, є проблема з інтерфейсом OAI постачальника контенту. У такому випадку, будь ласка, надішліть нам повідомлення з детальною інформацією (принаймні назву та URL постачальника контенту).

Чи потрібно повідомляти вас про додавання нового журналу до журнальної платформи, яка вже індексується в Харвестер?

Ні, контент усіх проіндексованих постачальників контенту автоматично оновлюється на регулярній основі. Якщо журнал додається до ресурсу, який вже індексується в Харвестер, він буде автоматично проіндексований. Якщо він не був проіндексований через 6 тижнів, то, як правило, є проблема з інтерфейсом OAI контент-провайдера. У такому випадку, будь ласка, надішліть нам повідомлення з детальною інформацією (принаймні, назву та URL-адресу вашого журналу і журнальної платформи, частиною якої він є).

Я опублікував документ у джерелі, яке індексується в Харвестер, але не можу знайти свій документ у Харвестер. Чому?

Потрібен певний час, щоб нові документи також були проіндексовані в Харвестер. Якщо ваш документ не проіндексовано через 6 тижнів, це, як правило, пов'язано з проблемою інтерфейсу OAI постачальника контенту. У такому випадку, будь ласка, надішліть нам повідомлення з детальною інформацією (принаймні назву та URL постачальника контенту, назву та URL документа).

8. Оновлення/видалення контенту

8.4. Не працює оновлення змін до документу

Я вніс зміни до документів у джерелі. Чому ці зміни не оновлюються в Харвестер?

Будь-яка наступна зміна запису має бути позначена в інтерфейсі OAI постачальника контенту шляхом надання змінених записів під час інкрементного збору. Усі постачальники індексованих даних оновлюються в Харвестер на регулярній, інкрементній основі. Це означає, що ми використовуємо запит за датою (від), щоб перевірити, чи оновлювався ваш інтерфейс OAI з моменту останнього запуску індексування. Якщо змінені записи доставлені некоректно, оновити індекс Харвестер неможливо, і документ залишиться незмінним, а отже, некоректним в індексі, доки ми повністю не переіндексуємо постачальника контенту, що трапляється лише через довші проміжки часу.

Видалення документу

Я хотів би видалити документ з індексу. Чи можливо це зробити?

Харвестер - це пошукова система. Ми індексуємо лише ті документи, які надають у відкритий доступ постачальники контенту. Ми не можемо видаляти записи безпосередньо з нашого індексу, оскільки вони будуть повторно проіндексовані при наступному індексуванні джерела. Якщо ви вважаєте, що документ має бути вилучений з Харвестер, ви повинні зв'язатися з постачальником контенту і попросити його видалити документ зі свого джерела. Зверніть увагу, що документи також поширюються через агрегатори, а це означає, що на документ можуть бути посилання в різних джерелах, а отже, він буде проіндексований в Харвестер кілька разів. Для того, щоб вилучити документ з індексу Харвестер, його потрібно вилучити у всіх постачальників контенту. Зверніть також увагу, що іноді існують законодавчі вимоги щодо вилучення документів з індексу Харвестер.

Не працює видалення документу

Я видалив документ з джерела. Чому він не видаляється з Харвестер?

Якщо документ видалено з джерела, запис має бути позначений як видалений в інтерфейсі OAI і доставлений під час інкрементального збору. За жодних обставин запис не можна повністю видаляти з інтерфейсу OAI. Якщо документ не буде доставлено і позначено як видалений під час інкрементального збору, його неможливо буде видалити з індексу Харвестер, і документ залишиться помилковим в індексі. У цьому випадку його можна видалити лише шляхом повторного збору та повної переіндексації джерела. Це можна зробити лише через довші проміжки часу.

Причини видалення документу

Джерело/документ, очевидно, було вилучено з Харвестер. Чому це сталося?

Ми регулярно перевіряємо сервери всіх індексованих постачальників контенту. Якщо сервер / інтерфейс OAI не працює взагалі або працює дуже ненадійно протягом тривалого періоду часу, цей сервер тимчасово або назавжди видаляється з індексу. Це також робиться, якщо постачальник контенту більше не пропонує контент у відкритому доступі. Також може статися так, що окремі документи більше не доступні через інтерфейс OAI від постачальника контенту. Тоді ці документи також видаляються з Харвестер при оновленні контенту. У цьому випадку перевірте, чи інтерфейс OAI постачальника контенту працює правильно і чи документ все ще міститься в інтерфейсі OAI постачальника контенту. Якщо це так, ви можете надіслати нам повідомлення через контактну форму і попросити перевірити.

Джерело/видавець здається " профанацією"/"фальшивою наукою" або пропонує рекламу / спам. Чи можна видалити це джерело?

Ми усвідомлюємо, що хижацька публікація є величезною проблемою, і ми намагаємося перевірити, чи є, наприклад, журнал хижацьким, перш ніж (не) індексувати його, але це дуже складно, оскільки ми можемо виконати лише коротку перевірку часто лише технічну перевірку постачальника контенту в цілому і ми не можемо перевірити контент, наприклад, журналу, детально. Харвестер індексує лише ті джерела, які надають робочий інтерфейс OAI, і це часто є технічним бар'єром для таких журналів. Однак деякі статті з цих журналів індексуються через загальних ("відкритих для всіх") постачальників контенту або агрегаторів. Тільки постачальник контенту / агрегатор може видалити цей контент зі свого джерела.

На жаль, може статися так, що постачальник контенту (наприклад, журнальна платформа) припиняє надання своїх послуг і продає домен. Тоді може статися так, що новий оператор пропонує контент, який не має нічого спільного з тим, що ми індексували спочатку.

Як тільки ми помічаємо подібні проблеми, постачальник контенту негайно видаляється з нашого індексу. Ви можете допомогти нам, повідомивши про таких постачальників контенту через нашу контактну форму.

9. Редагування контенту

9. Редагування контенту

9.1. Невірна назва джерела

Назва джерела в полі "Постачальник контенту" вказана невірно. Чи можете ви це виправити?             Якщо в назві постачальника контенту допущена орфографічна помилка або назва постачальника контенту змінилася, ви можете повідомити нам про це через нашу контактну форму, і ми виправимо назву якнайшвидше.

Зверніть увагу: у полі "Постачальник контенту" ви завжди знайдете назву постачальника, від якого ми проіндексували документ. З різних причин вона може відрізнятися від фактичної назви вашого джерела (наприклад, назви вашого журналу або репозитарію). Можливо, що документи були проіндексовані через агрегатор (наприклад, DataCite) або через платформу електронних журналів. У цьому випадку вказується назва агрегатора/платформи, а назва постачальника контенту не може бути змінена. Тому для журналів у полі dc:source інтерфейсу OAI завжди слід вказувати назву журналу. Ця інформація буде показана в полі "Джерело" в списку пошуку Харвестер.

9. Редагування контенту

9.2. Невірний відсоток відкритих документів

Відсоток відкритих документів постачальника контенту не відповідає дійсності. Чому документи з відкритим доступом з джерела не позначені в Харвестер як документи з відкритим доступом?

У нашому списку контент-провайдерів ми показуємо відсоток відкритих документів для кожного проіндексованого контент-провайдера. Існує триступеневий процес того, як документ, проіндексований у Харвестер, може отримати статус відкритого доступу:

Постачальник контенту надає лише документи з відкритим доступом. Це буде записано (якщо відомо) в нашій адміністративній базі даних, і всі проіндексовані документи від цього постачальника контенту будуть позначені в Харвестер як документи з відкритим доступом.

Метадані документа відкритого доступу містять спеціальний набір для документів відкритого доступу в <record><header> в "setSpec" (наприклад, "driver", "openaire" або "OpenAccess"). Цей набір вноситься до нашої бази даних, і всі документи з цього набору позначаються як документи з відкритим доступом.

Документи з відкритим доступом індивідуально позначаються постачальником контенту в <dc:rights> (або ліцензія CC, або описова інформація, наприклад, "OpenAccess" тощо).

Якщо жоден з цих трьох реквізитів не доступний, Харвестер не може ідентифікувати документ як відкритий доступ. Якщо у вас виникли проблеми з цим показником, перевірте ваш інтерфейс OAI і покращіть метадані, якщо це можливо (докладніше див. наші Золоті правила), або залиште нам повідомлення.

9. Редагування контенту

9.3. Невірна індексація документу

Документ проіндексовано неправильно (наприклад, назва або імена авторів відсутні/ неправильно/невірно написані). Куди я можу повідомити про цю проблему?

Харвестер це пошукова система. Це означає, що ми індексуємо документи/записи так, як їх надають постачальники контенту. Ми виправляємо очевидні помилки метаданих під час індексації за допомогою автоматизованих процедур, але перевірити зміст неможливо. Якщо ви виявили помилку в метаданих запису в Харвестер, наприклад, неправильне, неправильне написання або відсутність імен авторів, назв, років або помилки в наборі символів (наприклад, ? замість символу), це, як правило, відповідальність постачальника контенту і має бути виправлено ним. Найкраще звертатися безпосередньо до відповідного постачальника контенту, якщо ви виявили помилки в записі.

Якщо метадані виправлено в інтерфейсі OAI постачальника контенту (і виправлення вносяться під час інкрементального збору), записи також слід оновити в Харвестер, оскільки ми регулярно оновлюємо всі індексовані дані постачальників контенту. Оновлення запису/документа, виправленого в інтерфейсі OAI постачальника контенту, в Харвестер може зайняти до 6 тижнів.

10. ORCID

10. ORCID

10.1. Що таке ORCID?

ORCID (Open Researcher and Contributor ID - Відкритий ідентифікатор авторів) це стандарт, встановлений у всьому світі для однозначного співставлення наукових авторів з їхніми опублікованими роботами. Ідентифікатор ORCID як постійний ідентифікатор дозволяє, наприклад, у випадку ідентичних імен, змін імен або варіантів імен, чітко диференціювати імена авторів. Він може бути використаний у будь-якій точці світу і відображає зміни афіліації протягом індивідуальної академічної кар'єри. Таким чином, він сприяє кращій видимості авторів та їхніх публікацій, і все більше видавництв та дослідницьких організацій вимагають, щоб автори надавали ідентифікатор ORCID.

10. ORCID

10.2. Заявити про публікацію в Харвестер

Якщо ви є автором публікації, яка включена до списку результатів Харвестеру, ви можете підтвердити своє авторство на цю публікацію за посиланням "заявити" (англ. "claim"). Після "заявити" поруч з вашим ім'ям автора в Харвестер відображається іконка ("iD") з посиланням на ваш профіль в ORCID.

Для цього ви повинні один раз зареєструватися в нашій пошуковій системі (див. особистий логін) і мати ідентифікатор ORCID.

Якщо у вас ще немає ORCID iD, ви можете безкоштовно зареєструватися в ORCID, натиснувши на кнопку "заявити". Після реєстрації ORCID надасть вам ідентифікатор, який дозволить вам унікально ідентифікувати ваші публікації (навіть якщо ім'я ідентичне імені іншої людини, варіанти написання вашого імені або зміни імені). Ви також можете вносити метадані публікації (автор, назва, рік видання тощо) безпосередньо до свого списку публікацій в ORCID.

10. ORCID

10.3. Скасувати Заявити

Якщо ви призначили публікації іншої особи своєму ідентифікатору ORCID або якщо ви хочете скасувати «Заявити» з іншої причини, ви можете видалити це призначення. Увійдіть у свій особистий кабінет у Харвестер та натисніть «Мої публікації». Тут ви можете знайти всі публікації, які ви заявили в Харвестер. Натисніть посилання «Видалити зі списку публікацій у Харвестер» або «Видалити зі списку публікацій у Харвестер та ORCID», щоб від’єднати призначення. Значок «iD» біля імені автора в публікації, на яку ви випадково заявили права, буде видалено, а посилання «претензія» відобразиться знову.

Мої публікації були призначені не тій людині. Чи можна це виправити?

Якщо хтось інший помилково «оголосив» ваші публікації своїми, будь ласка, повідомте нам про цю проблему через нашу контактну форму. Натисніть «Детальний перегляд», щоб отримати URL-адресу цього запису та скопіюйте цю URL-адресу в контактну форму, щоб ми могли визначити проблему. Якщо на декілька чи всі ваші публікації заявлено помилки, будь ласка, напишіть коментар у контактній формі та наведіть приклад.