8.4. Не працює оновлення змін до документу
Я вніс зміни до документів у джерелі. Чому ці зміни не оновлюються в Харвестер?
Будь-яка наступна зміна запису має бути позначена в інтерфейсі OAI постачальника контенту шляхом надання змінених записів під час інкрементного збору. Усі постачальники індексованих даних оновлюються в Харвестер на регулярній, інкрементній основі. Це означає, що ми використовуємо запит за датою (від), щоб перевірити, чи оновлювався ваш інтерфейс OAI з моменту останнього запуску індексування. Якщо змінені записи доставлені некоректно, оновити індекс Харвестер неможливо, і документ залишиться незмінним, а отже, некоректним в індексі, доки ми повністю не переіндексуємо постачальника контенту, що трапляється лише через довші проміжки часу.
Видалення документу
Я хотів би видалити документ з індексу. Чи можливо це зробити?
Харвестер - це пошукова система. Ми індексуємо лише ті документи, які надають у відкритий доступ постачальники контенту. Ми не можемо видаляти записи безпосередньо з нашого індексу, оскільки вони будуть повторно проіндексовані при наступному індексуванні джерела. Якщо ви вважаєте, що документ має бути вилучений з Харвестер, ви повинні зв'язатися з постачальником контенту і попросити його видалити документ зі свого джерела. Зверніть увагу, що документи також поширюються через агрегатори, а це означає, що на документ можуть бути посилання в різних джерелах, а отже, він буде проіндексований в Харвестер кілька разів. Для того, щоб вилучити документ з індексу Харвестер, його потрібно вилучити у всіх постачальників контенту. Зверніть також увагу, що іноді існують законодавчі вимоги щодо вилучення документів з індексу Харвестер.
Не працює видалення документу
Я видалив документ з джерела. Чому він не видаляється з Харвестер?
Якщо документ видалено з джерела, запис має бути позначений як видалений в інтерфейсі OAI і доставлений під час інкрементального збору. За жодних обставин запис не можна повністю видаляти з інтерфейсу OAI. Якщо документ не буде доставлено і позначено як видалений під час інкрементального збору, його неможливо буде видалити з індексу Харвестер, і документ залишиться помилковим в індексі. У цьому випадку його можна видалити лише шляхом повторного збору та повної переіндексації джерела. Це можна зробити лише через довші проміжки часу.
Причини видалення документу
Джерело/документ, очевидно, було вилучено з Харвестер. Чому це сталося?
Ми регулярно перевіряємо сервери всіх індексованих постачальників контенту. Якщо сервер / інтерфейс OAI не працює взагалі або працює дуже ненадійно протягом тривалого періоду часу, цей сервер тимчасово або назавжди видаляється з індексу. Це також робиться, якщо постачальник контенту більше не пропонує контент у відкритому доступі. Також може статися так, що окремі документи більше не доступні через інтерфейс OAI від постачальника контенту. Тоді ці документи також видаляються з Харвестер при оновленні контенту. У цьому випадку перевірте, чи інтерфейс OAI постачальника контенту працює правильно і чи документ все ще міститься в інтерфейсі OAI постачальника контенту. Якщо це так, ви можете надіслати нам повідомлення через контактну форму і попросити перевірити.
Джерело/видавець здається " профанацією"/"фальшивою наукою" або пропонує рекламу / спам. Чи можна видалити це джерело?
Ми усвідомлюємо, що хижацька публікація є величезною проблемою, і ми намагаємося перевірити, чи є, наприклад, журнал хижацьким, перш ніж (не) індексувати його, але це дуже складно, оскільки ми можемо виконати лише коротку перевірку ‒ часто лише технічну перевірку постачальника контенту в цілому ‒ і ми не можемо перевірити контент, наприклад, журналу, детально. Харвестер індексує лише ті джерела, які надають робочий інтерфейс OAI, і це часто є технічним бар'єром для таких журналів. Однак деякі статті з цих журналів індексуються через загальних ("відкритих для всіх") постачальників контенту або агрегаторів. Тільки постачальник контенту / агрегатор може видалити цей контент зі свого джерела.
На жаль, може статися так, що постачальник контенту (наприклад, журнальна платформа) припиняє надання своїх послуг і продає домен. Тоді може статися так, що новий оператор пропонує контент, який не має нічого спільного з тим, що ми індексували спочатку.
Як тільки ми помічаємо подібні проблеми, постачальник контенту негайно видаляється з нашого індексу. Ви можете допомогти нам, повідомивши про таких постачальників контенту через нашу контактну форму.
Без коментарів