A research of invisible errors in bibliographic data input and its impact on the quality and search accessibility
The research is devoted to a special class of errors in bibliographic data input into automated library information system, which is invisible to users, but affects the functioning of the electronic catalog system. The cause of the problem is the misuse of visually similar Latin characters where Cyr...
Збережено в:
Дата: | 2021 |
---|---|
Автор: | |
Формат: | Стаття |
Мова: | Ukrainian |
Опубліковано: |
Інститут проблем реєстрації інформації НАН України
2021
|
Теми: | |
Онлайн доступ: | http://drsp.ipri.kiev.ua/article/view/239252 |
Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
Назва журналу: | Data Recording, Storage & Processing |
Репозитарії
Data Recording, Storage & Processingid |
drspiprikievua-article-239252 |
---|---|
record_format |
ojs |
spelling |
drspiprikievua-article-2392522021-08-31T12:26:55Z A research of invisible errors in bibliographic data input and its impact on the quality and search accessibility Дослідження візуально непомітних помилок введення та їхнього впливу на якість і пошукову доступність бібліографічних даних Петренко , М. В. помилки введення, виправлення помилок, вплив помилок, кирилиця, латиниця, бібліографічні дані, дедублікація, пошукова доступність, автоматизована бібліотечна інформаційна система input errors, error correction, errors impact, Cyrillic, Latin, bibliographic data, deduplication, search accessibility, automated library information system, OPAC The research is devoted to a special class of errors in bibliographic data input into automated library information system, which is invisible to users, but affects the functioning of the electronic catalog system. The cause of the problem is the misuse of visually similar Latin characters where Cyrillic characters should have been and vice versa. The study is based on bibliographic information collected from 141 public libraries in Kyiv for the period from 1993 to 2021 (obtained from two sources). This allows fully explore the features of the problem, its prevalence and impact on the functioning of automated library information system and its OPAC module. Attention is drawn to the text fields common in search and identification tasks — «Book Title», «Author», «Publisher». The investigation provides one by information about: 1) the method of automatic error identification is applied; 2) prevalence of errors by type and their percentage in each source; 3) the impact of errors on the search; 4) the impact of errors on the search for duplicates; 5) distribution of errors by symbols; 6) errors and use of reference tables; The research has shown that all characters with the same appearance are used incorrectly. The frequency of use of symbols differs significantly. There are many mistakes related to Cyrillic using in Roman numerals. Often some part of the number is written in Cyrillic and some part in Latin. But it affects comparison more than search. The conclusions state that this class of errors affects the search accessibility of hundreds of book records in the libraries of Kyiv and provide suggestions for measures to eliminate and prevent errors in the future. Some records correspond to several real books, so there are thousands of real books in different libraries. The problem can be solved only with software using. Effective prevention is possible with the appropriate improvements of automated library information systems. Tabl.: 4. Fig.: 3. Refs: 8 titles. Статтю присвячено дослідженню особливого класу помилок при введенні бібліографічних даних до автоматизованої бібліотечної інформаційної системи, який є непомітним для користувача, але впливає на функціонування системи електронних каталогів. Причиною проблеми є помилкове введення візуально подібних символів латиниці замість символів кирилиці та навпаки. Дослідження відбувалося на основі бібліографічних даних зі 141 публічної бібліотеки м. Києва за період з 1993 року до початку 2021 року (отримано з двох джерел). Описано особливості помилок, метод автоматичної ідентифікації помилок, розпов-сюдженість помилок, вплив на пошукову доступність і пошук дублів, розподіл помилок за символами. Надано рекомендації щодо профілактики та усунення проблеми. Інститут проблем реєстрації інформації НАН України 2021-06-29 Article Article application/pdf http://drsp.ipri.kiev.ua/article/view/239252 10.35681/1560-9189.2021.23.2.239252 Data Recording, Storage & Processing; Vol. 23 No. 2 (2021); 81-90 Регистрация, хранение и обработка данных; Том 23 № 2 (2021); 81-90 Реєстрація, зберігання і обробка даних; Том 23 № 2 (2021); 81-90 1560-9189 uk http://drsp.ipri.kiev.ua/article/view/239252/237888 Авторське право (c) 2021 Реєстрація, зберігання і обробка даних |
institution |
Data Recording, Storage & Processing |
collection |
OJS |
language |
Ukrainian |
topic |
помилки введення виправлення помилок вплив помилок кирилиця латиниця бібліографічні дані дедублікація пошукова доступність автоматизована бібліотечна інформаційна система input errors error correction errors impact Cyrillic Latin bibliographic data deduplication search accessibility automated library information system OPAC |
spellingShingle |
помилки введення виправлення помилок вплив помилок кирилиця латиниця бібліографічні дані дедублікація пошукова доступність автоматизована бібліотечна інформаційна система input errors error correction errors impact Cyrillic Latin bibliographic data deduplication search accessibility automated library information system OPAC Петренко , М. В. A research of invisible errors in bibliographic data input and its impact on the quality and search accessibility |
topic_facet |
помилки введення виправлення помилок вплив помилок кирилиця латиниця бібліографічні дані дедублікація пошукова доступність автоматизована бібліотечна інформаційна система input errors error correction errors impact Cyrillic Latin bibliographic data deduplication search accessibility automated library information system OPAC |
format |
Article |
author |
Петренко , М. В. |
author_facet |
Петренко , М. В. |
author_sort |
Петренко , М. В. |
title |
A research of invisible errors in bibliographic data input and its impact on the quality and search accessibility |
title_short |
A research of invisible errors in bibliographic data input and its impact on the quality and search accessibility |
title_full |
A research of invisible errors in bibliographic data input and its impact on the quality and search accessibility |
title_fullStr |
A research of invisible errors in bibliographic data input and its impact on the quality and search accessibility |
title_full_unstemmed |
A research of invisible errors in bibliographic data input and its impact on the quality and search accessibility |
title_sort |
research of invisible errors in bibliographic data input and its impact on the quality and search accessibility |
title_alt |
Дослідження візуально непомітних помилок введення та їхнього впливу на якість і пошукову доступність бібліографічних даних |
description |
The research is devoted to a special class of errors in bibliographic data input into automated library information system, which is invisible to users, but affects the functioning of the electronic catalog system. The cause of the problem is the misuse of visually similar Latin characters where Cyrillic characters should have been and vice versa.
The study is based on bibliographic information collected from 141 public libraries in Kyiv for the period from 1993 to 2021 (obtained from two sources). This allows fully explore the features of the problem, its prevalence and impact on the functioning of automated library information system and its OPAC module.
Attention is drawn to the text fields common in search and identification tasks — «Book Title», «Author», «Publisher».
The investigation provides one by information about: 1) the method of automatic error identification is applied; 2) prevalence of errors by type and their percentage in each source; 3) the impact of errors on the search; 4) the impact of errors on the search for duplicates; 5) distribution of errors by symbols; 6) errors and use of reference tables;
The research has shown that all characters with the same appearance are used incorrectly. The frequency of use of symbols differs significantly. There are many mistakes related to Cyrillic using in Roman numerals. Often some part of the number is written in Cyrillic and some part in Latin. But it affects comparison more than search.
The conclusions state that this class of errors affects the search accessibility of hundreds of book records in the libraries of Kyiv and provide suggestions for measures to eliminate and prevent errors in the future. Some records correspond to several real books, so there are thousands of real books in different libraries. The problem can be solved only with software using. Effective prevention is possible with the appropriate improvements of automated library information systems. Tabl.: 4. Fig.: 3. Refs: 8 titles. |
publisher |
Інститут проблем реєстрації інформації НАН України |
publishDate |
2021 |
url |
http://drsp.ipri.kiev.ua/article/view/239252 |
work_keys_str_mv |
AT petrenkomv aresearchofinvisibleerrorsinbibliographicdatainputanditsimpactonthequalityandsearchaccessibility AT petrenkomv doslídžennâvízualʹnonepomítnihpomilokvvedennâtaíhnʹogovplivunaâkístʹípošukovudostupnístʹbíblíografíčnihdanih AT petrenkomv researchofinvisibleerrorsinbibliographicdatainputanditsimpactonthequalityandsearchaccessibility |
first_indexed |
2024-04-21T19:34:23Z |
last_indexed |
2024-04-21T19:34:23Z |
_version_ |
1796974118238683136 |