A research of invisible errors in bibliographic data input and its impact on the quality and search accessibility

The research is devoted to a special class of errors in bibliographic data input into automated library information system, which is invisible to users, but affects the functioning of the electronic catalog system. The cause of the problem is the misuse of visually similar Latin characters where Cyr...

Повний опис

Збережено в:
Бібліографічні деталі
Дата:2021
Автор: Петренко , М. В.
Формат: Стаття
Мова:Ukrainian
Опубліковано: Інститут проблем реєстрації інформації НАН України 2021
Теми:
Онлайн доступ:http://drsp.ipri.kiev.ua/article/view/239252
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Data Recording, Storage & Processing

Репозитарії

Data Recording, Storage & Processing
id drspiprikievua-article-239252
record_format ojs
spelling drspiprikievua-article-2392522021-08-31T12:26:55Z A research of invisible errors in bibliographic data input and its impact on the quality and search accessibility Дослідження візуально непомітних помилок введення та їхнього впливу на якість і пошукову доступність бібліографічних даних Петренко , М. В. помилки введення, виправлення помилок, вплив помилок, кирилиця, латиниця, бібліографічні дані, дедублікація, пошукова доступність, автоматизована бібліотечна інформаційна система input errors, error correction, errors impact, Cyrillic, Latin, bibliographic data, deduplication, search accessibility, automated library information system, OPAC The research is devoted to a special class of errors in bibliographic data input into automated library information system, which is invisible to users, but affects the functioning of the electronic catalog system. The cause of the problem is the misuse of visually similar Latin characters where Cyrillic characters should have been and vice versa. The study is based on bibliographic information collected from 141 public libraries in Kyiv for the period from 1993 to 2021 (obtained from two sources). This allows fully explore the features of the problem, its prevalence and impact on the functioning of automated library information system and its OPAC module. Attention is drawn to the text fields common in search and identification tasks — «Book Title», «Author», «Publisher». The investigation provides one by information about: 1) the method of automatic error identification is applied; 2) prevalence of errors by type and their percentage in each source; 3) the impact of errors on the search; 4) the impact of errors on the search for duplicates; 5) distribution of errors by symbols; 6) errors and use of reference tables; The research has shown that all characters with the same appearance are used incorrectly. The frequency of use of symbols differs significantly. There are many mistakes related to Cyrillic using in Roman numerals. Often some part of the number is written in Cyrillic and some part in Latin. But it affects comparison more than search. The conclusions state that this class of errors affects the search accessibility of hundreds of book records in the libraries of Kyiv and provide suggestions for measures to eliminate and prevent errors in the future. Some records correspond to several real books, so there are thousands of real books in different libraries. The problem can be solved only with software using. Effective prevention is possible with the appropriate improvements of automated library information systems. Tabl.: 4. Fig.: 3. Refs: 8 titles. Статтю присвячено дослідженню особливого класу помилок при введенні бібліографічних даних до автоматизованої бібліотечної інформаційної системи, який є непомітним для користувача, але впливає на функціонування системи електронних каталогів. Причиною проблеми є помилкове введення візуально подібних символів латиниці замість символів кирилиці та навпаки. Дослідження відбувалося на основі бібліографічних даних зі 141 публічної бібліотеки м. Києва за період з 1993 року до початку 2021 року (отримано з двох джерел). Описано особливості помилок, метод автоматичної ідентифікації помилок, розпов-сюдженість помилок, вплив на пошукову доступність і пошук дублів, розподіл помилок за символами. Надано рекомендації щодо профілактики та усунення проблеми. Інститут проблем реєстрації інформації НАН України 2021-06-29 Article Article application/pdf http://drsp.ipri.kiev.ua/article/view/239252 10.35681/1560-9189.2021.23.2.239252 Data Recording, Storage & Processing; Vol. 23 No. 2 (2021); 81-90 Регистрация, хранение и обработка данных; Том 23 № 2 (2021); 81-90 Реєстрація, зберігання і обробка даних; Том 23 № 2 (2021); 81-90 1560-9189 uk http://drsp.ipri.kiev.ua/article/view/239252/237888 Авторське право (c) 2021 Реєстрація, зберігання і обробка даних
institution Data Recording, Storage & Processing
collection OJS
language Ukrainian
topic помилки введення
виправлення помилок
вплив помилок
кирилиця
латиниця
бібліографічні дані
дедублікація
пошукова доступність
автоматизована бібліотечна інформаційна система
input errors
error correction
errors impact
Cyrillic
Latin
bibliographic data
deduplication
search accessibility
automated library information system
OPAC
spellingShingle помилки введення
виправлення помилок
вплив помилок
кирилиця
латиниця
бібліографічні дані
дедублікація
пошукова доступність
автоматизована бібліотечна інформаційна система
input errors
error correction
errors impact
Cyrillic
Latin
bibliographic data
deduplication
search accessibility
automated library information system
OPAC
Петренко , М. В.
A research of invisible errors in bibliographic data input and its impact on the quality and search accessibility
topic_facet помилки введення
виправлення помилок
вплив помилок
кирилиця
латиниця
бібліографічні дані
дедублікація
пошукова доступність
автоматизована бібліотечна інформаційна система
input errors
error correction
errors impact
Cyrillic
Latin
bibliographic data
deduplication
search accessibility
automated library information system
OPAC
format Article
author Петренко , М. В.
author_facet Петренко , М. В.
author_sort Петренко , М. В.
title A research of invisible errors in bibliographic data input and its impact on the quality and search accessibility
title_short A research of invisible errors in bibliographic data input and its impact on the quality and search accessibility
title_full A research of invisible errors in bibliographic data input and its impact on the quality and search accessibility
title_fullStr A research of invisible errors in bibliographic data input and its impact on the quality and search accessibility
title_full_unstemmed A research of invisible errors in bibliographic data input and its impact on the quality and search accessibility
title_sort research of invisible errors in bibliographic data input and its impact on the quality and search accessibility
title_alt Дослідження візуально непомітних помилок введення та їхнього впливу на якість і пошукову доступність бібліографічних даних
description The research is devoted to a special class of errors in bibliographic data input into automated library information system, which is invisible to users, but affects the functioning of the electronic catalog system. The cause of the problem is the misuse of visually similar Latin characters where Cyrillic characters should have been and vice versa. The study is based on bibliographic information collected from 141 public libraries in Kyiv for the period from 1993 to 2021 (obtained from two sources). This allows fully explore the features of the problem, its prevalence and impact on the functioning of automated library information system and its OPAC module. Attention is drawn to the text fields common in search and identification tasks — «Book Title», «Author», «Publisher». The investigation provides one by information about: 1) the method of automatic error identification is applied; 2) prevalence of errors by type and their percentage in each source; 3) the impact of errors on the search; 4) the impact of errors on the search for duplicates; 5) distribution of errors by symbols; 6) errors and use of reference tables; The research has shown that all characters with the same appearance are used incorrectly. The frequency of use of symbols differs significantly. There are many mistakes related to Cyrillic using in Roman numerals. Often some part of the number is written in Cyrillic and some part in Latin. But it affects comparison more than search. The conclusions state that this class of errors affects the search accessibility of hundreds of book records in the libraries of Kyiv and provide suggestions for measures to eliminate and prevent errors in the future. Some records correspond to several real books, so there are thousands of real books in different libraries. The problem can be solved only with software using. Effective prevention is possible with the appropriate improvements of automated library information systems. Tabl.: 4. Fig.: 3. Refs: 8 titles.
publisher Інститут проблем реєстрації інформації НАН України
publishDate 2021
url http://drsp.ipri.kiev.ua/article/view/239252
work_keys_str_mv AT petrenkomv aresearchofinvisibleerrorsinbibliographicdatainputanditsimpactonthequalityandsearchaccessibility
AT petrenkomv doslídžennâvízualʹnonepomítnihpomilokvvedennâtaíhnʹogovplivunaâkístʹípošukovudostupnístʹbíblíografíčnihdanih
AT petrenkomv researchofinvisibleerrorsinbibliographicdatainputanditsimpactonthequalityandsearchaccessibility
first_indexed 2024-04-21T19:34:23Z
last_indexed 2024-04-21T19:34:23Z
_version_ 1796974118238683136