Простий пошук
Визначення простого пошуку як найбільш загального і найзручнішого типу пошуку. Опис основних його характеристик та різновидів.
- Загальне визначення
- Пошук окремих слів
- Слова, що не шукаються - стоп-слова
- Пошук по багатьом словам
- Використання в словах групових символів
- Пошук по близькості звучання слова
- Пошук за фразами
- Пошук з використанням відстані між словами
- Пошук за важливістю слів або фраз
- Обов’язкова наявність слів або фраз
- Довідка з пошукових виразів
- Формат дати в полях пошуку
Загальне визначення
Простий пошук - це найбільш загальний і найзручніший тип пошуку, який дає змогу ввести один або кілька пошукових термінів у поле пошуку на головній сторінці й отримати список релевантних ресурсів, тобто ресурсів, які задовольняють тій або іншій умові. У варіанті простого пошуку сформульований пошуковий вираз має відношення до відповідного набору описових полів (див. рис. 7), тобто на цей час в разі вибору Всі поля пошук проводиться одночасно по:
- авторам, dc.creator ;
- назвам, dc.title;
- назвам журналу, dc.relation;
- опису або анотаціям статей, dc:description.abstract;
- предметам або тематичним розділам статей, dc.subject;
- тегам.
Рис. 7. Пошукові поля в режимі простого пошуку
Звуження простору пошуку по тим чи іншим пошуковим полям здійснюється вибором відповідного поля зі списку Всі поля і далі натиснувши на кнопку Знайти.
У простому пошуку після введення щонайменше 3-х літер Ви отримуєте пошукові підказки (рис. 8). Вибравши пошукову пропозицію, ви можете застосувати її до відповідного поля пошуку.
Рис. 8. Пошукові підказки у режимі простого пошуку
Пошук окремих слів
Для знаходження наявності того чи іншого слова серед усіх описових полів, введіть це слово в пошукове поле та натисніть кнопку Знайти (рис. 9).
Рис. 9. Простий пошук
Так, наприклад, якщо Ви введете для пошуку слово “насіння”, то отримаєте результат, приведений на рис. 10. Як видно з цього рисунку, результуючий список документів за замовчуванням видається за релевантністю (тобто ступеню відповідності запиту), але надається можливість вибрати і інший параметр з випадаючого списку Сортувати. Зверніть також увагу на наступне. Не всі знайдені статті мають в своїй назві слово “насіння” (таких статей буде лише три), інші статті серед знайдених є статті де слово “насіння” зустрічається в Анотації (тут Опис, див. рис. 11). Пам’ятайте, що у простому пошуку одночасно залучаються всі описові поля.
Рис. 10. Представлення результатів пошуку слова “насіння”
Рис. 11. Стаття з результуючого списку, яка була знайдена по наявності слова “насіння” в анотації
Зауваження. Всі слова, які використовуються для пошуку є не чутливими до регістру, що використовується, тобто можна використовувати великі або малі літери. Результат пошуку буде однаковий.
Слова, що не шукаються - стоп-слова
Механізм пошуку ігнорує деякі слова, які часто зустрічаються в англійській мові, однак є безглуздими з погляду пошуку. До них відносяться:
"a", "and" , "are" , "as" , "at" , "be" , "but" , "by" , "for" , "if" , "in" , "into", "is" ,"it" ,"no" , "not" , "of" , "on" , "or" , "such", "the" , "to" , "was"
Якщо вказати в якості пошукового слова будь яке з цих слів, то нічого не буде знайдено.
Для української та російської мови ніякі слова не ігнорується. Наприклад, якщо вказати в якості пошукового слова ”а”, то можливо отримати безліч статей.
Пошук по багатьом словам
В пошуковому запиті можна вказати декілька слів. У цьому випадку виконується пошук статей, які містять кожне з вказаних слів. Між словами треба розмістити один або більше символів “пробілу”. Наприклад, якщо в якості пошукових слів вказати “курган*” та “околиц*” то отримаємо результат з двох статей (рис. 12). Якщо в пошуковому запиті вказати окремо ці слова, отримаємо відповідно результати (рис. 13-14), з 19 і 11 статей, тобто результат пошукового запиту, який складається з двох слів, становить їх перетин.
Простий пошук підтримує різні оператори і модифікатори, такі як лапки, зірочки, мінуси, логічні оператори AND, OR, NOT (рис. 15).
Рис. 12. Простий пошук по багатьом словам. Запит ‘курган* околиц*’
Рис. 15. Простий пошук. Кількість результатів пошуку при різних варіантах логічних комбінацій пошукових слів “Полісся” і “споруди”.
Використання в словах групових символів
Груповий символ – це спеціальний символ, який заміщує один або більше символів в пошуковому слові. Є два групових символи: знак питання (?) та зірочка (*). Знак питання заміщує будь який одиночний символ у слові у тому місці, де він розташований. Символ “зірочка” використовується для представлення будь-якого символу або групи символів у слові). Наприклад, ‘нейронні мережі’, ‘нейронних мереж’, ‘нейронними мережами’, всі такі словосполучення можна знайти пошуковою фразою ‘нейрон* мереж*’ (рис. 16).
Рис. 16. Простий пошук. Запит ‘нейрон* мереж*’
Символ „?” можна використовувати, наприклад, якщо ви не знаєте точне написання пошукового слова. Наприклад, якщо Ви точно не знаєте, як пишеться англійське слово “dynamic” або “dinamic”, то можете вказати у пошуковому запиті “d?namic”. Другий варіант можливого використання – якщо прізвище автора в різних статтях вказується на українській або російській мові, наприклад “Анісімов” та “Анисимов”. Якщо Ви бажаєте знайти всі статті цього автора не зважаючи на мову, то в пошуковому запиті вказуєте “Ан?с?мов”. Звичайно, що цього Ви досягнете тільки в тому випадку, коли написання прізвища (або іншого пошукового слова) різниться тільки окремим буквами в одних ї тих же позиціях слова.
Зауваження. Не дозволяється використовувати символ „?” на початку слова. У цьому випадку, та всіх інших, коли Ви неправильно сформулювали пошуковий запит виводиться відповідне повідомлення.
Можна використовувати декілька підряд розташованих символів “?”. Так, наприклад, якщо використати пошукове слово “алекс??в”, то будуть знайдені статті з авторами Алексеев, Алексєєв та Алексєєв (рис. 17).
Рис. 17. Простий пошук. Запит Алекс??в
Символ “зірочка” (*) використовується також у тому випадку, коли в слові відома лише деяка послідовність символів, а інші – ні. Наприклад, ви пам’ятаєте, що прізвище точно починається на “Антонч”, але наступні літери не пам’ятаєте. У цьому випадку треба використати пошукове слово “Антонч*” і будуть знайдені усі ті статті, в яких прізвище автора починається на потрібні символи. Так, наприклад, на рис. 18 видно, що знайдені статті з авторами Антончик і Антонченко.
Рис. 18. Простий пошук. Запит Антонч*
Зауваження. Символ “*” можна використовувати в середині та в кінці слова, на початку – ні.
Можна одночасно використовувати символи “*” та “?”. Наприклад, пошукове слово “Р?зн*е?ко” є коректним и знаходяться всі ті статті, які відповідають його змісту (рис. 19).
Рис. 19. Використання групових слів “*” та “?” у запиті
Пошук по близькості звучання слова
Надається така оригінальна можливість, як пошук по близькості звучання того слова, яке ви вкажете. Для цього треба вказати символ тильда "~" в кінці слова. Так, наприклад, якщо Ви вкажете пошукове слово “cемантический~” (рис. 20), то, будуть знайдені статі, що вмішують слова однокореневі слова, наприклад, “семантические”, “семантическому”, “семантичні” і так далі, а також такі близькі по звучанню слова, як “генетический”, “статический”, ‘механические”, ‘органический”, “електрические”, “математический”, “електрический” и т.д. Ви також можете вказати додатковий (факультативний) параметр, що вказує міру близькості звучання слів. Це число у вигляді десятого дробу в інтервалі 0 – 1 (наприклад 0.4 – точка для зображення десяткового знаку). Наприклад, “cемантический~0.4”. Чим більше число, тим більша схожість звучання потребується. Наприклад, при використанні виразу “cемантический~0.8” у існуючій на поточний момент електронній бібліотеці знаходяться статті тільки з однокореневими словами, але не знаходяться інші однокореневі слова, які не так близькі по звучанню, наприклад, “семантичному”, “семантичного”.
Якщо міра близькості звучання не вказується, то за замовчуванням використовується значення 0.5.
Рис. 20. Простий пошук. Запит по близькості звучання ‘семантический ~'
Пошук за фразами
Фраза – це послідовність слів, розташованих у подвійних лапках. Наприклад, фразами є "база даних", "числення предикатів", "семантична мережа". При використанні фрази здійснюється пошук статей, що мають вказану фразу, тобто саме таку послідовність слів. Наприклад, якщо Ви вказуєте фразу "knowledge base" і пошук проводиться у полі Назва, то можете отримати результат, наведений на рис. 21.
Рис. 21. Простий пошук. Пошук фрази "knowledge base"
Якщо пошук фрази проводиться і по іншим полям, опція Всі поля, не дивуйтесь, якщо результат містить україномовні та російськомовні статті. Стаття може мати додаткову англомовну назву чи англомовну анотацію, або ця фраза зустрічається в анотації статті.
У фразах нема сенсу використовувати групові символи для слів. Їх використання не розглядається як помилка, але ви не отримуєте очікуваного результату.
У фразах нема сенсу використовувати пошук по близькості звучання усієї фрази. Його використання не розглядається як помилка, але результат буде такий же самий, як і пошук по самій фразі.
Використання слів і фраз. У пошуковому запиті можна вказувати одночасно слова та фрази. Наприклад: "видов водорослей" "основном русле" або "видов водорослей" русл* (рис. 22).
Пам’ятайте, що здійснюється пошук статей, які містять всі з перелічених слів або фраз.
Рис. 22. Простий пошук. Пошук набору фраз і слів
Пошук з використанням відстані між словами
Надається можливість пошуку за словами, які розташовані на відстані, яка не перевищує вказане число. Для цього в кінці фрази, застосуйте символ тильда “~” за яким вкажіть ціле число, що вказує відстань. Наприклад, якщо ви вкажете наступний пошуковий вираз "проблеми війни"~5, то отримаєте результат, наведений на рис. 23.
Рис. 23. Простий пошук. Запит ‘"проблеми війни" ~5‘
Пам’ятайте. Англомовні стоп-слова не враховується при визначенні відстані між словами. Відстань 0 вказує, що слова розташовані поруч. Порядок розташування двох слів у фразі є суттєвим.
Фраза може містити декілька слів. При цьому мається на увазі наступне: відстань між першим та останнім словами не повинна перевищувати вказану відстань, не враховуючи вказані проміжні слова.
Пошук за важливістю слів або фраз
Коли Ви перелічуєте слова або фрази, надається можливість вказати які з них є більш важливими (релевантними). Важливість слів та фраз впливає на порядок розташування статей у результаті пошуку. Спочатку слідують статті з найбільш важливими словами/фразами, а потім з менш важливими. Для вказівки міри важливості в кінці слова/фрази помістіть символ "^", і слід за ним число, яке вказує ступінь важливості.
Наприклад, якщо ви бажаєте знайти статті за словами. "parallel" та "programming” і придати слову "parallel" більшу релевантність, то сформулюйте наступний пошуковий запит: parallel^4 programming (рис. 24).
Рис. 24. Простий пошук. Пошук за важливістю слів
В якості міри релевантності можна використовувати не від’ємні цілі числа та десяткові дроби в інтервалі 0-1. За замовчуванням усі слова/фрази мають міру релевантності 1.
Релевантність можна вказувати для декількох слів та фраз, наприклад, "база даних"^20 "інформаційна система"^10 бібліотека^5
Рис. 25. Простий пошук. Пошук за важливістю слів або фраз
Попередній запит не надав результатів (рис. 25), тому наведемо ще один приклад пошуку за важливістю слів або фраз: інформатизаці*^20 досвід*^10 (рис. 26).
Рис. 26. Простий пошук. Пошук за важливістю слів або фраз
Зауваження. Розташовуйте слова/фрази у порядку зменшення їх міри релевантності.
Обов’язкова наявність слів або фраз
Коли перелічуються слова або/та фрази, то можна вказати, які з них обов’язково повинні зустрітися в статті. Для цього треба перед словом/фразою вказати символ “плюс” (+). Наведемо приклад такого запиту. При використанні слів їх можна вживати з груповими символами “?” та “*”. Так, наприклад, згідно з запитом ‘+Київщин* +Полісся’. Можемо отримати наступний результат (рис. 27).
Рис. 27. Простий пошук. Запит з обов’язковою наявністю слів Київщин* і Полісся
Довідка з пошукових виразів
Пошук за допомогою шаблонів (символів підстановки) |
|||||
не можуть бути першими символами в пошуковому полі |
|||||
? |
підстановка одного символу |
Резн?ченко |
Резниченко або Резніченко |
||
* |
підстановка декількох символів |
лазерн* нано*структурний |
лазерний, лазерне або лазерні наномоноструктурний або нанополіструктурний |
||
Логічні оператори |
|||||
логічне включення і виключення застосовуються тільки до окремих слів і не застосовуються до фраз |
|||||
AND |
логічний зв'язок І |
"інформаційний" AND "аналіз ринку" |
опис міститиме "інформаційний" та "аналіз ринку" |
||
OR |
логічний зв'язок АБО |
"інформаційний" OR "аналіз ринку" |
опис міститиме "інформаційний" або "аналіз ринку" |
||
NOT |
логічний зв'язок НЕ |
"інформаційний" NOT "аналіз ринку" |
опис міститиме "інформаційний" і не міститиме "аналіз ринку" |
||
+ |
логічне включення |
аналіз +ринку |
опис міститиме "ринку" і може містити "аналіз" |
||
‒ |
логічне виключення |
- аналіз ринку |
опис міститиме "інформаційний" та не міститиме "аналіз ринку" |
||
Оператор "схожого" слова |
|||||
~ |
пошук схожого слова (нечіткий пошук), можливе зазначення відсотка "схожості" (від 0 до 1) |
|
Низамутдинов, Низамудинов, Незамудинов і т.д. |
||
Оператор "відстані" слів |
|||||
~ |
пошук слів у фразі на певній відстані |
"лазерне зварювання "~3 |
"лазерне" і не більше ніж через 3 слова "зварювання" |
||
Оператор діапазону |
|||||
{TO} |
пошук слів, що починаються на букву з діапазону |
{ В TO Д } |
слова, які починаються з "В", "Г", "Д" |
||
[TO] |
Пошук дат з діапазону |
[ 2014 TO 2015 ] |
дати 2014, 2015 |
||
Оператор пріоритету |
|||||
^ |
пошук слів із зазначенням значущості під час пошуку (вказується будь-яке значення, що перевищує 0) |
лазерне^10 автоматичне^5 зварювання |
при виведенні результатів із сортуванням за релевантністю пріоритет буде у "лазерне" |
Формат дати в полях пошуку
Як задавати дати в пошукових полях? Дату, наприклад в полі анотація, у VuFind визначають так само, як і в будь-якому іншому полі, яке містить дані про дату. Ви можете використовувати функції для визначення дати залежно від типу і формату даних у полі.
Формат ISO 8601 - це міжнародний стандарт, який описує формати дат і часу та дає рекомендації для їхнього використання в міжнародному контексті. Формат ISO 8601 був розроблений організацією ISO (International Organization for Standardization) в 1988 році і відтоді кілька разів оновлювався. Наразі діє версія ISO 8601-1:2019 та ISO 8601-2:2019, що замінила ISO 8601:2004[1].
Формат ISO 8601 заснований на таких принципах:
- Значення дати і часу розташовані в порядку від більш до менш значущого. Кожне число (рік, місяць, день, час) записується з фіксованим числом знаків і, за необхідності, має бути доповнене до нього провідними нулями. Наприклад, час "7:40" має бути записано як "07:40".
- Подання може бути в одному з двох форматів: простому форматі з мінімальним числом символів, або розширеному форматі з розділювачами, доданими для зручності читання. Стандарт дозволяє використання дефіса між елементами дати і двокрапки між годинами, хвилинами і секундами.
- Від дати і часу можна відкинути будь-яку кількість полів, але менш значущі поля обов'язково мають бути відкинуті раніше більш значущих. Наприклад, "2004-05" це коректна дата, що означає травень 2004. При цьому, таке позначення за стандартом не може трактуватися як 5-е число невідомого місяця 2004 року.
- Стандарт підтримує додавання десяткової крапки до найменшої одиниці часу, коли потрібна більша точність. При цьому допустиме подання з десятковою крапкою в скорочених форматах часу, тобто T13:23,5 еквівалентно T13:23:30. Стандарт не дозволяє використовувати подання з десятковою крапкою для дат.
Наприклад, такі подання дати та часу відповідають стандарту ISO 8601:
- 2023-04-13 - це простий формат для дати 13 квітня 2023 року.
- 2023-04-13T18:30 - це простий формат для дати і часу 13 квітня 2023 року о 18 годині 30 хвилин.
- 2023-04-13T18:30Z - це простий формат для дати і часу в UTC (Всесвітній координований час) 13 квітня 2023 року о 18 годині 30 хвилин.
- 2023-04-13T18:30+04 - це простий формат для дати й часу із зазначенням зсуву від UTC (у цьому випадку +4 години) 13 квітня 2023 року о 18 годині 30 хвилин.
- 2023-W15 - це простий формат для тижня (15-й тиждень) у році (2023 рік).
[1] https://ru.wikipedia.org/wiki/ISO_8601