Theoretical principles of use of ontologies for semantization of the Web resources

In this paper we show the main directions of semantization of the Web information resources and their theoretical bases. We consider the semantization problems associated with the open environment information at the knowledge level. This analysis substantiates the need for the Web semantic search me...

Повний опис

Збережено в:
Бібліографічні деталі
Дата:2018
Автор: Rogushina, J.V.
Формат: Стаття
Мова:Ukrainian
Опубліковано: Інститут програмних систем НАН України 2018
Теми:
Онлайн доступ:https://pp.isofts.kiev.ua/index.php/ojs1/article/view/283
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Problems in programming
Завантажити файл: Pdf

Репозитарії

Problems in programming
id pp_isofts_kiev_ua-article-283
record_format ojs
resource_txt_mv ppisoftskievua/85/24f687c59d2e5d99da4a44b677051285.pdf
spelling pp_isofts_kiev_ua-article-2832024-04-28T11:37:24Z Theoretical principles of use of ontologies for semantization of the Web resources Теоретические основы применения онтологий для семантизации ресурсов Web Теоретичні засади застосування онтологій для семантизації ресурсів Web Rogushina, J.V. semantic retrieval; task ontology; semantic Wiki resources; personification of retrieval UDC 004.853, 004.55 семантический поиск; онтология задачи; семантические Wiki-ресурсы; персонификация поиска УДК 004.853, 004.55 семантичний пошук; онтологія задачі; семантичні Wiki-ресурси; персоніфікація пошуку УДК 004.853, 004.55 In this paper we show the main directions of semantization of the Web information resources and their theoretical bases. We consider the semantization problems associated with the open environment information at the knowledge level. This analysis substantiates the need for the Web semantic search methods and means. Modern principle tendencies in the personified semantic deal with the ontology-based formalization of knowledge about the information needs of users and their current tasks. Our approach is based on use of the semantically marked Wiki-resources as a source of knowledge for constructing of ontologies of individual task. Each task ontology is considered as a small subset of domain ontology with large number of terms volume and high complexity. We develop the formal model of the task ontology as a special case of the formal model of domain ontology and propose methods for constructing of this task ontology on base of the set of semantically marked Wiki pages. The software implementation of the retrieval systems capable to process such task ontologies is analyzed on example of MAIPS – semantic retrieval system which provides personalized satisfaction of user information needs. Such personification is based on knowledge contained into the user task thesauri that are built on base of task ontologies. Problems in programming 2018; 2-3: 197-203 В работе проанализированы основные направления семантизации информационных ресурсов Web и теоретические основы, которые могут использоваться для этого. Рассмотрены проблемы, связанные с использованием и анализом информации из открытой среды на уровне знаний. Обоснована потребность в разработке методов и средств семантического поиска в Web и целесообразность использовании онтологий для формализации знаний об информационных потребностях пользователей и их текущих задачах. Рассмотрены современные направления развития семантического поиска и его персонификации. Обоснованная целесообразность использования семантически размеченных Wiki-ресурсов как источника знаний для построения онтологий отдельных задач, которые являются подмножествами больших по объему и сложностью онтологий предметных областей. Разработана формальная модель онтологии задачи, рассматривается ее сопоставление с формальной моделью онтологии предметной области. Предложены методы построения онтологии задачи по множеству семантически размеченных Wiki-страниц. Проанализированы перспективы применения систем семантического поиска, способных использовать такие онтологии. Описана программная реализация предложенного в работе подхода – система семантического поиска МАИПС, которая обеспечивает персонифицированное удовлетворение информационных потребностей пользователей. Такая персонификация базируется на применение знаний, содержащихся в онтологиях задач и построенных по этими онтологиям тезаурусах. Problems in programming 2018; 2-3: 197-203 В роботі проаналізовано основні напрямки семантизації інформаційних ресурсів Web та теоретичні засади, що можуть використовуватися для цього. Розглянуто проблеми, пов’язані з використанням та аналізом інформації з відкритого середовища на рівні знань. Обґрунтована потреба в розробці методів та засобів семантичного пошуку в Web та доцільність використанні онтологій для формалізації знань щодо інформаційних потреб користувачів та їх поточних задач. Розглянуто сучасні напрямки розвитку семантичного пошуку та його персоніфікації. Обґрунтована доцільність використання семантично розмічених Wiki-ресурсів як джерела знань для побудови онтологій окремих задач, що є підмножинами більших за обсягом та складністю онтологій предметних областей. Розроблено формальну модель онтології задачі, розглядається її співставлення з формальною моделлю онтології предметної області. Запропоновано методи побудови онтології задачі за множиною семантично розмічених Wiki-сторінок. Проаналізовано перспективи застосування систем семантичного пошуку, здатних використовувати такі онтології. Описано програмну реалізацію запропонованого у роботі підходу – систему семантичного пошуку МАІПС, що забезпечує персоніфіковане задоволення інформаційних потреб користувачів. Така персоніфікація базується на застосування знань з онтологій задач та побудованих за цими онтологіями тезаурусів. Problems in programming 2018; 2-3: 197-203 Інститут програмних систем НАН України 2018-11-05 Article Article application/pdf https://pp.isofts.kiev.ua/index.php/ojs1/article/view/283 10.15407/pp2018.02.197 PROBLEMS IN PROGRAMMING; No 2-3 (2018); 197-203 ПРОБЛЕМЫ ПРОГРАММИРОВАНИЯ; No 2-3 (2018); 197-203 ПРОБЛЕМИ ПРОГРАМУВАННЯ; No 2-3 (2018); 197-203 1727-4907 10.15407/pp2018.02 uk https://pp.isofts.kiev.ua/index.php/ojs1/article/view/283/277 Copyright (c) 2018 PROBLEMS OF PROGRAMMING
institution Problems in programming
baseUrl_str https://pp.isofts.kiev.ua/index.php/ojs1/oai
datestamp_date 2024-04-28T11:37:24Z
collection OJS
language Ukrainian
topic semantic retrieval
task ontology
semantic Wiki resources
personification of retrieval
UDC 004.853
004.55
spellingShingle semantic retrieval
task ontology
semantic Wiki resources
personification of retrieval
UDC 004.853
004.55
Rogushina, J.V.
Theoretical principles of use of ontologies for semantization of the Web resources
topic_facet semantic retrieval
task ontology
semantic Wiki resources
personification of retrieval
UDC 004.853
004.55
семантический поиск
онтология задачи
семантические Wiki-ресурсы
персонификация поиска
УДК 004.853
004.55
семантичний пошук
онтологія задачі
семантичні Wiki-ресурси
персоніфікація пошуку
УДК 004.853
004.55
format Article
author Rogushina, J.V.
author_facet Rogushina, J.V.
author_sort Rogushina, J.V.
title Theoretical principles of use of ontologies for semantization of the Web resources
title_short Theoretical principles of use of ontologies for semantization of the Web resources
title_full Theoretical principles of use of ontologies for semantization of the Web resources
title_fullStr Theoretical principles of use of ontologies for semantization of the Web resources
title_full_unstemmed Theoretical principles of use of ontologies for semantization of the Web resources
title_sort theoretical principles of use of ontologies for semantization of the web resources
title_alt Теоретические основы применения онтологий для семантизации ресурсов Web
Теоретичні засади застосування онтологій для семантизації ресурсів Web
description In this paper we show the main directions of semantization of the Web information resources and their theoretical bases. We consider the semantization problems associated with the open environment information at the knowledge level. This analysis substantiates the need for the Web semantic search methods and means. Modern principle tendencies in the personified semantic deal with the ontology-based formalization of knowledge about the information needs of users and their current tasks. Our approach is based on use of the semantically marked Wiki-resources as a source of knowledge for constructing of ontologies of individual task. Each task ontology is considered as a small subset of domain ontology with large number of terms volume and high complexity. We develop the formal model of the task ontology as a special case of the formal model of domain ontology and propose methods for constructing of this task ontology on base of the set of semantically marked Wiki pages. The software implementation of the retrieval systems capable to process such task ontologies is analyzed on example of MAIPS – semantic retrieval system which provides personalized satisfaction of user information needs. Such personification is based on knowledge contained into the user task thesauri that are built on base of task ontologies. Problems in programming 2018; 2-3: 197-203
publisher Інститут програмних систем НАН України
publishDate 2018
url https://pp.isofts.kiev.ua/index.php/ojs1/article/view/283
work_keys_str_mv AT rogushinajv theoreticalprinciplesofuseofontologiesforsemantizationofthewebresources
AT rogushinajv teoretičeskieosnovyprimeneniâontologijdlâsemantizaciiresursovweb
AT rogushinajv teoretičnízasadizastosuvannâontologíjdlâsemantizacííresursívweb
first_indexed 2024-09-16T04:07:42Z
last_indexed 2024-09-16T04:07:42Z
_version_ 1818568220479586304
fulltext Моделі та засоби систем баз даних і знань © Ю.В. Рогушина, 2018 ISSN 1727-4907. Проблеми програмування. 2018. № 2–3. Спеціальний випуск 197 УДК 004.853, 004.55 ТЕОРЕТИЧНІ ЗАСАДИ ЗАСТОСУВАННЯ ОНТОЛОГІЙ ДЛЯ СЕМАНТИЗАЦІЇ РЕСУРСІВ WEB Ю.В. Рогушина В роботі проаналізовано основні напрямки семантизації інформаційних ресурсів Web та теоретичні засади, що можуть використовуватися для цього. Розглянуто проблеми, пов’язані з використанням та аналізом інформації з відкритого середовища на рівні знань. Обґрунтована потреба в розробці методів та засобів семантичного пошуку в Web та доцільність використанні онтологій для формалізації знань щодо інформаційних потреб користувачів та їх поточних задач. Розглянуто сучасні напрямки розвитку семантичного пошуку та його персоніфікації. Обґрунтована доцільність використання семантично розмічених Wiki- ресурсів як джерела знань для побудови онтологій окремих задач, що є підмножинами більших за обсягом та складністю онтологій предметних областей. Розроблено формальну модель онтології задачі, розглядається її співставлення з формальною моделлю онтології предметної області. Запропоновано методи побудови онтології задачі за множиною семантично розмічених Wiki-сторінок. Проаналізовано перспективи застосування систем семантичного пошуку, здатних використовувати такі онтології. Описано програмну реалізацію запропонованого у роботі підходу – систему семантичного пошуку МАІПС, що забезпечує персоніфіковане задоволення інформаційних потреб користувачів. Така персоніфікація базується на застосування знань з онтологій задач та побудованих за цими онтологіями тезаурусів. Ключові слова: семантичний пошук, онтологія задачі, семантичні Wiki-ресурси, персоніфікація пошуку. В работе проанализированы основные направления семантизации информационных ресурсов Web и теоретические основы, которые могут использоваться для этого. Рассмотрены проблемы, связанные с использованием и анализом информации из открытой среды на уровне знаний. Обоснована потребность в разработке методов и средств семантического поиска в Web и целесообразность использовании онтологий для формализации знаний об информационных потребностях пользователей и их текущих задачах. Рассмотрены современные направления развития семантического поиска и его персонификации. Обоснованная целесообразность использования семантически размеченных Wiki-ресурсов как источника знаний для построения онтологий отдельных задач, которые являются подмножествами больших по объему и сложностью онтологий предметных областей. Разработана формальная модель онтологии задачи, рассматривается ее сопоставление с формальной моделью онтологии предметной области. Предложены методы построения онтологии задачи по множеству семантически размеченных Wiki-страниц. Проанализированы перспективы применения систем семантического поиска, способных использовать такие онтологии. Описана программная реализация предложенного в работе подхода – система семантического поиска МАИПС, которая обеспечивает персонифицированное удовлетворение информационных потребностей пользователей. Такая персонификация базируется на применение знаний, содержащихся в онтологиях задач и построенных по этими онтологиям тезаурусах. Ключевые слова: семантический поиск, онтология задачи, семантические Wiki-ресурсы, персонификация поиска. In this paper we show the main directions of semantization of the Web information resources and their theoretical bases. We consider the semantization problems associated with the open environment information at the knowledge level. This analysis substantiates the need for the Web semantic search methods and means. Modern principle tendencies in the personified semantic deal with the ontology-based formalization of knowledge about the information needs of users and their current tasks. Our approach is based on use of the semantically marked Wiki-resources as a source of knowledge for constructing of ontologies of individual task. Each task ontology is considered as a small subset of domain ontology with large number of terms volume and high complexity. We develop the formal model of the task ontology as a special case of the formal model of domain ontology and propose methods for constructing of this task ontology on base of the set of semantically marked Wiki pages. The software implementation of the retrieval systems capable to process such task ontologies is analyzed on example of MAIPS – semantic retrieval system which provides personalized satisfaction of user information needs. Such personification is based on knowledge contained into the user task thesauri that are built on base of task ontologies. Key words: semantic retrieval, task ontology, semantic Wiki resources, personification of retrieval. Сучасні інформаційні системи орієнтовані на роботу в розподіленому середовищі Web, що потребує автоматизованого здобуття актуальних та пертинентних знань з його ресурсів. Великий обсяг та складна структура інформаційних ресурсів Web викликають потребу у створенні засобів їх автоматизованої обробки, які дозволили б аналізувати зміст цих ресурсів та здобувати з них саме ті відомості, що потрібні користувачу для вирішення його поточної задачі. Це визначає актуальність семантизації як самих ресурсів Web, так і процесу їх пошуку. У мовознавстві семантизацією називають виявлення змісту мовних одиниць, приміром, появу нових семантичних одиниць у структурі лексеми, тобто набуття словом нового значення. Таким чином, можна казати, що у більш загальному випадку семантизація – це встановлення зв’язку між певним інформаційним об’єктом (ІО) та його змістом. Під семантизацією інформаційних ресурсів (ІР) будемо надалі розуміти встановлення зв’язків між цими ІР (або їх елементами) та певними формалізованими знаннями. Основні задачі, які при цьому вирішуються, – це пошук ІР, пертинентних потребам користувачів, та здобуття з цих ІР необхідної інформації. Окремими випадками семантизації ІР є семантичний пошук, семантичне анотування (побудова семантичних метаописів) та семантична розмітка. Моделі та засоби систем баз даних і знань 198 Семантичний пошук [1] – це пошук інформації, що задовольняє інформаційні потреби користувача в процесі розв’язання певної задачі із застосуванням знань щодо суб’єктів і об’єктів пошукової процедури й методів аналізу цих знань [2]. Ці знання можуть стосуватися як користувача та його інформаційних потреб (персоніфікація пошуку), так і структури та типів ІР, серед яких здійснюється пошукова процедура. Знання можуть використовуватися приховано від користувача (внутрішня база знань пошукової системи, до якої користувач не має доступу), що ускладнює розуміння роботи такої системи та зменшує довіру до неї, або безпосередньо за його вибором (база знань користувача), що вимагає від користувача додаткових зусиль . Пошук у Web є ключовою технологією Web, тому що дозволяє отримати доступ до його ресурсів. Результатами пошуку можуть бути різні види інформаційних ресурсів або їх елементів – природномовні документи та їх фрагменти, структуровані або слабкоструктуровані дані. Сам інформаційний запит, що формалізує інформаційну потребу користувача, теж може бути представлено по-різному – ключовими словами, структурованими мовами запитів (SQL, SQRL тощо) або прикладами тих ІО, що потрібні користувачеві. Ціль пошуку у найбільш широкому розумінні – співставити запит з описами тих ІР, про які відомо пошуковій системі, та знайти серед них найбільш релевантні. Але на сьогодні збільшення ефективності пошуку пов’язують не з його повнотою, а з фільтрацією результатів, яка дозволяє з великої кількості ІР, релевантних запиту користувача, відібрати ті ІР, які стосуються його поточних інтересів, позбавивши самого користувача від рутинного аналізу запропонованої інформації. Основна тенденція семантизації пошукових засобів пов’язана з переходом від виявлення документів, що містять певні ключові слова, до пошуку знань, необхідних для виконання поставленого перед користувачем завдання. Семантична розмітка ІР дозволяє автоматизувати такий аналіз, використовуючи зовнішні бази знань, з якими пов’язується контент ІР, для співставлення зі сферою інтересів користувача, яка теж описується певним чином формалізованими знаннями відповідної предметної області (ПрО). Слід відмітити, що використання онтології ПрО для семантичної розмітки ІР та використання семантичної розмітки ІР для вдосконалення онтології ПрО розглядаються в цій роботі як два взаємопов’язані етапи онтологічного аналізу ПрО, що застосовуються ітеративно до того часу, поки користувач не буде задоволений побудованою онтологією. Ефективність цього процесу значним чином залежить від того, які саме бази знань використовуються для цього. В процесі досліджень в сфері подання знань створено різноманітні формалізми (семантичні мережі та фреймові системи, таксономії тощо) та мови, приміром, OWL [3] та RDF [4]. Важливо, з одного боку, який саме формалізм використовується для подання знань, а з другого – наскільки цей набір знань відповідає потребам конкретного користувача та його поточній задачі. Якщо для рішення першого питання на сьогодні для Web-орієнтованих застосувань фактично стало стандартом використання онтологій [5] (і питання більшою мірою стосується того, якої складності онтології потрібно використовувати), то для другого – вибору або пошуку найбільш пертинентної онтології – поки що загальноприйняте рішення ще на знайдено. Існує два основні напрямки рішення цієї проблеми – 1. пошук серед існуючих онтологій (приміром, пошук в репозиторії онтологій за запитом або співставлення знайдених онтологій із описом задачі користувача) та 2. Побудова персональної онтології за матеріалами, наданими користувачем [6]. У першому випадку досить складно знайти онтологію, що досить повно співпадає зі сферою інтересів користувача (якщо обрати онтологію надто широкої ПрО, то це значно збільшує час обробки, а онтологія надто вузької ПрО може не містити важливих для задачі знань), а другий потребує багато зусиль спеціалістів та часу. На практиці зазвичай використовують певну комбінацію обох підходів. Сьогодні поширені різні підходи до семантизації пошуку в Web. Деякі з них використовують складні структуровані мови для подання запитів користувачів, інші орієнтовані на пошук за ключовими словами або на природномовні запити. Більшість підходів першої групи базуються на RDF і орієнтовані на технології проекту Semantic Web, тобто здійснюють пошук у вже семантично розмічених ІР. Наприклад, Swoogle [7] використовує краулер для виявлення, індексації та запитування документів в форматі RDF. На жаль, таку розмітку на сьогодні має лише невелика частина ресурсів Web. Більш детально відмінності між цим типами пошуку розглянуто в [8]. Для семантизації пошуку у Web багато дослідників використовують онтології, але ці онтології зазвичай є однаковими для всіх користувачів пошукової системи. Використання онтологій для подання знань у Web Використання онтологій для подання знань у Web є потужним та ефективним засобом, але обробка онтологічних структур дуже складна і потребує багато часу. Онтологія певної ПрО містить багато понять та зв’язків між ними, але для рішення окремих задач з цієї ПрО у багатьох випадках потрібна тільки невелика частина цих знань. Тому для рішення прикладних задач виникає потреба будувати за онтологіями ПрО простіші ІО – залежно від специфіки задачі, а потім використовувати їх як джерело знань, приміром, у Моделі та засоби систем баз даних і знань 199 семантичному пошуку. Такі ІО містять тільки певну підмножину онтології ПрО, і тому їх обробка стає значно швидшою. Значно ефективніше використовувати ті онтології, які характеризують область інтересів та поточну задачу конкретного користувача, тобто пошукова система здатна трансформувати той самий інформаційний запит відповідно до знань щодо тієї ПрО, до якої відноситься задача користувача, та від його персональних особистостей. Тому виникає потреба у засобах побудови таких онтологій та у методах їх застосування для семантичного пошуку. Аналіз існуючих на сьогодні засобів семантичного пошуку показує, що для переважної кількості задач для опису ПрО достатньо використовувати “легковагові” онтології, в яких не застосовуються аксіоми, а множина відношень між класами, що описуються додатковими властивостями, зазвичай є порожніми. Легковагові онтології – це відносно прості таксономічні структури термів з відповідними визначеннями. Вони менш аксіоматизовані. Такі онтології мають менші виразові можливості, але їх значно легше та швидше обробляти. Для великовагової онтології можна побудувати її легковагу версію [9]. Для таких онтологій характерна наявність тільки наступних відношень: - відношення “клас-підклас”, значення якого пов’язані транзитивно; - об’єктне відношення синонімії, значення якого пов’язані симетрично; - об’єктні відношення, специфічні для ПрО, значення яких не мають бінарних властивостей. У більш складних випадках деякі відношення ПрО можуть також бути визначені як транзитивні або симетричні, і це дозволяє реалізувати більш складне логічне виведення на знаннях ПрО. Але частіше для семантичного пошуку достатньо самої наявності відношення між екземплярами класів, щоб оцінити пертинентність ІО області пошуку. Це пов’язано з тим, що аналіз, приміром, природномовного тексту із урахуванням усіх знань щодо ПрО для визначення його семантики займає дуже багато часу, що неприйнятно для аналізу великої кількості ІР, релевантних запиту. Залежно від того, наскільки складно описує користувач потрібну ПрО, залежить як час пошуку, так і його якість. Обирати компроміс між цими протилежними критеріями має сам користувач. Така “легковажна” онтологія може базуватися на онтології більш широкої ПрО (з більшою кількістю класів, відношень та екземплярів), яка має значно більшу виразну потужність (приміром, подана на OWL Full або OWL-DL). Але безпосередньо побудувати підмножину онтології для переважної більшості користувачів є надто складною задачею. Значно легше обробляти ІР, що містять відповідну семантичну розмітку, обираючи ті, що відносяться до поточної задачі. Постановка задачі Для персоніфікованого семантичного пошуку виникає потреба у побудові онтологічних структур, що базуються на ІР, вже семантично розмічених елементами онтології більш широкої ПрО. Використання семантичної розмітки таких ІР дозволяє будувати підмножину такої онтології, що безпосередньо стосується поточної задачі користувача. Для цього необхідно розробити алгоритм, який за набором семантично розмічених ІР будує онтологію з елементів розмітки. Семантичні Wiki як джерело онтологічної інформації На сьогодні переважна частина ресурсів Web не є семантизованими, але кількість ІР, що містять семантичну розмітку та різноманітні метаописи, постійно зростає. Але для користувачів все ще важко відокремлювати такі ресурси від загальної маси ІР, незважаючи на те, що існує велика кількість пошукових систем, орієнтованих саме на пошук структурованих ІР, приміром, для виявлення, індексації та запитування документів в форматі RDF або OWL. Використовуючи такі системи, можна знайти конкретний документ, але досить складно побудувати множину документів, що відповідають якійсь поточній задачі, тому що безпосередні посилання між такими ІР, як правило, відсутні або не є наочними. Тому доцільніше використовувати бази знань, побудовані на Wiki-платформі. По-перше, такі системи застосовують стандартизовані засоби для подання семантичної розмітки (за допомогою системи категорій та властивостей). Ці елементи можна легко розпізнавати навіть у тих випадках, коли різні ІО отримані з різних ресурсів. Інша важлива перевага – у семантичних Wiki- ресурсах завжди є наявності різноманітні засоби для внутрішньої навігації та пошуку, і це дозволяє користувачу досить швидко визначити набір Wiki-сторінок, пов’язаних з його задачею. Третій важливий фактор – на сьогодні вже створено багато різноманітних семантичних Wiki-ресурсів, і їх кількість, обсяг та якість постійно збільшуються. У-четвертих, у випадку, якщо інформації в семантичних Wiki недостатньо, їх досить легко доповнити відомостями з несемантизованих Wiki (приміром, з Вікіпедій різними мовами або Wiki-довідників) – з таких ресурсів можна здобути менше семантичної інформація, але у поєднання з семантизованими вони дозволяють досить коректно описати довільну проблему. Моделі та засоби систем баз даних і знань 200 Сьогодні використовується багато семантичних розширень Wiki-технології. Сформовані на їх основі ІР можуть динамічно оновлюватися всім співтовариством користувачів, що забезпечує актуальність інформації, мають зручну й просту для розуміння структуру, забезпечують обробку інформації на семантичному рівні, надаючи технологічну платформу для групового керування знаннями. Одним з таких розширень є Semantic MediaWiki [10]. Ця надбудова над MediaWiki має досить високу виразну потужність, надійну реалізацію і зручний інтерфейс користувачів. Сьогодні на SMW базується значна кількість сайтів, порталів та енциклопедичних видань. Прикладом ІР, що базується саме на цій платформі, є електронна версія Великої української енциклопедії [2]. Алгоритм побудови онтології задачі користувача Для опису онтологій будемо використовувати наступну формальну модель T,F,R,XO  , що складається з наступних елементів: - indcl XXX  – множина концептів онтології, де clX – множина класів, indX – множина екземплярів класів, таких, що Aa,XAXa clind  ; - }p{}r{rR jicl_ier  – множина відношень між елементами онтології, де cl_ierr – ієрархічні відношення, що можуть встановлюватися між класами онтології і властивостями класів і характеризується такими властивостями, як антисиметричність і транзитивність, clclcl_ier XX:r  ; }r{ i – множина об'єктних властивостей, що встановлюють стосунки між екземплярами класів:   indindi Xb,bXa,ar  , indindi XX:r  ; }p{ j – множина властивостей даних, що установлюють відношення між екземплярами класів і значеннями:   Tt,tXa,ap indi  , ConstX:p indi  , такі, що усередині множин об'єктних властивостей і властивостей відносин також можуть існувати ієрархічні відносини obj_ierr , }r{}r{:r iiobj_ier  і data_ierr , }p{}p{:r jjdata_ier  ; - F – множина характеристик класів онтології, екземплярів класів і їхніх властивостей, що можуть застосовуватися для логічного виводу (наприклад, еквівалентність, відмінність, відсутність перетинання, область визначення й область значення); - T – множина типів даних (наприклад, рядок, ціле). Формально проблема побудови онтології задачі користувача полягає у наступному: за онтологією ПрО domainO , domaindomaindomaindomaindomain T,F,R,XO  , та набором Wiki-сторінок userW , семантична розмітка яких базується на domainO , побудувати “легковажну” онтологію задачі користувача userO , знання якої є підмножиною знань з domainO . Потрібно відмітити, що джерела та методи побудови цієї онтології ПрО знаходяться поза сферою розгляду даної роботи – вона може мати довільну структуру, високу виразну потужність та бути сформована як безпосередньо експертами ПрО, так і за допомогою різноманітних засобів здобуття онтологічних знань. useruseruseruseruser T,F,R,XO  , така, що: - domainuser XX  , тобто domainuser clcl XX  , domainuser indind XX  ; - domainuser RR  , тобто domainuser cl_iercl_ier rr  , nm,m,0j,n,0i},r{}r{ ij domainuser  ; qt,t,0k,q,0l},p{}p{ lk domainuser  - userF ; - domainuser TT  . Така робота має виконуватися в тому разі, якщо користувач починає працювати над великою та досить складною проблемою, рішення якої буде потребувати інформації на протязі досить значного часу, значно більшого, ніж час, потрібний на побудову власної онтології (приміром, плануючи дослідження на кілька років, доцільно витратити кілка годин на те, щоб надалі отримувати семантично відфільтровані відомості). Моделі та засоби систем баз даних і знань 201 Основні етапи побудови онтології задачі Етап 1. Знайти семантичний Wiki-ресурс W, що за тематикою співвідноситься із задачею користувача або перекриває більш широку ПрО. Найпростіше використовувати неспеціалізовані енциклопедії та довідники (такі, як електронна версія Великої української енциклопедії [11]), але, якщо користувач має відомості до більш спеціалізованих ресурсів, то їх застосування може збільшити ефективність роботи. Етап 2. У цьому Wiki-ресурсі відібрати множину ІР userW , що безпосередньо пов’язані із задачею користувача, WWuser . Почати цей відбір можна із пошуку Wiki-сторінок, назви яких співпадають із ключовими словами цієї задачі, а надалі за допомогою вбудованих засобів навігації Wiki-ресурсом переходити до сторінок, сполучених із цими сторінками семантичними властивостями (усіма або тільки тими, що цікавлять користувача) або відносяться до тих самих категорій. На цьому етапі користувач має виконати певну кількість роботи самостійно, щоб охарактеризувати ту інформацію, що йому потрібна, та відкинути ту, що не стосується його поточної задачі (це може бути цінна інформація, важлива для ПрО в цілому, але не потрібна саме для рішення поточної проблеми). Від того, наскільки точно буде виконано відбір, залежить ефективність виконання семантичного пошуку: відсутність потрібної інформації не дозволить знаходити відповідні ресурси, а наявність зайвих сторінок збільшить час обробки. Етап 3. Здійснюється аналіз інформації з s,1i},w{W iuseruser  . Для кожної сторінки виконуються наступні дії: - інформація про класи сторінки (усі або відібрані користувачем) дозволяє поповнити userclX . Ієрархічні відношення між цими класами можна визначити за допомогою сторінок цих категорій; - ім’я самої сторінки заноситься до userindX ; - імена тих семантичних властивостей сторінок, що використані на даній сторінці та область визначення яких відноситься до типу “Сторінка” (усі або відібрані користувачем), заносяться до }r{ juser ; - імена сторінок, на які дана сторінка посилається за допомогою семантичних властивостей типу “Сторінка” (усі або відібрані користувачем), також заносяться до userindX ; - імена сторінок, на які дана сторінка посилається за допомогою гіперпосилань (усі або відібрані користувачем), також заносяться до userindX ; - якщо дана сторінка відсилає до іншої сторінки, тоді ім’я такої сторінки розглядається як синонім поточної сторінки, заноситься до userindX та пов’язується відношенням синонімії із іменем поточної сторінки. Якщо обробляються несемантизовані Wiki-сторінки, тоді алгоритм їх обробки значно скорочується: - інформація про класи сторінки (усі або відібрані користувачем) дозволяє поповнити userclX . Ієрархічні відношення між цими класами можна визначити за допомогою сторінок цих категорій; - ім’я самої сторінки заноситься до userindX ; - імена сторінок, на які дана сторінка посилається за допомогою гіперпосилань (усі або відібрані користувачем), також заносяться до userindX ; - якщо дана сторінка відсилає до іншої сторінки, тоді ім’я такої сторінки розглядається як синонім поточної сторінки, заноситься до userindX та пов’язується відношенням синонімії із іменем поточної сторінки. Ці дії дозволяють побудувати онтологію задачі користувача. Хоча існує можливість їх програмної реалізації, через те, що більшість операцій потребує втручання користувача та прийняття рішення щодо кожного поняття та відношення, доцільніше виконувати ці дії безпосередньо за допомогою редактору онтологій (приміром, Protégé [12]). Таким чином побудована онтологія представлена мовою OWL та може використовуватися семантичними пошуковими системами для фільтрації результатів запитів [13]. Основна ідея такої фільтрації полягає у тому, що контент знайдених ІР (або певних їх елементів, визначених користувачем) порівнюється із елементами онтології. За результатами порівняння знайдені ІР впорядковуються відповідно до кількісного значення коефіцієнту близькості. Алгоритм порівняння та міри близькості залежать від специфіки конкретних пошукових систем та від обраних користувачем налаштувань. Моделі та засоби систем баз даних і знань 202 Приклад такої системи семантичного пошуку, що використовує онтології користувачів, – метапошукова система МАІПС, що призначена для пошуку інформації, пов’язаної з професійними чи науковими інтересами користувачів, – більш детально описано в [9]. Формалізація інформаційних потреб користувача МАІПС базується на представленні знань щодо його інтересів через онтології ПрО та похідні від них тезауруси задач. Персоналізація семантичного пошуку в МАІПС базується на тому, що користувач явно визначає, які саме знання (онтології та базовані на них тезауруси задач) використовуються для формалізації його інформаційних потреб. Це є характерною рисою цієї ССП та її основною відмінністю від інших систем, що підтримують пошук інформації на семантичному рівні. Висновки Пропонується використовувати онтології для накопичення знань ПрО в інтероперабельному вигляді, а для рішення прикладних задач будувати за онтологіями простіші інформаційні об’єкти – залежно від специфіки задачі, а потім використовувати їх як джерело знань, приміром, у семантичному пошуку. Запропонований у роботі алгоритм дозволяє будувати онтології, що характеризують поточну задачу користувача і можуть застосовуватися для семантичного пошуку інформації, потрібної для розв’язання цієї задачі. Література 1. Baeza-Yates R., A. Raghavan R. Next generation Web search. S. Ceri and M. Brambilla, editors, Search Computing, Springer. 2010. P. 11–23. 2. Rogushina J. Analysis of Automated Matching of the Semantic Wiki Resources with Elements of Domain Ontologies. International Journal of Mathematical Sciences and Computing(IJMSC). 2017. Vol. 3, N 3. P. 50–58. 3. Antoniou G., Van Harmelen F. Web ontology language: Owl. In Handbook on ontologies. Springer Berlin Heidelberg. 2004. P. 67–92. 4. Cyganiak R., Wood D., Lanthaler M. RDF 1. 1 Concepts and Abstract Syntax. W3C Recommendation 25 February 2014. http://www.w3.org/TR/2014/REC-rdf11-concepts-20140225/. 5. Gruber T.R. Toward Principles for the Design of Ontologies Used for Knowledge Sharing. International Journal of Human-Computer Studies. 1995. Vol. 43. Issues 5–6. P. 907–928. 6. Gladun A., Rogushina J., Valencia-García R., Martínez-Béjar R. Semantics-driven modelling of user preferences for information retrieval in the biomedical domain. Informatics for health and social care. 2013. Vol. 38, N 2. P. 150–170. 7. Finin T.W., Ding L., Pan R., Joshi A., Kolari P., Java A., Peng Y. Swoogle: Searching for knowledge on the Semantic Web. Proc. AAAI-2005, AAAI Press. MIT Press. 2005. P. 1682–1683. 8. Fazzingaa B., Lukasiewicz T. Semantic search on the Web. Semantic Web – Interoperability, Usability, Applicability. 2010. N 1. P. 1–7. https://www.researchgate.net/profile/Thomas_Lukasiewicz/ publication/220575552_Semantic_search_on_the_Web/links/0046351e94ee8994bd000000.pdf. 9. Рогушина Ю.В. Семантичний пошук у Web на основі онтологій: розробка моделей, засобів і методів. Мелітополь: МДПУ ім. Богдана Хмельницького. 2015. 291 с. 10. Krotzsch M., Vrandecic D., Volkel M. Semantic MediaWiki. http://c.unik.no/images/6/6d/SemanticMW.pdf. 11. Рогушина Ю.В. Разработка распределенных интеллектуальных систем на основе онтологического анализа и семантических wiki- технологий. Онтология проектирования. 2017. Т. 7, № 4(26). С. 453–472. 12. Protégé. http:// protege. stanford.edu/. 13. Rogushina J.V. The Use of Ontological Knowledge for Semantic Search of Complex Information Objects. Open semantic technologies for intelligent systems. 2017. С. 127–132. References 1. Baeza-Yates R., A. Raghavan R. Next generation Web search. S. Ceri and M. Brambilla, editors, Search Computing, Springer, 2010. P. 11–23. 2. Rogushina J. Analysis of Automated Matching of the Semantic Wiki Resources with Elements of Domain Ontologies // International Journal of Mathematical Sciences and Computing(IJMSC). 2017. Vol. 3, N 3, P. 50–58. 3. Antoniou G., Van Harmelen F. Web ontology language: Owl. In Handbook on ontologies. Springer Berlin Heidelberg. 2004. P. 67–92. 4. Cyganiak R., Wood D., Lanthaler M. RDF 1. 1 Concepts and Abstract Syntax. W3C Recommendation 25 February 2014. http://www.w3.org/TR/2014/REC-rdf11-concepts-20140225/. 5. Gruber T.R. Toward Principles for the Design of Ontologies Used for Knowledge Sharing. International Journal of Human-Computer Studies. 1995. Vol. 43. Issues 5–6. P. 907–928. 6. Gladun A., Rogushina J., Valencia-García R., Martínez-Béjar R. Semantics-driven modelling of user preferences for information retrieval in the biomedical domain. Informatics for health and social care. 2013. Vol. 38, N 2. P. 150–170. 7. Finin T.W., Ding L., Pan R., Joshi A., Kolari P., Java A., Peng Y. Swoogle: Searching for knowledge on the Semantic Web. Proc. AAAI-2005, AAAI Press. MIT Press. 2005. P. 1682–1683. http://www.w3.org/TR/2014/REC-rdf11-concepts-20140225/ http://c.unik.no/images/6/6d/SemanticMW.pdf http://www.w3.org/TR/2014/REC-rdf11-concepts-20140225/ Моделі та засоби систем баз даних і знань 203 8. Fazzingaa B., Lukasiewicz T. Semantic search on the Web. Semantic Web – Interoperability, Usability, Applicability. 2010. N 1. P. 1–7. https://www.researchgate.net/profile/Thomas_Lukasiewicz/ publication/220575552_Semantic_search_on_the_Web/links/0046351e94ee8994bd000000.pdf. 9. Rogushina J.V. Semantic retrieval for Web on base of ontologies: design of models, tools and methods. Melitopol: Bogdan Hmelnitsky MDUPU. 2015. 291 p. [in Ukrainian] 10. Krotzsch M., Vrandecic D., Volkel M. Semantic MediaWiki. http://c.unik.no/images/6/6d/SemanticMW.pdf. 11. Rogushina J.V. Design of distributed intelligent systems on base of ontological analysis and semantic Wiki technologies. Ontology of designing, Vol. 7, N 4(26)/2017. P. 453-472. [in Russian] 12. Protégé. http:// protege. stanford.edu/. 13. Rogushina J.V. The Use of Ontological Knowledge for Semantic Search of Complex Information Objects. Open semantic technologies for intelligent systems. 2017. P. 127–132. Про автора: Рогушина Юлія Віталіївна, кандидат фізико-математичних наук, старший науковий співробітник Інституту програмних систем НАН України. Кількість наукових публікацій в українських виданнях – 140. Кількість наукових публікацій в зарубіжних виданнях – 30. Індекс Хірша – 10. http://orcid.org/0000-0001-7958-2557. Місце роботи автора: Інститут програмних систем НАН України, 03181, Київ-187, проспект Академіка Глушкова, 40. Тел.: 066 550 1999. E-mail: ladamandraka2010@gmail.com http://c.unik.no/images/6/6d/SemanticMW.pdf mailto:ladamandraka2010@gmail.com