Problems of ontological analysis use for knowledge representation in Wiki-resources
The main direction of the Wiki-technologies use for development of information resources of large volume and complex structure, focused on functioning in the open Web environment is analyzed. We substantiate the demand for intellectualization of the Wiki technology and compare various approaches fo...
Збережено в:
Дата: | 2019 |
---|---|
Автор: | |
Формат: | Стаття |
Мова: | Ukrainian |
Опубліковано: |
Інститут програмних систем НАН України
2019
|
Теми: | |
Онлайн доступ: | https://pp.isofts.kiev.ua/index.php/ojs1/article/view/358 |
Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
Назва журналу: | Problems in programming |
Завантажити файл: |
Репозитарії
Problems in programmingid |
pp_isofts_kiev_ua-article-358 |
---|---|
record_format |
ojs |
resource_txt_mv |
ppisoftskievua/b6/2bcd2316fce277248df319f134a9b1b6.pdf |
spelling |
pp_isofts_kiev_ua-article-3582024-04-28T11:02:47Z Problems of ontological analysis use for knowledge representation in Wiki-resources Проблемы использования онтологического анализа для представления знаний в Wiki-ресурсах Проблеми використання онтологічного аналізу для подання знань у Wiki-ресурсах Rogushina, J.V. ontology; Semantic Web; Wiki-resource; Wiki-ontology UDC 004.853, 004.55 онтология; Semantic Web; Wiki-ресурс; Wiki-онтология УДК 004.853, 004.55 онтологія; Semantic Web; Wiki-ресурс; Wiki-онтологія УДК 004.853, 004.55 The main direction of the Wiki-technologies use for development of information resources of large volume and complex structure, focused on functioning in the open Web environment is analyzed. We substantiate the demand for intellectualization of the Wiki technology and compare various approaches for its semantic expansion. Such evaluation shows the expediency of the Semantic MediaWiki use to obtain the necessary expressive power to represent the semantics of the main elements of a Wiki resource, their properties and the relations between them. The relations between the representation of knowledge in the Semantic MediaWiki and the standards of the Semantic Web, which are used for integration of the Web-oriented intelligent software and knowledge bases are considered. The examples deal with the online version of the Big Ukrainian Encyclopedia (e-VUE) demonstrate the feasibility of us of ontological analysis and development of ontological model for the formal and unambiguous representatio of the structure and content of the knowledge base of the complex Wiki-resource. Methods and means of application of this ontological model for development of e-VUE content and more efficient retrieval and navigation in this information resource are proposed. Проанализированы направления применение Wiki-технологий для создания информационных ресурсов большого объема и сложной структуры, ориентированных на функционирование в открытой среде Web. Обоснована потребность в интеллектуализации Wiki-технологии, а именно – целесообразность использования Semantic MediaWiki, для получения необходимой выразительной мощности для представления семантики основных элементов Wiki-ресурса, их свойств и связей между ними. Рассмотрена связь между представлением знаний в Semantic MediaWiki и стандартами Semantic Web, которые используются для интеграции интеллектуальных отношений и баз знаний в Web. Продемонстрирована на примерах целесообразность применения онтологического анализа и построения онтологической модели для формального и однозначного отображения структуры и контента базы знаний онлайн-версии Большой украинской энциклопедии (е-ВУЕ). Предложены методы и средства применения этой онтологической модели для создания контента е-ВУЕ и более эффективного поиска и навигации в этом информационном ресурсе. Проаналізовано напрямки застосування Wiki-технологій для створення інформаційних ресурсів великого обсягу та складної структури, орієнтованих на функціювання у відкритому середовищі Web. Обґрунтовано потребу в інтелектуалізації Wiki-технології, а саме – доцільність використання Semantic MediaWiki для отримання необхідної виразної потужності у поданні семантики основних елементів Wiki-ресурсу, їх властивостей та зв’язків між ними. Розглянуто зв’язок між поданням знань у Semantic MediaWiki та стандартами Semantic Web, які використовуються для інтеграції інтелектуальних застосунків та баз знань у Web. Продемонстровано на прикладах доцільність застосування онтологічного ана-лізу та побудови онтологічної моделі для формального та однозначного відображення структури та контенту бази знань онлайн-версії «Великої української енциклопедії» (е-ВУЕ). Запропоновано методи та засоби застосування цієї онтологічної моделі для створення контенту е-ВУЕ та більш ефективного пошуку та навігації у цьому інформаційному ресурсі. Інститут програмних систем НАН України 2019-06-16 Article Article application/pdf https://pp.isofts.kiev.ua/index.php/ojs1/article/view/358 10.15407/pp2019.02.017 PROBLEMS IN PROGRAMMING; No 2 (2019); 17-37 ПРОБЛЕМЫ ПРОГРАММИРОВАНИЯ; No 2 (2019); 17-37 ПРОБЛЕМИ ПРОГРАМУВАННЯ; No 2 (2019); 17-37 1727-4907 10.15407/pp2019.02 uk https://pp.isofts.kiev.ua/index.php/ojs1/article/view/358/360 Copyright (c) 2019 PROBLEMS IN PROGRAMMING |
institution |
Problems in programming |
baseUrl_str |
https://pp.isofts.kiev.ua/index.php/ojs1/oai |
datestamp_date |
2024-04-28T11:02:47Z |
collection |
OJS |
language |
Ukrainian |
topic |
ontology Semantic Web Wiki-resource Wiki-ontology UDC 004.853 004.55 |
spellingShingle |
ontology Semantic Web Wiki-resource Wiki-ontology UDC 004.853 004.55 Rogushina, J.V. Problems of ontological analysis use for knowledge representation in Wiki-resources |
topic_facet |
ontology Semantic Web Wiki-resource Wiki-ontology UDC 004.853 004.55 онтология Semantic Web Wiki-ресурс Wiki-онтология УДК 004.853 004.55 онтологія Semantic Web Wiki-ресурс Wiki-онтологія УДК 004.853 004.55 |
format |
Article |
author |
Rogushina, J.V. |
author_facet |
Rogushina, J.V. |
author_sort |
Rogushina, J.V. |
title |
Problems of ontological analysis use for knowledge representation in Wiki-resources |
title_short |
Problems of ontological analysis use for knowledge representation in Wiki-resources |
title_full |
Problems of ontological analysis use for knowledge representation in Wiki-resources |
title_fullStr |
Problems of ontological analysis use for knowledge representation in Wiki-resources |
title_full_unstemmed |
Problems of ontological analysis use for knowledge representation in Wiki-resources |
title_sort |
problems of ontological analysis use for knowledge representation in wiki-resources |
title_alt |
Проблемы использования онтологического анализа для представления знаний в Wiki-ресурсах Проблеми використання онтологічного аналізу для подання знань у Wiki-ресурсах |
description |
The main direction of the Wiki-technologies use for development of information resources of large volume and complex structure, focused on functioning in the open Web environment is analyzed. We substantiate the demand for intellectualization of the Wiki technology and compare various approaches for its semantic expansion. Such evaluation shows the expediency of the Semantic MediaWiki use to obtain the necessary expressive power to represent the semantics of the main elements of a Wiki resource, their properties and the relations between them. The relations between the representation of knowledge in the Semantic MediaWiki and the standards of the Semantic Web, which are used for integration of the Web-oriented intelligent software and knowledge bases are considered. The examples deal with the online version of the Big Ukrainian Encyclopedia (e-VUE) demonstrate the feasibility of us of ontological analysis and development of ontological model for the formal and unambiguous representatio of the structure and content of the knowledge base of the complex Wiki-resource. Methods and means of application of this ontological model for development of e-VUE content and more efficient retrieval and navigation in this information resource are proposed. |
publisher |
Інститут програмних систем НАН України |
publishDate |
2019 |
url |
https://pp.isofts.kiev.ua/index.php/ojs1/article/view/358 |
work_keys_str_mv |
AT rogushinajv problemsofontologicalanalysisuseforknowledgerepresentationinwikiresources AT rogushinajv problemyispolʹzovaniâontologičeskogoanalizadlâpredstavleniâznanijvwikiresursah AT rogushinajv problemivikoristannâontologíčnogoanalízudlâpodannâznanʹuwikiresursah |
first_indexed |
2024-09-16T04:08:36Z |
last_indexed |
2024-09-16T04:08:36Z |
_version_ |
1818568459116609536 |
fulltext |
Моделі та засоби систем баз даних і знань
© Ю.В. Рогушина, 2019
ISSN 1727-4907. Проблеми програмування. 2019. № 2 17
УДК 004.853, 004.55 https://doi.org/10.15407/pp2019.02.017
Ю.В. Рогушина
ПРОБЛЕМИ ВИКОРИСТАННЯ ОНТОЛОГІЧНОГО АНАЛІЗУ
ДЛЯ ПОДАННЯ ЗНАНЬ У WIKI-РЕСУРСАХ
Проаналізовано напрямки застосування Wiki-технологій для створення інформаційних ресурсів вели-
кого обсягу та складної структури, орієнтованих на функціювання у відкритому середовищі Web. Об-
ґрунтовано потребу в інтелектуалізації Wiki-технології, а саме – доцільність використання Semantic
MediaWiki для отримання необхідної виразної потужності у поданні семантики основних елементів
Wiki-ресурсу, їх властивостей та зв’язків між ними. Розглянуто зв’язок між поданням знань у Semantic
MediaWiki та стандартами Semantic Web, які використовуються для інтеграції інтелектуальних застосу-
нків та баз знань у Web. Продемонстровано на прикладах доцільність застосування онтологічного ана-
лізу та побудови онтологічної моделі для формального та однозначного відображення структури та ко-
нтенту бази знань онлайн-версії «Великої української енциклопедії» (е-ВУЕ). Запропоновано методи та
засоби застосування цієї онтологічної моделі для створення контенту е-ВУЕ та більш ефективного по-
шуку та навігації у цьому інформаційному ресурсі.
Ключові слова: онтологія, Semantic Web, Wiki-ресурс, Wiki-онтологія.
Вступ
Збільшення обсягів інформації у
Web, поширення Big Data викликають пот-
ребу у переході від збереження та накопи-
чення даних до побудови та збереження
знань, придатних для повторного викорис-
тання в інформаційних системах різних ви-
робників та різного призначення. Такі
знання можуть стати основою для структу-
рування даних, для систем машинного на-
вчання та для семантичного пошуку. Це
викликає потребу у створенні та колектив-
ному використанні розподілених баз знань,
що базуються на загальноприйнятих стан-
дартах подання інформації. На сьогодні в
якості таких стандартів можна використо-
вувати розробки Semantic Web, такі як
OWL та RDF, але їх безпосередня підтрим-
ка вимагає від користувачів спеціалізова-
них навичок. Тому виникає необхідність у
технологіях, які підтримують колективне
накопичення знань та мають достатню ви-
разну потужність для їх інтеграції зі склад-
ними інтелектуальними застосунками. Крім
того, потрібно орієнтуватися на соціальні
засоби подання інформації, які вже сьогод-
ні широко розповсюджені та використову-
ються багатьма спільнотами користувачів.
Технологія Wiki як основа для
колективної побудови бази знань
Важливою рисою багатьох Web-
сайтів є створення спільнот, де користува-
чі зі спільними інтересами є активними
учасниками як споживання, так і створен-
ня інформації, тобто соціальних мереж. У
сучасному розумінні термін «соціальна
мережа» використовується для характери-
стики програмного забезпечення, призна-
ченого для встановлення відношень між
окремими особами, а інтелектуалізація
Web-технологій визначають тенденцію пе-
реходу до семантичних соціальних мереж
(S
2
N – The Semantic Social Network) [1].
Однією з широко відомих інформаційних
технологій, що використовуються для цьо-
го, є Wiki, особливістю яких є відкритий
підхід до створення контенту [2].
Базові можливості та обмеження
Wiki в обробці інформації
Wiki-система – це форма Web-
платформи для соціального програмного
забезпечення, яка дозволяє спільно ство-
рювати, супроводжувати та знаходити ци-
фровий контент. Найбільш вживане нині
програмне забезпечення для Wiki-систем –
MediaWiki, що базується на PHP і MySQL.
MediaWiki використовують проекти
Wikipedia, Wikidata, Wikibooks. MediaWiki
відрізняється якісним та зручним редакто-
ром контенту.
У. Каннінгем, що створив Wiki у
1994 році, визначив цю технологію як най-
простішу онлайнову базу даних, яка спро-
можна працювати [3]. Основними характе-
https://doi.org/10.15407/pp2019.02.017
Моделі та засоби систем баз даних і знань
18
ристиками Wiki і надалі залишаються про-
стота колаборативного використання та
редагування сторінок, легке встановлення
взаємозв'язків між сторінок всередині і по-
за Wiki-ресурсом.
Wiki-ресурс – це екземпляр соціаль-
ного програмного забезпечення, який є су-
купністю спільно створених статей, що
містять структурований за допомогою
Wiki-розмітки текст (призначений для чи-
тання та розуміння людьми) і гіперпоси-
лання на інші Wiki-статті або зовнішні ІР.
Wiki-ресурси є основою для спільного
створення та використання знань. Спіль-
ними рисами усіх Wiki-ресурсів є наяв-
ність Web-інтерфейсу, простий синтаксис
для структурування контенту та можли-
вість встановлення гіперпосилань на інші
сторінки. Більшість Wiki-систем також за-
безпечують механізм відкату у випадку
випадкових або небажаних змін.
Ефективність використання Wiki як
основи для створення інформаційного ре-
сурсу (наприклад, посібника, енциклопедії
або довідника) базується на таких особли-
востях цієї технології, як:
колаборативність – контент не-
гайно стає доступним для всіх після публі-
кації;
простота створення документів
та інформаційних взаємозв'язків між ними,
що полегшує повторне використання ін-
формації;
тонка деталізація контенту –
технологія забезпечує створення окремих
сторінок для кожної теми, терміну або
слова з довільним рівнем деталізації;
засоби структурування контен-
ту – за допомогою метаданих (шаблонів,
категорій та семантичних властивостей).
Незважаючи на ефективність Wiki
як інструменту співпраці, ця технологія
має певні недоліки. Інформація, що нако-
пичується у Wiki-ресурсах, є неструктуро-
ваною у тому розумінні, що для неї відсу-
тня попередньо визначена модель даних, а
її наявні структурні елементи не пристосо-
вані для автоматизованої обробки без до-
даткових уточнень. Наприклад, природно-
мовна (ПМ) складова контенту має певну
лінгвістичну структурованість (поділ на
частини мови, члени речення), але у зага-
льному випадку кожна Wiki-сторінка має
довільний розмір, складається з довільних
частин і не має стандартизованої моделі
подання, що викликає складнощі її аналізу.
Така інформація обробляється як
неструктуровані дані (НСД) [4], що ство-
рює проблеми для менеджменту знань у
Wiki-ресурсі. Сторінки не можуть бути ав-
томатично відформатовані відповідно до
того, яку інформацію вони містять. Сор-
тування об'єктів, описаних у Wiki за дові-
льними критеріями, потребує використан-
ня спеціальних шаблонів.
У традиційних Wiki-ресурсах до-
сить складно імпортувати структуровані
дані із зовнішніх баз даних і робити до них
запити. Протилежна операція, тобто екс-
порт довільного вибору контенту Wiki до
зовнішнього програмного забезпечення,
теж пов’язані з певними складнощами та
не може бути виконаний автоматично.
Поширений підхід до вирішення
цих проблем полягає в тому, щоб семанти-
чно структурувати інформацію (з викорис-
танням форм та шаблонів) – це робить ко-
нтент Wiki-ресурсу набагато зрозумілішим
для людей і більш доступним для комп'ю-
терних операцій, таких як пошук на основі
структури, інтеграція даних і аналіз даних.
Цей підхід називають семантизацією Wiki,
і для його реалізації розроблено велику
кількість програмного забезпечення, що
різниться за своїми цілями, можливостями
та вимогами до користувачів. Семантичні
Wiki здатні автоматизовано обробляти дані
з чітко визначеною семантикою, а це дає
змогу істотно розширити функціональ-
ність таких систем.
Програмне забезпечення для сема-
нтизації Wiki-ресурсів
Для кращого розуміння того, що
можна назвати семантизацією Wiki, доці-
льно порівняти можливості існуючих про-
грамних систем, які більш детально розг-
лянуті в [5, 6].
Приклади семантичного розширен-
ня Wiki-технології
AceWiki
(http://attempto.ifi.uzh.ch/acewiki) [7] вико-
ристовує обмежену підмножину англійсь-
кої мови Attempto Controlled English
(ACE). Формальні твердження є основним
Моделі та засоби систем баз даних і знань
19
вмістом самої Wiki. Таким чином, система
намагається інтегрувати онтологію, прави-
ла і мову запитів. Редактор дозволяє кори-
стувачеві безпосередньо вводити вислов-
лювання або використовувати керовану
форму вибору з існуючої онтології.
AceWiki концептуалізує кожну Wiki-
сторінку як поняття і здійснює виведення
OWL для базової онтології.
Kiwi (http://www.kiwi-project.eu/) [8]
створює екземпляри даних на основі існу-
ючої онтології, а також надає засоби для
створення та редагування онтологій. Kiwi
використовує інтерфейс, подібний до
Mediawiki, та базується на таких розробках
Semantic Web, як RDF і OWL. Формальна
структура знань використовується для по-
кращення навігації та надання рекоменда-
цій під час редагування. У системі реалізо-
ване логічне виведення для підтримки ко-
ристувача у виконанні завдань. Система
пропонує і WYSIWYG-редактор, що приз-
начений для користувачів, які не мають
досвіду роботи з Wiki-редактором.
KawaWiki [9] надає повну формаль-
ну структуру для даних на основі RDF і
RDFS. Архітектура Wiki-ресурсу поділя-
ється на три основні шари: 1) схему RDF,
що визначає базову онтологію і викорис-
товується для перевірки шаблонів RDF;
2) шаблони RDF, які визначають тип сто-
рінок Wiki, які можуть бути створені кори-
стувачем; 3) контент Wiki-ресурсу, який
користувач отримує для редагування.
OntoWiki [10] призначена для роз-
робки баз знань і спирається на подання
даних у форматі RDF. Вона не надає Wiki-
інтерфейс для вводу ПМ-тексту для по-
дання понять, але підтримує декілька фун-
кцій спільної роботи та дозволяє встанов-
лювати плагіни. OntoWiki реалізує кожну
сторінку як ресурс, зберігаючи їх як твер-
дження RDF. Знання в системі презентова-
ні за допомогою «інформаційної карти»,
збагаченої зручними інтерфейсами для ві-
зуалізації й редагування контенту
(WYSIWYG редактор для RDF, контроль
версій, статистика, підтримка співтоварис-
тва тощо). Кожен вузол, поданий як сторі-
нка системи, в інформаційній карті
зв’язаний з відповідним цифровим джере-
лом.
SMW [11] є семантичним розши-
ренням до Mediawiki, що дозволяє корис-
тувачам додавати відношення та властиво-
сті до Wiki-сторінок. Semantic Mediawiki
зберігає семантичні дані в базі даних
MySQL у Mediawiki, які також можуть бу-
ти експортована як RDF.
Основні семантичні поняття у
Semantic MediaWiki – це категорії, що до-
зволяють користувачам класифікувати
Web-сторінки (присутні й у звичайних
Wiki-ресурсах), семантичні властивості,
які дозволяють встановлювати зв’язки
елементів контенту Wiki-сторінок з інши-
ми сторінками Wiki ресурсу та з даними
(дата, число, текстовий рядок, географічні
координати тощо), визначаючи семантику
цих зв’язків, та семантичні запити, в яких
можуть використовуватися категорії та
семантичні властивості. Результати семан-
тичних запитів вставляються у відповідні
Wiki-сторінки та автоматично оновлюють-
ся, якщо змінюється контент тих сторінок,
з яких вони здобувають інформацію. Це
забезпечує цілісність та актуальність ство-
рюваного Wiki-ресурсу.
KnowWE є розширенням JSPWiki,
що додає до нього семантичну функціона-
льність. Його механізми аналізу та розв'я-
зування проблем також будуються на про-
екті d3web. Кожна сторінка є поняттям в
контрольованій онтології. Семантика
включена в Wiki-розмітку і надає три аль-
тернативи: явну розмітку знань, семантич-
ну анотацію та сегментований текст. Текст
анотується онтологічним контентом. Крім
того, знання для вирішення проблем в тек-
сті можуть бути явними, з використанням,
наприклад, правил. Крім того, забезпечу-
ється обмін знаннями за допомогою онто-
логій OWL.
Tiki Wiki CMS Groupware є одним з
найбільш багатофункціональних пакетів
систем керування контентом (Content
Management System – CMS), який забезпе-
чує визначення деякі семантичні відно-
шень між Wiki-сторінками.
Knoodl – це колаборативний редак-
тор Web-онтології. Кожен ресурс є онто-
логією і має свою власну Web-сторінку,
яка містить як структурований контент з
онтології, так і неструктурований контент
Моделі та засоби систем баз даних і знань
20
у вигляді Wiki-тексту. Контент у Knoodl
організований у спільноти, які можуть
створюватися будь-якими користувачами.
Онтології можна імпортувати і експорту-
вати як OWL-файли, з пов'язаним з ними
Wiki-текстом або без нього.
Параметри порівняння
Існує багато різних підходів до по-
рівняння засобів семантизації Wiki. З ме-
тодологічної точки зору при додаванні се-
мантики до Wiki можна виділити два під-
ходи:
текстові підходи, які збагачу-
ють традиційне Wiki-середовище семанти-
чними анотаціями (Semantic MediaWiki);
логіко-орієнтовані підходи, що
використовують семантичні Wiki як засіб
для онлайнового редагування онтологій
(OntoWiki, Knoodl).
Для того, щоб порівняти різні варі-
анти семантизації Wiki, в [12] запропоно-
вано два виміри: 1) перспективи користу-
вача – скільки технічних навичок користу-
вач повинен мати для того, щоб викорис-
товувати Wiki та додати свій внесок до он-
тології; та 2) виразність знань – наскільки
виразною є результуюча онтологія (рис. 1).
Перспектива користувача (вісь x)
розрізняє такі категорії користувачів:
Повсякденний користувач
(Everyday user) – Користувач, який знайо-
мий з використанням конкретних програм,
без адміністративних навичок, моделю-
вання або програмування;
Потужний користувач (Power
user) – користувач, який знайомий з вико-
ристанням більш широкого кола програм
та адмініструванням власного комп'ютера,
але без навичок моделювання;
Професійний користувач (Profes-
sional user) – досвідчений користувач, який
обізнаний у використанні та адміністру-
ванні різноманітного програмного забез-
печення, має знання з моделювання та
програмування, але не знає технологій
Semantic Web (наприклад, OWL і RDF);
• Онтолог (Ontologist) – експерт з
онтологічного аналізу, який знає, як вико-
ристовувати технології Semantic Web, зок-
рема онтології.
Рівень
OWL DL,
OWL Full
Рівень
OWL Lite
Відношення
між поняттями
Проста
таксономія
Повсякденний
користувач
Потужний
користувач
Професійний
користувач
Онтологіст
Виразність
Потрібні
знання
1. AceWiki
2. IkeWiki
3. KawaWiki
4. Makna
5. PlaturusWiki
6. OntoWiki
7. Rhizome
8. SMW
9. SweetWiki
10. WikSAR
11. MediaWiki
3 1
2
4
5
6 7
8
9
10
11
Рис. 1. Порівняння семантичних Wiki
Моделі та засоби систем баз даних і знань
21
Шкала експресивності (вісь у) ви-
окремлює широкі рівні експресивності та
формалізму, які відноситься до того, наскі-
льки виразною є результуюча онтологія:
• проста таксономія – таксономіч-
на класифікація Wiki-сторінок без доданої
семантики щодо відношень між сторінка-
ми та термінами;
• відношення між поняттями – по-
няття в Wiki пов'язані між собою за допо-
могою семантичних анотацій;
• рівень OWL Lite – краща формалі-
зація, ніж прості відношення, з деякими
обмеженнями, подібними до функціона-
льності, яку пропонує OWL Lite;
• рівень OWL DL, OWL Full – функ-
ціональність, подібна до функціональності
OWL DL і OWL Full, що підтримує більшу
виразність обмежень і відношень з харак-
теристиками властивостей, таких як тран-
зитивність, функціональність, відсутність
перетину тощо.
Системи в лівій частині графіка
(наприклад, AceWiki і KawaWiki) обме-
жують дії користувачів і не потребують
від них складних навичок, а Wiki у правій
частині графіка (KiwiWiki, KnowWE і до
деякої міри OntoWiki) мають більшу вира-
зність, але вони потребують від користу-
вачів знання технологій Semantic Web або
спеціального синтаксису, а система
Knoodl, що знаходиться праворуч, потре-
бує навичок професійного онтолога. Сис-
теми, що знаходяться в середній частині
графіка, такі як SMW andTiki Wiki CMS
Groupware, намагаються збалансувати до-
статню виразність і знання, необхідні для
застосування цієї виразності.
Таке порівняння дозволяє робити
припущення щодо знань, що зафіксовані в
таких Wiki-ресурсах, та оцінити зусилля
користувачів, потрібні для їх створення та
підтримки. Більш детально результати по-
рівняння розглянуто в [6].
Це порівняння між семантичними
Wiki обґрунтовує вибір MediaWiki і
Semantic MediaWiki як базової технології
для вирішення питання взаємодії в гетеро-
генних середовищах, які потребують об-
міну знаннями та спільного використання:
з точки зору користувача
Semantic MediaWiki базується на тексті і
легке в освоєнні і використанні;
з точки зору виразності знань
Semantic MediaWiki являють собою рі-
шення, вдало збалансоване між виразніс-
тю та необхідними знаннями.
Semantic MediaWiki використову-
ється у великій кількості як публічних, так
і приватних Wiki-ресурсів.
Модель даних у MediaWiki
MediaWiki надає об'єктно-
орієнтовану модель зберігання документів
середньої деталізації (іменовані фрагмен-
ти – це Wiki-сторінки). Модель зберігання
подібна в багатьох аспектах на поширені
зараз noSQL, хоча попередні MediaWiki
зазвичай використовують mysql.
Таким чином, знання створюються
і підтримуються в Semantic MediaWiki
еволюційно через Web-інтерфейс самою
спільнотою користувачів. Загалом, Wiki
можна порівняти з системами управління
контентом (CMS – content-management
systems), що створють та колективно ви-
користовують знання, але Wiki надають
набагато простіший і більш відкритий ін-
терфейс для цього технологічного процесу.
Двигун MediaWiki як основа ство-
рення Wiki-ресурсів
MediaWiki базується на архітектурі
LAMP (PHP на стороні сервера і Javascript
на стороні клієнта, з базою даних MySQL).
Ядро MediaWiki дозволяє створювати та
редагувати сторінки, встановлювати їх ка-
тегорії та взаємозв'язки, переглядати кон-
тент цих сторінок тощо. З точки зору ін-
формаційної структури MediaWiki надає
систему шаблонів і можливість категори-
зації сторінок.
Функціональні шари MediaWiki
означають також багаторівневу розробку
Wiki:
• ядро – базове програмне забезпе-
чення та повний набір API, які надаються
для зовнішнього програмного доступу до
основних функцій MediaWiki;
• розширення – засоби додавання
розширених функціональних можливостей
до ядра MediaWiki: вдосконалені функції
редагування, розширені інтерфейси корис-
Моделі та засоби систем баз даних і знань
22
тувача та семантичні функції. Зазвичай
розширення розробляються мовою PHP,
використовуючи механізм перехоплення
(hook) для використання подій MediaWiki;
• шаблони – дозволяють створюва-
ти зразки Wiki з метою зменшення супе-
речностей у Wiki-ресурсі та гнучкого роз-
витку схеми;
• створення контенту – викорис-
тання вихідних даних, отриманих від по-
передніх шарів, та ефективне створення
екземпляра MediaWiki, тобто Wiki-
ресурсу.
Ця багатошарова структура спів-
праці в розвитку MediaWiki дозволяє ви-
ділити різні групи людей, що приймають
участь у створенні Wiki-ресурсу:
розробники базового програмно-
го забезпечення,
розробники розширень,
розробники шаблонів,
розробники контенту.
З точки зору соціального програм-
ного забезпечення, соціальним об'єктом у
MediaWiki є безпосередньо MediaWiki.
З точки зору об’єктно-орієнтова-
ного програмування (ООП), розробка кон-
тенту в MediaWiki є створенням екземпля-
ру Wiki-ресурсу.
Основною одиницею Wiki-ресурсу,
побудованого на основі MediaWiki, є
Wiki-сторінка. У Wiki інформацію можна
зберігати на неформальному, напівформа-
льному або формальному рівні, залежно
від рівня співпраці спільноти розробників
контенту.
MediaWiki надає кілька механізмів
для створення структури у Wiki. На цьому
рівні дані у Wiki структуровані, напівст-
руктуровані або неструктуровані. За замо-
вчуванням не існує якоїсь обов’язково не-
обхідної структури, але відсутність струк-
турування робить контент дуже складним
для навігації. Тому для Wiki-ресурсів, що
використовують MediaWiki, зазвичай бу-
дується їх власна структура, що відповідає
специфіці тієї предметної області, для якої
розробляється цей інформаційний ресурс.
Для побудови такої структури в
MediaWiki можуть бути використані на-
ступні механізми:
Простори імен (Namespaces).
Всі сторінки в MediaWiki поділяються на
окремі простори імен, що надаються мо-
деллю зберігання. Це дозволяє повторно
використовувати базову модель для об'єк-
тів контенту першого класу (наприклад, у
е-ВУЕ це сторінки гасел енциклопедії), а
також створювати об'єкти, що використо-
вуються при використанні гіпертексту (це
можуть бути різноманітні медіа-елементи
(двійкові плюс метадані) в просторі імен
«Файл», “Ілюстрація” або “Відео”, блоки
програмування та фрагменти структуро-
ваного тексту в просторі імен «Шаблон»);
Категорії (Categories) – це сто-
рінки простору імен Категорії, які можна
використовувати для автоматичного гру-
пування сторінок. Ці механізми передба-
чають побудову таксономій у Wiki-ресурсі
(наприклад, підкатегорії категорії “Галузь
знань” в е-ВУЕ утворюють таксономічну
структуру). Категорії Wiki відповідають
визначенню класу в об’єктно-орієнтованій
парадигмі, а сторінки Wiki-ресурсу, які
належать до певних категорій, є екземпля-
рами цих класів;
Шаблони (Templates). MediaWiki
надає простір імен, присвячений транзак-
ції, який називається Шаблон. Сторінки у
цьому просторі назв призначені для вклю-
чення до інших статей повторюваних еле-
ментів. Цей механізм використовується
також для уникнення суперечностей у
Wiki та для більш уніфікованого подання
інформації. Це поширений спосіб струк-
турування даних. Наприклад, в е-ВУЕ
створено шаблони для опису типових ін-
формаційних об’єктів.
Використання шаблонів структу-
рування контенту Wiki-ресурсу
Модель на основі шаблонів перед-
бачає гнучку розробку схеми Wiki-
ресурсу. Кожен шаблон визначає клас з
вільно обраними атрибутами (еквівалент
“тип сутності”), екземпляри яких можуть
бути вільно вбудовані в інші об'єкти. Ек-
земпляри шаблонів можуть бути пов’язані
ієрархічно. Наприклад, у е-ВУЕ за допо-
могою набору ієрархічно організованої
множини шаблонів подаються знання що-
до типових інформаційних об’єктів (ІО).
Моделі та засоби систем баз даних і знань
23
Механізми шаблонізації контенту
використовуються у Wiki для того, щоб
дати авторам контенту можливість запов-
нити схему (модель) конкретними значен-
нями. Сторінки з такими шаблонами мо-
жуть використовуватися для опису подіб-
них елементів.
Вивчення сучасних механізмів
Wiki-шаблонів дозволяє зрозуміти, як са-
ме вони можуть бути використані для
створення семантично багатих Web-
сторінок. При цьому можна виділити дві
альтернативні моделі шаблонів, які можна
знайти в сучасних Wiki-движках:
- функціональні шаблони (functio-
nal templating), коли шаблони виклика-
ються за ім'ям і переданими параметрами;
- шаблони створення (creational
templating), в яких шаблони просто копі-
юються як новий контент на початок істо-
рії перегляду сторінки.
На відміну від традиційних CMS,
де шаблони розглядаються як спеціальні
ресурси, у Wiki-технології шаблони та ек-
земпляри розглядаються на одному рівні:
це дозволяє користувачам керувати обома
видами інформації подібним чином.
В обробці шаблонів беруть участь
два види Wiki-сторінок:
сторінка шаблону (наприклад,
Шаблон:Річка): основна сторінка, інфор-
мацію з якої використовувати ті сторінки,
на яких цей шаблон викликається;
сторінка екземпляру шаблону
(наприклад, Дніпро): сторінка, контент
якої побудовано з використанням виклику
шаблону з певними конкретними значен-
нями його параметрів.
У функціональних шаблонах слід
відмітити кілька важливих характеристик:
міцний і постійний зв'язок між
шаблоном та його екземплярами (зміни,
що вносяться на сторінку шаблону, відра-
зу ж відображаються на усіх сторінках, де
цей шаблон викликається);
різний вихідний код шаблонів та
їх екземплярів;
екземпляри шаблонів є неліній-
ною розміткою щодо її форми інтерпретації.
Важливо, що за допомогою шабло-
нів дані, що містяться на Wiki-сторінках,
можуть бути структуровані безпосередньо
– шляхом їх зв’язування із семантичними
властивостями та з категоріями. Незважа-
ючи на це, такі дані, вбудовані в екземп-
ляри шаблонів, складно вилучати і повто-
рно використовувати, хоча різні дослідни-
ки пропонують для виконання цієї задачі
досить ефективні евристичні методи. На-
приклад, один з таких методів використо-
вується у проекту Dbpedia [13], що спря-
мований на здобуття структурованої інфо-
рмації з Вікіпедії та забезпечення доступ-
ності цієї інформації в Web-середовищі.
У Вікіпедії, яка не є семантизова-
ним ресурсом, нині теж досить часто за-
стосовуються шаблони. Найчастіше такі
шаблони призначені лише для макету-
вання інформації, однак відносна частка
шаблонів, що забезпечують структуру-
вання контенту через елементи Wiki-
розмітки, що відмінні від семантичних
властивостей, постійно збільшується
(приблизно від чверті до третини сторі-
нок Вікіпедії нині містять структуровану
інформацію, придатну для машинної ін-
терпретації). Наприклад, широко застосо-
вується особливий тип шаблонів – інфор-
бокси (infoboxes), що призначені для
створення послідовно форматованих бло-
ків для певного контенту в статтях, які
описують екземпляри певного специфіч-
ного типу (наприклад, типові ІО). Щоб
розкрити семантику, закодовану в таких
шаблонах, використовують різні методи
здобуття знань. Застосування таких мето-
дів може бути корисним і для семантизо-
ваних Wiki-ресурсів, тому що вони забез-
печують отримання тих знань, що неявно
містяться в контенті, але не формалізова-
ні повністю для автоматичного видобут-
тя. Наприклад, в [14] запропоновано та-
кий алгоритм здобуття інформації, що
працює в п'ять етапів.
1. Обрати усі сторінки Wiki-ре-
сурсу, які містять шаблони. Таку множину
сторінок Wiki-ресурсу можна отримати за
допомогою запиту SQL, який шукає вхо-
дження роздільника шаблону "{{" в тексті
бази даних MediaWiki. Запит SQL дозво-
ляє також вибрати тільки сторінки певних
категорій Wiki-ресурсу або сторінки, що
містять певні шаблони.
Моделі та засоби систем баз даних і знань
24
2. Здобути з обраних сторінок ва-
жливі шаблони. Усі шаблони на сторінці
Wiki-ресурсу можна отримати за допомо-
гою рекурсивного регулярного виразу.
Через те, що шаблони використовуються у
Wiki-ресурсі для різних цілей, потрібно
обрати тільки ті шаблони, що містять
структуровану інформацію. Це можна
зробити на основі такої евристики: ігнору-
вати шаблони з одним або двома атрибу-
тами (такі шаблони зазвичай діють як яр-
лики для попередньо визначених розділів),
а також ігнорувати шаблони, кількість ви-
користання яких не перевищує певний по-
ріг (такі шаблони можуть бути помилко-
вими або неважливими). Алгоритм здо-
буття може бути додатково сконфігурова-
но для ігнорування певних явно визначе-
них шаблонів або груп шаблонів, напри-
клад, якщо ці шаблони пов’язані з іншими
аспектами структурування інформації, та-
кими як умови створення та використання
контенту.
3. Виконується аналіз структури
кожного обраного шаблону і створюються
відповідні трійки “суб’єкт-предикат-
об’єкт”. URL-адреса, отримана з назви
Wiki-сторінки, на якій знайдено шаблон,
використовується як суб’єкт для шаблонів,
які використовуються не більше одного
разу на сторінці. Для шаблонів, що зустрі-
чаються на сторінці більше за один раз,
потрібно генерувати новий ідентифікатор,
який використовується як суб’єкт. Кожен
атрибут шаблону відповідає предикату
трійки, а відповідне значення атрибута пе-
ретворюється на його об'єкт. Шаблони
MediaWiki можуть бути вкладеними, тоб-
то значення атрибута в шаблоні може зно-
ву бути шаблоном. У такому випадку ге-
нерується порожній вузол, що пов'язує
значення атрибута з новоствореним екзе-
мпляром для вкладеного шаблону.
4. Обробка значень об'єктів для
створення відповідних URI-посилань або
літеральних значень. Для гіперпосилань
MediaWiki створюються відповідні URI-
посилання, які забезпечують перехід на
пов'язану Wiki-сторінку. Типізовані літе-
рали генеруються для рядків і числових
значень. Загальновживані одиниці виміру
(наприклад, кг для кілограмів, с для се-
кунд) виявляються і кодуються як спеціа-
льні типи даних, однак перетворення між
різними масштабами (наприклад, між см,
м, км) не виконується автоматично. Крім
того, розпізнаються списки, що розділя-
ються комами, і, залежно від параметрів
конфігурації, перетворюються на списки
RDF або на окремі висловлювання.
5. Визначення належності Wiki-
сторінки до класу. Сторінки Wiki-ресурсу
організовані за категоріями. У деяких ви-
падках ці категорії можуть бути інтерпре-
товані як класи, що включають екземпля-
ри, описані сторінками Wiki-ресурсу з ві-
дповідній категорії. Крім того, назва шаб-
лону може бути індикатором належності
до класу. Самі категорії є сторінками
Wiki-ресурсу і також можуть бути органі-
зовані у надкатегорії (такі відношення
можуть відображатися через зв’язок «бути
пов'язаними з»).
На основі використання цього ме-
тоду здобуття знань з Wiki-ресурсів, що
структуровано за допомогою шаблонів,
його авторами розроблено набір рекоме-
ндацій для побудови Wiki-шаблонів. До-
тримання цих рекомендацій не тільки ко-
рисно для семантичного здобуття інфор-
мації з Wiki-сторінок, але зазвичай також
покращує відповідний шаблон у цілому,
тобто він стає більш зручним для викорис-
тання авторами Wiki-сторінок. Будуючи
нові шаблони та модифікуючи існуючі, до-
цільно дотримуватися наступних правил:
не визначати атрибути в шаб-
лонах, які кодують інформацію для маке-
тування сторінки – це правило відповідає
відомому принципу відокремлення контен-
ту від його подання, тобто HTML-розмітка
повинна використовуватися в значеннях
атрибутів тільки у разі необхідності;
використовувати лише один
шаблон для певного інформаційного об'є-
кта замість того, щоб використовувати
окремий шаблон для кожного атрибута (це
потребує створення більш складних шаб-
лонів, але спрощує процес здобуття знань
щодо структури цих об’єктів);
кожен атрибут шаблону пови-
нен мати точно одне значення в шаблоні
статті (хоча таке значення може бути спи-
Моделі та засоби систем баз даних і знань
25
ском значень), але не слід змішувати декі-
лька операторів (з точки зору RDF) в ме-
жах одного значення атрибута (тобто пот-
рібно більш чітко відрізняти різні атрибу-
ти шаблона, виокремлюючи їх можливі
значення);
не бажано використовувати рі-
зні шаблони для однакової цілі (таке дуб-
лювання структури різними шаблонами не
тільки ускладнює здобуття знань й потре-
бує додаткових операцій з їх об’єднання,
але й спричиняє накопичення застарілих
шаблонів із некоректно поданою інформа-
цією);
не слід використовувати різні
імена атрибутів для одного і того ж типу
контенту (наприклад, в різних шаблонах
називати подібний атрибут “Назва міста”,
“Назва селища” та “Позначення міста”) і
не доцільно використовувати одне ім'я ат-
рибута для різних типів вмісту (напри-
клад, в шаблонах “Персоналія” та “Місто”
використовувати атрибут “Ім’я”);
намагатися використовувати
стандартні подання для елементів, щоб
вони могли бути виявлені алгоритмом
здобуття.
Крім того, для більш зручного здо-
буття знань та коректного введення даних
у Wiki-ресурсах доцільно мати наступні
можливості:
зафіксувати тип даних для зна-
чення атрибута шаблону. У Semantic
MediaWiki це можна робити за допомогою
типів значень семантичних властивостей,
але тільки для базових типів даних. На-
приклад, можна вказати у визначенні шаб-
лону, що значення атрибуту “Рік наро-
дження” має бути числом, а “Місце наро-
дження” – посиланням на Wiki-сторінку.
Але необхідно враховувати, що іноді ви-
никає необхідність використовувати при-
родномовні описи для значень атрибутів,
наприклад, значення року народження
може бути “у середині 3 століття” або
“приблизно між 1100 та 1105 роками”, що
призводить до застосування менш жорст-
ких обмежень на дані, наприклад, усі дані
описуються як текстовий рядок;
використовувати специфічні
для певного Wiki-ресурсу типи даних, на-
приклад, забезпечити засоби введення те-
гів природної мови (якщо певне значення
атрибута може бути подано різними мова-
ми, наприклад, прізвище особи може бути
подано українською та рідною мовою осо-
би) та одиниць виміру для елементів, які
можуть оцінюватися у різних одиницях
(наприклад, у метрах та футах).
Для атрибуту, який визначено у
шаблоні, MediaWiki дозволяє знайти шаб-
лони, де цей атрибут вже використовуєть-
ся, та показувати інші характеристики ат-
рибуту, щоб дати розробнику шаблону
можливість перевірити, чи мають ці атри-
бути однакове семантичне значення. Це
спрощує розробку шаблонів та дозволяє
уніфікувати імена параметрів, не викли-
каючи суперечностей. Наприклад, в е-ВУЕ
атрибут “Площа” має однакові одиниці
виміру та тип значення для шаблонів
“Країна” та “Озеро”, тому доцільно вико-
ристовувати в них однакову назву. Але
використання атрибуту “Ім’я” в шаблонах
“Персоналія” та “Літературний твір” не-
доцільно, якщо в першому випадку цей
параметр має значення типу “текстовий
рядок” та характеризує особисте ім’я осо-
би, а в другому – це посилання на прізви-
ще автора, що має тип “Wiki-посилання”, і
тому краще замінити його на параметр
“Автор”.
Модель даних Semantic MediaWiki
Semantic MediaWiki – це семантич-
но розширений Wiki-двигун, який дозво-
ляє користувачам анотувати контент Wiki
явно визначеною інформацією, придат-
ною для автоматичної обробки (машино-
читаною). Він підтримує додавання струк-
турованої та семантично анотованої інфо-
рмації у Wiki з використанням відповідно-
го синтаксису.
Semantic MediaWiki (SMW) є над-
будовою над інструментальним засобом
побудови Wiki-сайту MediaWiki. Переваги
SMW – це обробка інформації на семанти-
чному рівні, наявність засобів групового
керування знаннями, відносно висока ви-
разна потужність, надійна реалізація і зру-
чний інтерфейс користувачів, наявність
документації та спільнот користувачів.
SMW дозволяє інтегрувати інформацію з
різних Wiki-сторінок, здійснюючи пошук
Моделі та засоби систем баз даних і знань
26
на рівні знань, та генерувати за Wiki-
сторінками онтологічні структури, які мо-
жуть використовувати інші системи.
Використовуючи семантичні еле-
менти, SMW вирішує такі основні про-
блеми сучасних Wiki:
послідовність контенту (Con-
tent consistency): інформація, що зустріча-
ється на різних Wiki-сторінках, має бути
несуперечною.
доступність знань (Knowledge
Access): пошук і порівняння інформації з
різних сторінок у Wiki-ресурсі великого
обсягу потребує відповідних засобів.
повторне використання знань
(Knowledge reuse): на відміну від жорстко-
го контенту на основі тексту у традицій-
них Wiki, який може використовуватися
лише для читання сторінок у браузері або
подібній програмі, семантизація є осно-
вою для доступу до Wiki-контенту з інших
застосунків та експорт знань у поширені
формати їх подання.
Крім категорій, в SMW для струк-
турування інформації використовуються
такі механізми, як семантичні властивос-
ті. Вони дозволяють семантично пов’я-
зувати Wiki-сторінки як між собою, так і з
різними даними. Кожна семантична влас-
тивість має тип, назву і значення, а також
власну Wiki-сторінку в спеціальному про-
сторі імен, яка дозволяє визначати її місце
в ієрархії властивостей та документувати
те, як цю властивість необхідно викорис-
товувати. Кожна семантична властивість
має власну Wiki-сторінку. На цій сторінці
можна явно визначити тип значень, що
приймає ця властивість, використовуючи
конструкцію [[Has type::ххх]]. Has type
розпізнається SMW як спеціальна влас-
тивість, тобто значення такої властивості є
посиланням на іншу Wiki-сторінку. В
Semantic MediaWiki підтримуються насту-
пні типи властивостей: String, Number,
Annotation UR1, Boolean, Email, Text,
Geographic Coordinates тощо.
Динамічно генерований контент
може створюватися за допомогою вбудо-
вування запитів у Wiki-сторінки. Імпорт
зовнішніх даних з існуючих онтологій ти-
пу FOAF, SIOC або Doublin Core може
здійснюватися шляхом зіставлення Wiki-
анотацій з елементами цих словників.
Щоб зробити можливим зовнішнє
повторне використання інформації з Wiki-
ресурсу, що базується на Semantic
MediaWiki, можна отримувати формаль-
ний опис для однієї або кількох статей че-
рез Web-інтерфейс у форматі OWL/RDF.
Оскільки SMW чітко дотримується стан-
дарту OWL DL, експортовану інформацію
можна повторно використовувати в різних
інструментах.
Синтаксис семантичних анотацій
використовує мову сценаріїв для опису
контенту сторінок Wiki, який розширю-
ється в SMW за допомогою наступних
трьох основних наборів семантичних ано-
тацій.
Визначення класів і властивостей:
SMW повторно використовує простір імен
"Category" (“Категорія”) для визначення
класів. Наприклад, сторінка Wiki з назвою
"Category: Images" призначена для подан-
ня класу всіх зображень, а також новий
простір імен під назвою "Властивість" для
визначення властивостей понять. Завдяки
такому підходу, SMW підтримує як бінар-
ні, так і n-арні властивості.
Аксіоми: SMW дозволяє декларува-
ти відношення “клас-підклас” і “власти-
вість-субвластивість”. Наприклад, можна
декларувати, що категорія “Зображення” є
підкатегорією “Медіа”, додавши на сторі-
нку цієї категорії анотацію “[[Category:
Медіа]]”. Це дозволяє утворювати таксо-
номію категорій та властивостей, яка є
дуже корисною як для навігації у Wiki-
ресурсі, так і для коректного створення
нових категорій та властивостей. SMW
також підтримує затвердження еквівален-
тності між двома Wiki-сторінками або між
двома класами за допомогою механізму
переспрямування (redirection) у Media-
Wiki. Для цього використовується конс-
трукція «REDIRECT [[x]]. Наприклад, в
е-ВУЕ за допомогою цього механізму ор-
ганізовано відсильні статті, коли існує кі-
лька загальновживаних формулювань того
самого терміну.
Твердження про екземпляри: SMW
дозволяє оголошувати сторінку екземп-
Моделі та засоби систем баз даних і знань
27
ляром класу або суб'єктом RDF-трійки.
Наприклад, якщо сторінка Wiki «Зобра-
ження Хрещатику» містить анотацію
«[[Категорія: Зображення]] та [[Type ::
Фотографія]]», це означає, що Зображен-
ня Хрещатику є цифровим ресурсом і має
тип «Фотографія». Також можна створи-
ти екземпляр n-арної властивості. Напри-
клад, на Wiki-сторінці "Зображення Хре-
щатику" анотація "[[Загальні ключові
слова :: Зображення Хрещатику; пей-
заж]]" означатиме, що Зображення Хре-
щатику відноситься до предметної кате-
горії пейзажей.
З точки зору функціональності ме-
ханізм семантичних анотацій відображає
три основні аспекти функціональності:
• функціональність гіпертекстових
посилань – успадкована від MediaWiki
для встановлення зв’язків між Wiki-сто-
рінками;
• функціональність подання знань у
семантичну мережу;
• функціональність бази даних, що
забезпечує подання n-арних кортежів вла-
стивостей в SQL-подібному стилі.
Шаблони в Semantic MediaWiki –
це Wiki-сторінки в спеціальному просторі
імен. Використання шаблонів корисне для
структурованого введення інформації ко-
ристувачами. Агрегація властивостей в
шаблонах та агрегація шаблонів подані у
семантичних формах.
Приклад форми:
Property: CollectionName | hasType:
String Property: BestQualityURI | hasType:
URL Property: Type| hasType: String
Приклад шаблону:
{{Metadata | CollectionName = |
BestQualityURI = | Type = }}
Form: {{#forminput:Form-
MetadataEntry
{{{for Metadata
{| class="formtable" | Collection
Name: | {{{field | CollectionName}}}
...
{{{end template}}}
}}
Для пошуку Semantic MediaWiki
використовує вбудовані запити.
Семантичні властивості та вбудо-
вані запити разом із семантичними фор-
мами та шаблонами є потужним інструме-
нтом, який може підтримувати моделю-
вання для різних потреб проектів.
Структура семантизованого Wiki-
ресурсу як основа для побудови
його онтологічної моделі
Використання семантичних Wiki-
технологій для створення розподілених
інформаційних ресурсів не тільки дозво-
ляє досить легко додавати структурування
до неструктурованих даних (НСД), але й є
джерелом фонових знань для аналізу дові-
льних природномовних текстів відповід-
ної предметної області. Створення е-ВУЕ
як семантизованого Wiki-ресурсу дозволяє
вдосконалити процес генерації таких
знань. Використання онтологічного аналі-
зу є основою для переходу від неструкту-
рованого контенту [4] до розподіленої ба-
зи знань, придатної для повторного вико-
ристання.
З точки зору онтологічного аналізу,
кожна Wiki-сторінка являє собою онтоло-
гічний елемент, тобто елемент одного з
RDF-класів – Thing, Class, ObjectProperty,
DatatypeProperty, AnnotationProperty. Крім
того, кожна стаття має власний URI, який
дозволяє уникнути плутанини між понят-
тями і HTML- сторінками. Зазвичай, статті
є екземплярами класів онтології OWL, ка-
тегорії – класами, а відношення – об'єкт-
ними властивостями онтології.
Виходячи з цього, для будь-якої
сторінки SMW за запитом може генерува-
ти відповідний OWL/RDF-файл. Найпрос-
тіший спосіб отримати цей RDF – викори-
стати посилання "Переглянути як RDF"
("View as RDF"), що знаходиться
в нижній частині кожної анотованої сто-
рінки. Ця сторінка може виступати як
кінцева точка (endpoint) для зовнішніх
сервісів (зовнішньої точки доступу), які
хочуть отримати доступ до семантичних
даних SMW. На жаль, ця функція реалізо-
вана дуже невдало та підтримує надто ма-
ло опцій.
Моделі та засоби систем баз даних і знань
28
Оскільки SMW сумісна з моделлю
знань OWL DL, то існує можливість вико-
ристання в Wiki існуючих онтологій. Це
можливо здійснити двома шляхами: ім-
порт онтології дозволяє створювати і мо-
дифікувати сторінки в Wiki для подання
відношень, заданих в деякому існуючому
OWL DL-документі; а повторне викорис-
тання словника дозволяє користувачам
відображати (задавати відповідності)
Wiki-сторінки на елементи існуючих он-
тологій.
Функція імпорту онтології для чи-
тання RDF-документів використовує ін-
струментарій RAP toolkit. Він витягує
RDF-твердження, які можуть бути подані
у Wiki. Найменування статей імпортова-
них елементів витягуються з їх міток
(labels), або, в разі відсутності мітки, з іде-
нтифікатора розділу їх URI. Основною ме-
тою імпорту є ініціалізація (первинне ав-
томатичне завантаження) основи-шаблону
для заповнення Wiki. Крім того, імпорт
онтології вставляє спеціальні анотації, які
генерують еквівалентні твердження в екс-
порт OWL (тобто. owl:sameAs, owl:equiva-
lentClass, або owl:equivalentProperty). Ім-
порт онтологій дозволений тільки для ад-
міністраторів сайту, оскільки це може бу-
ти використано для спаму.
Імпорт словника дозволяє користу-
вачам ідентифікувати елементи Wiki, вка-
завши зв'язок з елементами існуючих он-
тологій. Наприклад, Category:Person мо-
же безпосередньо експортуватися в клас
foaf:Person словника Friend-Of-A-Friend.
Wiki-користувачі можуть вирішувати, які
сторінки Wiki повинні мати зовнішню се-
мантику, проте набір наявних зовнішніх
елементів управляється тільки адміністра-
торами. Вводячи в словник Wiki деякий
новий елемент, вони повинні упевнитися в
тому, що повторне використання словника
співвідноситься з типами обмежень OWL
DL. Наприклад, зовнішні класи, такі, як
foaf:Person, не можуть бути імпортовані у
відношення.
Експорт в OWL/RDF є засобом за-
безпечення зовнішнього повторного вико-
ристання даних з Wiki, але тільки практи-
чне застосування цієї функції може пока-
зати якість згенерованого RDF. З цією
метою для видачі RDF розробники си-
стеми використовували ряд інструментів
Semantic Web. SMW добре співпрацювало
з найбільш відтестованими застосування-
ми, такими, як FOAF Explorer, Tabulator
RDF browser, або розширенням браузера
Piggy Bank RDF.
Крім того, SMW надає сервіс для
підтримки SPARQL запитів. Система ба-
зується на автономному (stand-alone) RDF
сервері Joseki, який синхронізований з се-
мантичним контентом Wiki. Синхроніза-
ція полягає у генерації RSS-фіду зі звітом
про останні зміни, що відбулися у Wiki,
для того, щоб швидко перезавантажити
змінені статті. Таким чином, SPARQL-
точка доступу (endpoint) демонструє мож-
ливість дзеркально відобразити RDF-
контент Wiki за допомогою невеликих по-
крокових оновлень, і пропонує точку дос-
тупу для семантичних технологій, які по-
вторно використовують ці дані.
Формальна модель Wiki-онтології
Wiki-онтологія – це онтологія, що
відображає знання семантично розміченого
Wiki-ресурсу (набору Wiki сторінок, що
містять семантичну розмітку) [15]. Вона
містить тільки ті знання, які можна безпо-
середньо здобути із семантичної розмітки.
Тому в цій онтології відсутні, приміром,
такі характеристики класів та властивос-
тей, як еквівалентність, відсутність перети-
ну тощо. Така онтологія може бути згене-
рована в результаті аналізу Wiki-ресурсу
або, навпаки, створена до початку розробки
самого ресурсу та використовуватися як
основа для його семантичної розмітки, тоб-
то її поняття та їх атрибути використову-
ються для позначення категорій та семан-
тичних властивостей Wiki-ресурсу. На пра-
ктиці зазвичай обидва варіанти використо-
вуються ітеративно – спочатку генерується
онтологія предметної області, потім вона
використовується у розмітці, а в процесі
наповнення контентом Wiki-ресурсу вно-
сяться вдосконалення і в саму онтологію.
Для опису формальної моделі Wiki-
онтології пропонується використовувати
наступну формальну модель онтології
T,F,R,XO [16], що складається
з наступних елементів:
Моделі та засоби систем баз даних і знань
29
indcl XXX – множина
концептів онтології, де
- clX – множина класів,
- indX – множина екземплярів
класів, таких, що AaXAXa clind , ;
propierj
propiericlier
pp
rrrR
_
__
}{
}{
– мно-
жина відношень між елементами онто-
логії, де
- clierr _ – ієрархічні відношення
між класами онтології – це структури час-
ткового впорядкування з верхнім елемен-
том Thing, що можуть встановлюватися
між класами онтології і характеризується
такими властивостями, як антисиметрич-
ність і транзитивність, clclclier XXr :_ ;
- }{ ir – множина об'єктних влас-
тивостей, що встановлюють відношення
між екземплярами класів:
indindi XbbXaar ,, , indindi XXr : ;
- propierr _ – ієрархічні відно-
шення між об’єктними властивостями
класів онтології – це структури часткового
впорядкування з верхнім елементом
topObjectProperty, що можуть встановлю-
ватися між класами онтології і властивос-
тями класів і характеризується такими
властивостями, як антисиметричність і
транзитивність, }{}{:_ iipropier rrr ;
- }{ jp – множина властивостей
даних, що встановлюють відношення між
екземплярами класів і значеннями з Т:
TttXaap indi ,, , TXp indi : ;
- propierp _ – ієрархічні відно-
шення між властивостями даних екземп-
лярів класів онтології – це структури част-
кового впорядкування з верхнім елемен-
том topDataProperty, що можуть встанов-
люватися між властивостями даних екзем-
плярів класів онтології і характеризується
такими властивостями, як антисиметрич-
ність і транзитивність,
}{}{:_ iipropier ppp ;
}{ propcl FFF – множина
характеристик, що можуть використовува-
тися для логічного виведення над онтоло-
гією:
- clF – множина характеристик
класів онтології, що можуть застосовува-
тися для логічного виводу: еквівалент-
ність, відсутність перетину тощо;
- propF – множина характерис-
тик об’єктних властивостей екземплярів
класів онтології, що можуть застосовува-
тися для логічного виводу: транзитив-
ність, симетричність, антисиметричність,
рефлексивність, антирефлексивність то-
що);
T – множина типів даних (на-
приклад, рядок, ціле), значення з яких мо-
жуть приймати властивості даних класів
онтології;
M – множина нелогічних пра-
вил ПрО (наприклад, рядок, ціле).
У Wiki-онтології wikiO множина
концептів будується як поєднання таких
елементів Wiki, як сторінки та категорії
pagewikicategorwiki XXX __ , пов’язаних
різними видами відношень з
}{}{}{ __ propsemrrrR
linkclier
: множина
класів – це множина категорій Wiki
categorwikiX _ , між якими існують ієрархіч-
ні відношення
clier
r
_
; множина екземпля-
рів – множина Wiki-сторінок pagewikiX _ ,
між якими існують посилання
link
r та се-
мантичні відношення mir
ipropsem ,0,_ ;
множина типів даних доповнюється спе-
цифічним класом – “Wiki-сторінка”. Ця
модель може бути вдосконалена з ураху-
ванням таких елементів Wiki, як шабло-
ни, форми, спеціальні сторінки тощо.
У формальній моделі Wiki-онтології
wikiO не семантизованого Wiki-ресурсу
Х ці множини мають наступний склад:
- Х – це множини сторінок Wiki-
ресурсу:
spectemplatecateguserwiki PPPPX ,
де
userP – множина сторінок, ство-
рених користувачами,
Моделі та засоби систем баз даних і знань
30
categP – множина сторінок, що
описують категорії,
templateP – множина сторінок, що
описують шаблони,
specP – множина інших спеціа-
льних сторінок;
- wikicategorier RrR _
categorierr _ – ієрархічні відно-
шення, що можуть встановлюватися між
категоріями Wiki-ресурсу і характеризу-
ється такими властивостями, як антисиме-
тричність і транзитивність,
categcategcategorier PPr :_ ;
}"","_","{" useaislinkRwiki –
множина з трьох елементів, де “link” –
відношення, що описує посилання однієї
довільної Wiki-сторінки цього ресурсу на
іншу Wiki-сторінку цього ресурсу (хоча в
Wiki-ресурсах передбачені і посилання на
інші види сторінок, у рамках даної моделі
вони не враховуються), categPXais :"_"
– відношення включення довільної сторі-
нки до певної категорії, а
templatePXuse :"" – відношення, що фо-
рмалізує включення Wiki-шаблону до до-
вільної сторінки ресурсу;
- T – множина типів даних, що
підтримуються в MediaWiki (наприклад,
рядок, ціле, число, дата, координата), зна-
чення з яких можуть приймати властивос-
ті даних класів онтології;
- інші множини такої Wiki-
онтології є порожніми.
Формальна модель Wiki-онтології
wikisO _ для семантично збагачених Wiki-
ресурсів є більш складною і включає ряд
елементів, зв'язаних із семантичними вла-
стивостями [16]:
- Х – це множини сторінок Wiki-
ресурсу:
propswikiwikisem PXX __ ,
яка доповнюється множиною propsemP _ –
сторінками семантичних властивостей,
деякі з який є семантично визначеними
посиланнями на інші Wiki-сторінки:
propsempagepropsem PP ___ ,
а інші зв'язують сторінки зі значеннями
різних типів даних (ці типи даних визна-
чаються на сторінках семантичних влас-
тивостей);
- wikisemantclier RrR __ , де
propertyiercategorierclier rrr ___
розширюється порівняно із онтологією
несемантизованого Wiki-ресурсу введен-
ням окремого ієрархічного відношення
propertyierr _ для задання ієрархії семантич-
них властивостей;
}"_"
,"_{"_
valueproperty
propertyhasRR wikiwikisemant
– множина відношень, що доповнюється
відношеннями, що пов’язані із семантич-
ними властивостями Wiki-сторінок:
propsemPXpropertyhas _:"_"
– відношення, що вказує на те, що довіль-
на Wiki-сторінка має певну семантичну
властивість, та
TXPvalueproperty propsem _:"_"
– відношення, що пов’язує семантичну
властивість сторінки з її значенням, яке
може бути як посиланням на іншу сторін-
ку, так і літералом;
- T – множина типів даних, що
підтримуються в MediaWiki;
- інші множини такої Wiki-
онтології є порожніми.
Вибір саме такої моделі онтології
для даної задачі обумовлюється наступ-
ними причинами. По-перше, така модель
має достатню виразність для розв’язання
широкого класу інтелектуальних задач.
По-друге, вона відповідає інтуїтивному
уявленню про онтології, яке міститься в
користувальницькому інтерфейсі редакто-
ра онтологій Protégé і тому легко поєдну-
ється з візуалізаціями елементів онтології
в цьому програмному продукті. По-третє,
ця модель досить легко інтегрується з різ-
ними інтелектуальними застосуваннями,
Моделі та засоби систем баз даних і знань
31
які підтримують семантичну обробку ін-
формації (приміром, з семантичними
Wiki-ресурсами, лексичними онтологія-
ми).
Онтологічна модель бази знань
е-ВУЕ
Розглянемо проаналізовані вище
засоби побудови та вдосконалення струк-
тури бази знань Wiki-ресурсу на прикладі
науково-інформаційного наповнення пор-
тальної версії Великої української енцик-
лопедії – е-ВУЕ (http://vue.gov.ua), що ви-
користовує вільне програмне забезпечення
MediaWiki версії 1.29.1. та його семантич-
не розширення Semantic MediaWiki версії
2.5.5 – інноваційний проект зі створення
національної енциклопедії на основі су-
часних засобів подання знань.
Принциповими відмінностями
е-ВУЕ від відомих онлайнових довідників
та енциклопедій (приміром, від Вікіпедії)
є: 1) орієнтація на авторські статті, тобто
на оригінальний та якісний контент, під-
готовлений експертами відповідної облас-
ті; 2) наявність складної системи семанти-
чних відношень між гаслами, що базують-
ся на наборах ієрархій категорій та семан-
тичних властивостей; 3) рецензованість
гасел, що забезпечує більший рівень
об’єктивності та довіри до поданої інфор-
мації.
Через високу складність інформа-
ційного наповнення е-ВУЕ виникає необ-
хідність застосування засобів онтологіч-
ного аналізу для моделювання структури,
взаємозв’язків та властивостей об’єктів,
що складають контент цієї енциклопедії.
Ці засоби дозволяють встановлювати спів-
ставлення між Wiki-онтологією (тобто ті-
єю онтологією, елементи якої лежать в ос-
нові семантичної розмітки Wiki-ресурсу)
та довільною онтологією ПрО. Онтологіч-
на модель знань е-ВУЕ дозволяє перетво-
рити її на розподілену базу знань, що є
джерелом корисної та перевіреної інфор-
мації як для людей, так і для інтелектуаль-
них програмних засобів, необхідно ство-
рити цього енциклопедичного видання.
Така модель формалізує відношення між її
основними об’єктами, їх типами та влас-
тивостями.
Категорії е-ВУЕ
Кожне гасло е-ВУЕ може бути від-
несено до довільної кількості категорій.
Засоби Wiki-середовища дозволяють явно
вказувати ієрархічні (“є підкатегорією”)
зв’язки між такими категоріями. Жодних
зовнішніх обмежень на такі зв’язки в
Semantic MediaWiki немає. Такі категорії
можуть відображати різні аспекти, за яки-
ми можна класифікувати гасла енцикло-
педії. Деякі з них відображають специфіку
предметної області енциклопедистики,
інші можуть стосуватися, приміром, умов
публікації та використання матеріалу.
Можна виділити кілька незалежних
ієрархій категорій е-ВУЕ:
- напрямки знань та їх підкласи
(приклад ієрархії підкатегорій: “Технічні
науки” – “Радіотехніка та телекомунікації”
– “Оптоелектронні системи”);
- тип інформаційного об’єкта –
“Персоналії”, “Цивілізація” та “Природа”,
а також підкатегорії цих категорій;
- тип опублікування – категорії
“е-ВУЕ” (всі сторінки гасел енциклопедії)
та її підкатегорія “ВУЕ” (інформація, що
опублікована у паперовій версії ВУЕ);
- мультимедійні матеріали;
- типи учасників побудови кон-
тенту – категорії “Автори ВУЕ”, “Модера-
тори”.
З точки зору тематики найвищим
рівнем класифікації в ієрархії категорій є
поділ гасел на три категорії, що не пере-
тинаються: “Персоналії”, “Цивілізація” та
“Природа”. Усі повністю завершені гасла
на порталі е-ВУЕ віднесено до прихованої
категорії “е-ВУЕ”, яка використовується в
семантичних запитах і дозволяє не брати
до розгляду та аналізу технічні й допомі-
жні сторінки, – це сторінки е-ВУЕ, на які
можна посилатися із зовнішніх джерел.
Шаблони е-ВУЕ
Шаблони Semantic MediaWiki до-
зволяють автоматизувати введення відпо-
відної інформації на сторінках та забезпе-
чують уніфікацію імен категорій та семан-
тичних властивостей. Крім того, вони до-
зволяють інтегрувати контент різних сто-
рінок (з використанням убудованих запи-
тів) та запобігати суперечностей у поданні
інформації.
Моделі та засоби систем баз даних і знань
32
В процесі розробки енциклопедії
виділено типові інформаційні об’єкти (ІО)
– Wiki-сторінки з подібним набором роз-
ділів та близьким набором семантичних
властивостей. Для таких типових ІО ство-
рено Wiki-шаблони, що дозволяють уніфі-
ковано відображати відомості на екрані та
забезпечують коректне введення значень
семантичних властивостей.
На сьогодні в е-ВУЕ використову-
ються наступні шаблони базових типових
ІО (рис. 2):
Битва Відзнаки
Війна Група осіб
Історична подія Книжкове видання
Країна Материк
Мінерал Місто
Модератор Море
Музичний гурт Озеро
Океан Олімпійські_ігри
Організація Періодичне видання
Персоналія Порода
Рельєф Річка
СМТ Таксон
Семантичні властивості е-ВУЕ
В е-ВУЕ використовуються семан-
тичні властивості різних типів, які дозво-
ляють як пов’язувати Wiki-сторінки на рі-
вні знань, так і фіксувати значення їх ат-
рибутів. Для кожного з типових ІО визна-
чено набір таких властивостей та задано за
допомогою шаблонів форму їх відобра-
ження. Наприклад, шаблон “Озеро” має
такі семантичні властивості, як “Найбіль-
ша глибина” (число, єдине значення),
“Країни” (посилання, можливо кілька зна-
чень), “Тип живлення” (текст) та “Площа”
(число).
Код шаблона “Озеро”
<includeonly>{| class="wikitable vueshablon" | style=""
! style="text-align: center; background-color:#7983aa;”
colspan="2" |<span class="vueSpanPagenameShablon" style="">
{{color|white|
{{PAGENAME}} }} {{if||{{{Оригінальна назва|}}}|
'''('''{{#arraymap:{{{Оригінальна назва|}}}
|,|x|[[Оригінальна назва::x]]}}''')''' }}
</span>{{if||{{{Прісне/солоне|}}}|
{{!}}-{{!}} '''Прісне/солоне'''
{{!}} [[Прісне/солоне::{{{Прісне/солоне}}}]] }}
{{if||{{{Площа|}}}|{{!}}-
{{!}} '''Площа (км²)''’
{{if||{{{Оригінальна назва|}}}|
'''('''{{#arraymap:{{{Оригінальна назва|}}}|,|
x|[[Оригінальна назва::x]]}}''')''' }}</span>
{{if||{{{Прісне/солоне|}}}|
{{!}}-{{!}} '''Прісне/солоне'''
{{!}} [[Прісне/солоне::{{{Прісне/солоне}}}]] }}
Виклик шаблона “Озеро”
{{Озеро
|Оригінальна назва=
|Тип=
|Країни=
|Регіон=
|Найбільша глибина=
|Середня глибина=
|Тип живлення=
|Прісне/солоне=
|Площа=
|Півострови=
|Острови=
|Впадають річки=
|Витікають річки=
}}
Виклик шаблона “Озеро”
{{Озеро
|Оригінальна назва=
|Тип=
|Країни=
|Регіон=
|Найбільша глибина=
|Середня глибина=
|Тип живлення=
|Прісне/солоне=
|Площа=
|Півострови=
|Острови=
|Впадають річки=
|Витікають річки=
}}
Wiki-сторінка,
де використано
шаблон
Інфорбокс
зі вмістом
параметрів
шаблону
Рис. 2. Шаблони базових ІО в е-ВУЕ
Моделі та засоби систем баз даних і знань
33
Виразні можливості Semantic
MediaWiki дозволяють відображати до-
сить складну систему знань предметної
області та відношень між її базовими по-
няттями, але їх недостатньо для формаль-
ного подання таких описів, що мали б од-
нозначну інтерпретацію користувачами.
Це викликає доцільність застосування
більш виразної онтологічної моделі, яка
забезпечує вищий рівень формалізації
знань.
Wiki-онтологія е-ВУЕ
Wiki-онтологія е-ВУЕ як модель
знань цієї предметної області дозволяє ко-
ректно відображати його базові закономі-
рності та обмеження. Використання Wiki-
онтології як основи семантичної розмітки
підтримує формування відповідного набо-
ру ієрархічно пов’язаних категорій, шаб-
лонів типових інформаційних об’єктів, їх
семантичних властивостей та запитів, що
їх використовують.
Використання Wiki-онтології е-
ВУЕ є засобом явного визначення семан-
тики типових ІО Wiki-ресурсу – їх харак-
теристик та відношень з іншими ІО. Важ-
ливо, що таке онтологічне подання дозво-
ляє виявляти та вирішувати неоднозначні
інтерпретації та некоректне використання
термінів, пов’язаних з описом ІО. Напри-
клад, це дозволяє розв’язати проблему
уніфікації назв семантичних властивостей
та категорій, які використовують різні ро-
зробники.
Крім того, онтологічне подання
спрощує сприйняття знань користувача-
ми, наприклад, дозволяє візуалізувати іє-
рархічні відношення між категоріями
categorierr _ , описувати їх характеристики
та надавати анотації. Для складної струк-
тури знань, що характерна для е-ВУЕ, це
дозволяє значно чіткіше описувати знання
та запобігати повторного використання
імен категорій з різними значеннями. Ре-
дактор онтологій Protégé забезпечує знач-
но ширший функціонал для подання та
візуалізації знань порівняно із вбудовани-
ми можливостями Semantic MediaWiki
(рис. 3).
Рис. 3. Класи Wiki-онтології е-ВУЕ в Protégé
Моделі та засоби систем баз даних і знань
34
Семантичні властивості в е-ВУЕ
описуються у Wiki-онтології за допомо-
гою об’єктних властивостей (для значень
типу “Сторінка”) та властивостей даних
(для значень інших типів.
Особливо важливо формально опи-
сати семантичні властивості, що
пов’язують Wiki-сторінки (в онтології для
цього застосовуються об’єктні властивос-
ті). Наявність такого опису дозволяє поле-
гшити семантичну розмітку природномо-
вного тексту та перетворення НСД на
структуровану базу знань. Використання
онтологічної моделі дозволяє чітко визна-
чити область значення та область визна-
чення семантичних властивостей, які ха-
рактеризують Wiki-сторінку, що пов’язана
з певним типом інформаційного об’єкта за
допомогою шаблону. Така формалізація
семантики сторінок дозволяє запобігти
некоректних посилань. Слід відмітити, що
в Protege можна формально зафіксувати
характеристики властивостей, щоб вико-
ристовувати їх в е-ВУЕ тільки відповід-
ним чином (рис. 4).
Редактор онтологій дозволяє явно
вказати, що певна властивість є симетрич-
ною чи транзитивною. В е-ВУЕ такі хара-
ктеристики має, наприклад, семантична
властивість “Співпраця”. Крім того, в
Protege як об’єктні властивості, так і влас-
тивості даних створюються як підкатегорії
інших властивостей, і ця ієрархія візуалі-
зується у простій та зрозумілій формі. У
середовищі Semantic MediaWiki можна
також вказувати ієрархічні відношення
між властивостями – за допомогою твер-
джень [[Subproperty of::dc:date]] на сторі-
нці властивості, але відстежувати ці взає-
мини має сам користувач вручну. За наяв-
ності великої кількості як властивостей,
так і користувачів, що мають право їх
створювати (а саме така ситуація характе-
рна для е-ВУЕ) це може призвести до не-
коректності у структурі бази знань енцик-
лопедії.
Рис. 4. Створення властивостей Wiki-онтології е-ВУЕ в Protégé
Моделі та засоби систем баз даних і знань
35
Важливо відмітити, що засоби
Semantic MediaWiki дозволяють вказати
тип властивості, поділяючи їх на об’єктні
властивості, що посилаються на інші сто-
рінки, та на властивості даних, що поси-
лаються на конкретні значення (текст, ці-
ле, дата тощо). Але це не дозволяє ви-
значати тип інформаційного об’єкта, на
який таке посилання є релевантним. На-
приклад, за змістом “Місце народження”
може пов’язувати сторінки категорії “Пе-
рсоналія” зі сторінками категорій “Місто”,
“Країна”, “Регіон”, але формально визна-
чити це засоби Semantic MediaWiki не до-
зволяють (можна тільки явно вказати при-
пустимі значення, а цього недостатньо).
Wiki-онтологія дозволяє формалі-
зувати набір властивостей кожної Wiki-
сторінки як екземпляра відповідного
класу.
Коли структура бази знань ресурсу
містить багато різних типів інформаційних
об’єктів з різними наборами властивостей,
що перетинаються, але мають різні області
значення та визначення, велику роль грає
наявність засобів візуалізації цієї інфор-
мації у зручній для користувача формі. На
жаль, середовище Semantic MediaWiki не
може розглядатися як повноцінна система
менеджменту розподілених знань: незва-
жаючи на достатню для широкого класу
задач виразність, вона не містить достат-
ніх засобів для аналізу та візуалізації та-
ких знань (інформація видається у формі
абеткового переліку, через набори власти-
востей окремих Wiki-сторінок або як ре-
зультати запитів тощо, але її важко
сприймати у такому поданні).
Рис. 5. Подання знань щодо ІО у е-ВУЕ та у Wiki-онтології
Моделі та засоби систем баз даних і знань
36
Висновки
Проаналізовано доцільність засто-
сування Wiki-технологій для створення
складних інформаційних ресурсів велико-
го обсягу та складної структури, орієнто-
ваних на функціювання у відкритому се-
редовищі Web, до яких відноситься пор-
тальна версія Великої української енцик-
лопедії.
Обґрунтована потреба семантично-
го розширення Wiki-технології, а саме –
використання Semantic MediaWiki, для
отримання необхідної виразної потужнос-
ті для подання семантики основних еле-
ментів е-ВУЕ, їх властивостей та зв’язків
між ними. Розглянуто зв’язок між подан-
ням знань у Semantic MediaWiki та стан-
дартами Semantic Web, які використову-
ються для інтеграції інтелектуальних за-
стосунків та баз знань у Web.
Доведено на прикладах доцільність
застосування онтологічного аналізу та по-
будови онтологічної моделі е-ВУЕ для
формального та однозначного відобра-
ження та аналізу структури та контенту
бази знань онлайн-версії «Великої україн-
ської енциклопедії».
Запропоновано методи та засоби
застосування цієї онтологічної моделі для
створення контенту е-ВУЕ та більш ефек-
тивного здійснення пошуку та навігації у
цьому інформаційному ресурсі.
Література
1. Breslin J., Passant A., Deker S. The Social
Semantic Web, Springer. 2009.
http://staff.um.edu.mt/cabe2/lectures/webscie
nce/docs/S2N.pdf.
2. Hagedorn, G., Weber, G., Plank, A. Giurgiu,
M. Homodi, A., C. Veja An online authoring
and publishing platform for field guides and
identification tools. Proc. of Conf. Tools for
Identifying Biodiversity: Progress and
Problems, Paris, September 2010. P. 13–18.
3. Leuf B., Cunningham W. The Wiki Way
Quick Collaboration on the Web. 2001.
https://archive.org/details/isbn_97802017149
99.
4. Рогушина Ю. В. Засоби та методи аналізу
неструктурованих даних. Проблеми про-
грамування. 2019. № 1. С. 57–77.
http://pp.isofts.kiev.ua/ojs1/article/view/348/
346.
5. Veja C.F., Vaida M.-F., Hagedorn G.
Sharing the knowledge: semantic mediawiki.
Acta Technica Napocensis. 2011. 52(2), N.2.
http://users.utcluj.ro/~atn/papers/ATN_2_201
1_2.pdf.
6. Рогушина Ю.В., Прийма С.М., Строкань
О.В. Створення та використання семанти-
чних Wiki-ресурсів: навчальний довідник.
Мелітополь, ФОП Однорог Т.В. 2017.
169 с.
7. Kuhn T. Acewiki: A natural and expressive
semantic wiki. 2008. https://arxiv.org/pdf/
0807.4618.pdf.
8. Schaffert S., Eder J., Grünwald S., Kurz T.,
Radulescu M. KiWi – a platform for semantic
social software. European Semantic Web
Conference. 2009. P. 888–892. https://link.
springer.com/content/pdf/10.1007/978-3-642-
02121-3_76.pdf.). Springer, Berlin,
Heidelberg.
9. Kawamoto K., Kitamura Y., Tijerino Y.
Kawawiki: A semantic wiki based on rdf
templates. IEEE/WIC/ACM International
Conference on Web Intelligence and
Intelligent Agent Technology Workshops.
2006. P. 425–432. https://ist.ksc.kwansei.
ac.jp/~kitamura/papers/src/iwi06.pdf.
10. Auer S., Dietzold S., Riechert T. OntoWiki–a
tool for social, semantic collaboration.
International Semantic Web Conference.
2006. P. 736–749. https://link.springer.com/
content/pdf/10.1007/11926078_53.pdf.
11. Krötzsch M., Vrandečić D., Völkel M.
Semantic mediawiki. International semantic
web conference. 2006. P. 935–942.
https://link.springer.com/content/pdf/10.1007
/11926078_68.pdf.
12. Kousetti Ch., Millard I., Yvonne H. A Study
of Ontology Convergence in a Semantic
Wiki. Based Infrastructure. University of
Southampton. UK, 2008.
13. Bizer C., Lehmann J., Kobilarov G., Auer S.,
Becker C., Cyganiak R., Hellmann S.
Dbpedia – A crystallization point for the Web
of Data. Web Semantics: science, services
and agents on the world wide web. 2009.
7(3). P. 154–165. https://gesispanel.gesis.org/
preprints/index.php/ps/article/download/164/
162.
14. Auer S., Lehmann J. What have innsbruck
and leipzig in common? extracting semantics
from wiki content. European semantic web
conference. 2007. P. 503–517. https://link.
springer.com/content/pdf/10.1007/978-3-540-
72667-8_36.pdf.
15. Rogushina J. Semantic Wiki resources and
their use for the construction of personalized
Моделі та засоби систем баз даних і знань
37
ontologies. CEUR Workshop Proceedings
1631. 2016. P. 188–195.
16. Рогушина Ю.В. Теоретичні засади засто-
сування онтологій для семантизації ресур-
сів Web. Проблеми програмування. 2018.
№ 2-3. С. 197–203.
References
1. Breslin J., Passant A., Deker S. The Social
Semantic Web, Springer, 2009.
http://staff.um.edu.mt/cabe2/lectures/webscie
nce/docs/S2N.pdf.
2. Hagedorn, G., Weber, G., Plank, A. Giurgiu,
M. Homodi, A., C. Veja An online authoring
and publishing platform for field guides and
identification tools // Proc. of Conf. Tools for
Identifying Biodiversity: Progress and
Problems, Paris, September 2010. P. 13–18.
3. Leuf B., Cunningham W. The Wiki Way
Quick Collaboration on the Web, 2001.
https://archive.org/details/isbn_97802017149
99.
4. Rogushina Y.V. Tools and methods of
unstructured data analysis // Problems in
Programming, № 1, 2019. P. 57–77.
http://pp.isofts.kiev.ua/ojs1/article/view/348/
346. [in Ukrainian]
5. Veja C.F., Vaida M.-F., Hagedorn G.
Sharing the knowledge: semantic mediawiki
// Acta Technica Napocensis, 52(2), N. 2,
2011. – http://users.utcluj.ro/~atn/papers/
ATN_2_2011_2.pdf.
6. Rogushina Y.V., Priyma S.M, Strokan O.V.
Creating and use of the Semantic Wiki
resources: tutorial. Melitopol, FOP Odinorog
T.V., 2017. 169 p. [in Ukrainian]
7. Kuhn T. Acewiki: A natural and expressive
semantic wiki. 2008. https://arxiv.org/
pdf/0807.4618.pdf.
8. Schaffert S., Eder J., Grünwald S., Kurz T.,
Radulescu M. KiWi – a platform for semantic
social software. European Semantic Web
Conference, 2009. P. 888–892.
https://link.springer.com/content/pdf/10.1007
/978-3-642-02121-3_76.pdf.). Springer,
Berlin, Heidelberg.
9. Kawamoto K., Kitamura Y., Tijerino Y.
Kawawiki: A semantic wiki based on rdf
templates. IEEE/WIC/ACM International
Conference on Web Intelligence and
Intelligent Agent Technology Workshops,
2006, P. 425–432. https://ist.ksc.kwansei.
ac.jp/~kitamura/papers/src/iwi06.pdf.
10. Auer S., Dietzold S., Riechert T. OntoWiki–a
tool for social, semantic collaboration //
International Semantic Web Conference,
2006, P. 736–749. https://link.springer.com/
content/pdf/10.1007/11926078_53.pdf.
11. Krötzsch M., Vrandečić D., Völkel M.
Semantic mediawiki. International semantic
web conference. 2006. P. 935–942.
https://link.springer.com/content/pdf/10.1007
/11926078_68.pdf.
12. Kousetti Ch., Millard I., Yvonne H. A Study
of Ontology Convergence in a Semantic
Wiki. Based Infrastructure. University of
Southampton. UK, 2008.
13. Bizer C., Lehmann J., Kobilarov G., Auer S.,
Becker C., Cyganiak R., Hellmann S.
Dbpedia – A crystallization point for the Web
of Data. Web Semantics: science, services
and agents on the world wide web. 2009.
7(3). P. 154–165. https://gesispanel.gesis.org/
preprints/index.php/ps/article/download/164/
162.
14. Auer S., Lehmann J. What have innsbruck
and leipzig in common? extracting semantics
from wiki content. European semantic web
conference. 2007. P. 503–517. https://link.
springer.com/content/pdf/10.1007/978-3-540-
72667-8_36.pdf.
15. Rogushina J. Semantic Wiki resources and
their use for the construction of personalized
ontologies. CEUR Workshop Proceedings
1631. 2016. P. 188–195.
16. Rogushina Y.V. Theoretical means of use of
ontologies for semanization of the Web
resources. Problems in Programming. № 2-3.
2018. P. 197–203. [in Ukrainian]
Одержано 22.04.2019
Про автора:
Рогушина Юлія Віталіївна,
кандидат фізико-математичних наук,
старший науковий співробітник.
Кількість наукових публікацій в
українських виданнях – 140.
Кількість наукових публікацій в
зарубіжних виданнях – 30.
Індекс Хірша – 3.
http://orcid.org/0000-0001-7958-2557.
Місце роботи автора:
Інститут програмних систем
НАН України,
03181, Київ-187,
проспект Академіка Глушкова, 40.
Тел.: 066 550 1999.
E-mail: ladamandraka2010@gmail.com
mailto:ladamandraka2010@gmail.com
|