Семантическая паутина и Wiki-системы
Представлен аналитический обзор современных результатов, связанных с созданием семантического Webа и целого ряда проблем, систем, технологий, активно разрабатываемых в общем направлении развития Интернета. Особое внимание уделяется исследованиям онтологий и Wiki технологиям....
Saved in:
| Published in: | Проблеми програмування |
|---|---|
| Date: | 2013 |
| Main Authors: | , , , |
| Language: | Russian |
| Published: |
Інститут програмних систем НАН України
2013
|
| Subjects: | |
| Online Access: | https://nasplib.isofts.kiev.ua/handle/123456789/86652 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| Journal Title: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Cite this: | Семантическая паутина и Wiki-системы / А.Н. Глибовец, Н.Н. Глибовец, Д.Е. Покопцев, М.О. Сидоренко // Проблеми програмування. — 2013. — № 1. — С. 45-67. — Бібліогр.: 56 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| _version_ | 1859622487774461952 |
|---|---|
| author | Глибовец, А.Н. Глибовец, Н.Н. Покопцев, Д.Е. Сидоренко, М.О. |
| author_facet | Глибовец, А.Н. Глибовец, Н.Н. Покопцев, Д.Е. Сидоренко, М.О. |
| citation_txt | Семантическая паутина и Wiki-системы / А.Н. Глибовец, Н.Н. Глибовец, Д.Е. Покопцев, М.О. Сидоренко // Проблеми програмування. — 2013. — № 1. — С. 45-67. — Бібліогр.: 56 назв. — рос. |
| collection | DSpace DC |
| container_title | Проблеми програмування |
| description | Представлен аналитический обзор современных результатов, связанных с созданием семантического Webа и целого ряда проблем, систем, технологий, активно разрабатываемых в общем направлении развития Интернета. Особое внимание уделяется исследованиям онтологий и Wiki технологиям.
|
| first_indexed | 2025-11-29T06:41:28Z |
| fulltext |
Експертні та інтелектуальні інформаційні системи
© А.Н. Глибовец, Н.Н. Глибовец, Д.Е. Покопцев, М.О. Сидоренко, 2013
ISSN 1727-4907. Проблеми програмування. 2013. № 1 45
УДК 519.683
А.Н. Глибовец, Н.Н. Глибовец, Д.Е. Покопцев, М.О. Сидоренко
CЕМАНТИЧЕСКАЯ ПАУТИНА И WIKI-СИСТЕМЫ
Представлен аналитический обзор современных результатов, связанных с созданием семантического
Webа и целого ряда проблем, систем, технологий, активно разрабатываемых в общем направлении раз-
вития Интернета. Особое внимание уделяется исследованиям онтологий и Wiki технологиям.
Введение
Интернет – всемирная система объ-
единенных компьютерных сетей, исполь-
зующая для связи и маршрутизации паке-
тов данных протоколы TCP/IP. Паутина
(Web) – глобальное информационное про-
странство, работающее на физической ин-
фраструктуре Интернета, используя про-
токол HTTP и идентификаторы ресурсов
URI (Universal Resource Identifier). Для
улучшения автоматизированной (машин-
ной) обработки информации необходимо
совершенствовать форму ее представления
[1–3]. Технология Semantic Web определя-
ет подход к решению этой задачи путем
трансформации информационного напол-
нения Интернета в глобальную базу зна-
ний c помощью созданной сети докумен-
тов – семантической паутины (СП),
содержащих метаданные о ресурсах.
Для построения такого решения требо-
валось разработать и реализовать новую
информационно-коммуникационную мо-
дель, аналогичную семиуровневой моде-
ли OSI, но в приложении к Web и c
ориентацией на обмен информацией, а
не данными.
Семантическая паутина (Semantic
Web) – это направление развития Всемир-
ной паутины, целью которого является
представление информации в виде, при-
годном для машинной обработки на базе
технологических стандартов разрабатыва-
емых и внедряемых World Wide Web
Consortium (W3C). СП предполагает за-
пись информации в виде семантической
сети с помощью онтологий, что позволяет
специальной программе (агенту) непо-
средственно извлекать из паутины факты и
делать из них логические заключения, что
позволяет человеку и компьютеру эффек-
тивней взаимодействовать.
Понятие «семантическая паутина»
было введено в 2001 году Тимом
Бернерсом-Ли [4]. Магистральной линией
разработки СП он назвал поэтапное и рас-
пределенное создание универсального
языка описания данных и правил рассуж-
дений об этих данных. Этот язык должен
допускать не только простую визуализа-
цию данных, но и легкую переносимость
правил вывода, существовавших в неко-
торой системе представления данных, в
Паутину, что превратит традиционную
паутину (Web) в систему семантического
уровня. При разработке такого языка зада-
ния метаданных требовалось решить две
основные проблемы: он должен позволять
определять выражения произвольной
сложности, но эти выражения должны
иметь форму, достаточно простую для по-
нимания машиной.
Пользователь, используя уникаль-
ные идентификаторы URI, может легко
выражать введенные им понятия, даже ин-
тегрировать в Интернет объекты реального
мира. Универсальный язык позволяет по-
степенно связать все эти понятия в уни-
версальную сеть, переведя все сайты на
этот язык. Позже потребуется написать
программы (агенты), обрабатывающие
знания на этом языке. Таким образом, СП
предусматривает объединение разнообраз-
ных видов информации в единую структу-
ру, где каждому смысловому элементу
данных будет соответствовать специаль-
ный синтаксический блок (тэг). Тэги
должны составлять единую иерархиче-
скую структуру, на основе которой и
должна функционировать СП.
Параллельно разрабатывалась и
другая ветвь СП названая онтологическим
подходом. Этот подход включает в себя
http://ru.wikipedia.org/wiki/URI
http://ru.wikipedia.org/wiki/%D0%92%D1%81%D0%B5%D0%BC%D0%B8%D1%80%D0%BD%D0%B0%D1%8F_%D0%BF%D0%B0%D1%83%D1%82%D0%B8%D0%BD%D0%B0
http://ru.wikipedia.org/wiki/%D0%92%D1%81%D0%B5%D0%BC%D0%B8%D1%80%D0%BD%D0%B0%D1%8F_%D0%BF%D0%B0%D1%83%D1%82%D0%B8%D0%BD%D0%B0
http://ru.wikipedia.org/wiki/%D0%98%D0%BD%D1%84%D0%BE%D1%80%D0%BC%D0%B0%D1%86%D0%B8%D1%8F
http://ru.wikipedia.org/wiki/%D0%A1%D0%B5%D0%BC%D0%B0%D0%BD%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D1%81%D0%B5%D1%82%D1%8C
http://ru.wikipedia.org/wiki/%D0%A1%D0%B5%D0%BC%D0%B0%D0%BD%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D1%81%D0%B5%D1%82%D1%8C
http://ru.wikipedia.org/wiki/%D0%9E%D0%BD%D1%82%D0%BE%D0%BB%D0%BE%D0%B3%D0%B8%D1%8F_%28%D0%B8%D0%BD%D1%84%D0%BE%D1%80%D0%BC%D0%B0%D1%82%D0%B8%D0%BA%D0%B0%29
http://ru.wikipedia.org/wiki/%D0%92%D1%8B%D0%B2%D0%BE%D0%B4_%28%D1%80%D0%B0%D1%81%D1%81%D1%83%D0%B6%D0%B4%D0%B5%D0%BD%D0%B8%D0%B5%29
http://ru.wikipedia.org/wiki/%D0%91%D0%B5%D1%80%D0%BD%D0%B5%D1%80%D1%81-%D0%9B%D0%B8,_%D0%A2%D0%B8%D0%BC
http://ru.wikipedia.org/wiki/%D0%91%D0%B5%D1%80%D0%BD%D0%B5%D1%80%D1%81-%D0%9B%D0%B8,_%D0%A2%D0%B8%D0%BC
http://ru.wikipedia.org/wiki/%D0%A1%D0%B5%D0%BC%D0%B0%D0%BD%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%BF%D0%B0%D1%83%D1%82%D0%B8%D0%BD%D0%B0#cite_note-sa-eng-0
Експертні та інтелектуальні інформаційні системи
46
развитие средств аннотирования докумен-
тов, которыми могли бы воспользоваться
Web-сервисы и специализированные ком-
пьютерные программы-агенты при обра-
ботке сложных пользовательских запро-
сов.
Консорциум W3 решил [5], что для
практического использования СП доста-
точно разработать: универсальный язык
представления знаний, использующего
ссылки на онтологии (RDF); языки описа-
ния онтологий (OWL); языки описания
Web-сервисов (WSDL, OWL-S); инстру-
ментарий создания и обработки докумен-
тов (Jena, Haystack, Protege); языки запро-
сов к знаниям (SPARQL); логический вы-
вод знаний; семантические поисковые си-
стемы (SHOE); программы-агенты.
Анализу последних тенденций раз-
вития СП и посвящена данная работа.
1. Семантическая паутина
СП представляет собой систему с
зачатками искусственного интеллекта. В
этой паутине компьютеры могут взаимо-
действовать друг с другом без участия че-
ловека, а приложения автоматически рас-
познают информацию. Для построения
глобальной базы знаний паутины проект
предполагает внедрение во все документы,
Web-страницы и файлы специальных ме-
таданных, указывающих на то, где, когда,
кем был создан файл, как он отформатиро-
ван, для чего предназначен, а также ис-
пользование расширений языка онтологий
OWL (Web Ontology Language) вместе с
RDF (Resource Definition Framework).
Основные функциональные воз-
можности СП можно разбить на несколько
базисных групп в соответствии с типом
сервиса, который они предоставляют поль-
зователям. Рассмотрим боле детально каж-
дую из них [6–8].
Первую группу представляет тип
сервиса названый обзором ресурсов. Они
должны помочь пользователю в осознании
и интерпретации связей среды разнород-
ного контента. Типичным сценарием для
таких систем является указание пользова-
телем некоторого понятия, отправной точ-
ки и вывод в той или иной форме всего
множества связанных с ним ресурсов. Для
таких систем нет аналогов внутри преды-
дущего поколения Web. Понятно, что реа-
лизация сервиса обзора ресурсов базирует-
ся на сервисах поиска.
Последние, широко распространен-
ные в Интернете, но для их трансформа-
ции в СП требуется существенное измене-
ние основной функции – результатом по-
иска являются факты, а не контент.
Реализацией сервиса обзора ресур-
сов занимаются многие проекты [3, 6]. В
основном они различаются используемы-
ми методами поиска, формами представ-
ления и обработки "развёрнутых ответов",
обзором контекста. Для оптимизации ра-
боты таких сервисов видится необходи-
мым коллективное накопление знаний в
форме разнообразных хранилищ знаний.
Основную функцию пополнения
знаний в хранилищах несут непосред-
ственно пользователи (пользователи соци-
альных сетей). Ярким примером таких си-
стем являются Wiki-системы. Характерной
особенностью последних являются разви-
тые методологии способности пополнения
знания из внешних источников и их моди-
фикации. Все это обуславливает создание
эффективных сервисов интеллектуальной
обработки данных паутины: интерпрети-
рование данных, построение метаданных,
определение семантических связей, по-
строение логических выводов и т. п.
В сети Интернет на момент появле-
ния СП уже были созданы специализиро-
ванные хранилища больших массивов
данных. Основной проблемой их прямого
использования в СП была (есть) либо их
разнообразная структурированность, либо
ее отсутствие вообще. Анализ таких дан-
ных затруднителен не только для машины,
но и для человека. Для устранения этих
недостатков было предложено использо-
вание языка описания ресурсов Resource
Description Framework (RDF) – низкоуров-
невого языка описания метаданных [9].
Смысл в нем кодируется с помо-
щью деревьев глубины 3. Каждое дерево
состоит из субъекта (подлежащего), свой-
ства (сказуемое) и объекта (дополнение). В
языке используется модель представления
знаний объект-субъект-свойство, но все
элементы таких триплетов должны являть-
http://ru.wikipedia.org/wiki/Resource_Description_Framework
http://ru.wikipedia.org/wiki/Resource_Description_Framework
Експертні та інтелектуальні інформаційні системи
47
ся уникальными идентификаторами ресур-
сов (URI согласно стандартам W3C – стро-
ка определенного формата, адресующая
реально существующий объект). Благодаря
использованию такого URI, при доступе к
одному из звеньев триплета можно авто-
матически восстановить всю цепочку в це-
лом, формировать сети из взаимосвязан-
ных объектов и обеспечивается привязка
каждого понятия к единому определению
в Сети.
В начале RDF документа идет спи-
сок ссылок н а онтологии и каждая вер-
шина может задаваться строкой или ссыл-
кой на объект из некоторой онтологии.
Вершины могут иметь дополнительные
квалификаторы. Универсальность объек-
тов, служащих элементами логических вы-
ражений языка позволяет добиться требу-
емого уровня повторного использования
данных и их переносимости, унификации
представления информации об объекте.
На основе RDF строятся более высоко-
уровневые языки (RDF schema, OWL),
позволяющие создавать специализирован-
ные форматы для представления много-
образия различных типов объектов и пол-
ноценные онтологии соответственно.
Консорциумом W3 был разработан
и специализированный язык запросов к
RDF-хранилищам – SPARQL, позволяю-
щий осуществлять сложные выборки из
массивов метаданных [10]. Все это позво-
ляет нам утверждать о существовании уже
сейчас формальной базы построения необ-
ходимого для СП полностью распределён-
ного, но единого хранилища данных. Кон-
сорциум провел значительную работу как
по созданию стандартов представления
данных, так и разработке набора соглаше-
ний об именовании ресурсов и способах
выдачи метаинформации.
На определенном уровне абстрак-
ции можно сказать, что построение и
развитие СП для практического ис-
пользования основывается на оптимиза-
ции использования трех базисных компо-
нент: программ-агентов, расширяемого
языка разметки XML и Web-онтологий.
Чаще всего набор используемых техноло-
гий оптимизации представляют в виде
специализированного «пирога», изобра-
женного на рис. 1 [11].
Рис. 1. «Пирог» уровней СП
Нижние слои пирога (по крайней
мере до RDF + RDF Schema) уже стали ре-
альностью. Прослойка онтологий пока ча-
стично реализована и продолжает активно
совершенствоваться [12, 13]. Верхняя
часть стека требует существенного разви-
тия на уровне Паутины, но успешно ис-
пользуется на локальном и отраслевом
уровне. Нельзя сказать, что структура СП
этим ограничивается, поскольку появля-
ются новые технологии благодаря иссле-
дованиям и практическим испытаниям.
В основе семантической сети ле-
жат три принципа: агрегация, безопасность
и логика. Агрегация означает совместное
использование любых данных, путем со-
здания соответствующей семантической
информация (онтологии). В основу без-
опасности предоставления и работы с
информацией положены цифровые подпи-
си (Crypto). Логика (Unifying Logic) – это
набор правил описания информационной
структуры данных, протоколы и язык опи-
сания страниц. Самый нижний уровень
CП – это URI, унифицированный иден-
тификатор, определяющий способ записи
адреса произвольного ресурса и дающий
возможность просто выражать те поня-
тия, которыми пользуется потребитель.
Експертні та інтелектуальні інформаційні системи
48
Типичными примерами URI-идентифи-
каторов являются URL-адреса в Интернете
(ссылка на адресуемый объект, например,
Web-страницу, файл или ящик электрон-
ной почты). В СП URI используются также
для именования объектов, то есть каждый
URI однозначно называет некоторый объ-
ект. Свои URI в СП есть не только у стра-
ниц, но и у объектов реального мира (лю-
дей), и даже у абстрактных понятий
(например, у свойств «название», «слож-
ность»). Поскольку URI глобально уни-
кальны, они позволяют называть одни и те
же предметы в разных местах в семантиче-
ской паутине. При этом URI протокола
HTTP (т. е. начинающиеся с http://) можно
одновременно использовать как адреса до-
кументов, содержащих «машинно-
читаемые» описания этих предметов.
Следующий уровень – язык XML
как базовая форма разметки и средств,
предназначенных для определения и опи-
сания классов XML-документов (DTD,
XML-схемы), развертывания средства
описания ресурсов RDF и RDF-схемы,
объясняющие, как состыковывать XML-
данные в сети и строить каталоги и слова-
ри понятий. RDF позволяет выполнять по-
иск необходимых понятий в СП.
Основное методологическое назна-
чение модели RDF в СП состоит в описа-
нии связей (отношений) между сетевыми
ресурсами и информацией. Система, рабо-
тая только с тегами XML, не может найти
суть их смыслового наполнения. Поэтому
была начата разработка стандартa языка
формального описания содержания сете-
вых ресурсов RDF. Фактически он являет-
ся связующим звеном между XML-
документами и средствами, обеспечиваю-
щими поиск и навигацию на основе логи-
ческих утверждений. RDF представляет
собой технологию выражения смысла тер-
минов и понятий в виде, доступном для
обработки программами. Эта технология
предназначена для стандартизации опре-
делений и использования метаданных,
описывающих Web-ресурсы, а также для
представления самих данных, содержа-
щихся в этих ресурсах. Использование URI
для кодирования информации в документе
обеспечивает единственность привязки
понятия к его определению в СП. Утвер-
ждения, кодируемые с помощью RDF, в
дальнейшем можно интерпретировать с
помощью онтологий, созданных по стан-
дартам RDF Schema и OWL, чтобы полу-
чать из них логические заключения.
Техническую часть семантической
паутины составляет семейство стандартов,
включающее XML, XML Schema, RDF,
RDF Schema, OWL и другие. XML предо-
ставляет синтаксис для определения
структуры документа, подлежащего ма-
шинной обработке, не неся семантической
нагрузки. XML Schema определяет огра-
ничения на структуру XML-документа.
Стандартный синтаксический анализатор
языка XML в состоянии проверить произ-
вольный XML-документ на соответствие
его структуры, так называемой схеме до-
кумента, описанной в XML Schema. RDF
представляет собой простой способ описа-
ния экземплярных данных в формате субъ-
ект-отношение-объект. Существует стан-
дартизованное отображение этих троек на
XML-документы предопределённой струк-
туры (то есть консорциумом W3 определе-
на схема XML-документов, содержащих
RDF-описания), а также на другие форма-
ты представления (например, в нотацию
N3). RDF Schema описывает набор атрибу-
тов (здесь их точнее назвать отношения-
ми), таких, как rdfs:Class, для определения
новых типов RDF-данных. Языком под-
держивается также отношение наследова-
ния типов rdfs:subClassOf. OWL расширяет
возможности по описанию новых типов (в
частности, добавлением перечислений), а
также позволяет описывать новые типы
данных RDF Schema в терминах уже суще-
ствующих (например, определять тип, яв-
ляющийся пересечением или объединени-
ем двух существующих). Он также может
использоваться для явного представления
значения терминов и отношений между
терминами в словарях. SWRL (Semantic
Web Rule Language) [14] расширяет OWL
возможностью определения Хорн-
подобных правил.
Необходимость описания метадан-
ных приводит к дублированию информа-
ции. Каждый документ должен быть со-
здан в двух экземплярах: размеченным для
http://ru.wikipedia.org/wiki/%D0%AD%D0%BB%D0%B5%D0%BA%D1%82%D1%80%D0%BE%D0%BD%D0%BD%D0%B0%D1%8F_%D0%BF%D0%BE%D1%87%D1%82%D0%B0
http://ru.wikipedia.org/wiki/%D0%AD%D0%BB%D0%B5%D0%BA%D1%82%D1%80%D0%BE%D0%BD%D0%BD%D0%B0%D1%8F_%D0%BF%D0%BE%D1%87%D1%82%D0%B0
http://ru.wikipedia.org/wiki/HTTP
http://ru.wikipedia.org/w/index.php?title=RDF_Schema&action=edit&redlink=1
http://ru.wikipedia.org/wiki/Web_Ontology_Language
http://ru.wikipedia.org/wiki/%D0%92%D1%8B%D0%B2%D0%BE%D0%B4_%28%D1%80%D0%B0%D1%81%D1%81%D1%83%D0%B6%D0%B4%D0%B5%D0%BD%D0%B8%D0%B5%29
http://ru.wikipedia.org/wiki/XML
http://ru.wikipedia.org/wiki/XML_Schema
http://ru.wikipedia.org/wiki/RDF
http://ru.wikipedia.org/w/index.php?title=RDF_Schema&action=edit&redlink=1
http://ru.wikipedia.org/wiki/Web_Ontology_Language
http://ru.wikipedia.org/wiki/XML
http://ru.wikipedia.org/wiki/XML_Schema
http://ru.wikipedia.org/wiki/RDF
http://ru.wikipedia.org/wiki/%D0%9D%D0%BE%D1%82%D0%B0%D1%86%D0%B8%D1%8F_3
http://ru.wikipedia.org/w/index.php?title=RDF_Schema&action=edit&redlink=1
http://ru.wikipedia.org/wiki/Web_Ontology_Language
http://ru.wikipedia.org/wiki/%D0%9F%D0%B5%D1%80%D0%B5%D1%87%D0%B8%D1%81%D0%BB%D0%B8%D0%BC%D1%8B%D0%B9_%D1%82%D0%B8%D0%BF
http://ru.wikipedia.org/wiki/%D0%9F%D0%B5%D1%80%D0%B5%D1%81%D0%B5%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_%D0%BC%D0%BD%D0%BE%D0%B6%D0%B5%D1%81%D1%82%D0%B2
http://ru.wikipedia.org/wiki/%D0%9E%D0%B1%D1%8A%D0%B5%D0%B4%D0%B8%D0%BD%D0%B5%D0%BD%D0%B8%D0%B5_%D0%BC%D0%BD%D0%BE%D0%B6%D0%B5%D1%81%D1%82%D0%B2
http://ru.wikipedia.org/wiki/%D0%9E%D0%B1%D1%8A%D0%B5%D0%B4%D0%B8%D0%BD%D0%B5%D0%BD%D0%B8%D0%B5_%D0%BC%D0%BD%D0%BE%D0%B6%D0%B5%D1%81%D1%82%D0%B2
Експертні та інтелектуальні інформаційні системи
49
чтения людьми, а также в машинно-
ориентированном формате. Потребность
объединения форматов привела к созда-
нию так называемых микроформатов [15]
и языка RDFа [16]. Последний является
вариантом языка RDF и отличается от него
тем, что не определяет собственного син-
таксиса, а предназначен для внедрения в
XML-атрибуты XHTML-страниц.
Существуют и другие модификации
RDF, например RSS (Really Simple
Syndication) версий 0.90 и 1.0 – это семей-
ство форматов для распространения кон-
тента (описания лент новостей, анонсов
статей, изменений в блогах), основанных
на стандарте XML [17]. Формат быстро
стал чрезвычайно популярным за счёт уз-
кой категоризации подмножества исполь-
зуемых метаданных. В нем субъектом
тройки всегда является сайт-источник
RSS-файла, а в качестве отношений ис-
пользуются самые очевидные свойства до-
кументов, имеющие отношение к часто
обновляющимся источникам информации:
дата написания, автор, постоянная ссылка.
Заметим, что формат RSS версии 2.0, хотя
и не является форматом, основанным на
RDF, позволяет внедрение произвольного
XML-содержимого, используя простран-
ство имён rdf.
Микроданные (HTML microdata) –
это стандарт семантической разметки
HTML-страниц, с помощью атрибутов,
описывающих смысл информации, содер-
жащейся в тех или иных HTML-элементах,
и позволяющие «понимать» контент веб-
страниц программами-агентами (находить
и извлекать необходимые данные). RSS
используется для нахождения информации
на сайтах, подкастах и торренткастах.
Подкаст – цифровой медиа-файл или на-
бор таких файлов, которые распространя-
ются Паутиной. Он представляет новый
способ распространения аудио и видео в
Паутине, который позволяет создавать та-
кие материалы каждому желающему. Тор-
ренткасты – RSS-потоки с прикреплен-
ными к ним .torrent-файлами (файл мета-
данных в bencode формате), работающими
с P2P-протоколом BitTorrent [18].
BitTórrent («битовый поток») –пиринговый
сетевой протокол для кооперативного об-
мена файлами через Паутину. Файлы пе-
редаются частями, каждый torrent-клиент,
получая (скачивая) данные части, при этом
отдаёт (закачивает) их другим клиентам,
что снижает нагрузку и зависимость от
каждого клиента-источника, обеспечива-
ет решение задачи избыточности данных.
Протокол не имеет системы поиска.
Для каждого файла создаётся информаци-
онный сопровождающий .torrent-файл,
распространяющийся через любые каналы
связи: специализированные Web-сервера,
домашние страницы пользователей сети,
электронную почту, публикацию в блогах
или новостных лентах RSS. Он содержит
метаинформацию (к примеру, хэш-сумму,
адрес трекера) о распределяемых данных.
Данные распределяются с помощью соб-
ственного коммуникационного протокола
на базе TCP/IP.
Основной принцип работы прото-
кола: раздача файла полностью контроли-
руется трэкером (адрес которого находит-
ся в torrent-файле), поэтому пользователь,
качающий себе файл (он называется ли-
чер) сам начинает раздавать, как только
скачивает первую пригодную для этого
часть.
Архитектура BitTorrent предусмат-
ривает наличие у файла, выкладываемого в
сеть, единственного владельца, который и
заинтересован в его распространении.
Именно первоначальный обладатель файла
генерирует torrent-файл. Клиент, в свою
очередь, загружает файл (на HTTP, FTP
или просто раздаёт каким либо образом) с
расширением torrent, где содержится ин-
формация об адресе владельца в Интерне-
те, имени и размере нужного файла, а так-
же его хеш. Это всё необходимо для от-
слеживания хода процесса, контроля над
ним и ликвидации возможности загрузки
пользователями неполного или пустого
файла.
Микроформаты (microformats, ино-
гда сокращенно μF или uF) – это способ
семантически размечать сведения о разно-
образных сущностях на Web-страницах,
используя стандартные элементы языка
HTML (или XHTML) [19]. Пользователь
может воспринимать страницу с размечен-
ным микроформатом как обычную Web-
http://ru.wikipedia.org/wiki/%D0%9C%D0%B8%D0%BA%D1%80%D0%BE%D1%84%D0%BE%D1%80%D0%BC%D0%B0%D1%82%D1%8B
http://ru.wikipedia.org/wiki/%D0%A1%D0%B5%D0%BC%D0%B0%D0%BD%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%BF%D0%B0%D1%83%D1%82%D0%B8%D0%BD%D0%B0#cite_note-microf-6
http://ru.wikipedia.org/wiki/RDF
http://ru.wikipedia.org/wiki/%D0%A1%D0%B5%D0%BC%D0%B0%D0%BD%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%BF%D0%B0%D1%83%D1%82%D0%B8%D0%BD%D0%B0#cite_note-7
http://ru.wikipedia.org/wiki/RDF
http://ru.wikipedia.org/wiki/%D0%9C%D0%B8%D0%BA%D1%80%D0%BE%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D0%B5
http://uk.wikipedia.org/wiki/%D0%A4%D0%B0%D0%B9%D0%BB
http://ru.wikipedia.org/wiki/%D0%9C%D0%B5%D1%82%D0%B0%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D0%B5
http://ru.wikipedia.org/wiki/%D0%9C%D0%B5%D1%82%D0%B0%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D0%B5
http://ru.wikipedia.org/wiki/Bencode
http://ru.wikipedia.org/wiki/%D0%91%D0%B8%D1%82%D0%BE%D0%B2%D1%8B%D0%B9_%D0%BF%D0%BE%D1%82%D0%BE%D0%BA
http://ru.wikipedia.org/wiki/%D0%9E%D0%B4%D0%BD%D0%BE%D1%80%D0%B0%D0%BD%D0%B3%D0%BE%D0%B2%D0%B0%D1%8F_%D1%81%D0%B5%D1%82%D1%8C
http://ru.wikipedia.org/wiki/%D0%A1%D0%B5%D1%82%D0%B5%D0%B2%D0%BE%D0%B9_%D0%BF%D1%80%D0%BE%D1%82%D0%BE%D0%BA%D0%BE%D0%BB
http://ru.wikipedia.org/wiki/%D0%A4%D0%B0%D0%B9%D0%BB
http://ru.wikipedia.org/wiki/%D0%98%D0%BD%D1%82%D0%B5%D1%80%D0%BD%D0%B5%D1%82
http://ru.wikipedia.org/wiki/%D0%9A%D0%BB%D0%B8%D0%B5%D0%BD%D1%82-%D1%81%D0%B5%D1%80%D0%B2%D0%B5%D1%80
http://ru.wikipedia.org/wiki/%D0%98%D0%B7%D0%B1%D1%8B%D1%82%D0%BE%D1%87%D0%BD%D0%BE%D1%81%D1%82%D1%8C_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85
Експертні та інтелектуальні інформаційні системи
50
страницу (через браузер); при этом про-
граммы-обработчики способны извлечь из
такой страницы структурированную ин-
формацию, следуя определенным согла-
шениям.
При использовании микроформатов
к существующей HTML-разметке добав-
ляются новые составляющие, наполненные
особым, заранее определенным смыслом.
Например, с помощью атрибута class мож-
но обозначить смысл того или иного
HTML-элемента на странице (этот атрибут
определен для всех элементов) и в даль-
нейшем такую разметку можно обрабаты-
вать машинными средствами.
Каждый микроформат решает опре-
деленную, отдельную задачу. Например,
hCalendar (сокращенно от HTML
iCalendar) – микроформат для представле-
ния семантической информации о событи-
ях в формате календаря iCalendar на
(X)HTML-страницах. Обогатить пользова-
тельское взаимодействие с Web-фрагмен-
том можно с помощью визуальных эле-
ментов и встроенных (или глобальных)
стилей CSS [20].
Каскадные таблицы стилей CSS
(Cascading Style Sheets) фактически явля-
ются формальным языком описания внеш-
него вида документа созданного с исполь-
зованием языка разметки. Таблицы ис-
пользуются создателями Web-страниц в
качестве средства описания, оформления
внешнего вида Web-страниц для задания
цветов, шрифтов, расположения отдель-
ных блоков. Язык может также применять-
ся к любым XML-документам.
Форматы описания метаданных в
СП предполагают проведение логического
вывода на этих метаданных. Формализм,
лежащий в основе обработки формата, да-
ёт возможность делать заключения о свой-
ствах данных, представленных в этом
формате. Особенно это относится к языку
OWL. Его базой являются дескриптивные
логики, а сам язык разбит на три вложен-
ных подмножества (в порядке вложенно-
сти): OWL Lite, OWL DL и OWL Full [21].
В работе [22] доказано, что задача логиче-
ского вывода на метаданных с вырази-
тельностью OWL Lite принадлежит к клас-
су P. OWL DL описывает максимально
разрешимое подмножество дескриптивных
логик, правда, некоторые запросы здесь
могут выполняться за экспоненциальное
время. OWL Full реализует все существу-
ющие конструкторы дескриптивных логик,
но не каждый запрос в этом подмножестве
языка может быть удовлетворен.
Язык сетевых онтологий OWL
предназначен для описания классов и от-
ношений между ними, которые присущи
как для сетевых документов, так и прило-
жений. Многие приложения могут "по-
нимать" данные и работать с ними как с
информацией, а также корректно прове-
рять данные благодаря синтаксическому
взаимодействию сетей. Такое взаимодей-
ствие требует проведения преобразования
между терминами с помощью контент-
анализа. Сами онтологии образуют систе-
му, состоящую из наборов понятий и
утверждений об этих понятиях, на основе
которых можно строить классы, объекты и
отношения. Отдельная онтология опреде-
ляет семантику конкретной предметной
области и способствует установлению свя-
зей между значениями ее элементов.
Класс – это концепция в онтологии,
основной блок OWL. Классы традиционно
образуют таксономическую иерархию в
виде системы «подкласс-надкласс». Для
описания классов поддерживается шесть
базовых способов: именования (named),
пересечения (intersection), объединения
(union), дополнения (complement), ограни-
чения (restrictions), перечисления
(enumerated). Элементами классов являют-
ся индивидуальные элементы, которые в
RDF будут объектами и субъектами. Кро-
ме определения таксономии, свойства поз-
воляют делать общие утверждения (стро-
ить факты) о элементах классов и особые
утверждения об индивидах. Свойства-
объекты связывают индивидуальные эле-
менты между собой, a свойства-значения
(datatype properties) – индивидуальные
элементы со значениями типов данных,
определенных с помощью XML. Характе-
ристиками свойств являются симметрич-
ность, транзитивность и функциональ-
ность. К классам и свойствам применяются
различные ограничения, например, огра-
http://ru.wikipedia.org/wiki/%D0%A4%D0%BE%D1%80%D0%BC%D0%B0%D0%BB%D1%8C%D0%BD%D1%8B%D0%B9_%D1%8F%D0%B7%D1%8B%D0%BA
http://ru.wikipedia.org/wiki/%D0%AF%D0%B7%D1%8B%D0%BA_%D1%80%D0%B0%D0%B7%D0%BC%D0%B5%D1%82%D0%BA%D0%B8
http://ru.wikipedia.org/wiki/%D0%92%D0%B5%D0%B1-%D1%81%D1%82%D1%80%D0%B0%D0%BD%D0%B8%D1%86%D0%B0
http://ru.wikipedia.org/wiki/%D0%92%D0%B5%D0%B1-%D1%81%D1%82%D1%80%D0%B0%D0%BD%D0%B8%D1%86%D0%B0
http://ru.wikipedia.org/wiki/%D0%A6%D0%B2%D0%B5%D1%82
http://ru.wikipedia.org/wiki/%D0%A8%D1%80%D0%B8%D1%84%D1%82
http://ru.wikipedia.org/wiki/XML
http://ru.wikipedia.org/wiki/%D0%9B%D0%BE%D0%B3%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B9_%D0%B2%D1%8B%D0%B2%D0%BE%D0%B4
http://ru.wikipedia.org/wiki/%D0%9B%D0%BE%D0%B3%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B9_%D0%B2%D1%8B%D0%B2%D0%BE%D0%B4
http://ru.wikipedia.org/wiki/Web_Ontology_Language
http://ru.wikipedia.org/wiki/%D0%94%D0%B5%D1%81%D0%BA%D1%80%D0%B8%D0%BF%D1%86%D0%B8%D0%BE%D0%BD%D0%BD%D0%B0%D1%8F_%D0%BB%D0%BE%D0%B3%D0%B8%D0%BA%D0%B0
http://ru.wikipedia.org/wiki/%D0%94%D0%B5%D1%81%D0%BA%D1%80%D0%B8%D0%BF%D1%86%D0%B8%D0%BE%D0%BD%D0%BD%D0%B0%D1%8F_%D0%BB%D0%BE%D0%B3%D0%B8%D0%BA%D0%B0
http://ru.wikipedia.org/wiki/%D0%A1%D0%B5%D0%BC%D0%B0%D0%BD%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%BF%D0%B0%D1%83%D1%82%D0%B8%D0%BD%D0%B0#cite_note-9
http://ru.wikipedia.org/wiki/%D0%A1%D0%B5%D0%BC%D0%B0%D0%BD%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%BF%D0%B0%D1%83%D1%82%D0%B8%D0%BD%D0%B0#cite_note-10
http://ru.wikipedia.org/wiki/%D0%9A%D0%BB%D0%B0%D1%81%D1%81_P
http://ru.wikipedia.org/wiki/%D0%9A%D0%BB%D0%B0%D1%81%D1%81_P
http://ru.wikipedia.org/wiki/%D0%9A%D0%BB%D0%B0%D1%81%D1%81_EXPTIME
http://ru.wikipedia.org/wiki/%D0%9A%D0%BB%D0%B0%D1%81%D1%81_EXPTIME
Експертні та інтелектуальні інформаційні системи
51
ничение мощности множества, и команды
для склеивания (эквивалентности) классов.
Динамическую часть СП представ-
ляют семантические Web-сервисы SWS
(Semantic Web Services) – доступные че-
рез Паутину и пригодные для поиска, ком-
позиции и выполнения [23]. Семантиче-
ский Web-сервис предоставляет пользова-
телю как описание интерфейса, так и
описание его семантики (что сервис де-
лает, его предметную область, назначения
и т. п.). Традиционно для описания ин-
терфейса используют язык описания Web-
сервисов и доступа к ним WSDL (Web
Services Description Language), уточняю-
щий типы передаваемых сервису дан-
ных, возвращаемые значения и генери-
руемые ошибки. WSDL-описания серви-
сов изначально были предназначены для
машинной обработки. Стандарт WSDL до-
пускает наличие в описаниях дополни-
тельного XML-содержимого, что позволя-
ет не выносить метаданные из WSDL-
файлов. Для построения SWS использу-
ются языки RDF, RDF Schema, OWL и
онтологии OWL-S, описывающие базо-
вую терминологию предметной области.
Онтология OWL-S состоит из четырех он-
тологий – онтологии сервиса, онтологии
модели сервиса, онтологии процесса и он-
тологии базы. Можно рассматривать
OWL-S как семантическое расширение
UDDI-описания ( Universal Description
Discovery & Integration) – инструмента для
расположения описаний WSDL, чтобы
другие организации смогли их найти и ин-
тегрировать в свои системы. В этом слу-
чае, семантика сервиса характеризуется
семантикой четырех его характеристик
(IOPE): входных параметров (inputs), вы-
ходных параметров (outputs), предвари-
тельных условий (preconditions), эффектов
выполнения (effects). Использование се-
мантических Web-сервисов позволяет про-
граммным агентам реализовывать автома-
тический поиск и композицию подходя-
щих сервисов для решения поставленных
задач. Правда, ощутимый эффект от внед-
рения сервисно-ориентированной архитек-
туры пока наблюдается только в узкоспе-
циализированных отраслях, например, в
интеграции корпоративных приложений.
Базисные принципы реализации СП
были использованы в разных отдельных
проектах. Среди них традиционно выде-
ляют два: Dublin Core и DBpedia. Проект
«Дублинское ядро» (Dublin Core), реали-
зуемый инициативной организацией Dub-
lin Core Metadata Initiative (DCMI). Это от-
крытый проект разработки стандартов ме-
таданных, которые были бы независимы от
платформ и подходили бы для использова-
ния в различных областях. DCMI занима-
ется разработкой словарей метаданных
общего назначения, стандартизирующих
описания ресурсов в формате RDF [24].
Второй проект DBpedia реализовывал из-
влечение структурированной информации
из данных, созданных в рамках проекта
Wikipedia. Для этого пользователь должен
запрашивать информацию, основанную на
отношениях и свойствах ресурсов Вики-
педии, в том числе ссылки на соответ-
ствующие базы данных. Проект DBpedia
использует RDF для представления извле-
ченной информации. По состоянию на
сентябрь 2011, базы данных DBpedia со-
стоят из более чем 3,64 млн. понятий [25].
Подводя итоги общего обзора нель-
зя упустить список основных действую-
щих рекомендаций W3C, связанных с су-
ществованием СП:
XML (www.w3c.org/XML) обеспе-
чивает синтаксис для структурированных
документов, но не налагает никаких се-
мантических ограничений на содержание
этих документов.
XML Schema (www.w3c.org/XML/-
Schema) определяет структуру документов
XML, а также дополняет XML конкретны-
ми типами данных.
RDF (www.w3c.org/TR/2002/WD-
rdf-concepts-20021108) позволяет описать
модель данных для ресурсов и отношения
между ними, обеспечивает простую семан-
тику для этой модели данных, представляя
их в синтаксисе XML.
RDF Schema (www.w3c.org/TR/-
2002/ WD-rdf-schema-20021112) предо-
ставляет средства для описания свойств и
классов RDF-ресурсов, а также семантику
для иерархий-обобщений таких свойств и
классов.
http://ru.wikipedia.org/wiki/WSDL
http://ru.wikipedia.org/wiki/%D0%94%D1%83%D0%B1%D0%BB%D0%B8%D0%BD%D1%81%D0%BA%D0%BE%D0%B5_%D1%8F%D0%B4%D1%80%D0%BE
http://ru.wikipedia.org/wiki/%D0%A1%D0%B5%D0%BC%D0%B0%D0%BD%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%BF%D0%B0%D1%83%D1%82%D0%B8%D0%BD%D0%B0#cite_note-11
http://ru.wikipedia.org/wiki/%D0%A1%D0%B5%D0%BC%D0%B0%D0%BD%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%BF%D0%B0%D1%83%D1%82%D0%B8%D0%BD%D0%B0#cite_note-autogenerated1-15
http://www.w3c.org/TR/%1f2002/
http://www.w3c.org/TR/%1f2002/
Експертні та інтелектуальні інформаційні системи
52
OWL (http://www.w3.org/TR/owl-
features/) расширенные возможности опи-
сания свойств и классов.
Онтологии составляют фундамент
СП и представляют собой описание на
некотором формальном языке понятий
некоторой предметной области и отноше-
ний между ними [26]. Онтологии во мно-
гом похожи на тезаурусы и таксономии,
но на самом деле шире их, поскольку
предоставляют дополнительные средства
для описания структуры описываемых
данных. Поскольку по своей сути онто-
логии – это информация об информации,
то они являются метаданными. Онтоло-
гический уровень формализует накоп-
ленные знания, определяя и объединяя
терминологию различных предметных
областей.
Среди наиболее используемых
определений онтологии выделяют сле-
дующее [27]. Онтология – это "специфи-
кация концептуализации предметной об-
ласти", или упрощенно, документ или
файл, формально задающий отношения
между терминами (словарь понятий пред-
метной области и совокупность явным
образом выраженных предположений
относительно смысла этих понятий). Ча-
ще всего онтология представляется как
иерархия понятий, связанных отношени-
ями некоторых определенных видов. Та-
кие определения онтологий используют-
ся в различных классификациях. Разви-
тые онтологии формализуются средства-
ми языков логики и допускают возмож-
ности логического вывода.
Разработка языка описания струк-
турированных онтологий OWL стала в
последнее время одним из наиболее важ-
ных звеньев работ по усовершенствова-
нию СП, проводимых консорциумом
W3C. Еще в 2004 году консорциум при-
своил языку OWL статус рекомендован-
ной к реализации технологии. В рамках
OWL онтология – это совокупность
утверждений, задающих отношения меж-
ду понятиями и определяющих логиче-
ские правила для рассуждений о них.
Программы-агенты могут "распознавать"
смысл семантических данных на Web-
страницах, используя гиперссылки, ве-
дущие на соответствующие онтологиче-
ские ресурсы. Онтология может включать
описания классов, свойств и их примеры
(индивиды). Формальная семантика OWL
описывает, как получить логические выво-
ды на основе онтологий, т. е. получить
факты, которые не представлены букваль-
но, а следуют из семантики онтологии. Эти
выводы могут базироваться на анализе од-
ного документа или множества докумен-
тов, распределенных в Паутине.
На практике создание онтологий
начинается с построения одной или
нескольких иерархий классов понятий,
составляющих предметную область, каж-
дый из которых может иметь подклас-
сы, представляющие собой более точные
понятия, чем исходный класс [28]. Клас-
сы могут содержать атрибуты, которые
описывают свойства и внутреннюю стру-
ктуру понятий, лежащих в основе клас-
сов. Фундаментальным таксономическим
конструктором для классов является
rdfs:subClassOf. Он связывает более част-
ный класс с более общим классом. Если X
– подкласс Y, то каждый представитель X
– также представитель Y. Отношение
rdfs:subClassOf является транзитивным.
Если X – подкласс Y, и Y – подкласс Z, то
X – подкласс Z.
Все подклассы наследуют атрибуты
родительских классов. Каждый атрибут
класса помимо названия имеет тип значе-
ния, разрешенные значения, число значе-
ний (мощность). Традиционно онтологии
содержат и экземпляры классов (классы, в
которых установлены значения всех их ат-
рибутов). Это позволяет плавно перехо-
дить от построения онтологий к построе-
нию баз знаний.
Процесс разработки онтологии тра-
диционно включает: выделение глоссария
терминов (понятий) для исследования
свойств и характеристик представленных в
нем терминов; построение списка точных
определений терминов из глоссария; по-
строение деревьев классификации понятий
(иерархии классов) на базе таксономиче-
ских отношений; выделение из не задей-
ствованных при составлении деревьев
Експертні та інтелектуальні інформаційні системи
53
классификации понятий атрибутов классов
и их возможных значений для установки
основных связей между классами; необя-
зательное добавление экземпляров клас-
сов; создание экспертами правил логиче-
ских выводов для манипулирования и из-
влечения новых знаний. Этот процесс по-
хож на проектирование классов в объект-
но-ориентированном программировании.
Отличием является подход к принятию
решения. Программист проектирует, бази-
руясь в основном на методы классов. Раз-
работчик онтологии принимает аналогич-
ные решения на основе структурных
свойств классов.
Для описания онтологий использу-
ются в основном традиционные языки
описания онтологий (Interlinguas, CycL);
языки, основанные на дескриптивных ло-
гиках (LOOM); языки, основанные на
фреймах (OKBC, OCML, Flogic) и языки,
основанные на Web-стандартах (XOL,
UPML, SHOE, RDF с RDFS, DAML, OIL,
OWL). Языки различаются предоставляе-
мыми средствами описания предметной
области и механизма логического вывода.
Каждый из них имеет свои преимущества
и недостатки. Особое место занимает
язык онтологий OWL. Он выступил реша-
ющей компонентой интеллектуализации,
базисом для построения семантических
сетей.
Представлениям знаний в СП при-
сущи универсальные выразительные воз-
можности, синтаксическая и семантиче-
ская интероперабельность. Семантическая
интероперабельность реализуется, напри-
мер, в онтологиях путем установлени-
ем соответствия между используемыми
терминами.
Онтологии различаются по многим
параметрам, поэтому исследователи выде-
ляют различные основания для их класси-
фикации. Эдуард Хоув [29] производит
деление в зависимости от набора элемен-
тов, содержащихся в них, а также от типов
отношений.
Классификация онтологий возмож-
на и по количеству включенных в нее по-
нятий.
Первая классификация онтологий
проходит на основе анализа уровней.
Онтология верхнего уровня (top-
ontology) насчитывает от 100 до 3000 кон-
цептов и содержит наиболее абстрактные
категории, такие например как: «сущ-
ность», «явление», «роль», «объект»,
«процесс».
Онтологии среднего уровня (mid-
level ontology) составляют приблизительно
500-100000 концептов. Их особенность в
том, что они могут представлять реальный
мир как, в общем, так и в частном случае,
но требуют использования многих аксиом.
Наиболее распространенные – он-
тологии нижнего уровня, или так назы-
ваемые онтологии предметной области
(domain ontologies). Они содержат 2000-
20000 концептов и набор отношений,
специфических для конкретной области.
Для них можно создавать много аксиом
и правил. Типичными представителями та-
ких онтологий являются SCTG (Standard
Classification of Transported Goods), Roset-
taNet, The United Nations Standard Prod-
ucts and Services Codes (UNSPSC),
NAICS (North American Industry Classifi-
cation System).
Еще один вид онтологий – лексиче-
ские или лингвистические, они связаны с
семантикой грамматических элементов. К
ним относятся WordNet, MikroKosmos,
Sensus и другие. Такие онтологии приме-
няются к задачам, связанным с обработкой
естественного языка.
Особенно важна классификация он-
тологий – по степени выразительности. В
работе [29] спектр выразительности онто-
логий представлен в виде, показанным на
рис. 2.
Выделяются две основные группы –
это легкие и тяжелые онтологии, кото-
рые уже в свою очередь делятся на 8 под-
категорий:
список термов (term list) –
список ключевых слов, который обычно
используется для ограничения значений
определенных свойств;
тезаурус определяет отноше-
ния между термами;
неформальная таксономия оп-
ределяет явную иерархию обобщения
и специализации, однако не поддержи-
вает строгого наследования;
Експертні та інтелектуальні інформаційні системи
54
Рис. 2. Уровень выразительности онтологий
формальная таксономия обеспечи-
вает строгое наследование;
онтология на основе фреймов или
классов/отношений подобная объектно-
ориентированным моделям: класс опреде-
ляется по месту в иерархии и свойствами,
вытекающие из подклассов, реализован-
ных в сущностях;
ограничение области значений при-
обретает силу для свойств и может быть
проведено по типу данных или предметной
области;
с помощью логических условий
значения свойств можно еще больше огра-
ничивать;
онтологии с наибольшей отчетли-
востью часто используют ограничения: от-
ношение-целое, инверсные отношения,
дизъюнктивное покрытия и т. п.
Тяжелые онтологии очень результа-
тивны, что было проверено на сектораль-
ном уровне, однако такие системы не то-
лерантны к нецелостности. С другой сто-
роны, легкие онтологии не позволяют де-
лать столь качественный логический вы-
вод, однако здесь на нестрогие онтологи-
ческие договоренности не так сильно вли-
яет нецелостность. Известная фраза Джима
Хендлера "A little semantics goes a long
way" [30] выражает одну из идеологий со-
временного развития СП. Поэтому легкие
онтологии стали наиболее распространен-
ными и применяемыми.
Интеллектуальные агенты
Интеллектуальные агенты – специ-
ализированные компьютерные программы,
в большинстве случаев использующиеся
при обработке сложных пользовательских
запросов. Запускаются на выполнение
пользователем, находят, используя инфор-
мацию о пользователе (профиль пользова-
теля), подходящее решение и в удобном
виде предоставляют это решение. В роли
агентов в СП часто выступают и различ-
ные Web-сервисы.
Для удовлетворения запроса агент
может параллельно или последовательно
обращаться к разным сервисам, пока не
будет найдено решение или его отсутствие
в СП. Здесь можно провести полную ана-
логию с поисковыми системами [31].
Структура такого взаимодействия показана
на рис. 3.
Агенты обмениваются информаци-
ей и правилами логических выводов, ис-
пользуемых в онтологиях, цепочками по-
строенных ими рассуждений и профилями
пользователей. Разрешение на обмен ин-
формацией между агентами дается либо
пользователем, либо происходит автома-
тически, путем использования различных
методов проверки, например посредством
цифровых подписей. Развитие СП суще-
ственно изменяет работу поисковых си-
стем [32]. Используя онтологии, поиско-
вые движки (search engine), специальные
Експертні та інтелектуальні інформаційні системи
55
Рис. 3. Поиск информации через поисковый сервис
логические движки (logical engine) они мо-
гут существенно повысить качество и точ-
ность поиска. В языке OWL имеется сред-
ства реализации описанного взаимодей-
ствия агентов. За основу были взяты раз-
работки из языка общения автономных
агентов DARPA Agent Markup Language
(DAML).
Основные принципы функциониро-
вания автономных агентов следующие:
агент не имеет полной информации, необ-
ходимой для решения поставленной зада-
чи; обрабатываемые данные распределены
в сети; вычисления выполняются агента-
ми асинхронно; взаимодействие агентов
между собой и с человеком происходит на
высоком семантическом уровне; отсут-
ствует глобальный контроль над деятель-
ностью всей системы агентов. Создаются
агенты с использованием различных тех-
нологий (CORBA, EJB, .NET) и языков
[33]. Программные агенты создаются
больше всего на Java, учитывая направ-
ленность языка на сетевое программиро-
вание и независимость от платформы.
Linked Data.Термин Linked Data
(связанные данные (СД)) предложен Ти-
мом Бернерсом-Ли в 2006 году в его заме-
тке об архитектуре Webа [34]. Linked Data
– это метод выявления, совместного испо-
льзования и объединения структурирован-
ных данных в CП для более оптимального
использования информации.
В СП люди преимущественно пуб-
ликуют неструктурированные документы
и устанавливают связь между ними с по-
мощью гиперссылок. СД меняют парадиг-
му распространения документов на пара-
дигму распространения данных. Эта тех-
нология призвана сделать данные доступ-
ными, формируя сеть данных, которую
называют «Webом данных» (Web of Data).
СД объединяет желающих сделать
свои данные общедоступными. Тимоти
Бернерс-Ли предложил для этого очень
простые правила [34]:
разнообразные объекты и понятия
«именуются», и эти имена суть строки
синтаксиса URI;
где только можно, URI начинаются
с http://..., чтобы получать информацию об
объекте простым вводом его имени в ад-
ресную строку браузера;
если клиент запрашивает URI и мо-
жет принимать данные в виде RDF, они
передаются клиенту для дальнейшей обра-
ботки. Если есть техническая возмож-
ность, то желательно предоставить воз-
можность выборки этих данных стандарт-
ными средствами и в стандартных форма-
тах (например, используя язык и протокол
SPARQL);
описание одного объекта или поня-
тия не должно быть изолированным и са-
модостаточным. Оно должно содержать
ссылки на связанные понятия, опять же в
виде URI.
Благодаря СД, связи между объек-
тами реального мира отображаются на свя-
зи между ресурсами в Интернете, исполь-
зуя которые программные агенты могут
накапливать факты о реальности в специа-
лизированных базах знаний (RDF могут
содержать связные «метаданные»). Избы-
точность данных не составляет проблемы.
http://ru.wikipedia.org/wiki/%D0%91%D0%B5%D1%80%D0%BD%D0%B5%D1%80%D1%81-%D0%9B%D0%B8,_%D0%A2%D0%B8%D0%BC
http://ru.wikipedia.org/wiki/%D0%91%D0%B5%D1%80%D0%BD%D0%B5%D1%80%D1%81-%D0%9B%D0%B8,_%D0%A2%D0%B8%D0%BC
http://ru.wikipedia.org/wiki/URI
http://www.w3.org/RDF/
http://www.w3.org/TR/rdf-sparql-query/
Експертні та інтелектуальні інформаційні системи
56
Важно, что они доступны, и определенная
их часть из множества RDF-документов
может быть автоматически отобрана для
дальнейшей обработки.
Специализированные приложения,
использующие данные из СД, позволяют
существенно улучшить обработку запроса
пользователя. Многими из таких приложе-
ний мы пользуемся и не думая, что они ра-
ботают с СД. Примером, такого приложе-
ния может служить Amarok, определяю-
щее автора песни, ее название и т.п. Разно-
образие данных и лёгкость их связывания
дают простор для их использования в раз-
личных предметных областях с различны-
ми механизмами построения вывода. Про-
стота представления данных в виде графа
с вершинами трёх видов и дугами разных
типов на первый взгляд существенно огра-
ничивает возможности их обработки. К
счастью это не так. Такое представление
характерно только для процесса ввода-
вывода. Внутри хранилища мы можем ис-
пользовать стандартные типы SQL, все ти-
пы XML Schema или полную коллекцию
базовых типов. Тесная связь представле-
ния данных в виде графа с реляционными
СУБД дает повод говорить о возможности
использования развитого аппарата работы
с данными последних. Несомненно, в мо-
дели RDF плохо с поддержкой обработки
физических величин, которые невозможно
представить в виде литерала. Но запись
этих величин при необходимости может
уточняться определенной структуризаци-
ей. Проблемы, связанные с громадными
объёмами обрабатываемых данных, по
объёму схемы обрабатываемых данных
или по числу запросов, могут быть решены
в СД при широком использовании воз-
можностей cloud computing [35] и универ-
сальных онтологий.
Среди существующих решений для
работы с данными в СП выделяют систему
с открытым кодом Protégé [36], коммерче-
ский аналог TopBraid Composer [37] и
Oracle.
TopBraid Composer определяется
как профессиональная среда разработки
для RDF, RDFS, OWL, SWRL, SPARQL,
предоставляющая полный набор средств
для покрытия всего жизненного цикла раз-
работки семантических приложений.
TopBraid Composer имеет схожие Protégé
пользовательский интерфейс и функцио-
нальность. Оба средства с помощью до-
ступных механизмов поддержки рассуж-
дений позволяют просто выполнять клас-
сификацию и проверку логической це-
лостности на основе OWL.
Наибольшими коллекциями входя-
щими в реестр Linked Data есть: LOD
(Linking Open Data) Cloud, Climate Data,
International Development Data, Public
Domain, Bibliographic Data, Energy Data,
Art. Крупнейшими поставщиками Linked
Data являются правительства Великобри-
тании и США, компания ВВС, газета NY
Times, сеть магазинов Best Buy, CNET,
Dbpedia. На сентябрь 2010 года проект
LOD содержал 220 объединенных наборов
данных и составлял 24 миллиарда RDF
триплетов, среди которых Data.gov и
data.gov wiki – 11.5 млрд., LinkedGeoData –
3 млрд., UniProt – 1.1 млрд., DBpedia – 1
млрд., US Census Data – 1 млрд., Freebase –
0.1 млрд.
2. Организация коллективных
и персональных хранилищ
знаний Wiki
Многие эксперты традиционно де-
лят информацию на две части – знания и
оперативные сведения. Оперативные све-
дения – это данные, которые требуются в
определенный момент в текущем месте
для принятия решения. От скорости при-
нятия решения зависит во многом дости-
жение цели. Системы комплексного анали-
за, которые создаются для обработки опе-
ративной информации, позволяют приме-
нять такую информацию раньше, чем она
устареет. Однако сам процесс добывания
оперативных сведений является достаточ-
но сложным и затратным.
С развитием СП и специализиро-
ванных технологий типа GooglDocs [38],
Cloud computing возникли новые возмож-
ности построения коллективных и персо-
нальных баз знаний. В принципе, можно
унифицировать требования к их построе-
нию, если отбросить тот факт, что персо-
нальная система организации знаний не
требует коллективного доступа. Поэтому,
Експертні та інтелектуальні інформаційні системи
57
требования к системе организации знаний
в основном включают: обеспечение кол-
лективного доступа, поддержку сетевого
взаимодействия, возможность работы с
гипертекстом, предоставление облегченно-
го процесса разметки, возможность за-
грузки файлов различных форматов и при-
вязка их к конкретной теме, наличие си-
стемы контроля версий.
Одна из особенностей Web 2.0 – это
создание контента совместными усилиями
пользователей. Миллионы людей создают
коллекцию ресурсов, содержащую инфор-
мацию, которая, благодаря постоянному
обновлению, является актуальной, образуя
социальную паутину (Web). Выделяют
наиболее типичные применения социаль-
ного Webа: блоги, Wiki, сайты, социаль-
ные сети.
Социальная сеть – идеальная струк-
тура для распространения информации.
Она имеет большой успех среди пользова-
телей благодаря своей простоте и понятно-
сти, что способствует активному сотруд-
ничеству. Например, если раньше браузер
воспринимался людьми исключительно
как средство просмотра информации, то
теперь это простой, мощный и удобный
инструмент создания контента в социаль-
ной паутине. Феномен простоты социаль-
ной паутины вдохновил миллионы пользо-
вателей к созданию огромного массива
информации, который может обогатить
СП достаточным количеством данных для
зарождения новой эры паутины.
С другой стороны, из-за больших
объемов неструктурированной информа-
ции, социальная паутина также страдает и
требует для дальнейшего развития внедре-
ния определенных семантических стандар-
тов и понятной семантики данных. Соци-
альная и семантическая паутины могут до-
полнять друг друга для решения общих
проблем. Однако, это довольно непростая
задача, соединить два разных мира: один,
понятный людям, другой – машинам. Од-
ним из вариантов ее решения есть исполь-
зование интенсивно развивающейся тех-
нологии Wiki для построения хранилищ
коллективных и персональных знаний [39].
Wiki – Web-сайт, структуру и со-
держимое которого пользователи могут
самостоятельно изменять с помощью ин-
струментов, предоставляемых сайтом.
Форматирование текста и вставка в него
различных объектов производится с ис-
пользованием Wiki-разметки.
Термин «вики» был введен в 1995
году Уордом Каннингемом при разработке
первой Wiki-системы «Портлендского
хранилища образцов» с целью упростить
создание и документирование образцов
программ. Он называл систему «простей-
шей онлайн-базой данных, которая может
быстро функционировать» [40] и отражала
понятие «быстрый». Позже этому слову
был придуман английский кроним "What I
Know Is…" («то, что я знаю, это…»).
Позже Wiki-системы получили
большое распространение, в основном в
различных энциклопедиях, и сейчас вы-
шли на уровень коммерческого использо-
вания в корпоративных хранилищах зна-
ний. Развитием подобных исследований
заинтересовались крупные компании, мно-
гие из них сейчас разрабатывают свои
Wiki-системы. В частности, разработкой
собственной системы занимается и
Майкрософт. Существуют персональные
Wiki-системы [41].
Технология Wiki может изменить и
многие традиционные формы работы с
информацией. Например, одной из наибо-
лее распространенных функций Wiki-
систем является функция RSS-потоков,
используемая для создания новых доку-
ментов или внесения изменений в доку-
менте. В потенциале она может заменить
наиболее распространенный сейчас способ
обмена информацией – электронную по-
чту. В этом случае, важнейшим инстру-
ментом внутреннего документооборота
станет не почтовый клиент, а RSS-клиент,
что приведет к изменению уже привычной
концепции рабочего общения и поможет
решить проблемы «неполучения письма/не
прочтение важной информации» и другие.
Далее опишем сущность концепции
Wiki, используя матeриалы книги [42].
Пользователям разрешено редакти-
рование любой страницы или создание но-
вых страниц на Wiki-сайте, используя
обычный Web-браузер без каких-либо его
расширений. При редактировании имеется
http://ru.wikipedia.org/wiki/%D0%9A%D0%B0%D0%BD%D0%BD%D0%B8%D0%BD%D0%B3%D0%B5%D0%BC,_%D0%A3%D0%BE%D1%80%D0%B4
http://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8#cite_note-3
http://ru.wikipedia.org/wiki/%D0%91%D1%8D%D0%BA%D1%80%D0%BE%D0%BD%D0%B8%D0%BC
Експертні та інтелектуальні інформаційні системи
58
возможность сравнения редакций и вос-
становления ранних версий, проявления
изменений сразу после их внесения, разде-
ления содержимого на именованные стра-
ницы. Связи между разными страницами
поддерживаются за счёт почти интуитивно
понятного создания ссылок на другие
страницы. Wiki ориентированы на посто-
янных посетителей сайта, и инициирует их
к непрерывному процессу создания и со-
трудничества по изменению сайта. Для
разметки текста используется так называ-
емая Wiki-разметка, которая позволяет
легко и быстро размечать в тексте струк-
турные элементы и гиперссылки; форма-
тировать и оформлять отдельные элемен-
ты.
Существует два базовых принципа
работы Wiki-систем: первые работают с
контентом, именование ссылок тут имеет
лишь второстепенное значение; другие –
делают акцент на аннотациях. Разные по
уровню семантических возможностей и
формализации Wiki-системы имеют харак-
терные общие черты: аннотации ссылок,
представление информации в соответствии
с контекстом, улучшенная навигация, се-
мантический поиск и поддержка логиче-
ского вывода [43].
Для создания Wiki-среды необхо-
димо особое программное обеспечение,
которое называют Wiki. Wiki-движок –
набор программ, служащий для преобразо-
вания Wiki-разметки в удобочитаемое
представление на языке HTML и взаимо-
действия пользователя с базой данных
(знаний). Традиционно он довольно прост,
ибо почти все действия по структурирова-
нию и обработке содержимого делаются
пользователями вручную.
Понятен и основной недостаток
Wiki-систем – возможность изменять со-
держимое всем желающим. Для его устра-
нения разработаны развитые средства вос-
становления содержания с использованием
понятия версийности и дублирования. Но
появляется новая проблема – согласован-
ность содержимого. Постоянное дублиро-
вание данных обуславливает возможность
содержания одной информации на не-
скольких разных страницах. Ее изменение
на одной странице приводит к потребно-
сти отслеживания соответствующего об-
новления на всех остальных страницах.
Доступ к знаниям Wiki-систем затруднен
из-за большого объема информации на
сайте и ручной обработки результатов за-
просов. Возникают здесь и классические
проблемы повторного использования зна-
ний. Невозможность использования типи-
зированных свойств порождает огромное
количество тэгов или категорий.
Устранить эти недостатки должны
семантические Wiki (СВ). Они предо-
ставляют пользователю удобные сред-
ства для добавления семантической
разметки информации. Впервые термин
СВ был употреблен Энди Динглеем (Andy
Dingley) в телеконференции Usenet
comp.infosystems.www.authoring.site-design,
а в научно-технический обиход он вве-
ден в работе Лео Зауэрмана (Leo Sauer-
mann) [44].
СВ – Web-приложение, использу-
ющее обрабатываемые машиной данные со
строго определённой семантикой. Послед-
нее позволяет существенно расширить
функциональность Wiki-системы. Напри-
мер, разрешение использования в СВ ти-
пизированных ссылок между статьями, ти-
пов данных внутри статей, а также инфор-
мации о страницах позволяет говорить о
возможности работы с метаданными. В СВ
структурированные данные хранятся либо
прямо в тексте страниц (например,
Semantic MediaWiki), либо отдельно
(например, Ontowiki). В первом случае ис-
пользуется расширенная Wiki-разметка, во
втором – специальный интерфейс ввода
данных (форму), отдельный по отношению
к содержимому статей.
Ссылки между статьями несут в
своем имени информацию о типе связи.
Например, KiWi позволяет связывать
структурированные данные с помощью
средств RDF, а затем соотносить RDF-
термины с текстом в статье. Многие СВ
добавляют семантические аннотации ав-
томатически (ACEWiki) и позволяют из-
менять способы представления содержи-
мого страниц с их помощью. Контекстное
представление включает отображение ста-
тей, близких к данной и информации, ко-
торая может быть выведена из базы зна-
http://ru.wikipedia.org/wiki/%D0%93%D0%B8%D0%BF%D0%B5%D1%80%D1%81%D1%81%D1%8B%D0%BB%D0%BA%D0%B0
http://ru.wikipedia.org/wiki/%D0%9A%D0%BE%D0%BC%D0%BF%D1%8C%D1%8E%D1%82%D0%B5%D1%80%D0%BD%D0%B0%D1%8F_%D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0
http://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8
http://ru.wikipedia.org/wiki/HTML
http://ru.wikipedia.org/wiki/%D0%91%D0%B0%D0%B7%D0%B0_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85
http://ru.wikipedia.org/wiki/Semantic_MediaWiki
http://ru.wikipedia.org/w/index.php?title=KiWi&action=edit&redlink=1
http://ru.wikipedia.org/wiki/RDF
Експертні та інтелектуальні інформаційні системи
59
ний. У большинства СВ имеется возмож-
ность получения дополнительной инфор-
мацию о связи (ссылке), что позволяет ре-
ализовать новые способы навигации и се-
мантический поиск. Возможность постро-
ения многокритериального запроса на
формальном языке, подобном SPARQL
существенно улучшает поиск, а использо-
вание семантических аннотаций позволяет
реализовать фасетный поиск и уточняю-
щий поиск за счет оптимизации путем
фильтрации результатов [45].
Например, при поиске слова «Ива-
нов» пользователь после ввода этого слова
в поисковую строку, используя поисковые
фасеты, фильтрует результаты поиска: вы-
бирает категорию «Ученые» и время жиз-
ни – 1900–2000 год.
Большинство СВ хранят данные в
форматах СП или предоставляют возмож-
ность импорта/экспорта в RDF и OWL.
Языком запросов к Wiki часто служит
SPARQL, что обеспечивает поддержку ло-
гического вывода в системе.
В разработке первых СВ (Platypus
Wiki [46] и Rhizome Wiki [47]) ударение
сделано на создание средств редактирова-
ния RDF-содержимого. RDF-данные пред-
ставлялись как свободно редактируемый
текст, не связанный с неструктурирован-
ным содержимым Wiki-разметки. Это
обеспечивало импорт RDF-данных, но
проверку непротиворечивости и классифи-
кации невозможно реализовать.
Существует два основных подхода
к продуцированию структурированных
данных [44]: получение структурирован-
ных данных из уже существующих источ-
ников информации и прямое создание се-
мантического контента.
Первый подход предлагает пользо-
вателям создавать контент паутины с
помощью существующих Web-приложе-
ний социальной сети. Структурирование
данных (экспорт информации из баз дан-
ных, преобразования или реализация соот-
ветствия между открытыми семантиче-
скими стандартами, например SIOC) и их
семантическая интерпретация, определе-
ние смысла тегов (онтологии MOAT,
SCOT) получаются из сети автоматически
с помощью специализированных про-
грамм. Этот процесс включает построение
смысловых связей из неструктурированно-
го материала (обработка естественного
языка, извлечение информации), опреде-
ление сути (группировка подобных тегов,
формирование результирующих концептов
из них) с использованием внешних ре-
сурсов.
При прямом создании семантиче-
ского контента пользователям сразу
предоставляются специализированные
программные средства создания структу-
рированных (размеченных специальным
образом) данных. К ним можно отнести
семантические блоги, семантические за-
кладки, семантические десктопы, семанти-
ческие аннотации, семантические Wiki. К
сожалению, только СВ, во многом благо-
даря коллаборативной природе функцио-
нирования, способны продуцировать но-
вые концепты и онтологии [48].
Чаще всего семантизация разметки
достигается путем обогащения (аннотаци-
ей) ссылок текстом, который описывает их
значение. Например, в статье о Киеве,
ссылку на статью Украина можно имено-
вать как «is capital» или «located in». Такое
аннотирование позволяет значительно
улучшить визуализацию информации (де-
монстрация контекстуальной информа-
ции), навигацию (доступ к релевантной
информации), поиск (поиск по контексту, а
не только по тексту).
Существует два вида взаимообога-
щения онтологий и Wiki: системы, в кото-
рых Wiki используются для построения
онтологий и системы, использующие он-
тологии для работы Wiki [49]. В большин-
стве случаев Wiki-системы выступают
как внешний интерфейс коллаборатив-
ной системы разработки онтологий. При-
мерами таких систем являются Semantic
MediaWIki, PlatypusWiki. Во втором под-
ходе онтологиии применяются для улуч-
шения самой Wiki-системы (IkeWiki,
SWIM, SweetWiki). Существуют СВ, кото-
рые не подпадают под эту классификацию
– это коллаборативные системы разрабо-
танные и применяемые исключительно для
создания хранилищ знаний, не совмещая
это с редактированием текста. К таким си-
стемам относится AceWiki. В последний
http://ru.wikipedia.org/wiki/SPARQL
http://ru.wikipedia.org/w/index.php?title=%D0%A4%D0%B0%D1%81%D0%B5%D1%82%D0%BD%D1%8B%D0%B9&action=edit&redlink=1
http://ru.wikipedia.org/w/index.php?title=%D0%A3%D1%82%D0%BE%D1%87%D0%BD%D1%8F%D1%8E%D1%89%D0%B8%D0%B9_%D0%BF%D0%BE%D0%B8%D1%81%D0%BA&action=edit&redlink=1
http://ru.wikipedia.org/w/index.php?title=%D0%A3%D1%82%D0%BE%D1%87%D0%BD%D1%8F%D1%8E%D1%89%D0%B8%D0%B9_%D0%BF%D0%BE%D0%B8%D1%81%D0%BA&action=edit&redlink=1
http://ru.wikipedia.org/wiki/Semantic_Web
http://ru.wikipedia.org/wiki/RDF
http://ru.wikipedia.org/wiki/Web_Ontology_Language
http://ru.wikipedia.org/wiki/SPARQL
http://ru.wikipedia.org/wiki/RDF
Експертні та інтелектуальні інформаційні системи
60
воплощен интересный подход. Благодаря
применению специализированного языка
ACE, формальные утверждения Wiki вы-
глядят как утверждения на английском
языке. Рассмотрим подробнее каждый из
подходов, сделав обзор главных предста-
вителей каждого.
3. Современные семантические
Wiki
Среди новых движков семантиче-
ских Wiki выделяют движки с четким раз-
делением структурированной и неструкту-
рированной информации (Ikewiki [50],
OntoWiki [51]), либо включением семанти-
ческих аннотаций в Wiki-разметку
(WikiSAR [52] и Semantic MediaWiki).
Стали развиваться и новые типы Wiki-
систем, например, персональные.
Персональные Wiki позволяют
организовать информацию на своём ком-
пьютере или мобильном устройстве в
форме традиционной Wiki системы, но
только для личного использования.
Например, многопользовательские с воз-
можностью организации личного про-
странства (DokuWiki – простой, но доста-
точно функциональный Wiki-движок, ко-
торый может быть использован для со-
здания любой документации) и однополь-
зовательские Wiki-приложения, не име-
ющие в Web-сервера и сервера баз дан-
ных (WikidPad – бесплатная программа,
написанная на языке Python, позволяю-
щая хранить списки дел, контакты, замет-
ки и другую информацию с использовани-
ем Wiki-разметки).
На данный момент существует
множество различных реализаций техно-
логии Wiki. Они направлены на различные
платформы, написанные на разных языках,
предоставляют разные возможности. В
таблице приведен краткий обзор наиболее
распространенных систем.
Таблица. Обзор наиболее распространенных Wiki-систем
Название Ссылки
Платформа/
Язык
Комментарий
NoodleWiki http://flangy.com/dev/asp/noodle/ ASP
Может использовать базу данных
Ассеss или запись в файлы
OpenWiki http://www.OpenWiki.com ASP
Поддержка SQL Server, MSDE,
Oracle и My SQL
WikiAsp ASP Использует MS-Access.
AwkiAwki http://awkiawki.bogosoft.com/ Awk Быстрая небольшая Wiki-система
WikicWeb http://c2.com/cgi-bin/wiki?WikicWeb С
DidiWiki http://didiwiki.org/ С
Простая Wiki-система со встроен-
ным http-сервером
EddiesWiki http://c2.com/cgi-bin/wiki?EddiesWiki С++
Система с встроенным Web-
сервером,
WikiCpp http://wikicpp.sourceforge.net/ С++
DotNetWiki http://www.dotnetwiki.org/ С#
FlexWiki http://www.flexwiki.com/ С# Система от Microsoft
CLiki http://www.cliki.net/ CommonLisp
FreeWiki http://sourceforge.net/projects/freewiki/ Java
JavaWiki http://c2.com/cgi-bin/wiki?JavaWiki Java
JspWiki http://www.jspwiki.org Java
WebMacroWiki
http://www.webmacro.org/WebMacro
Wiki
Java
TiddlyWiki http://www.tiddlywiki.com JavaScript
Wiki-система, состоящая из одного
html-файла и не требует Web
CitiWiki http://wiki.cs.cityu.edu.hk/citiwiki PHP
PmWiki http://www.pmichaud.com/pmwiki PHP
WackoWiki http://wackowiki.org/WackoWiki PHP Удобная и быстрая Wiki-система
MediaWiki http://www.mediawiki.org/ PHP
Наиболее известная Wiki-система
(на ней базируется сайт
Wikipedia.org)
http://ru.wikipedia.org/wiki/%D0%A1%D0%B5%D0%BC%D0%B0%D0%BD%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%B2%D0%B8%D0%BA%D0%B8#cite_note-schaffert2007-13
http://ru.wikipedia.org/wiki/OntoWiki
http://ru.wikipedia.org/wiki/%D0%A1%D0%B5%D0%BC%D0%B0%D0%BD%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%B2%D0%B8%D0%BA%D0%B8#cite_note-auer2006-15
http://ru.wikipedia.org/wiki/%D0%A1%D0%B5%D0%BC%D0%B0%D0%BD%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%B2%D0%B8%D0%BA%D0%B8#cite_note-aumueller2005-16
http://ru.wikipedia.org/wiki/Semantic_MediaWiki
http://ru.wikipedia.org/wiki/DokuWiki
http://ru.wikipedia.org/wiki/WikidPad
Експертні та інтелектуальні інформаційні системи
61
Semantic Media Wiki (SMW) одна
из наиболее распространенных Wiki-
систем [53]. Она базируется на использо-
вании семантических аннотаций и факти-
чески является расширением движка (пла-
гина) MediaWiki (MW), на котором рабо-
тает Википедия. Система имеет средства
добавления новых элементов Wiki-
разметки, которые позволяют размечать
страницы типизированными свойствами и
обеспечивают доступ к данным с помо-
щью структурированных запросов. MW –
это хорошо проверенная, надежная
и удобная платформа, позволяющая
превратить обычную Wiki-систему в
семантическую без серьезных усилий.
Существует много инструментов для рабо-
ты с семантикой в виде расширений для
MW, обеспечивающие удобство настройки
и управления функционалом Wiki (ком-
плекты SMW + Semantic Bundle). Архитек-
тура SMW показана на рис. 4, который
взят из [53].
Основной принцип работы – это
задание Wiki-ссылкой семантических
аннотаций. SMW отображает эти анно-
тации с помощью языка онтологий
OWL DL в формат OWL/RDF. Разметка
ведется с помощью Web-интерфейса,
приспособленного к внешнему исполь-
зованию. Каждая Wiki-статья отвечает
одному онтологическому элементу, а
каждая аннотация в статье формирует
утверждения только об одном элементе.
Такое ограничение имеет ключевое зна-
чение для эксплуатации, поскольку зна-
ния используются повторно, и конечные
потребители должны знать, откуда эта
информация была получена. Таким об-
разом, SMW создает невидимый семан-
тический слой, что позволяет системе
выглядеть как Wiki, а функционировать
как Linked Data.
Уточним, как основные онтологи-
ческие понятия реализованы в SMW:
категория – это аннотация, позво-
ляющая пользователям классифицировать
Web-страницы. Категории были уже воз-
можны в MW, расширение SMW только
предоставило им формальную интерпрета-
цию в виде классов OWL;
отношение – позволяют пользова-
телям определить связи между статьями с
помощью имен ссылки;
атрибуты – используются для
определения взаимосвязи статей и сущно-
стей (дата, количество и т. д.). Для реа-
лизации атрибутов существует несколько
Рис. 4. Архитектура SMV
http://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8-%D1%80%D0%B0%D0%B7%D0%BC%D0%B5%D1%82%D0%BA%D0%B0
http://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8-%D1%80%D0%B0%D0%B7%D0%BC%D0%B5%D1%82%D0%BA%D0%B0
Експертні та інтелектуальні інформаційні системи
62
типов данных: целое число, дата, темпера-
тура, географические координаты, элек-
тронная почта и т. п.
Тип элементов для большинства
видов аннотаций фиксированный. Статьи
публикуются как OWL-экземпляр, катего-
рия – как OWL-класс, а отношение
становятся OWL-отношениями (object
properties). Атрибуты, в зависимости от
собственного типа у Wiki, могут иметь
свойства типа данных, свойство аннотации
или объекта.
SMW имеет специальный инстру-
мент Import Vocabulary для импорта и по-
вторного использования словарей, при-
надлежащих документам и стандартам
Semantic Web. Это дает возможность соот-
носить аннотации SMW в общепринятые
словари (например, FOAF, SIOC) путем их
ассоциации с терминами Wiki.
Вместе с тем SMW имеет инстру-
мент запросов, обеспечивающий нетриви-
альный поиск внутри системы с приме-
нением диапазонов значений, знаков под-
становки и подзапросов. Функционал
формирования запросов может использо-
ваться и для создания страниц с дина-
мическим контентом. Например, про-
стой запрос [[Category: Event]] [[Start
date :: ≥ Jan 01 2012]] [[Start date :: ≤ Dec
31 2012]], встроенный в страницу созда-
ет список мероприятий в сфере Semantic
Web, которые состоятся 2012 году.
Система представления данных
SMW позволяет избавиться как от некото-
рых проблем несовершенства текстового
поиска, так и нарушения целостности
данных в традиционных Wiki-системах.
Wiki-статьи содержат много информации,
однако зачастую пользователь желает
получить конкретный ответ на постав-
ленный вопрос. Для преодоления этой
проблемы в MW были введены статьи-
списки. Они состоят из ссылок на дру-
гие статьи, объединенные одной тема-
тикой. Однако и этот подход имеет мно-
го недостатков, поскольку пользователь
при создании статьи должен собствен-
норучно вносить изменения в списки,
которых она касается. Аналогично, при
изменении информации в статье из
списка, нужно вручную править статью-
список. SMW благодаря механизму ди-
намического создания страниц и боль-
шим количеством форматов вывода
контента помогает решить эту проблему.
Одним из главных недостатков
SMW является отсутствие встроенной
поддержки моделирования правил. По-
этому, она не дает возможности из явных
утверждений Wiki получать метаданные.
Однако, по Жи Бао [54], использование
шаблонов и расширений позволяет смоде-
лировать несколько наиболее употреби-
тельных и полезных типов правил в SMW:
моделирование логического следствия
OWL, логических программ, проверка на
ограничение целостности.
Роль расширений в системе SMW
очень важна.
Приложение Triple Store Connector
позволяет соединить Wiki с RDF-
хранилищем и использовать SPARQL для
запросов. Версия 1.6 работает с любым
RDF-хранилищем, поддерживающим
SPARQL и SPARQL Update.
Данные, созданные в SMW, могут
легко передаваться в форматах CSV, JSON
и RDF наружу. Это дает возможность Wiki
быть источником данных для внешних
приложений, исполняя роль, которую
обычно выполняют реляционные базы
данных. А с использованием расширений
External Data и Semantic Result Formats,
несколько семантических Wiki могут ис-
пользовать данные друг друга, устраняя
необходимость в дублировании и ручной
синхронизации. Дополнения Data Import,
Data Transfer и External Data позволяют
использовать данные извне: с Web-
сервисов, ресурсов Linked Data, уже суще-
ствующих систем. Таким образом, систе-
ма, построенная на SMW, может выпол-
нять роль информационного хаба, кото-
рый собирает и синхронизирует данные
отовсюду.
Расширение Semantic Forms пред-
лагает не опытным Wiki-пользователям
интерфейс для ввода данных с помощью
форм с поддержкой автозаполнения по-
лей. Приложение Halo Extension имеет
целью сделать работу людей еще удобнее,
Експертні та інтелектуальні інформаційні системи
63
обеспечив WYSIWYG редактором, обо-
зревателем онтологий и семантической
панелью инструментов. Расширение
Ontology Editor является платформой для
совместной разработки легких онтологий.
Оно обогащает систему мощными интер-
фейсами редактирования и создания онто-
логий, статистике, импортом и экспортом
фолксономий и онтологий, алгоритмом
восстановления знания.
Учитывая широкое распростране-
ние и сообщество активных пользовате-
лей, SMW можно считать наиболее
успешной семантической Wiki-системой.
Она нашла применение во многих направ-
лениях, в частности в крупных биовики:
SNPedia, Neurolex. Среди других удачных
примеров применения следует привести
Shortipedia-Wiki, сайт для сбора фактов
[55], который завоевал третье место на
Semantic Web Challenge 2010.
IkeWiki и KiWi (IW) олицетворяет
направление построения семантических
Wiki [55], в котором используются онто-
логии для улучшения самой системы. В
IW реализован функционал построения
логического вывода для поддержки поль-
зователя в выполнении задач. Система
предлагает и WYSIWYG редактор, кото-
рый пригодится пользователям, которые
не имеют опыта работы с Wiki-
редактором.
IkeWiki платформа написана на
языке Java. Данные хранятся в СУБД
Postgres, однако существует разграниче-
ние текста и структуры документов.
При необходимости, они возвращаются
пользователю в удобном формате XML
(для текста) или RDF (для структуры).
База знаний в системе представ-
лена RDF фреймворком Jena. Часть
RDF-хранилища является SPARQL-
движком, обеспечивающим поиск в си-
стеме и базе.
Для аннотаций существует три
вида редакторов. Редактор метаданных
позволяет заполнять текстуальные мета-
данные, касающиеся страницы (данные
Dublin Core или RDF комментарии).
Редактор типа позволяет ассоциирова-
ние страницы с одним или несколькими
типами, внедренными в систему. Редак-
тор ссылок обеспечивает управление
аннотациями ссылок. В IkeWiki доступ-
ны аннотации, определяющиеся логиче-
ским выводом. Например, если ссылка
из статьи «Kyiv» до «Ukraine» имено-
вать как «capitalOf», то система автома-
тически ассоциирует тип «Capital» стра-
ницы, описывающий Киев, и этот тип не
может быть удален пользователем.
IkeWiki больше не развивается как
самостоятельная система. Ее продолже-
нием стала система KiWi [56], которая
унаследовала большинство характери-
стик. Онтологическая единица этой си-
стемы определяется с помощью URI
и включает текст понятный человеку
в формате XHTML. Можно сделать
KiWi-систему частью Linked Open Data,
что в свою очередь, делает возможной ин-
теграцию контента с другими сервисами
Semantic Web.
В системе KiWi реализован фасет-
ный поиск, способный совмещать поиск
метаданных (типы, теги, люди), текстовый
поиск и поиск в базе данных (название,
дата). Более сложный поиск находится в
состоянии разработки.
Среди особенностей системы KiWi
следует отметить настраиваемую стра-
ницу пользователя под названием
Dashboard. Она позволяет удобно отсле-
живать и применять в работе: поток
деятельности (например, обновление к
элементам контента), рекомендации
(предлагает пользователю другой контент
с помощью различных рекомендатель-
ных алгоритмов), историю (список эле-
ментов, которые просматривал или ре-
дактировал пользователь), теги (список
тегов используемых пользователем).
Кроме этого, Dashboard это и профиль
пользователя, и список его друзей. Так,
в системе KiWi делают упор на функцио-
нале социальных сетей, поскольку он по-
могает определить контекст, над которым
работает пользователь.
OntoWiki [51] предназначена для
разработки баз знаний. Платформа
ставит на первое место представления
данных в формате RDF. Для машинной
Експертні та інтелектуальні інформаційні системи
64
обработки система поддерживает раз-
личные RDF-форматы и RDFa, Linked
Data и SPARQL-интерфейсы. Знания в
системе представлены так называемой
"информационной картой", обогащенной
удобными интерфейсами для визуализа-
ции и редактирования контента
(WYSIWYG редактор RDF, контроль вер-
сий, статистика, поддержка сообщества
и т.д.). Каждый узел (представлен стра-
ницей системы) в информационной кар-
те связан с соответствующим цифровым
источником.
OntoWiki спроектирована для ра-
боты с онтологиями любого размера и
пытается поддерживать создание онтоло-
гий "с нуля". Эта платформа не только
позволяет применять частично опреде-
ленные шаблоны из репозитария шаб-
лонов, но и создавать собственные. Она
поддерживает коллаборативную разра-
ботку путем отслеживания изменений,
возможностью комментировать и обсуж-
дать каждую часть базы знаний, позво-
ляя оценивать и ограничивать количе-
ство контента и поощрять пользователь-
скую активность.
Семантический поиск системы
представлен как поиск в локальном RDF-
хранилище с помощью SPARQL-запросов
и предлагает несколько способов нави-
гации: таксономический и иерархический
поиск, фасетный поиск и текстовый по-
иск. В сочетании с поисковым роботом,
который ищет, загружает и сохраняет
любые RDF-документы с Webа,
OntoWiki можно легко превратить в се-
мантическую поисковую систему.
Freebase. Система Freebase (FB)
заинтересовала Google и приобретена
компанией летом 2010 года. Эта плат-
форма позволяет пользователям опреде-
лять собственные схемы для моделиро-
вания различных типов данных и управ-
лять связанной структурированной ин-
формацией. FB – это большая колабора-
тивная база знаний. Она содержит значи-
тельно меньше триплетов чем DBpedia (в
10 раз), однако качество данных значи-
тельно лучше.
Платформа FB пытается интегри-
ровать различные подходы к формирова-
нию базы знаний. Кроме Wiki-стиля, она
имеет возможность собирать информацию
автоматически с различных ресурсов,
таких как Wikipedia и MusicBrainz. Неко-
торые сущности могут быть смоделирова-
ны и добавлены к системе людьми. Одна-
ко в ней не просто создавать собственные
типы. Она имеет и сложный интерфейс.
Все атрибуты должны иметь типы и
границы определенные самой системой.
FB имеет строгие ограничения схемы, что
может вызвать неудобства в опубликова-
нии данных.
Web-интерфейс предоставляет
пользователям удобную возможность
искать, принимать, редактировать и орга-
низовывать информацию. Основной спо-
соб доступа к FB – через API на основе
протокола HTTP. Все операции по за-
просам происходят на специально разра-
ботанном языке MQL (Metaweb Query
Language).
Недостатком платформы является
сложность присоединения к внешнему ре-
сурсу изнутри FB. Система связывает дан-
ные друг с другом с помощью значений
атрибутов, однако она не может подклю-
читься к другим источникам на уровне
данных.
Заключение
Информационные ресурсы Сети
составляют свыше десятка миллиардов
документов (Web-страниц) и их количе-
ство существенно увеличивается с каж-
дым днем. Для поиска информации в
этой распределенной, полнотекстовой ба-
зе данных необходимо использовать са-
мые мощные ИПС. Необходимость ана-
лиза больших объемов неструктуриро-
ванных или слабо структурированных
данных очень часто усложняют процесс
принятия решений. Для подобного ана-
лиза нужны технологии другого типа,
представленные системами добычи зна-
ний. Примером такой системы может
быть система mSpace. Она представляет
собой набор мощных инструментов,
позволяющих собирать данные из раз-
личных источников, организовывать ин-
формацию по категориям и дающих воз-
Експертні та інтелектуальні інформаційні системи
65
можность пользователю свободно ориен-
тироваться в ней.
СП уже вполне готова к широкому
внедрению в корпоративном секторе. Все
ее основополагающие технологии стано-
вятся стандартами, а крупные участники
рынка высоких технологий внедряют их в
прикладные программы корпоративного
уровня.
Для совершенствования процессов
создания, копирования и доступа к знани-
ям предлагается использовать системы
управления знаниями, основанные на
технологии Wiki. Множество реализаций
Wiki-систем позволяют выбрать наиболее
полезную систему, а условия распростра-
нения позволяют создать персональную
или корпоративную базу знаний, исполь-
зуя наиболее подходящие семантические
Wiki. Это значительно упростит созда-
ние развитого, более функционального
информационного пространства.
Представленный в работе обзор
может использоваться разработчиками
прикладных интеллектуальных систем для
выбора адекватных средств построения
распределенных баз знаний.
1. Андон Ф.И., Гришанова И.Ю., Резниче-
нко В.А. Semantic Web как новая модель
информационного пространства Интернет
// Проблеми програмування. – 2008. –
№ 2/3 (спец. вип.). – С. 417–430.
2. Андон Ф.И., Яшунин А.Е., Резниченко В.А.
Логические модели интеллектуальных
информационных систем. – К.: Наук.
думка, 1999. – 396 с.
3. Глибовец Н.Н., Глибовец А.Н., Шабин-
ский А.С. Применение онтологий и
методов текстового анализа при создании
интеллектуальных поисковых систем //
Проблемы управления и информатики. –
2011. – № 6. – С. 95–103.
4. Berners-Lee T., Hendler J., Lassila O. The
Semantic Web. Scientific American, 2001,
284, С. 34–42.
5. World Wide Web Consortium(W3C) –
Режим доступа: http://www.w3.org –
Название с экрана. (Загружено 21.04.2011)
6. Андон П.І., Дерецький В.О. Засоби
координації агентів у пошукових
архітектурах Web // Проблеми програ-
мування. – 2004. – № 1. – С. 60–70.
7. Пелещишин А.М., Березко О.Л. Аналіз
сучасних концепцій розвитку середовища
WWW // Вісник Національного уні-
верситету "Львівська політехніка":
Комп’ютерні науки та інформаційні
технології. – 2006. – № 565. – С. 57–64.
8. Segaran T., Evans C., Taylor J. Programming
the Semantic Web. Build Flexible
Applications with Graph Data. – O'Reilly
Media, 2009. – P. 302.
9. Mahola E., Miller E., eds RDF Primer W3C
Recommendation (2004) – Режим доступа:
http://www.w3.org/TR/xhtml-rdfa-primer/
10. SPARQL Query Language for RDF. W3C
Recommendation 15 January 2008 – Режим
доступа: http://www.w3.org/TR/rdf-sparql-
query/
11. Bratt S. Semantic Web, and Other
Technologies to Watch, World Wide Web
Consortium (2007). – Режим доступа:
http://www.w3.org/2007/Talks/0130-sb-
W3CTechSemWeb/#(24) – Название с
экрана. (Загружено 21.04.2011)
12. Berners-Lee T. Linked data. World Wide
Web design issues. (2000). – Режим досту-
па: <http://www.w3.org/DesignIssues/Linked
Data.html> – Название с экрана.
(Загружено 03.02.2011)
13. Андон П., Дерецький В. Проблеми побудо-
ви сервіс-орієнтованих прикладних інфор-
маційних систем в semantic Web
середовищі на основі агентного підходу //
Проблеми програмування. – 2006. – № 2-3.
– (спец. вип.). – С. 493–502.
14. SWRL: A Semantic Web Rule Language
Combining OWL and RuleML: W3C
Member Submission 21 May 2004. – Режим
доступа: http://www.w3.org/Submission
/SWRL/
15. Microformats – Режим доступа:
http://microformats.org/
16. RDFa 1.1 Primer. Rich Structured Data
Markup for Web Documents: W3C Working
Group Note 07 June 2012. – Режим доступа:
http://www.w3.org/TR/xhtml-rdfa-primer/
17. RSS: Really Simple Syndication: 21 Mar
2007. – Режим доступа: –
technet.microsoft.com/en-us/.../secrssinfo
18. BigTorrent – Режим доступа:
ru.wikipedia.org/wiki/BitTorrent
19. Allsopp J. Developing with Web Standards.
– New Riders. – 2010. – 432 p.
20. What is CSS? – Режим доступа:
http://www.w3.org/Style/CSS/
21. The Species of OWL.– Режим доступа:
http://www.w3.org/TR/owl-guide/
#OwlVarieties
22. OWL Full, OWL DL and OWL Lite. –
http://www.w3.org/
http://www.w3.org/TR/xhtml-rdfa-primer/
http://www.w3.org/TR/rdf-sparql-query/
http://www.w3.org/TR/rdf-sparql-query/
http://www.w3.org/2007/Talks/0130-sb-W3CTechSemWeb/#(24)
http://www.w3.org/2007/Talks/0130-sb-W3CTechSemWeb/#(24)
http://www.w3.org/Submission/SWRL/
http://www.w3.org/Submission/SWRL/
http://microformats.org/
http://www.w3.org/TR/xhtml-rdfa-primer/
http://technet.microsoft.com/en-us/security/bulletin/secrssinfo
http://www.w3.org/Style/CSS/
http://www.w3.org/TR/owl-guide/#OwlVarieties
http://www.w3.org/TR/owl-guide/#OwlVarieties
Експертні та інтелектуальні інформаційні системи
66
Режим доступа: http://www.w3.org/TR/owl-
ref/#Sublanguage-def
23. Semantic Web Services. – Режим доступа:
http://www.ai.sri.com/daml/services/
24. Dublin Core Metadata Element Set, Version
1.1 – Режим доступа: http://dublincore.org/
documents/dces/
25. DBpedia. – Режим доступа:
http://en.wikipedia.org/wiki/DBpedia
26. Хатян О.А. Онтології як інструментальна
складова дослідження інформаційного
простору // Інформаційна безпека людини,
суспільства, держави. – 2010. –№ 1(3). –
С. 71–77.
27. Gruber T.R. A translation approach to
portable ontologies // Knowledge
Acquisition. – 1993. – V. 5(2). – P. 199–220.
28. Corcho O., Fernandez-Lopez M., Gomez-
Perez A. Methodologies, tools and languages
for building ontologies. Where is their
meeting point? Data & Knowledge
Engineering. – 2003. – 46(1). – P. 41–64.
29. Hovy E. Combining and standardizing large-
scale, practical ontologies for machine
translation and other uses. Proceedings of
the 1st I nternational Conference on
Language Resources and Evaluation (LREC):
Granada, Spain. 1998) – Режим доступа:
http://www.isi.edu/natural-language/people/
hovy/papers/98LREC-ontol-align.pdf
30. Hendler J. A little semantics goes a long way.
– Режим доступа: http://www.cs.rpi.edu/
~hendler/LittleSemanticsWeb.html
31. Глибовець А.М., Шабінський А.С. Один
підхід до побудови інтелектуальної
пошукової системи // Наукові записки
НАУКМА. Комп’ютерні науки. – 2010. –
Том 112. – С. 26–30.
32. Анісімов А.В., Глибовець А.М., Жаб’юк
В.Я. Основні архітектурні принципи
побудови програмних систем реаліза-
ції мобільних агентів // Вісник Київсь-
кого національного університету імені
Тараса Шевченка. – серія: фізико-мате-
матичні науки. – Випуск № 3. – 2008. –
С. 125–131.
33. Глибовець А.М., Гороховський С.С.,
Жаб’юк В.Я. Вирішення проблем
побудови платформи мобільних агентів за
допомогою технологій Java, Jini // Вісник
Київського національного університету
імені Тараса Шевченка. – серія: фізико-
математичні науки. – Випуск № 4. – 2008.
– С. 109–115.
34. Linking Open Data. W3C SWEO Community
Project (22.10.2010). – Режим доступа:
http://www.w3.org/wiki/SweoIG/TaskForces/
CommunityProjects/LinkingOpenData –
(Загружено 21.05.2011.)
35. Глибовець М.М., Глибовець М.М., Бон-
дар Є.О., Гороховський С.С. Хмарні
обчислення. Проблеми і перспективи //
Вісник Київського університету. – 2011. –
№ 1. – С. 74–81.
36. Protégé. Режим доступа: http://protege.
stanford.edu/
37. TopBraid Composer. – Режим доступа:
http://www.topquadrant.com/products/TB_Co
mposer.html.
38. GooglDocs. – Режим доступа:
docs.google.com/
39. WhatIsWiki. – Режим доступа:
http://wiki.org/wiki.cgi?WhatIsWiki
40. Portland Pattern Repository. – Режим
доступа: http://c2.com/ppr/
41. TiddyWiki a reusable non-linear personal веб
notebook – Режим доступа:
http://www.tiddlywiki.com
42. Bo Leuf, Ward Cunningham, The Wiki Way:
Quick Collaboration on the Web, Addison-
Wesley. – 2001. – 436 p.
43. Schaffert S. IkeWiki: A Semantic Wiki for
Collaborative Knowledge Management.
Proceedings of the 15th IEEE International
Workshops on Enabling Technologies:
Infrastructure for Collaborative Enterprises. –
2006. – Р. 388–396.
44. Sauermann L. The Gnowsis. Using Semantic
Web Technologies to build aSemantic Desk-
tophttp – Режим доступа: www.dfki.uni-
kl.de/~sauermann/papers/sauermann2003.pdf
45. English J., Hearst M., Sinha R., Swea-
ringen K., Yee K.P. Hierarchical faceted
metadata in site search interfaces // CHI'02
extended abstracts on Human factors in
computing systems. ACM New York, NY,
USA. – 2002. – Р. 628–639.
46. P Castagna, SE Campanini. Towards a
semantic wiki wiki web. – Режим доступа:
http://www.tecweb.inf.puc-rio.br/semweb/
space/Platypus+Wiki/platypuswiki.pdf
47. Souzis A. Building a Semantic Wiki // IEEE
Intelligent Systems. – 2005. – Vol. 20. – N 5.
– P. 87–91.
48. Shakya A., Takeda H. and Wuwongse V.
Community-driven Consolidated Linked
Data, in M. Sheth ed., Semantic Services,
Interoperability and Web Applications:
Emerging Concepts. – 2011. – P. 228–258.
49. Buffa M et al. SweetWiki: A semantic wiki //
Journal of Web Semantics. – 2008. – 6(1). –
Р. 84–97.
50. Völkel M. et al. Semantic Wikipedia // J. of
Web Semantics. – 2007. – N 5. – Р. 251–261.
http://www.w3.org/TR/owl-ref/#Sublanguage-def
http://www.w3.org/TR/owl-ref/#Sublanguage-def
http://www.ai.sri.com/daml/services/
http://dublincore.org/documents/dces/
http://dublincore.org/documents/dces/
http://en.wikipedia.org/wiki/DBpedia
http://www.isi.edu/natural-language/people/%20hovy/papers/98LREC-ontol-align.pdf
http://www.isi.edu/natural-language/people/%20hovy/papers/98LREC-ontol-align.pdf
http://www.cs.rpi.edu/~hendler/LittleSemanticsWeb.html
http://www.cs.rpi.edu/~hendler/LittleSemanticsWeb.html
http://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenData
http://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenData
http://protege.stanford.edu/
http://protege.stanford.edu/
http://wiki.org/wiki.cgi?WhatIsWiki
http://c2.com/ppr/
http://www.tiddlywiki.com/
http://ru.wikipedia.org/w/index.php?title=The_Wiki_Way:_Quick_Collaboration_on_the_Web&action=edit&redlink=1
http://ru.wikipedia.org/w/index.php?title=The_Wiki_Way:_Quick_Collaboration_on_the_Web&action=edit&redlink=1
http://www.dfki.uni/
http://portal.acm.org/citation.cfm?id=506517
http://portal.acm.org/citation.cfm?id=506517
http://www.acm.org/publications
http://www.tecweb.inf.puc-rio.br/semweb/space/Platypus+Wiki/platypuswiki.pdf
http://www.tecweb.inf.puc-rio.br/semweb/space/Platypus+Wiki/platypuswiki.pdf
http://www.tecweb.inf.puc-rio.br/semweb/space/Platypus+Wiki/platypuswiki.pdf
http://www.tecweb.inf.puc-rio.br/semweb/space/Platypus+Wiki/platypuswiki.pdf
http://dx.doi.org/10.4018/978-1-60960-593-3.ch009
http://dx.doi.org/10.4018/978-1-60960-593-3.ch009
Експертні та інтелектуальні інформаційні системи
67
51. Auer S., Dietzold S., Riechert T. OntoWiki–A
tool for social, semantic collaboration //
ISWC 2006, 5th International Semantic Web
Conference, Athens, GA, USA. – 2007. –
Р. 736–749.
52. SAR – Режим доступа: http://en.wikipedia.
org/wiki/SAR.
53. Krötzsch M., Vrandečić D., Völkel M.
Semantic MediaWiki // Lecture Notes in
Computer Science. – 2006. – Р. 935–942.
54. Bao J. et al. – Rule Modeling Using Semantic
MediaWiki // 3rd Annual Conference of the
International Technology Alliance
(ACITA'09), Maryland, USA, 2009.
55. Vrandecic D. et al. – Shortipedia: Aggre-
gating and Curating Semantic Web Data.
Proceedings of the ISWC, Shanghai. – 2010.
56. Schaffert S. et al. KiWi – A Platform for
Semantic Social Software. 4th Semantic Wiki
Workshop at ESWC09 Heraklion, 2009.
Получено 19.07.2012
Об авторах:
Глибовец Андрей Николаевич,
кандидат физико-математических наук,
доцент кафедры сетевых технологий
НаУКМА,
Глибовец Николай Николаевич,
доктор физико-математических наук,
профессор,
декан факультета информатики
НаУКМА,
Покопцев Дмитрий Евгеньевич,
магистр,
Сидоренко Марина Олеговна,
ассистент кафедры информатики
НаУКМА.
Место работы авторов:
Национальный университет
“Киево-Могилянская Академия”,
254070, Киев-70,
ул. Григория Сковороды, 2,
Тел.: (044) 463 6985,
факс.: (044) 416 4515,
e-mail: glib@ukma.kiev.ua
http://en.wikipedia.org/wiki/SAR
http://en.wikipedia.org/wiki/SAR
mailto:glib@ukma.kiev.ua
|
| id | nasplib_isofts_kiev_ua-123456789-86652 |
| institution | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| issn | 1727-4907 |
| language | Russian |
| last_indexed | 2025-11-29T06:41:28Z |
| publishDate | 2013 |
| publisher | Інститут програмних систем НАН України |
| record_format | dspace |
| spelling | Глибовец, А.Н. Глибовец, Н.Н. Покопцев, Д.Е. Сидоренко, М.О. 2015-09-25T14:55:23Z 2015-09-25T14:55:23Z 2013 Семантическая паутина и Wiki-системы / А.Н. Глибовец, Н.Н. Глибовец, Д.Е. Покопцев, М.О. Сидоренко // Проблеми програмування. — 2013. — № 1. — С. 45-67. — Бібліогр.: 56 назв. — рос. 1727-4907 https://nasplib.isofts.kiev.ua/handle/123456789/86652 519.683 Представлен аналитический обзор современных результатов, связанных с созданием семантического Webа и целого ряда проблем, систем, технологий, активно разрабатываемых в общем направлении развития Интернета. Особое внимание уделяется исследованиям онтологий и Wiki технологиям. ru Інститут програмних систем НАН України Проблеми програмування Експертні та інтелектуальні інформаційні системи Семантическая паутина и Wiki-системы published earlier |
| spellingShingle | Семантическая паутина и Wiki-системы Глибовец, А.Н. Глибовец, Н.Н. Покопцев, Д.Е. Сидоренко, М.О. Експертні та інтелектуальні інформаційні системи |
| title | Семантическая паутина и Wiki-системы |
| title_full | Семантическая паутина и Wiki-системы |
| title_fullStr | Семантическая паутина и Wiki-системы |
| title_full_unstemmed | Семантическая паутина и Wiki-системы |
| title_short | Семантическая паутина и Wiki-системы |
| title_sort | семантическая паутина и wiki-системы |
| topic | Експертні та інтелектуальні інформаційні системи |
| topic_facet | Експертні та інтелектуальні інформаційні системи |
| url | https://nasplib.isofts.kiev.ua/handle/123456789/86652 |
| work_keys_str_mv | AT glibovecan semantičeskaâpautinaiwikisistemy AT glibovecnn semantičeskaâpautinaiwikisistemy AT pokopcevde semantičeskaâpautinaiwikisistemy AT sidorenkomo semantičeskaâpautinaiwikisistemy |