Семантическая паутина и Wiki-системы

Представлен аналитический обзор современных результатов, связанных с созданием семантического Webа и целого ряда проблем, систем, технологий, активно разрабатываемых в общем направлении развития Интернета. Особое внимание уделяется исследованиям онтологий и Wiki технологиям....

Full description

Saved in:
Bibliographic Details
Published in:Проблеми програмування
Date:2013
Main Authors: Глибовец, А.Н., Глибовец, Н.Н., Покопцев, Д.Е., Сидоренко, М.О.
Language:Russian
Published: Інститут програмних систем НАН України 2013
Subjects:
Online Access:https://nasplib.isofts.kiev.ua/handle/123456789/86652
Tags: Add Tag
No Tags, Be the first to tag this record!
Journal Title:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Cite this:Семантическая паутина и Wiki-системы / А.Н. Глибовец, Н.Н. Глибовец, Д.Е. Покопцев, М.О. Сидоренко // Проблеми програмування. — 2013. — № 1. — С. 45-67. — Бібліогр.: 56 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1859622487774461952
author Глибовец, А.Н.
Глибовец, Н.Н.
Покопцев, Д.Е.
Сидоренко, М.О.
author_facet Глибовец, А.Н.
Глибовец, Н.Н.
Покопцев, Д.Е.
Сидоренко, М.О.
citation_txt Семантическая паутина и Wiki-системы / А.Н. Глибовец, Н.Н. Глибовец, Д.Е. Покопцев, М.О. Сидоренко // Проблеми програмування. — 2013. — № 1. — С. 45-67. — Бібліогр.: 56 назв. — рос.
collection DSpace DC
container_title Проблеми програмування
description Представлен аналитический обзор современных результатов, связанных с созданием семантического Webа и целого ряда проблем, систем, технологий, активно разрабатываемых в общем направлении развития Интернета. Особое внимание уделяется исследованиям онтологий и Wiki технологиям.
first_indexed 2025-11-29T06:41:28Z
fulltext Експертні та інтелектуальні інформаційні системи © А.Н. Глибовец, Н.Н. Глибовец, Д.Е. Покопцев, М.О. Сидоренко, 2013 ISSN 1727-4907. Проблеми програмування. 2013. № 1 45 УДК 519.683 А.Н. Глибовец, Н.Н. Глибовец, Д.Е. Покопцев, М.О. Сидоренко CЕМАНТИЧЕСКАЯ ПАУТИНА И WIKI-СИСТЕМЫ Представлен аналитический обзор современных результатов, связанных с созданием семантического Webа и целого ряда проблем, систем, технологий, активно разрабатываемых в общем направлении раз- вития Интернета. Особое внимание уделяется исследованиям онтологий и Wiki технологиям. Введение Интернет – всемирная система объ- единенных компьютерных сетей, исполь- зующая для связи и маршрутизации паке- тов данных протоколы TCP/IP. Паутина (Web) – глобальное информационное про- странство, работающее на физической ин- фраструктуре Интернета, используя про- токол HTTP и идентификаторы ресурсов URI (Universal Resource Identifier). Для улучшения автоматизированной (машин- ной) обработки информации необходимо совершенствовать форму ее представления [1–3]. Технология Semantic Web определя- ет подход к решению этой задачи путем трансформации информационного напол- нения Интернета в глобальную базу зна- ний c помощью созданной сети докумен- тов – семантической паутины (СП), содержащих метаданные о ресурсах. Для построения такого решения требо- валось разработать и реализовать новую информационно-коммуникационную мо- дель, аналогичную семиуровневой моде- ли OSI, но в приложении к Web и c ориентацией на обмен информацией, а не данными. Семантическая паутина (Semantic Web) – это направление развития Всемир- ной паутины, целью которого является представление информации в виде, при- годном для машинной обработки на базе технологических стандартов разрабатыва- емых и внедряемых World Wide Web Consortium (W3C). СП предполагает за- пись информации в виде семантической сети с помощью онтологий, что позволяет специальной программе (агенту) непо- средственно извлекать из паутины факты и делать из них логические заключения, что позволяет человеку и компьютеру эффек- тивней взаимодействовать. Понятие «семантическая паутина» было введено в 2001 году Тимом Бернерсом-Ли [4]. Магистральной линией разработки СП он назвал поэтапное и рас- пределенное создание универсального языка описания данных и правил рассуж- дений об этих данных. Этот язык должен допускать не только простую визуализа- цию данных, но и легкую переносимость правил вывода, существовавших в неко- торой системе представления данных, в Паутину, что превратит традиционную паутину (Web) в систему семантического уровня. При разработке такого языка зада- ния метаданных требовалось решить две основные проблемы: он должен позволять определять выражения произвольной сложности, но эти выражения должны иметь форму, достаточно простую для по- нимания машиной. Пользователь, используя уникаль- ные идентификаторы URI, может легко выражать введенные им понятия, даже ин- тегрировать в Интернет объекты реального мира. Универсальный язык позволяет по- степенно связать все эти понятия в уни- версальную сеть, переведя все сайты на этот язык. Позже потребуется написать программы (агенты), обрабатывающие знания на этом языке. Таким образом, СП предусматривает объединение разнообраз- ных видов информации в единую структу- ру, где каждому смысловому элементу данных будет соответствовать специаль- ный синтаксический блок (тэг). Тэги должны составлять единую иерархиче- скую структуру, на основе которой и должна функционировать СП. Параллельно разрабатывалась и другая ветвь СП названая онтологическим подходом. Этот подход включает в себя http://ru.wikipedia.org/wiki/URI http://ru.wikipedia.org/wiki/%D0%92%D1%81%D0%B5%D0%BC%D0%B8%D1%80%D0%BD%D0%B0%D1%8F_%D0%BF%D0%B0%D1%83%D1%82%D0%B8%D0%BD%D0%B0 http://ru.wikipedia.org/wiki/%D0%92%D1%81%D0%B5%D0%BC%D0%B8%D1%80%D0%BD%D0%B0%D1%8F_%D0%BF%D0%B0%D1%83%D1%82%D0%B8%D0%BD%D0%B0 http://ru.wikipedia.org/wiki/%D0%98%D0%BD%D1%84%D0%BE%D1%80%D0%BC%D0%B0%D1%86%D0%B8%D1%8F http://ru.wikipedia.org/wiki/%D0%A1%D0%B5%D0%BC%D0%B0%D0%BD%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D1%81%D0%B5%D1%82%D1%8C http://ru.wikipedia.org/wiki/%D0%A1%D0%B5%D0%BC%D0%B0%D0%BD%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D1%81%D0%B5%D1%82%D1%8C http://ru.wikipedia.org/wiki/%D0%9E%D0%BD%D1%82%D0%BE%D0%BB%D0%BE%D0%B3%D0%B8%D1%8F_%28%D0%B8%D0%BD%D1%84%D0%BE%D1%80%D0%BC%D0%B0%D1%82%D0%B8%D0%BA%D0%B0%29 http://ru.wikipedia.org/wiki/%D0%92%D1%8B%D0%B2%D0%BE%D0%B4_%28%D1%80%D0%B0%D1%81%D1%81%D1%83%D0%B6%D0%B4%D0%B5%D0%BD%D0%B8%D0%B5%29 http://ru.wikipedia.org/wiki/%D0%91%D0%B5%D1%80%D0%BD%D0%B5%D1%80%D1%81-%D0%9B%D0%B8,_%D0%A2%D0%B8%D0%BC http://ru.wikipedia.org/wiki/%D0%91%D0%B5%D1%80%D0%BD%D0%B5%D1%80%D1%81-%D0%9B%D0%B8,_%D0%A2%D0%B8%D0%BC http://ru.wikipedia.org/wiki/%D0%A1%D0%B5%D0%BC%D0%B0%D0%BD%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%BF%D0%B0%D1%83%D1%82%D0%B8%D0%BD%D0%B0#cite_note-sa-eng-0 Експертні та інтелектуальні інформаційні системи 46 развитие средств аннотирования докумен- тов, которыми могли бы воспользоваться Web-сервисы и специализированные ком- пьютерные программы-агенты при обра- ботке сложных пользовательских запро- сов. Консорциум W3 решил [5], что для практического использования СП доста- точно разработать: универсальный язык представления знаний, использующего ссылки на онтологии (RDF); языки описа- ния онтологий (OWL); языки описания Web-сервисов (WSDL, OWL-S); инстру- ментарий создания и обработки докумен- тов (Jena, Haystack, Protege); языки запро- сов к знаниям (SPARQL); логический вы- вод знаний; семантические поисковые си- стемы (SHOE); программы-агенты. Анализу последних тенденций раз- вития СП и посвящена данная работа. 1. Семантическая паутина СП представляет собой систему с зачатками искусственного интеллекта. В этой паутине компьютеры могут взаимо- действовать друг с другом без участия че- ловека, а приложения автоматически рас- познают информацию. Для построения глобальной базы знаний паутины проект предполагает внедрение во все документы, Web-страницы и файлы специальных ме- таданных, указывающих на то, где, когда, кем был создан файл, как он отформатиро- ван, для чего предназначен, а также ис- пользование расширений языка онтологий OWL (Web Ontology Language) вместе с RDF (Resource Definition Framework). Основные функциональные воз- можности СП можно разбить на несколько базисных групп в соответствии с типом сервиса, который они предоставляют поль- зователям. Рассмотрим боле детально каж- дую из них [6–8]. Первую группу представляет тип сервиса названый обзором ресурсов. Они должны помочь пользователю в осознании и интерпретации связей среды разнород- ного контента. Типичным сценарием для таких систем является указание пользова- телем некоторого понятия, отправной точ- ки и вывод в той или иной форме всего множества связанных с ним ресурсов. Для таких систем нет аналогов внутри преды- дущего поколения Web. Понятно, что реа- лизация сервиса обзора ресурсов базирует- ся на сервисах поиска. Последние, широко распространен- ные в Интернете, но для их трансформа- ции в СП требуется существенное измене- ние основной функции – результатом по- иска являются факты, а не контент. Реализацией сервиса обзора ресур- сов занимаются многие проекты [3, 6]. В основном они различаются используемы- ми методами поиска, формами представ- ления и обработки "развёрнутых ответов", обзором контекста. Для оптимизации ра- боты таких сервисов видится необходи- мым коллективное накопление знаний в форме разнообразных хранилищ знаний. Основную функцию пополнения знаний в хранилищах несут непосред- ственно пользователи (пользователи соци- альных сетей). Ярким примером таких си- стем являются Wiki-системы. Характерной особенностью последних являются разви- тые методологии способности пополнения знания из внешних источников и их моди- фикации. Все это обуславливает создание эффективных сервисов интеллектуальной обработки данных паутины: интерпрети- рование данных, построение метаданных, определение семантических связей, по- строение логических выводов и т. п. В сети Интернет на момент появле- ния СП уже были созданы специализиро- ванные хранилища больших массивов данных. Основной проблемой их прямого использования в СП была (есть) либо их разнообразная структурированность, либо ее отсутствие вообще. Анализ таких дан- ных затруднителен не только для машины, но и для человека. Для устранения этих недостатков было предложено использо- вание языка описания ресурсов Resource Description Framework (RDF) – низкоуров- невого языка описания метаданных [9]. Смысл в нем кодируется с помо- щью деревьев глубины 3. Каждое дерево состоит из субъекта (подлежащего), свой- ства (сказуемое) и объекта (дополнение). В языке используется модель представления знаний объект-субъект-свойство, но все элементы таких триплетов должны являть- http://ru.wikipedia.org/wiki/Resource_Description_Framework http://ru.wikipedia.org/wiki/Resource_Description_Framework Експертні та інтелектуальні інформаційні системи 47 ся уникальными идентификаторами ресур- сов (URI согласно стандартам W3C – стро- ка определенного формата, адресующая реально существующий объект). Благодаря использованию такого URI, при доступе к одному из звеньев триплета можно авто- матически восстановить всю цепочку в це- лом, формировать сети из взаимосвязан- ных объектов и обеспечивается привязка каждого понятия к единому определению в Сети. В начале RDF документа идет спи- сок ссылок н а онтологии и каждая вер- шина может задаваться строкой или ссыл- кой на объект из некоторой онтологии. Вершины могут иметь дополнительные квалификаторы. Универсальность объек- тов, служащих элементами логических вы- ражений языка позволяет добиться требу- емого уровня повторного использования данных и их переносимости, унификации представления информации об объекте. На основе RDF строятся более высоко- уровневые языки (RDF schema, OWL), позволяющие создавать специализирован- ные форматы для представления много- образия различных типов объектов и пол- ноценные онтологии соответственно. Консорциумом W3 был разработан и специализированный язык запросов к RDF-хранилищам – SPARQL, позволяю- щий осуществлять сложные выборки из массивов метаданных [10]. Все это позво- ляет нам утверждать о существовании уже сейчас формальной базы построения необ- ходимого для СП полностью распределён- ного, но единого хранилища данных. Кон- сорциум провел значительную работу как по созданию стандартов представления данных, так и разработке набора соглаше- ний об именовании ресурсов и способах выдачи метаинформации. На определенном уровне абстрак- ции можно сказать, что построение и развитие СП для практического ис- пользования основывается на оптимиза- ции использования трех базисных компо- нент: программ-агентов, расширяемого языка разметки XML и Web-онтологий. Чаще всего набор используемых техноло- гий оптимизации представляют в виде специализированного «пирога», изобра- женного на рис. 1 [11]. Рис. 1. «Пирог» уровней СП Нижние слои пирога (по крайней мере до RDF + RDF Schema) уже стали ре- альностью. Прослойка онтологий пока ча- стично реализована и продолжает активно совершенствоваться [12, 13]. Верхняя часть стека требует существенного разви- тия на уровне Паутины, но успешно ис- пользуется на локальном и отраслевом уровне. Нельзя сказать, что структура СП этим ограничивается, поскольку появля- ются новые технологии благодаря иссле- дованиям и практическим испытаниям. В основе семантической сети ле- жат три принципа: агрегация, безопасность и логика. Агрегация означает совместное использование любых данных, путем со- здания соответствующей семантической информация (онтологии). В основу без- опасности предоставления и работы с информацией положены цифровые подпи- си (Crypto). Логика (Unifying Logic) – это набор правил описания информационной структуры данных, протоколы и язык опи- сания страниц. Самый нижний уровень CП – это URI, унифицированный иден- тификатор, определяющий способ записи адреса произвольного ресурса и дающий возможность просто выражать те поня- тия, которыми пользуется потребитель. Експертні та інтелектуальні інформаційні системи 48 Типичными примерами URI-идентифи- каторов являются URL-адреса в Интернете (ссылка на адресуемый объект, например, Web-страницу, файл или ящик электрон- ной почты). В СП URI используются также для именования объектов, то есть каждый URI однозначно называет некоторый объ- ект. Свои URI в СП есть не только у стра- ниц, но и у объектов реального мира (лю- дей), и даже у абстрактных понятий (например, у свойств «название», «слож- ность»). Поскольку URI глобально уни- кальны, они позволяют называть одни и те же предметы в разных местах в семантиче- ской паутине. При этом URI протокола HTTP (т. е. начинающиеся с http://) можно одновременно использовать как адреса до- кументов, содержащих «машинно- читаемые» описания этих предметов. Следующий уровень – язык XML как базовая форма разметки и средств, предназначенных для определения и опи- сания классов XML-документов (DTD, XML-схемы), развертывания средства описания ресурсов RDF и RDF-схемы, объясняющие, как состыковывать XML- данные в сети и строить каталоги и слова- ри понятий. RDF позволяет выполнять по- иск необходимых понятий в СП. Основное методологическое назна- чение модели RDF в СП состоит в описа- нии связей (отношений) между сетевыми ресурсами и информацией. Система, рабо- тая только с тегами XML, не может найти суть их смыслового наполнения. Поэтому была начата разработка стандартa языка формального описания содержания сете- вых ресурсов RDF. Фактически он являет- ся связующим звеном между XML- документами и средствами, обеспечиваю- щими поиск и навигацию на основе логи- ческих утверждений. RDF представляет собой технологию выражения смысла тер- минов и понятий в виде, доступном для обработки программами. Эта технология предназначена для стандартизации опре- делений и использования метаданных, описывающих Web-ресурсы, а также для представления самих данных, содержа- щихся в этих ресурсах. Использование URI для кодирования информации в документе обеспечивает единственность привязки понятия к его определению в СП. Утвер- ждения, кодируемые с помощью RDF, в дальнейшем можно интерпретировать с помощью онтологий, созданных по стан- дартам RDF Schema и OWL, чтобы полу- чать из них логические заключения. Техническую часть семантической паутины составляет семейство стандартов, включающее XML, XML Schema, RDF, RDF Schema, OWL и другие. XML предо- ставляет синтаксис для определения структуры документа, подлежащего ма- шинной обработке, не неся семантической нагрузки. XML Schema определяет огра- ничения на структуру XML-документа. Стандартный синтаксический анализатор языка XML в состоянии проверить произ- вольный XML-документ на соответствие его структуры, так называемой схеме до- кумента, описанной в XML Schema. RDF представляет собой простой способ описа- ния экземплярных данных в формате субъ- ект-отношение-объект. Существует стан- дартизованное отображение этих троек на XML-документы предопределённой струк- туры (то есть консорциумом W3 определе- на схема XML-документов, содержащих RDF-описания), а также на другие форма- ты представления (например, в нотацию N3). RDF Schema описывает набор атрибу- тов (здесь их точнее назвать отношения- ми), таких, как rdfs:Class, для определения новых типов RDF-данных. Языком под- держивается также отношение наследова- ния типов rdfs:subClassOf. OWL расширяет возможности по описанию новых типов (в частности, добавлением перечислений), а также позволяет описывать новые типы данных RDF Schema в терминах уже суще- ствующих (например, определять тип, яв- ляющийся пересечением или объединени- ем двух существующих). Он также может использоваться для явного представления значения терминов и отношений между терминами в словарях. SWRL (Semantic Web Rule Language) [14] расширяет OWL возможностью определения Хорн- подобных правил. Необходимость описания метадан- ных приводит к дублированию информа- ции. Каждый документ должен быть со- здан в двух экземплярах: размеченным для http://ru.wikipedia.org/wiki/%D0%AD%D0%BB%D0%B5%D0%BA%D1%82%D1%80%D0%BE%D0%BD%D0%BD%D0%B0%D1%8F_%D0%BF%D0%BE%D1%87%D1%82%D0%B0 http://ru.wikipedia.org/wiki/%D0%AD%D0%BB%D0%B5%D0%BA%D1%82%D1%80%D0%BE%D0%BD%D0%BD%D0%B0%D1%8F_%D0%BF%D0%BE%D1%87%D1%82%D0%B0 http://ru.wikipedia.org/wiki/HTTP http://ru.wikipedia.org/w/index.php?title=RDF_Schema&action=edit&redlink=1 http://ru.wikipedia.org/wiki/Web_Ontology_Language http://ru.wikipedia.org/wiki/%D0%92%D1%8B%D0%B2%D0%BE%D0%B4_%28%D1%80%D0%B0%D1%81%D1%81%D1%83%D0%B6%D0%B4%D0%B5%D0%BD%D0%B8%D0%B5%29 http://ru.wikipedia.org/wiki/XML http://ru.wikipedia.org/wiki/XML_Schema http://ru.wikipedia.org/wiki/RDF http://ru.wikipedia.org/w/index.php?title=RDF_Schema&action=edit&redlink=1 http://ru.wikipedia.org/wiki/Web_Ontology_Language http://ru.wikipedia.org/wiki/XML http://ru.wikipedia.org/wiki/XML_Schema http://ru.wikipedia.org/wiki/RDF http://ru.wikipedia.org/wiki/%D0%9D%D0%BE%D1%82%D0%B0%D1%86%D0%B8%D1%8F_3 http://ru.wikipedia.org/w/index.php?title=RDF_Schema&action=edit&redlink=1 http://ru.wikipedia.org/wiki/Web_Ontology_Language http://ru.wikipedia.org/wiki/%D0%9F%D0%B5%D1%80%D0%B5%D1%87%D0%B8%D1%81%D0%BB%D0%B8%D0%BC%D1%8B%D0%B9_%D1%82%D0%B8%D0%BF http://ru.wikipedia.org/wiki/%D0%9F%D0%B5%D1%80%D0%B5%D1%81%D0%B5%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_%D0%BC%D0%BD%D0%BE%D0%B6%D0%B5%D1%81%D1%82%D0%B2 http://ru.wikipedia.org/wiki/%D0%9E%D0%B1%D1%8A%D0%B5%D0%B4%D0%B8%D0%BD%D0%B5%D0%BD%D0%B8%D0%B5_%D0%BC%D0%BD%D0%BE%D0%B6%D0%B5%D1%81%D1%82%D0%B2 http://ru.wikipedia.org/wiki/%D0%9E%D0%B1%D1%8A%D0%B5%D0%B4%D0%B8%D0%BD%D0%B5%D0%BD%D0%B8%D0%B5_%D0%BC%D0%BD%D0%BE%D0%B6%D0%B5%D1%81%D1%82%D0%B2 Експертні та інтелектуальні інформаційні системи 49 чтения людьми, а также в машинно- ориентированном формате. Потребность объединения форматов привела к созда- нию так называемых микроформатов [15] и языка RDFа [16]. Последний является вариантом языка RDF и отличается от него тем, что не определяет собственного син- таксиса, а предназначен для внедрения в XML-атрибуты XHTML-страниц. Существуют и другие модификации RDF, например RSS (Really Simple Syndication) версий 0.90 и 1.0 – это семей- ство форматов для распространения кон- тента (описания лент новостей, анонсов статей, изменений в блогах), основанных на стандарте XML [17]. Формат быстро стал чрезвычайно популярным за счёт уз- кой категоризации подмножества исполь- зуемых метаданных. В нем субъектом тройки всегда является сайт-источник RSS-файла, а в качестве отношений ис- пользуются самые очевидные свойства до- кументов, имеющие отношение к часто обновляющимся источникам информации: дата написания, автор, постоянная ссылка. Заметим, что формат RSS версии 2.0, хотя и не является форматом, основанным на RDF, позволяет внедрение произвольного XML-содержимого, используя простран- ство имён rdf. Микроданные (HTML microdata) – это стандарт семантической разметки HTML-страниц, с помощью атрибутов, описывающих смысл информации, содер- жащейся в тех или иных HTML-элементах, и позволяющие «понимать» контент веб- страниц программами-агентами (находить и извлекать необходимые данные). RSS используется для нахождения информации на сайтах, подкастах и торренткастах. Подкаст – цифровой медиа-файл или на- бор таких файлов, которые распространя- ются Паутиной. Он представляет новый способ распространения аудио и видео в Паутине, который позволяет создавать та- кие материалы каждому желающему. Тор- ренткасты – RSS-потоки с прикреплен- ными к ним .torrent-файлами (файл мета- данных в bencode формате), работающими с P2P-протоколом BitTorrent [18]. BitTórrent («битовый поток») –пиринговый сетевой протокол для кооперативного об- мена файлами через Паутину. Файлы пе- редаются частями, каждый torrent-клиент, получая (скачивая) данные части, при этом отдаёт (закачивает) их другим клиентам, что снижает нагрузку и зависимость от каждого клиента-источника, обеспечива- ет решение задачи избыточности данных. Протокол не имеет системы поиска. Для каждого файла создаётся информаци- онный сопровождающий .torrent-файл, распространяющийся через любые каналы связи: специализированные Web-сервера, домашние страницы пользователей сети, электронную почту, публикацию в блогах или новостных лентах RSS. Он содержит метаинформацию (к примеру, хэш-сумму, адрес трекера) о распределяемых данных. Данные распределяются с помощью соб- ственного коммуникационного протокола на базе TCP/IP. Основной принцип работы прото- кола: раздача файла полностью контроли- руется трэкером (адрес которого находит- ся в torrent-файле), поэтому пользователь, качающий себе файл (он называется ли- чер) сам начинает раздавать, как только скачивает первую пригодную для этого часть. Архитектура BitTorrent предусмат- ривает наличие у файла, выкладываемого в сеть, единственного владельца, который и заинтересован в его распространении. Именно первоначальный обладатель файла генерирует torrent-файл. Клиент, в свою очередь, загружает файл (на HTTP, FTP или просто раздаёт каким либо образом) с расширением torrent, где содержится ин- формация об адресе владельца в Интерне- те, имени и размере нужного файла, а так- же его хеш. Это всё необходимо для от- слеживания хода процесса, контроля над ним и ликвидации возможности загрузки пользователями неполного или пустого файла. Микроформаты (microformats, ино- гда сокращенно μF или uF) – это способ семантически размечать сведения о разно- образных сущностях на Web-страницах, используя стандартные элементы языка HTML (или XHTML) [19]. Пользователь может воспринимать страницу с размечен- ным микроформатом как обычную Web- http://ru.wikipedia.org/wiki/%D0%9C%D0%B8%D0%BA%D1%80%D0%BE%D1%84%D0%BE%D1%80%D0%BC%D0%B0%D1%82%D1%8B http://ru.wikipedia.org/wiki/%D0%A1%D0%B5%D0%BC%D0%B0%D0%BD%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%BF%D0%B0%D1%83%D1%82%D0%B8%D0%BD%D0%B0#cite_note-microf-6 http://ru.wikipedia.org/wiki/RDF http://ru.wikipedia.org/wiki/%D0%A1%D0%B5%D0%BC%D0%B0%D0%BD%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%BF%D0%B0%D1%83%D1%82%D0%B8%D0%BD%D0%B0#cite_note-7 http://ru.wikipedia.org/wiki/RDF http://ru.wikipedia.org/wiki/%D0%9C%D0%B8%D0%BA%D1%80%D0%BE%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D0%B5 http://uk.wikipedia.org/wiki/%D0%A4%D0%B0%D0%B9%D0%BB http://ru.wikipedia.org/wiki/%D0%9C%D0%B5%D1%82%D0%B0%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D0%B5 http://ru.wikipedia.org/wiki/%D0%9C%D0%B5%D1%82%D0%B0%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D0%B5 http://ru.wikipedia.org/wiki/Bencode http://ru.wikipedia.org/wiki/%D0%91%D0%B8%D1%82%D0%BE%D0%B2%D1%8B%D0%B9_%D0%BF%D0%BE%D1%82%D0%BE%D0%BA http://ru.wikipedia.org/wiki/%D0%9E%D0%B4%D0%BD%D0%BE%D1%80%D0%B0%D0%BD%D0%B3%D0%BE%D0%B2%D0%B0%D1%8F_%D1%81%D0%B5%D1%82%D1%8C http://ru.wikipedia.org/wiki/%D0%A1%D0%B5%D1%82%D0%B5%D0%B2%D0%BE%D0%B9_%D0%BF%D1%80%D0%BE%D1%82%D0%BE%D0%BA%D0%BE%D0%BB http://ru.wikipedia.org/wiki/%D0%A4%D0%B0%D0%B9%D0%BB http://ru.wikipedia.org/wiki/%D0%98%D0%BD%D1%82%D0%B5%D1%80%D0%BD%D0%B5%D1%82 http://ru.wikipedia.org/wiki/%D0%9A%D0%BB%D0%B8%D0%B5%D0%BD%D1%82-%D1%81%D0%B5%D1%80%D0%B2%D0%B5%D1%80 http://ru.wikipedia.org/wiki/%D0%98%D0%B7%D0%B1%D1%8B%D1%82%D0%BE%D1%87%D0%BD%D0%BE%D1%81%D1%82%D1%8C_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85 Експертні та інтелектуальні інформаційні системи 50 страницу (через браузер); при этом про- граммы-обработчики способны извлечь из такой страницы структурированную ин- формацию, следуя определенным согла- шениям. При использовании микроформатов к существующей HTML-разметке добав- ляются новые составляющие, наполненные особым, заранее определенным смыслом. Например, с помощью атрибута class мож- но обозначить смысл того или иного HTML-элемента на странице (этот атрибут определен для всех элементов) и в даль- нейшем такую разметку можно обрабаты- вать машинными средствами. Каждый микроформат решает опре- деленную, отдельную задачу. Например, hCalendar (сокращенно от HTML iCalendar) – микроформат для представле- ния семантической информации о событи- ях в формате календаря iCalendar на (X)HTML-страницах. Обогатить пользова- тельское взаимодействие с Web-фрагмен- том можно с помощью визуальных эле- ментов и встроенных (или глобальных) стилей CSS [20]. Каскадные таблицы стилей CSS (Cascading Style Sheets) фактически явля- ются формальным языком описания внеш- него вида документа созданного с исполь- зованием языка разметки. Таблицы ис- пользуются создателями Web-страниц в качестве средства описания, оформления внешнего вида Web-страниц для задания цветов, шрифтов, расположения отдель- ных блоков. Язык может также применять- ся к любым XML-документам. Форматы описания метаданных в СП предполагают проведение логического вывода на этих метаданных. Формализм, лежащий в основе обработки формата, да- ёт возможность делать заключения о свой- ствах данных, представленных в этом формате. Особенно это относится к языку OWL. Его базой являются дескриптивные логики, а сам язык разбит на три вложен- ных подмножества (в порядке вложенно- сти): OWL Lite, OWL DL и OWL Full [21]. В работе [22] доказано, что задача логиче- ского вывода на метаданных с вырази- тельностью OWL Lite принадлежит к клас- су P. OWL DL описывает максимально разрешимое подмножество дескриптивных логик, правда, некоторые запросы здесь могут выполняться за экспоненциальное время. OWL Full реализует все существу- ющие конструкторы дескриптивных логик, но не каждый запрос в этом подмножестве языка может быть удовлетворен. Язык сетевых онтологий OWL предназначен для описания классов и от- ношений между ними, которые присущи как для сетевых документов, так и прило- жений. Многие приложения могут "по- нимать" данные и работать с ними как с информацией, а также корректно прове- рять данные благодаря синтаксическому взаимодействию сетей. Такое взаимодей- ствие требует проведения преобразования между терминами с помощью контент- анализа. Сами онтологии образуют систе- му, состоящую из наборов понятий и утверждений об этих понятиях, на основе которых можно строить классы, объекты и отношения. Отдельная онтология опреде- ляет семантику конкретной предметной области и способствует установлению свя- зей между значениями ее элементов. Класс – это концепция в онтологии, основной блок OWL. Классы традиционно образуют таксономическую иерархию в виде системы «подкласс-надкласс». Для описания классов поддерживается шесть базовых способов: именования (named), пересечения (intersection), объединения (union), дополнения (complement), ограни- чения (restrictions), перечисления (enumerated). Элементами классов являют- ся индивидуальные элементы, которые в RDF будут объектами и субъектами. Кро- ме определения таксономии, свойства поз- воляют делать общие утверждения (стро- ить факты) о элементах классов и особые утверждения об индивидах. Свойства- объекты связывают индивидуальные эле- менты между собой, a свойства-значения (datatype properties) – индивидуальные элементы со значениями типов данных, определенных с помощью XML. Характе- ристиками свойств являются симметрич- ность, транзитивность и функциональ- ность. К классам и свойствам применяются различные ограничения, например, огра- http://ru.wikipedia.org/wiki/%D0%A4%D0%BE%D1%80%D0%BC%D0%B0%D0%BB%D1%8C%D0%BD%D1%8B%D0%B9_%D1%8F%D0%B7%D1%8B%D0%BA http://ru.wikipedia.org/wiki/%D0%AF%D0%B7%D1%8B%D0%BA_%D1%80%D0%B0%D0%B7%D0%BC%D0%B5%D1%82%D0%BA%D0%B8 http://ru.wikipedia.org/wiki/%D0%92%D0%B5%D0%B1-%D1%81%D1%82%D1%80%D0%B0%D0%BD%D0%B8%D1%86%D0%B0 http://ru.wikipedia.org/wiki/%D0%92%D0%B5%D0%B1-%D1%81%D1%82%D1%80%D0%B0%D0%BD%D0%B8%D1%86%D0%B0 http://ru.wikipedia.org/wiki/%D0%A6%D0%B2%D0%B5%D1%82 http://ru.wikipedia.org/wiki/%D0%A8%D1%80%D0%B8%D1%84%D1%82 http://ru.wikipedia.org/wiki/XML http://ru.wikipedia.org/wiki/%D0%9B%D0%BE%D0%B3%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B9_%D0%B2%D1%8B%D0%B2%D0%BE%D0%B4 http://ru.wikipedia.org/wiki/%D0%9B%D0%BE%D0%B3%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B9_%D0%B2%D1%8B%D0%B2%D0%BE%D0%B4 http://ru.wikipedia.org/wiki/Web_Ontology_Language http://ru.wikipedia.org/wiki/%D0%94%D0%B5%D1%81%D0%BA%D1%80%D0%B8%D0%BF%D1%86%D0%B8%D0%BE%D0%BD%D0%BD%D0%B0%D1%8F_%D0%BB%D0%BE%D0%B3%D0%B8%D0%BA%D0%B0 http://ru.wikipedia.org/wiki/%D0%94%D0%B5%D1%81%D0%BA%D1%80%D0%B8%D0%BF%D1%86%D0%B8%D0%BE%D0%BD%D0%BD%D0%B0%D1%8F_%D0%BB%D0%BE%D0%B3%D0%B8%D0%BA%D0%B0 http://ru.wikipedia.org/wiki/%D0%A1%D0%B5%D0%BC%D0%B0%D0%BD%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%BF%D0%B0%D1%83%D1%82%D0%B8%D0%BD%D0%B0#cite_note-9 http://ru.wikipedia.org/wiki/%D0%A1%D0%B5%D0%BC%D0%B0%D0%BD%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%BF%D0%B0%D1%83%D1%82%D0%B8%D0%BD%D0%B0#cite_note-10 http://ru.wikipedia.org/wiki/%D0%9A%D0%BB%D0%B0%D1%81%D1%81_P http://ru.wikipedia.org/wiki/%D0%9A%D0%BB%D0%B0%D1%81%D1%81_P http://ru.wikipedia.org/wiki/%D0%9A%D0%BB%D0%B0%D1%81%D1%81_EXPTIME http://ru.wikipedia.org/wiki/%D0%9A%D0%BB%D0%B0%D1%81%D1%81_EXPTIME Експертні та інтелектуальні інформаційні системи 51 ничение мощности множества, и команды для склеивания (эквивалентности) классов. Динамическую часть СП представ- ляют семантические Web-сервисы SWS (Semantic Web Services) – доступные че- рез Паутину и пригодные для поиска, ком- позиции и выполнения [23]. Семантиче- ский Web-сервис предоставляет пользова- телю как описание интерфейса, так и описание его семантики (что сервис де- лает, его предметную область, назначения и т. п.). Традиционно для описания ин- терфейса используют язык описания Web- сервисов и доступа к ним WSDL (Web Services Description Language), уточняю- щий типы передаваемых сервису дан- ных, возвращаемые значения и генери- руемые ошибки. WSDL-описания серви- сов изначально были предназначены для машинной обработки. Стандарт WSDL до- пускает наличие в описаниях дополни- тельного XML-содержимого, что позволя- ет не выносить метаданные из WSDL- файлов. Для построения SWS использу- ются языки RDF, RDF Schema, OWL и онтологии OWL-S, описывающие базо- вую терминологию предметной области. Онтология OWL-S состоит из четырех он- тологий – онтологии сервиса, онтологии модели сервиса, онтологии процесса и он- тологии базы. Можно рассматривать OWL-S как семантическое расширение UDDI-описания ( Universal Description Discovery & Integration) – инструмента для расположения описаний WSDL, чтобы другие организации смогли их найти и ин- тегрировать в свои системы. В этом слу- чае, семантика сервиса характеризуется семантикой четырех его характеристик (IOPE): входных параметров (inputs), вы- ходных параметров (outputs), предвари- тельных условий (preconditions), эффектов выполнения (effects). Использование се- мантических Web-сервисов позволяет про- граммным агентам реализовывать автома- тический поиск и композицию подходя- щих сервисов для решения поставленных задач. Правда, ощутимый эффект от внед- рения сервисно-ориентированной архитек- туры пока наблюдается только в узкоспе- циализированных отраслях, например, в интеграции корпоративных приложений. Базисные принципы реализации СП были использованы в разных отдельных проектах. Среди них традиционно выде- ляют два: Dublin Core и DBpedia. Проект «Дублинское ядро» (Dublin Core), реали- зуемый инициативной организацией Dub- lin Core Metadata Initiative (DCMI). Это от- крытый проект разработки стандартов ме- таданных, которые были бы независимы от платформ и подходили бы для использова- ния в различных областях. DCMI занима- ется разработкой словарей метаданных общего назначения, стандартизирующих описания ресурсов в формате RDF [24]. Второй проект DBpedia реализовывал из- влечение структурированной информации из данных, созданных в рамках проекта Wikipedia. Для этого пользователь должен запрашивать информацию, основанную на отношениях и свойствах ресурсов Вики- педии, в том числе ссылки на соответ- ствующие базы данных. Проект DBpedia использует RDF для представления извле- ченной информации. По состоянию на сентябрь 2011, базы данных DBpedia со- стоят из более чем 3,64 млн. понятий [25]. Подводя итоги общего обзора нель- зя упустить список основных действую- щих рекомендаций W3C, связанных с су- ществованием СП: XML (www.w3c.org/XML) обеспе- чивает синтаксис для структурированных документов, но не налагает никаких се- мантических ограничений на содержание этих документов. XML Schema (www.w3c.org/XML/- Schema) определяет структуру документов XML, а также дополняет XML конкретны- ми типами данных. RDF (www.w3c.org/TR/2002/WD- rdf-concepts-20021108) позволяет описать модель данных для ресурсов и отношения между ними, обеспечивает простую семан- тику для этой модели данных, представляя их в синтаксисе XML. RDF Schema (www.w3c.org/TR/- 2002/ WD-rdf-schema-20021112) предо- ставляет средства для описания свойств и классов RDF-ресурсов, а также семантику для иерархий-обобщений таких свойств и классов. http://ru.wikipedia.org/wiki/WSDL http://ru.wikipedia.org/wiki/%D0%94%D1%83%D0%B1%D0%BB%D0%B8%D0%BD%D1%81%D0%BA%D0%BE%D0%B5_%D1%8F%D0%B4%D1%80%D0%BE http://ru.wikipedia.org/wiki/%D0%A1%D0%B5%D0%BC%D0%B0%D0%BD%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%BF%D0%B0%D1%83%D1%82%D0%B8%D0%BD%D0%B0#cite_note-11 http://ru.wikipedia.org/wiki/%D0%A1%D0%B5%D0%BC%D0%B0%D0%BD%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%BF%D0%B0%D1%83%D1%82%D0%B8%D0%BD%D0%B0#cite_note-autogenerated1-15 http://www.w3c.org/TR/%1f2002/ http://www.w3c.org/TR/%1f2002/ Експертні та інтелектуальні інформаційні системи 52 OWL (http://www.w3.org/TR/owl- features/) расширенные возможности опи- сания свойств и классов. Онтологии составляют фундамент СП и представляют собой описание на некотором формальном языке понятий некоторой предметной области и отноше- ний между ними [26]. Онтологии во мно- гом похожи на тезаурусы и таксономии, но на самом деле шире их, поскольку предоставляют дополнительные средства для описания структуры описываемых данных. Поскольку по своей сути онто- логии – это информация об информации, то они являются метаданными. Онтоло- гический уровень формализует накоп- ленные знания, определяя и объединяя терминологию различных предметных областей. Среди наиболее используемых определений онтологии выделяют сле- дующее [27]. Онтология – это "специфи- кация концептуализации предметной об- ласти", или упрощенно, документ или файл, формально задающий отношения между терминами (словарь понятий пред- метной области и совокупность явным образом выраженных предположений относительно смысла этих понятий). Ча- ще всего онтология представляется как иерархия понятий, связанных отношени- ями некоторых определенных видов. Та- кие определения онтологий используют- ся в различных классификациях. Разви- тые онтологии формализуются средства- ми языков логики и допускают возмож- ности логического вывода. Разработка языка описания струк- турированных онтологий OWL стала в последнее время одним из наиболее важ- ных звеньев работ по усовершенствова- нию СП, проводимых консорциумом W3C. Еще в 2004 году консорциум при- своил языку OWL статус рекомендован- ной к реализации технологии. В рамках OWL онтология – это совокупность утверждений, задающих отношения меж- ду понятиями и определяющих логиче- ские правила для рассуждений о них. Программы-агенты могут "распознавать" смысл семантических данных на Web- страницах, используя гиперссылки, ве- дущие на соответствующие онтологиче- ские ресурсы. Онтология может включать описания классов, свойств и их примеры (индивиды). Формальная семантика OWL описывает, как получить логические выво- ды на основе онтологий, т. е. получить факты, которые не представлены букваль- но, а следуют из семантики онтологии. Эти выводы могут базироваться на анализе од- ного документа или множества докумен- тов, распределенных в Паутине. На практике создание онтологий начинается с построения одной или нескольких иерархий классов понятий, составляющих предметную область, каж- дый из которых может иметь подклас- сы, представляющие собой более точные понятия, чем исходный класс [28]. Клас- сы могут содержать атрибуты, которые описывают свойства и внутреннюю стру- ктуру понятий, лежащих в основе клас- сов. Фундаментальным таксономическим конструктором для классов является rdfs:subClassOf. Он связывает более част- ный класс с более общим классом. Если X – подкласс Y, то каждый представитель X – также представитель Y. Отношение rdfs:subClassOf является транзитивным. Если X – подкласс Y, и Y – подкласс Z, то X – подкласс Z. Все подклассы наследуют атрибуты родительских классов. Каждый атрибут класса помимо названия имеет тип значе- ния, разрешенные значения, число значе- ний (мощность). Традиционно онтологии содержат и экземпляры классов (классы, в которых установлены значения всех их ат- рибутов). Это позволяет плавно перехо- дить от построения онтологий к построе- нию баз знаний. Процесс разработки онтологии тра- диционно включает: выделение глоссария терминов (понятий) для исследования свойств и характеристик представленных в нем терминов; построение списка точных определений терминов из глоссария; по- строение деревьев классификации понятий (иерархии классов) на базе таксономиче- ских отношений; выделение из не задей- ствованных при составлении деревьев Експертні та інтелектуальні інформаційні системи 53 классификации понятий атрибутов классов и их возможных значений для установки основных связей между классами; необя- зательное добавление экземпляров клас- сов; создание экспертами правил логиче- ских выводов для манипулирования и из- влечения новых знаний. Этот процесс по- хож на проектирование классов в объект- но-ориентированном программировании. Отличием является подход к принятию решения. Программист проектирует, бази- руясь в основном на методы классов. Раз- работчик онтологии принимает аналогич- ные решения на основе структурных свойств классов. Для описания онтологий использу- ются в основном традиционные языки описания онтологий (Interlinguas, CycL); языки, основанные на дескриптивных ло- гиках (LOOM); языки, основанные на фреймах (OKBC, OCML, Flogic) и языки, основанные на Web-стандартах (XOL, UPML, SHOE, RDF с RDFS, DAML, OIL, OWL). Языки различаются предоставляе- мыми средствами описания предметной области и механизма логического вывода. Каждый из них имеет свои преимущества и недостатки. Особое место занимает язык онтологий OWL. Он выступил реша- ющей компонентой интеллектуализации, базисом для построения семантических сетей. Представлениям знаний в СП при- сущи универсальные выразительные воз- можности, синтаксическая и семантиче- ская интероперабельность. Семантическая интероперабельность реализуется, напри- мер, в онтологиях путем установлени- ем соответствия между используемыми терминами. Онтологии различаются по многим параметрам, поэтому исследователи выде- ляют различные основания для их класси- фикации. Эдуард Хоув [29] производит деление в зависимости от набора элемен- тов, содержащихся в них, а также от типов отношений. Классификация онтологий возмож- на и по количеству включенных в нее по- нятий. Первая классификация онтологий проходит на основе анализа уровней. Онтология верхнего уровня (top- ontology) насчитывает от 100 до 3000 кон- цептов и содержит наиболее абстрактные категории, такие например как: «сущ- ность», «явление», «роль», «объект», «процесс». Онтологии среднего уровня (mid- level ontology) составляют приблизительно 500-100000 концептов. Их особенность в том, что они могут представлять реальный мир как, в общем, так и в частном случае, но требуют использования многих аксиом. Наиболее распространенные – он- тологии нижнего уровня, или так назы- ваемые онтологии предметной области (domain ontologies). Они содержат 2000- 20000 концептов и набор отношений, специфических для конкретной области. Для них можно создавать много аксиом и правил. Типичными представителями та- ких онтологий являются SCTG (Standard Classification of Transported Goods), Roset- taNet, The United Nations Standard Prod- ucts and Services Codes (UNSPSC), NAICS (North American Industry Classifi- cation System). Еще один вид онтологий – лексиче- ские или лингвистические, они связаны с семантикой грамматических элементов. К ним относятся WordNet, MikroKosmos, Sensus и другие. Такие онтологии приме- няются к задачам, связанным с обработкой естественного языка. Особенно важна классификация он- тологий – по степени выразительности. В работе [29] спектр выразительности онто- логий представлен в виде, показанным на рис. 2. Выделяются две основные группы – это легкие и тяжелые онтологии, кото- рые уже в свою очередь делятся на 8 под- категорий: список термов (term list) – список ключевых слов, который обычно используется для ограничения значений определенных свойств; тезаурус определяет отноше- ния между термами; неформальная таксономия оп- ределяет явную иерархию обобщения и специализации, однако не поддержи- вает строгого наследования; Експертні та інтелектуальні інформаційні системи 54 Рис. 2. Уровень выразительности онтологий формальная таксономия обеспечи- вает строгое наследование; онтология на основе фреймов или классов/отношений подобная объектно- ориентированным моделям: класс опреде- ляется по месту в иерархии и свойствами, вытекающие из подклассов, реализован- ных в сущностях; ограничение области значений при- обретает силу для свойств и может быть проведено по типу данных или предметной области; с помощью логических условий значения свойств можно еще больше огра- ничивать; онтологии с наибольшей отчетли- востью часто используют ограничения: от- ношение-целое, инверсные отношения, дизъюнктивное покрытия и т. п. Тяжелые онтологии очень результа- тивны, что было проверено на сектораль- ном уровне, однако такие системы не то- лерантны к нецелостности. С другой сто- роны, легкие онтологии не позволяют де- лать столь качественный логический вы- вод, однако здесь на нестрогие онтологи- ческие договоренности не так сильно вли- яет нецелостность. Известная фраза Джима Хендлера "A little semantics goes a long way" [30] выражает одну из идеологий со- временного развития СП. Поэтому легкие онтологии стали наиболее распространен- ными и применяемыми. Интеллектуальные агенты Интеллектуальные агенты – специ- ализированные компьютерные программы, в большинстве случаев использующиеся при обработке сложных пользовательских запросов. Запускаются на выполнение пользователем, находят, используя инфор- мацию о пользователе (профиль пользова- теля), подходящее решение и в удобном виде предоставляют это решение. В роли агентов в СП часто выступают и различ- ные Web-сервисы. Для удовлетворения запроса агент может параллельно или последовательно обращаться к разным сервисам, пока не будет найдено решение или его отсутствие в СП. Здесь можно провести полную ана- логию с поисковыми системами [31]. Структура такого взаимодействия показана на рис. 3. Агенты обмениваются информаци- ей и правилами логических выводов, ис- пользуемых в онтологиях, цепочками по- строенных ими рассуждений и профилями пользователей. Разрешение на обмен ин- формацией между агентами дается либо пользователем, либо происходит автома- тически, путем использования различных методов проверки, например посредством цифровых подписей. Развитие СП суще- ственно изменяет работу поисковых си- стем [32]. Используя онтологии, поиско- вые движки (search engine), специальные Експертні та інтелектуальні інформаційні системи 55 Рис. 3. Поиск информации через поисковый сервис логические движки (logical engine) они мо- гут существенно повысить качество и точ- ность поиска. В языке OWL имеется сред- ства реализации описанного взаимодей- ствия агентов. За основу были взяты раз- работки из языка общения автономных агентов DARPA Agent Markup Language (DAML). Основные принципы функциониро- вания автономных агентов следующие: агент не имеет полной информации, необ- ходимой для решения поставленной зада- чи; обрабатываемые данные распределены в сети; вычисления выполняются агента- ми асинхронно; взаимодействие агентов между собой и с человеком происходит на высоком семантическом уровне; отсут- ствует глобальный контроль над деятель- ностью всей системы агентов. Создаются агенты с использованием различных тех- нологий (CORBA, EJB, .NET) и языков [33]. Программные агенты создаются больше всего на Java, учитывая направ- ленность языка на сетевое программиро- вание и независимость от платформы. Linked Data.Термин Linked Data (связанные данные (СД)) предложен Ти- мом Бернерсом-Ли в 2006 году в его заме- тке об архитектуре Webа [34]. Linked Data – это метод выявления, совместного испо- льзования и объединения структурирован- ных данных в CП для более оптимального использования информации. В СП люди преимущественно пуб- ликуют неструктурированные документы и устанавливают связь между ними с по- мощью гиперссылок. СД меняют парадиг- му распространения документов на пара- дигму распространения данных. Эта тех- нология призвана сделать данные доступ- ными, формируя сеть данных, которую называют «Webом данных» (Web of Data). СД объединяет желающих сделать свои данные общедоступными. Тимоти Бернерс-Ли предложил для этого очень простые правила [34]: разнообразные объекты и понятия «именуются», и эти имена суть строки синтаксиса URI; где только можно, URI начинаются с http://..., чтобы получать информацию об объекте простым вводом его имени в ад- ресную строку браузера; если клиент запрашивает URI и мо- жет принимать данные в виде RDF, они передаются клиенту для дальнейшей обра- ботки. Если есть техническая возмож- ность, то желательно предоставить воз- можность выборки этих данных стандарт- ными средствами и в стандартных форма- тах (например, используя язык и протокол SPARQL); описание одного объекта или поня- тия не должно быть изолированным и са- модостаточным. Оно должно содержать ссылки на связанные понятия, опять же в виде URI. Благодаря СД, связи между объек- тами реального мира отображаются на свя- зи между ресурсами в Интернете, исполь- зуя которые программные агенты могут накапливать факты о реальности в специа- лизированных базах знаний (RDF могут содержать связные «метаданные»). Избы- точность данных не составляет проблемы. http://ru.wikipedia.org/wiki/%D0%91%D0%B5%D1%80%D0%BD%D0%B5%D1%80%D1%81-%D0%9B%D0%B8,_%D0%A2%D0%B8%D0%BC http://ru.wikipedia.org/wiki/%D0%91%D0%B5%D1%80%D0%BD%D0%B5%D1%80%D1%81-%D0%9B%D0%B8,_%D0%A2%D0%B8%D0%BC http://ru.wikipedia.org/wiki/URI http://www.w3.org/RDF/ http://www.w3.org/TR/rdf-sparql-query/ Експертні та інтелектуальні інформаційні системи 56 Важно, что они доступны, и определенная их часть из множества RDF-документов может быть автоматически отобрана для дальнейшей обработки. Специализированные приложения, использующие данные из СД, позволяют существенно улучшить обработку запроса пользователя. Многими из таких приложе- ний мы пользуемся и не думая, что они ра- ботают с СД. Примером, такого приложе- ния может служить Amarok, определяю- щее автора песни, ее название и т.п. Разно- образие данных и лёгкость их связывания дают простор для их использования в раз- личных предметных областях с различны- ми механизмами построения вывода. Про- стота представления данных в виде графа с вершинами трёх видов и дугами разных типов на первый взгляд существенно огра- ничивает возможности их обработки. К счастью это не так. Такое представление характерно только для процесса ввода- вывода. Внутри хранилища мы можем ис- пользовать стандартные типы SQL, все ти- пы XML Schema или полную коллекцию базовых типов. Тесная связь представле- ния данных в виде графа с реляционными СУБД дает повод говорить о возможности использования развитого аппарата работы с данными последних. Несомненно, в мо- дели RDF плохо с поддержкой обработки физических величин, которые невозможно представить в виде литерала. Но запись этих величин при необходимости может уточняться определенной структуризаци- ей. Проблемы, связанные с громадными объёмами обрабатываемых данных, по объёму схемы обрабатываемых данных или по числу запросов, могут быть решены в СД при широком использовании воз- можностей cloud computing [35] и универ- сальных онтологий. Среди существующих решений для работы с данными в СП выделяют систему с открытым кодом Protégé [36], коммерче- ский аналог TopBraid Composer [37] и Oracle. TopBraid Composer определяется как профессиональная среда разработки для RDF, RDFS, OWL, SWRL, SPARQL, предоставляющая полный набор средств для покрытия всего жизненного цикла раз- работки семантических приложений. TopBraid Composer имеет схожие Protégé пользовательский интерфейс и функцио- нальность. Оба средства с помощью до- ступных механизмов поддержки рассуж- дений позволяют просто выполнять клас- сификацию и проверку логической це- лостности на основе OWL. Наибольшими коллекциями входя- щими в реестр Linked Data есть: LOD (Linking Open Data) Cloud, Climate Data, International Development Data, Public Domain, Bibliographic Data, Energy Data, Art. Крупнейшими поставщиками Linked Data являются правительства Великобри- тании и США, компания ВВС, газета NY Times, сеть магазинов Best Buy, CNET, Dbpedia. На сентябрь 2010 года проект LOD содержал 220 объединенных наборов данных и составлял 24 миллиарда RDF триплетов, среди которых Data.gov и data.gov wiki – 11.5 млрд., LinkedGeoData – 3 млрд., UniProt – 1.1 млрд., DBpedia – 1 млрд., US Census Data – 1 млрд., Freebase – 0.1 млрд. 2. Организация коллективных и персональных хранилищ знаний Wiki Многие эксперты традиционно де- лят информацию на две части – знания и оперативные сведения. Оперативные све- дения – это данные, которые требуются в определенный момент в текущем месте для принятия решения. От скорости при- нятия решения зависит во многом дости- жение цели. Системы комплексного анали- за, которые создаются для обработки опе- ративной информации, позволяют приме- нять такую информацию раньше, чем она устареет. Однако сам процесс добывания оперативных сведений является достаточ- но сложным и затратным. С развитием СП и специализиро- ванных технологий типа GooglDocs [38], Cloud computing возникли новые возмож- ности построения коллективных и персо- нальных баз знаний. В принципе, можно унифицировать требования к их построе- нию, если отбросить тот факт, что персо- нальная система организации знаний не требует коллективного доступа. Поэтому, Експертні та інтелектуальні інформаційні системи 57 требования к системе организации знаний в основном включают: обеспечение кол- лективного доступа, поддержку сетевого взаимодействия, возможность работы с гипертекстом, предоставление облегченно- го процесса разметки, возможность за- грузки файлов различных форматов и при- вязка их к конкретной теме, наличие си- стемы контроля версий. Одна из особенностей Web 2.0 – это создание контента совместными усилиями пользователей. Миллионы людей создают коллекцию ресурсов, содержащую инфор- мацию, которая, благодаря постоянному обновлению, является актуальной, образуя социальную паутину (Web). Выделяют наиболее типичные применения социаль- ного Webа: блоги, Wiki, сайты, социаль- ные сети. Социальная сеть – идеальная струк- тура для распространения информации. Она имеет большой успех среди пользова- телей благодаря своей простоте и понятно- сти, что способствует активному сотруд- ничеству. Например, если раньше браузер воспринимался людьми исключительно как средство просмотра информации, то теперь это простой, мощный и удобный инструмент создания контента в социаль- ной паутине. Феномен простоты социаль- ной паутины вдохновил миллионы пользо- вателей к созданию огромного массива информации, который может обогатить СП достаточным количеством данных для зарождения новой эры паутины. С другой стороны, из-за больших объемов неструктурированной информа- ции, социальная паутина также страдает и требует для дальнейшего развития внедре- ния определенных семантических стандар- тов и понятной семантики данных. Соци- альная и семантическая паутины могут до- полнять друг друга для решения общих проблем. Однако, это довольно непростая задача, соединить два разных мира: один, понятный людям, другой – машинам. Од- ним из вариантов ее решения есть исполь- зование интенсивно развивающейся тех- нологии Wiki для построения хранилищ коллективных и персональных знаний [39]. Wiki – Web-сайт, структуру и со- держимое которого пользователи могут самостоятельно изменять с помощью ин- струментов, предоставляемых сайтом. Форматирование текста и вставка в него различных объектов производится с ис- пользованием Wiki-разметки. Термин «вики» был введен в 1995 году Уордом Каннингемом при разработке первой Wiki-системы «Портлендского хранилища образцов» с целью упростить создание и документирование образцов программ. Он называл систему «простей- шей онлайн-базой данных, которая может быстро функционировать» [40] и отражала понятие «быстрый». Позже этому слову был придуман английский кроним "What I Know Is…" («то, что я знаю, это…»). Позже Wiki-системы получили большое распространение, в основном в различных энциклопедиях, и сейчас вы- шли на уровень коммерческого использо- вания в корпоративных хранилищах зна- ний. Развитием подобных исследований заинтересовались крупные компании, мно- гие из них сейчас разрабатывают свои Wiki-системы. В частности, разработкой собственной системы занимается и Майкрософт. Существуют персональные Wiki-системы [41]. Технология Wiki может изменить и многие традиционные формы работы с информацией. Например, одной из наибо- лее распространенных функций Wiki- систем является функция RSS-потоков, используемая для создания новых доку- ментов или внесения изменений в доку- менте. В потенциале она может заменить наиболее распространенный сейчас способ обмена информацией – электронную по- чту. В этом случае, важнейшим инстру- ментом внутреннего документооборота станет не почтовый клиент, а RSS-клиент, что приведет к изменению уже привычной концепции рабочего общения и поможет решить проблемы «неполучения письма/не прочтение важной информации» и другие. Далее опишем сущность концепции Wiki, используя матeриалы книги [42]. Пользователям разрешено редакти- рование любой страницы или создание но- вых страниц на Wiki-сайте, используя обычный Web-браузер без каких-либо его расширений. При редактировании имеется http://ru.wikipedia.org/wiki/%D0%9A%D0%B0%D0%BD%D0%BD%D0%B8%D0%BD%D0%B3%D0%B5%D0%BC,_%D0%A3%D0%BE%D1%80%D0%B4 http://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8#cite_note-3 http://ru.wikipedia.org/wiki/%D0%91%D1%8D%D0%BA%D1%80%D0%BE%D0%BD%D0%B8%D0%BC Експертні та інтелектуальні інформаційні системи 58 возможность сравнения редакций и вос- становления ранних версий, проявления изменений сразу после их внесения, разде- ления содержимого на именованные стра- ницы. Связи между разными страницами поддерживаются за счёт почти интуитивно понятного создания ссылок на другие страницы. Wiki ориентированы на посто- янных посетителей сайта, и инициирует их к непрерывному процессу создания и со- трудничества по изменению сайта. Для разметки текста используется так называ- емая Wiki-разметка, которая позволяет легко и быстро размечать в тексте струк- турные элементы и гиперссылки; форма- тировать и оформлять отдельные элемен- ты. Существует два базовых принципа работы Wiki-систем: первые работают с контентом, именование ссылок тут имеет лишь второстепенное значение; другие – делают акцент на аннотациях. Разные по уровню семантических возможностей и формализации Wiki-системы имеют харак- терные общие черты: аннотации ссылок, представление информации в соответствии с контекстом, улучшенная навигация, се- мантический поиск и поддержка логиче- ского вывода [43]. Для создания Wiki-среды необхо- димо особое программное обеспечение, которое называют Wiki. Wiki-движок – набор программ, служащий для преобразо- вания Wiki-разметки в удобочитаемое представление на языке HTML и взаимо- действия пользователя с базой данных (знаний). Традиционно он довольно прост, ибо почти все действия по структурирова- нию и обработке содержимого делаются пользователями вручную. Понятен и основной недостаток Wiki-систем – возможность изменять со- держимое всем желающим. Для его устра- нения разработаны развитые средства вос- становления содержания с использованием понятия версийности и дублирования. Но появляется новая проблема – согласован- ность содержимого. Постоянное дублиро- вание данных обуславливает возможность содержания одной информации на не- скольких разных страницах. Ее изменение на одной странице приводит к потребно- сти отслеживания соответствующего об- новления на всех остальных страницах. Доступ к знаниям Wiki-систем затруднен из-за большого объема информации на сайте и ручной обработки результатов за- просов. Возникают здесь и классические проблемы повторного использования зна- ний. Невозможность использования типи- зированных свойств порождает огромное количество тэгов или категорий. Устранить эти недостатки должны семантические Wiki (СВ). Они предо- ставляют пользователю удобные сред- ства для добавления семантической разметки информации. Впервые термин СВ был употреблен Энди Динглеем (Andy Dingley) в телеконференции Usenet comp.infosystems.www.authoring.site-design, а в научно-технический обиход он вве- ден в работе Лео Зауэрмана (Leo Sauer- mann) [44]. СВ – Web-приложение, использу- ющее обрабатываемые машиной данные со строго определённой семантикой. Послед- нее позволяет существенно расширить функциональность Wiki-системы. Напри- мер, разрешение использования в СВ ти- пизированных ссылок между статьями, ти- пов данных внутри статей, а также инфор- мации о страницах позволяет говорить о возможности работы с метаданными. В СВ структурированные данные хранятся либо прямо в тексте страниц (например, Semantic MediaWiki), либо отдельно (например, Ontowiki). В первом случае ис- пользуется расширенная Wiki-разметка, во втором – специальный интерфейс ввода данных (форму), отдельный по отношению к содержимому статей. Ссылки между статьями несут в своем имени информацию о типе связи. Например, KiWi позволяет связывать структурированные данные с помощью средств RDF, а затем соотносить RDF- термины с текстом в статье. Многие СВ добавляют семантические аннотации ав- томатически (ACEWiki) и позволяют из- менять способы представления содержи- мого страниц с их помощью. Контекстное представление включает отображение ста- тей, близких к данной и информации, ко- торая может быть выведена из базы зна- http://ru.wikipedia.org/wiki/%D0%93%D0%B8%D0%BF%D0%B5%D1%80%D1%81%D1%81%D1%8B%D0%BB%D0%BA%D0%B0 http://ru.wikipedia.org/wiki/%D0%9A%D0%BE%D0%BC%D0%BF%D1%8C%D1%8E%D1%82%D0%B5%D1%80%D0%BD%D0%B0%D1%8F_%D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0 http://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8 http://ru.wikipedia.org/wiki/HTML http://ru.wikipedia.org/wiki/%D0%91%D0%B0%D0%B7%D0%B0_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85 http://ru.wikipedia.org/wiki/Semantic_MediaWiki http://ru.wikipedia.org/w/index.php?title=KiWi&action=edit&redlink=1 http://ru.wikipedia.org/wiki/RDF Експертні та інтелектуальні інформаційні системи 59 ний. У большинства СВ имеется возмож- ность получения дополнительной инфор- мацию о связи (ссылке), что позволяет ре- ализовать новые способы навигации и се- мантический поиск. Возможность постро- ения многокритериального запроса на формальном языке, подобном SPARQL существенно улучшает поиск, а использо- вание семантических аннотаций позволяет реализовать фасетный поиск и уточняю- щий поиск за счет оптимизации путем фильтрации результатов [45]. Например, при поиске слова «Ива- нов» пользователь после ввода этого слова в поисковую строку, используя поисковые фасеты, фильтрует результаты поиска: вы- бирает категорию «Ученые» и время жиз- ни – 1900–2000 год. Большинство СВ хранят данные в форматах СП или предоставляют возмож- ность импорта/экспорта в RDF и OWL. Языком запросов к Wiki часто служит SPARQL, что обеспечивает поддержку ло- гического вывода в системе. В разработке первых СВ (Platypus Wiki [46] и Rhizome Wiki [47]) ударение сделано на создание средств редактирова- ния RDF-содержимого. RDF-данные пред- ставлялись как свободно редактируемый текст, не связанный с неструктурирован- ным содержимым Wiki-разметки. Это обеспечивало импорт RDF-данных, но проверку непротиворечивости и классифи- кации невозможно реализовать. Существует два основных подхода к продуцированию структурированных данных [44]: получение структурирован- ных данных из уже существующих источ- ников информации и прямое создание се- мантического контента. Первый подход предлагает пользо- вателям создавать контент паутины с помощью существующих Web-приложе- ний социальной сети. Структурирование данных (экспорт информации из баз дан- ных, преобразования или реализация соот- ветствия между открытыми семантиче- скими стандартами, например SIOC) и их семантическая интерпретация, определе- ние смысла тегов (онтологии MOAT, SCOT) получаются из сети автоматически с помощью специализированных про- грамм. Этот процесс включает построение смысловых связей из неструктурированно- го материала (обработка естественного языка, извлечение информации), опреде- ление сути (группировка подобных тегов, формирование результирующих концептов из них) с использованием внешних ре- сурсов. При прямом создании семантиче- ского контента пользователям сразу предоставляются специализированные программные средства создания структу- рированных (размеченных специальным образом) данных. К ним можно отнести семантические блоги, семантические за- кладки, семантические десктопы, семанти- ческие аннотации, семантические Wiki. К сожалению, только СВ, во многом благо- даря коллаборативной природе функцио- нирования, способны продуцировать но- вые концепты и онтологии [48]. Чаще всего семантизация разметки достигается путем обогащения (аннотаци- ей) ссылок текстом, который описывает их значение. Например, в статье о Киеве, ссылку на статью Украина можно имено- вать как «is capital» или «located in». Такое аннотирование позволяет значительно улучшить визуализацию информации (де- монстрация контекстуальной информа- ции), навигацию (доступ к релевантной информации), поиск (поиск по контексту, а не только по тексту). Существует два вида взаимообога- щения онтологий и Wiki: системы, в кото- рых Wiki используются для построения онтологий и системы, использующие он- тологии для работы Wiki [49]. В большин- стве случаев Wiki-системы выступают как внешний интерфейс коллаборатив- ной системы разработки онтологий. При- мерами таких систем являются Semantic MediaWIki, PlatypusWiki. Во втором под- ходе онтологиии применяются для улуч- шения самой Wiki-системы (IkeWiki, SWIM, SweetWiki). Существуют СВ, кото- рые не подпадают под эту классификацию – это коллаборативные системы разрабо- танные и применяемые исключительно для создания хранилищ знаний, не совмещая это с редактированием текста. К таким си- стемам относится AceWiki. В последний http://ru.wikipedia.org/wiki/SPARQL http://ru.wikipedia.org/w/index.php?title=%D0%A4%D0%B0%D1%81%D0%B5%D1%82%D0%BD%D1%8B%D0%B9&action=edit&redlink=1 http://ru.wikipedia.org/w/index.php?title=%D0%A3%D1%82%D0%BE%D1%87%D0%BD%D1%8F%D1%8E%D1%89%D0%B8%D0%B9_%D0%BF%D0%BE%D0%B8%D1%81%D0%BA&action=edit&redlink=1 http://ru.wikipedia.org/w/index.php?title=%D0%A3%D1%82%D0%BE%D1%87%D0%BD%D1%8F%D1%8E%D1%89%D0%B8%D0%B9_%D0%BF%D0%BE%D0%B8%D1%81%D0%BA&action=edit&redlink=1 http://ru.wikipedia.org/wiki/Semantic_Web http://ru.wikipedia.org/wiki/RDF http://ru.wikipedia.org/wiki/Web_Ontology_Language http://ru.wikipedia.org/wiki/SPARQL http://ru.wikipedia.org/wiki/RDF Експертні та інтелектуальні інформаційні системи 60 воплощен интересный подход. Благодаря применению специализированного языка ACE, формальные утверждения Wiki вы- глядят как утверждения на английском языке. Рассмотрим подробнее каждый из подходов, сделав обзор главных предста- вителей каждого. 3. Современные семантические Wiki Среди новых движков семантиче- ских Wiki выделяют движки с четким раз- делением структурированной и неструкту- рированной информации (Ikewiki [50], OntoWiki [51]), либо включением семанти- ческих аннотаций в Wiki-разметку (WikiSAR [52] и Semantic MediaWiki). Стали развиваться и новые типы Wiki- систем, например, персональные. Персональные Wiki позволяют организовать информацию на своём ком- пьютере или мобильном устройстве в форме традиционной Wiki системы, но только для личного использования. Например, многопользовательские с воз- можностью организации личного про- странства (DokuWiki – простой, но доста- точно функциональный Wiki-движок, ко- торый может быть использован для со- здания любой документации) и однополь- зовательские Wiki-приложения, не име- ющие в Web-сервера и сервера баз дан- ных (WikidPad – бесплатная программа, написанная на языке Python, позволяю- щая хранить списки дел, контакты, замет- ки и другую информацию с использовани- ем Wiki-разметки). На данный момент существует множество различных реализаций техно- логии Wiki. Они направлены на различные платформы, написанные на разных языках, предоставляют разные возможности. В таблице приведен краткий обзор наиболее распространенных систем. Таблица. Обзор наиболее распространенных Wiki-систем Название Ссылки Платформа/ Язык Комментарий NoodleWiki http://flangy.com/dev/asp/noodle/ ASP Может использовать базу данных Ассеss или запись в файлы OpenWiki http://www.OpenWiki.com ASP Поддержка SQL Server, MSDE, Oracle и My SQL WikiAsp ASP Использует MS-Access. AwkiAwki http://awkiawki.bogosoft.com/ Awk Быстрая небольшая Wiki-система WikicWeb http://c2.com/cgi-bin/wiki?WikicWeb С DidiWiki http://didiwiki.org/ С Простая Wiki-система со встроен- ным http-сервером EddiesWiki http://c2.com/cgi-bin/wiki?EddiesWiki С++ Система с встроенным Web- сервером, WikiCpp http://wikicpp.sourceforge.net/ С++ DotNetWiki http://www.dotnetwiki.org/ С# FlexWiki http://www.flexwiki.com/ С# Система от Microsoft CLiki http://www.cliki.net/ CommonLisp FreeWiki http://sourceforge.net/projects/freewiki/ Java JavaWiki http://c2.com/cgi-bin/wiki?JavaWiki Java JspWiki http://www.jspwiki.org Java WebMacroWiki http://www.webmacro.org/WebMacro Wiki Java TiddlyWiki http://www.tiddlywiki.com JavaScript Wiki-система, состоящая из одного html-файла и не требует Web CitiWiki http://wiki.cs.cityu.edu.hk/citiwiki PHP PmWiki http://www.pmichaud.com/pmwiki PHP WackoWiki http://wackowiki.org/WackoWiki PHP Удобная и быстрая Wiki-система MediaWiki http://www.mediawiki.org/ PHP Наиболее известная Wiki-система (на ней базируется сайт Wikipedia.org) http://ru.wikipedia.org/wiki/%D0%A1%D0%B5%D0%BC%D0%B0%D0%BD%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%B2%D0%B8%D0%BA%D0%B8#cite_note-schaffert2007-13 http://ru.wikipedia.org/wiki/OntoWiki http://ru.wikipedia.org/wiki/%D0%A1%D0%B5%D0%BC%D0%B0%D0%BD%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%B2%D0%B8%D0%BA%D0%B8#cite_note-auer2006-15 http://ru.wikipedia.org/wiki/%D0%A1%D0%B5%D0%BC%D0%B0%D0%BD%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%B2%D0%B8%D0%BA%D0%B8#cite_note-aumueller2005-16 http://ru.wikipedia.org/wiki/Semantic_MediaWiki http://ru.wikipedia.org/wiki/DokuWiki http://ru.wikipedia.org/wiki/WikidPad Експертні та інтелектуальні інформаційні системи 61 Semantic Media Wiki (SMW) одна из наиболее распространенных Wiki- систем [53]. Она базируется на использо- вании семантических аннотаций и факти- чески является расширением движка (пла- гина) MediaWiki (MW), на котором рабо- тает Википедия. Система имеет средства добавления новых элементов Wiki- разметки, которые позволяют размечать страницы типизированными свойствами и обеспечивают доступ к данным с помо- щью структурированных запросов. MW – это хорошо проверенная, надежная и удобная платформа, позволяющая превратить обычную Wiki-систему в семантическую без серьезных усилий. Существует много инструментов для рабо- ты с семантикой в виде расширений для MW, обеспечивающие удобство настройки и управления функционалом Wiki (ком- плекты SMW + Semantic Bundle). Архитек- тура SMW показана на рис. 4, который взят из [53]. Основной принцип работы – это задание Wiki-ссылкой семантических аннотаций. SMW отображает эти анно- тации с помощью языка онтологий OWL DL в формат OWL/RDF. Разметка ведется с помощью Web-интерфейса, приспособленного к внешнему исполь- зованию. Каждая Wiki-статья отвечает одному онтологическому элементу, а каждая аннотация в статье формирует утверждения только об одном элементе. Такое ограничение имеет ключевое зна- чение для эксплуатации, поскольку зна- ния используются повторно, и конечные потребители должны знать, откуда эта информация была получена. Таким об- разом, SMW создает невидимый семан- тический слой, что позволяет системе выглядеть как Wiki, а функционировать как Linked Data. Уточним, как основные онтологи- ческие понятия реализованы в SMW: категория – это аннотация, позво- ляющая пользователям классифицировать Web-страницы. Категории были уже воз- можны в MW, расширение SMW только предоставило им формальную интерпрета- цию в виде классов OWL; отношение – позволяют пользова- телям определить связи между статьями с помощью имен ссылки; атрибуты – используются для определения взаимосвязи статей и сущно- стей (дата, количество и т. д.). Для реа- лизации атрибутов существует несколько Рис. 4. Архитектура SMV http://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8-%D1%80%D0%B0%D0%B7%D0%BC%D0%B5%D1%82%D0%BA%D0%B0 http://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8-%D1%80%D0%B0%D0%B7%D0%BC%D0%B5%D1%82%D0%BA%D0%B0 Експертні та інтелектуальні інформаційні системи 62 типов данных: целое число, дата, темпера- тура, географические координаты, элек- тронная почта и т. п. Тип элементов для большинства видов аннотаций фиксированный. Статьи публикуются как OWL-экземпляр, катего- рия – как OWL-класс, а отношение становятся OWL-отношениями (object properties). Атрибуты, в зависимости от собственного типа у Wiki, могут иметь свойства типа данных, свойство аннотации или объекта. SMW имеет специальный инстру- мент Import Vocabulary для импорта и по- вторного использования словарей, при- надлежащих документам и стандартам Semantic Web. Это дает возможность соот- носить аннотации SMW в общепринятые словари (например, FOAF, SIOC) путем их ассоциации с терминами Wiki. Вместе с тем SMW имеет инстру- мент запросов, обеспечивающий нетриви- альный поиск внутри системы с приме- нением диапазонов значений, знаков под- становки и подзапросов. Функционал формирования запросов может использо- ваться и для создания страниц с дина- мическим контентом. Например, про- стой запрос [[Category: Event]] [[Start date :: ≥ Jan 01 2012]] [[Start date :: ≤ Dec 31 2012]], встроенный в страницу созда- ет список мероприятий в сфере Semantic Web, которые состоятся 2012 году. Система представления данных SMW позволяет избавиться как от некото- рых проблем несовершенства текстового поиска, так и нарушения целостности данных в традиционных Wiki-системах. Wiki-статьи содержат много информации, однако зачастую пользователь желает получить конкретный ответ на постав- ленный вопрос. Для преодоления этой проблемы в MW были введены статьи- списки. Они состоят из ссылок на дру- гие статьи, объединенные одной тема- тикой. Однако и этот подход имеет мно- го недостатков, поскольку пользователь при создании статьи должен собствен- норучно вносить изменения в списки, которых она касается. Аналогично, при изменении информации в статье из списка, нужно вручную править статью- список. SMW благодаря механизму ди- намического создания страниц и боль- шим количеством форматов вывода контента помогает решить эту проблему. Одним из главных недостатков SMW является отсутствие встроенной поддержки моделирования правил. По- этому, она не дает возможности из явных утверждений Wiki получать метаданные. Однако, по Жи Бао [54], использование шаблонов и расширений позволяет смоде- лировать несколько наиболее употреби- тельных и полезных типов правил в SMW: моделирование логического следствия OWL, логических программ, проверка на ограничение целостности. Роль расширений в системе SMW очень важна. Приложение Triple Store Connector позволяет соединить Wiki с RDF- хранилищем и использовать SPARQL для запросов. Версия 1.6 работает с любым RDF-хранилищем, поддерживающим SPARQL и SPARQL Update. Данные, созданные в SMW, могут легко передаваться в форматах CSV, JSON и RDF наружу. Это дает возможность Wiki быть источником данных для внешних приложений, исполняя роль, которую обычно выполняют реляционные базы данных. А с использованием расширений External Data и Semantic Result Formats, несколько семантических Wiki могут ис- пользовать данные друг друга, устраняя необходимость в дублировании и ручной синхронизации. Дополнения Data Import, Data Transfer и External Data позволяют использовать данные извне: с Web- сервисов, ресурсов Linked Data, уже суще- ствующих систем. Таким образом, систе- ма, построенная на SMW, может выпол- нять роль информационного хаба, кото- рый собирает и синхронизирует данные отовсюду. Расширение Semantic Forms пред- лагает не опытным Wiki-пользователям интерфейс для ввода данных с помощью форм с поддержкой автозаполнения по- лей. Приложение Halo Extension имеет целью сделать работу людей еще удобнее, Експертні та інтелектуальні інформаційні системи 63 обеспечив WYSIWYG редактором, обо- зревателем онтологий и семантической панелью инструментов. Расширение Ontology Editor является платформой для совместной разработки легких онтологий. Оно обогащает систему мощными интер- фейсами редактирования и создания онто- логий, статистике, импортом и экспортом фолксономий и онтологий, алгоритмом восстановления знания. Учитывая широкое распростране- ние и сообщество активных пользовате- лей, SMW можно считать наиболее успешной семантической Wiki-системой. Она нашла применение во многих направ- лениях, в частности в крупных биовики: SNPedia, Neurolex. Среди других удачных примеров применения следует привести Shortipedia-Wiki, сайт для сбора фактов [55], который завоевал третье место на Semantic Web Challenge 2010. IkeWiki и KiWi (IW) олицетворяет направление построения семантических Wiki [55], в котором используются онто- логии для улучшения самой системы. В IW реализован функционал построения логического вывода для поддержки поль- зователя в выполнении задач. Система предлагает и WYSIWYG редактор, кото- рый пригодится пользователям, которые не имеют опыта работы с Wiki- редактором. IkeWiki платформа написана на языке Java. Данные хранятся в СУБД Postgres, однако существует разграниче- ние текста и структуры документов. При необходимости, они возвращаются пользователю в удобном формате XML (для текста) или RDF (для структуры). База знаний в системе представ- лена RDF фреймворком Jena. Часть RDF-хранилища является SPARQL- движком, обеспечивающим поиск в си- стеме и базе. Для аннотаций существует три вида редакторов. Редактор метаданных позволяет заполнять текстуальные мета- данные, касающиеся страницы (данные Dublin Core или RDF комментарии). Редактор типа позволяет ассоциирова- ние страницы с одним или несколькими типами, внедренными в систему. Редак- тор ссылок обеспечивает управление аннотациями ссылок. В IkeWiki доступ- ны аннотации, определяющиеся логиче- ским выводом. Например, если ссылка из статьи «Kyiv» до «Ukraine» имено- вать как «capitalOf», то система автома- тически ассоциирует тип «Capital» стра- ницы, описывающий Киев, и этот тип не может быть удален пользователем. IkeWiki больше не развивается как самостоятельная система. Ее продолже- нием стала система KiWi [56], которая унаследовала большинство характери- стик. Онтологическая единица этой си- стемы определяется с помощью URI и включает текст понятный человеку в формате XHTML. Можно сделать KiWi-систему частью Linked Open Data, что в свою очередь, делает возможной ин- теграцию контента с другими сервисами Semantic Web. В системе KiWi реализован фасет- ный поиск, способный совмещать поиск метаданных (типы, теги, люди), текстовый поиск и поиск в базе данных (название, дата). Более сложный поиск находится в состоянии разработки. Среди особенностей системы KiWi следует отметить настраиваемую стра- ницу пользователя под названием Dashboard. Она позволяет удобно отсле- живать и применять в работе: поток деятельности (например, обновление к элементам контента), рекомендации (предлагает пользователю другой контент с помощью различных рекомендатель- ных алгоритмов), историю (список эле- ментов, которые просматривал или ре- дактировал пользователь), теги (список тегов используемых пользователем). Кроме этого, Dashboard это и профиль пользователя, и список его друзей. Так, в системе KiWi делают упор на функцио- нале социальных сетей, поскольку он по- могает определить контекст, над которым работает пользователь. OntoWiki [51] предназначена для разработки баз знаний. Платформа ставит на первое место представления данных в формате RDF. Для машинной Експертні та інтелектуальні інформаційні системи 64 обработки система поддерживает раз- личные RDF-форматы и RDFa, Linked Data и SPARQL-интерфейсы. Знания в системе представлены так называемой "информационной картой", обогащенной удобными интерфейсами для визуализа- ции и редактирования контента (WYSIWYG редактор RDF, контроль вер- сий, статистика, поддержка сообщества и т.д.). Каждый узел (представлен стра- ницей системы) в информационной кар- те связан с соответствующим цифровым источником. OntoWiki спроектирована для ра- боты с онтологиями любого размера и пытается поддерживать создание онтоло- гий "с нуля". Эта платформа не только позволяет применять частично опреде- ленные шаблоны из репозитария шаб- лонов, но и создавать собственные. Она поддерживает коллаборативную разра- ботку путем отслеживания изменений, возможностью комментировать и обсуж- дать каждую часть базы знаний, позво- ляя оценивать и ограничивать количе- ство контента и поощрять пользователь- скую активность. Семантический поиск системы представлен как поиск в локальном RDF- хранилище с помощью SPARQL-запросов и предлагает несколько способов нави- гации: таксономический и иерархический поиск, фасетный поиск и текстовый по- иск. В сочетании с поисковым роботом, который ищет, загружает и сохраняет любые RDF-документы с Webа, OntoWiki можно легко превратить в се- мантическую поисковую систему. Freebase. Система Freebase (FB) заинтересовала Google и приобретена компанией летом 2010 года. Эта плат- форма позволяет пользователям опреде- лять собственные схемы для моделиро- вания различных типов данных и управ- лять связанной структурированной ин- формацией. FB – это большая колабора- тивная база знаний. Она содержит значи- тельно меньше триплетов чем DBpedia (в 10 раз), однако качество данных значи- тельно лучше. Платформа FB пытается интегри- ровать различные подходы к формирова- нию базы знаний. Кроме Wiki-стиля, она имеет возможность собирать информацию автоматически с различных ресурсов, таких как Wikipedia и MusicBrainz. Неко- торые сущности могут быть смоделирова- ны и добавлены к системе людьми. Одна- ко в ней не просто создавать собственные типы. Она имеет и сложный интерфейс. Все атрибуты должны иметь типы и границы определенные самой системой. FB имеет строгие ограничения схемы, что может вызвать неудобства в опубликова- нии данных. Web-интерфейс предоставляет пользователям удобную возможность искать, принимать, редактировать и орга- низовывать информацию. Основной спо- соб доступа к FB – через API на основе протокола HTTP. Все операции по за- просам происходят на специально разра- ботанном языке MQL (Metaweb Query Language). Недостатком платформы является сложность присоединения к внешнему ре- сурсу изнутри FB. Система связывает дан- ные друг с другом с помощью значений атрибутов, однако она не может подклю- читься к другим источникам на уровне данных. Заключение Информационные ресурсы Сети составляют свыше десятка миллиардов документов (Web-страниц) и их количе- ство существенно увеличивается с каж- дым днем. Для поиска информации в этой распределенной, полнотекстовой ба- зе данных необходимо использовать са- мые мощные ИПС. Необходимость ана- лиза больших объемов неструктуриро- ванных или слабо структурированных данных очень часто усложняют процесс принятия решений. Для подобного ана- лиза нужны технологии другого типа, представленные системами добычи зна- ний. Примером такой системы может быть система mSpace. Она представляет собой набор мощных инструментов, позволяющих собирать данные из раз- личных источников, организовывать ин- формацию по категориям и дающих воз- Експертні та інтелектуальні інформаційні системи 65 можность пользователю свободно ориен- тироваться в ней. СП уже вполне готова к широкому внедрению в корпоративном секторе. Все ее основополагающие технологии стано- вятся стандартами, а крупные участники рынка высоких технологий внедряют их в прикладные программы корпоративного уровня. Для совершенствования процессов создания, копирования и доступа к знани- ям предлагается использовать системы управления знаниями, основанные на технологии Wiki. Множество реализаций Wiki-систем позволяют выбрать наиболее полезную систему, а условия распростра- нения позволяют создать персональную или корпоративную базу знаний, исполь- зуя наиболее подходящие семантические Wiki. Это значительно упростит созда- ние развитого, более функционального информационного пространства. Представленный в работе обзор может использоваться разработчиками прикладных интеллектуальных систем для выбора адекватных средств построения распределенных баз знаний. 1. Андон Ф.И., Гришанова И.Ю., Резниче- нко В.А. Semantic Web как новая модель информационного пространства Интернет // Проблеми програмування. – 2008. – № 2/3 (спец. вип.). – С. 417–430. 2. Андон Ф.И., Яшунин А.Е., Резниченко В.А. Логические модели интеллектуальных информационных систем. – К.: Наук. думка, 1999. – 396 с. 3. Глибовец Н.Н., Глибовец А.Н., Шабин- ский А.С. Применение онтологий и методов текстового анализа при создании интеллектуальных поисковых систем // Проблемы управления и информатики. – 2011. – № 6. – С. 95–103. 4. Berners-Lee T., Hendler J., Lassila O. The Semantic Web. Scientific American, 2001, 284, С. 34–42. 5. World Wide Web Consortium(W3C) – Режим доступа: http://www.w3.org – Название с экрана. (Загружено 21.04.2011) 6. Андон П.І., Дерецький В.О. Засоби координації агентів у пошукових архітектурах Web // Проблеми програ- мування. – 2004. – № 1. – С. 60–70. 7. Пелещишин А.М., Березко О.Л. Аналіз сучасних концепцій розвитку середовища WWW // Вісник Національного уні- верситету "Львівська політехніка": Комп’ютерні науки та інформаційні технології. – 2006. – № 565. – С. 57–64. 8. Segaran T., Evans C., Taylor J. Programming the Semantic Web. Build Flexible Applications with Graph Data. – O'Reilly Media, 2009. – P. 302. 9. Mahola E., Miller E., eds RDF Primer W3C Recommendation (2004) – Режим доступа: http://www.w3.org/TR/xhtml-rdfa-primer/ 10. SPARQL Query Language for RDF. W3C Recommendation 15 January 2008 – Режим доступа: http://www.w3.org/TR/rdf-sparql- query/ 11. Bratt S. Semantic Web, and Other Technologies to Watch, World Wide Web Consortium (2007). – Режим доступа: http://www.w3.org/2007/Talks/0130-sb- W3CTechSemWeb/#(24) – Название с экрана. (Загружено 21.04.2011) 12. Berners-Lee T. Linked data. World Wide Web design issues. (2000). – Режим досту- па: <http://www.w3.org/DesignIssues/Linked Data.html> – Название с экрана. (Загружено 03.02.2011) 13. Андон П., Дерецький В. Проблеми побудо- ви сервіс-орієнтованих прикладних інфор- маційних систем в semantic Web середовищі на основі агентного підходу // Проблеми програмування. – 2006. – № 2-3. – (спец. вип.). – С. 493–502. 14. SWRL: A Semantic Web Rule Language Combining OWL and RuleML: W3C Member Submission 21 May 2004. – Режим доступа: http://www.w3.org/Submission /SWRL/ 15. Microformats – Режим доступа: http://microformats.org/ 16. RDFa 1.1 Primer. Rich Structured Data Markup for Web Documents: W3C Working Group Note 07 June 2012. – Режим доступа: http://www.w3.org/TR/xhtml-rdfa-primer/ 17. RSS: Really Simple Syndication: 21 Mar 2007. – Режим доступа: – technet.microsoft.com/en-us/.../secrssinfo 18. BigTorrent – Режим доступа: ru.wikipedia.org/wiki/BitTorrent 19. Allsopp J. Developing with Web Standards. – New Riders. – 2010. – 432 p. 20. What is CSS? – Режим доступа: http://www.w3.org/Style/CSS/ 21. The Species of OWL.– Режим доступа: http://www.w3.org/TR/owl-guide/ #OwlVarieties 22. OWL Full, OWL DL and OWL Lite. – http://www.w3.org/ http://www.w3.org/TR/xhtml-rdfa-primer/ http://www.w3.org/TR/rdf-sparql-query/ http://www.w3.org/TR/rdf-sparql-query/ http://www.w3.org/2007/Talks/0130-sb-W3CTechSemWeb/#(24) http://www.w3.org/2007/Talks/0130-sb-W3CTechSemWeb/#(24) http://www.w3.org/Submission/SWRL/ http://www.w3.org/Submission/SWRL/ http://microformats.org/ http://www.w3.org/TR/xhtml-rdfa-primer/ http://technet.microsoft.com/en-us/security/bulletin/secrssinfo http://www.w3.org/Style/CSS/ http://www.w3.org/TR/owl-guide/#OwlVarieties http://www.w3.org/TR/owl-guide/#OwlVarieties Експертні та інтелектуальні інформаційні системи 66 Режим доступа: http://www.w3.org/TR/owl- ref/#Sublanguage-def 23. Semantic Web Services. – Режим доступа: http://www.ai.sri.com/daml/services/ 24. Dublin Core Metadata Element Set, Version 1.1 – Режим доступа: http://dublincore.org/ documents/dces/ 25. DBpedia. – Режим доступа: http://en.wikipedia.org/wiki/DBpedia 26. Хатян О.А. Онтології як інструментальна складова дослідження інформаційного простору // Інформаційна безпека людини, суспільства, держави. – 2010. –№ 1(3). – С. 71–77. 27. Gruber T.R. A translation approach to portable ontologies // Knowledge Acquisition. – 1993. – V. 5(2). – P. 199–220. 28. Corcho O., Fernandez-Lopez M., Gomez- Perez A. Methodologies, tools and languages for building ontologies. Where is their meeting point? Data & Knowledge Engineering. – 2003. – 46(1). – P. 41–64. 29. Hovy E. Combining and standardizing large- scale, practical ontologies for machine translation and other uses. Proceedings of the 1st I nternational Conference on Language Resources and Evaluation (LREC): Granada, Spain. 1998) – Режим доступа: http://www.isi.edu/natural-language/people/ hovy/papers/98LREC-ontol-align.pdf 30. Hendler J. A little semantics goes a long way. – Режим доступа: http://www.cs.rpi.edu/ ~hendler/LittleSemanticsWeb.html 31. Глибовець А.М., Шабінський А.С. Один підхід до побудови інтелектуальної пошукової системи // Наукові записки НАУКМА. Комп’ютерні науки. – 2010. – Том 112. – С. 26–30. 32. Анісімов А.В., Глибовець А.М., Жаб’юк В.Я. Основні архітектурні принципи побудови програмних систем реаліза- ції мобільних агентів // Вісник Київсь- кого національного університету імені Тараса Шевченка. – серія: фізико-мате- матичні науки. – Випуск № 3. – 2008. – С. 125–131. 33. Глибовець А.М., Гороховський С.С., Жаб’юк В.Я. Вирішення проблем побудови платформи мобільних агентів за допомогою технологій Java, Jini // Вісник Київського національного університету імені Тараса Шевченка. – серія: фізико- математичні науки. – Випуск № 4. – 2008. – С. 109–115. 34. Linking Open Data. W3C SWEO Community Project (22.10.2010). – Режим доступа: http://www.w3.org/wiki/SweoIG/TaskForces/ CommunityProjects/LinkingOpenData – (Загружено 21.05.2011.) 35. Глибовець М.М., Глибовець М.М., Бон- дар Є.О., Гороховський С.С. Хмарні обчислення. Проблеми і перспективи // Вісник Київського університету. – 2011. – № 1. – С. 74–81. 36. Protégé. Режим доступа: http://protege. stanford.edu/ 37. TopBraid Composer. – Режим доступа: http://www.topquadrant.com/products/TB_Co mposer.html. 38. GooglDocs. – Режим доступа: docs.google.com/ 39. WhatIsWiki. – Режим доступа: http://wiki.org/wiki.cgi?WhatIsWiki 40. Portland Pattern Repository. – Режим доступа: http://c2.com/ppr/ 41. TiddyWiki a reusable non-linear personal веб notebook – Режим доступа: http://www.tiddlywiki.com 42. Bo Leuf, Ward Cunningham, The Wiki Way: Quick Collaboration on the Web, Addison- Wesley. – 2001. – 436 p. 43. Schaffert S. IkeWiki: A Semantic Wiki for Collaborative Knowledge Management. Proceedings of the 15th IEEE International Workshops on Enabling Technologies: Infrastructure for Collaborative Enterprises. – 2006. – Р. 388–396. 44. Sauermann L. The Gnowsis. Using Semantic Web Technologies to build aSemantic Desk- tophttp – Режим доступа: www.dfki.uni- kl.de/~sauermann/papers/sauermann2003.pdf 45. English J., Hearst M., Sinha R., Swea- ringen K., Yee K.P. Hierarchical faceted metadata in site search interfaces // CHI'02 extended abstracts on Human factors in computing systems. ACM New York, NY, USA. – 2002. – Р. 628–639. 46. P Castagna, SE Campanini. Towards a semantic wiki wiki web. – Режим доступа: http://www.tecweb.inf.puc-rio.br/semweb/ space/Platypus+Wiki/platypuswiki.pdf 47. Souzis A. Building a Semantic Wiki // IEEE Intelligent Systems. – 2005. – Vol. 20. – N 5. – P. 87–91. 48. Shakya A., Takeda H. and Wuwongse V. Community-driven Consolidated Linked Data, in M. Sheth ed., Semantic Services, Interoperability and Web Applications: Emerging Concepts. – 2011. – P. 228–258. 49. Buffa M et al. SweetWiki: A semantic wiki // Journal of Web Semantics. – 2008. – 6(1). – Р. 84–97. 50. Völkel M. et al. Semantic Wikipedia // J. of Web Semantics. – 2007. – N 5. – Р. 251–261. http://www.w3.org/TR/owl-ref/#Sublanguage-def http://www.w3.org/TR/owl-ref/#Sublanguage-def http://www.ai.sri.com/daml/services/ http://dublincore.org/documents/dces/ http://dublincore.org/documents/dces/ http://en.wikipedia.org/wiki/DBpedia http://www.isi.edu/natural-language/people/%20hovy/papers/98LREC-ontol-align.pdf http://www.isi.edu/natural-language/people/%20hovy/papers/98LREC-ontol-align.pdf http://www.cs.rpi.edu/~hendler/LittleSemanticsWeb.html http://www.cs.rpi.edu/~hendler/LittleSemanticsWeb.html http://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenData http://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenData http://protege.stanford.edu/ http://protege.stanford.edu/ http://wiki.org/wiki.cgi?WhatIsWiki http://c2.com/ppr/ http://www.tiddlywiki.com/ http://ru.wikipedia.org/w/index.php?title=The_Wiki_Way:_Quick_Collaboration_on_the_Web&action=edit&redlink=1 http://ru.wikipedia.org/w/index.php?title=The_Wiki_Way:_Quick_Collaboration_on_the_Web&action=edit&redlink=1 http://www.dfki.uni/ http://portal.acm.org/citation.cfm?id=506517 http://portal.acm.org/citation.cfm?id=506517 http://www.acm.org/publications http://www.tecweb.inf.puc-rio.br/semweb/space/Platypus+Wiki/platypuswiki.pdf http://www.tecweb.inf.puc-rio.br/semweb/space/Platypus+Wiki/platypuswiki.pdf http://www.tecweb.inf.puc-rio.br/semweb/space/Platypus+Wiki/platypuswiki.pdf http://www.tecweb.inf.puc-rio.br/semweb/space/Platypus+Wiki/platypuswiki.pdf http://dx.doi.org/10.4018/978-1-60960-593-3.ch009 http://dx.doi.org/10.4018/978-1-60960-593-3.ch009 Експертні та інтелектуальні інформаційні системи 67 51. Auer S., Dietzold S., Riechert T. OntoWiki–A tool for social, semantic collaboration // ISWC 2006, 5th International Semantic Web Conference, Athens, GA, USA. – 2007. – Р. 736–749. 52. SAR – Режим доступа: http://en.wikipedia. org/wiki/SAR. 53. Krötzsch M., Vrandečić D., Völkel M. Semantic MediaWiki // Lecture Notes in Computer Science. – 2006. – Р. 935–942. 54. Bao J. et al. – Rule Modeling Using Semantic MediaWiki // 3rd Annual Conference of the International Technology Alliance (ACITA'09), Maryland, USA, 2009. 55. Vrandecic D. et al. – Shortipedia: Aggre- gating and Curating Semantic Web Data. Proceedings of the ISWC, Shanghai. – 2010. 56. Schaffert S. et al. KiWi – A Platform for Semantic Social Software. 4th Semantic Wiki Workshop at ESWC09 Heraklion, 2009. Получено 19.07.2012 Об авторах: Глибовец Андрей Николаевич, кандидат физико-математических наук, доцент кафедры сетевых технологий НаУКМА, Глибовец Николай Николаевич, доктор физико-математических наук, профессор, декан факультета информатики НаУКМА, Покопцев Дмитрий Евгеньевич, магистр, Сидоренко Марина Олеговна, ассистент кафедры информатики НаУКМА. Место работы авторов: Национальный университет “Киево-Могилянская Академия”, 254070, Киев-70, ул. Григория Сковороды, 2, Тел.: (044) 463 6985, факс.: (044) 416 4515, e-mail: glib@ukma.kiev.ua http://en.wikipedia.org/wiki/SAR http://en.wikipedia.org/wiki/SAR mailto:glib@ukma.kiev.ua
id nasplib_isofts_kiev_ua-123456789-86652
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 1727-4907
language Russian
last_indexed 2025-11-29T06:41:28Z
publishDate 2013
publisher Інститут програмних систем НАН України
record_format dspace
spelling Глибовец, А.Н.
Глибовец, Н.Н.
Покопцев, Д.Е.
Сидоренко, М.О.
2015-09-25T14:55:23Z
2015-09-25T14:55:23Z
2013
Семантическая паутина и Wiki-системы / А.Н. Глибовец, Н.Н. Глибовец, Д.Е. Покопцев, М.О. Сидоренко // Проблеми програмування. — 2013. — № 1. — С. 45-67. — Бібліогр.: 56 назв. — рос.
1727-4907
https://nasplib.isofts.kiev.ua/handle/123456789/86652
519.683
Представлен аналитический обзор современных результатов, связанных с созданием семантического Webа и целого ряда проблем, систем, технологий, активно разрабатываемых в общем направлении развития Интернета. Особое внимание уделяется исследованиям онтологий и Wiki технологиям.
ru
Інститут програмних систем НАН України
Проблеми програмування
Експертні та інтелектуальні інформаційні системи
Семантическая паутина и Wiki-системы
published earlier
spellingShingle Семантическая паутина и Wiki-системы
Глибовец, А.Н.
Глибовец, Н.Н.
Покопцев, Д.Е.
Сидоренко, М.О.
Експертні та інтелектуальні інформаційні системи
title Семантическая паутина и Wiki-системы
title_full Семантическая паутина и Wiki-системы
title_fullStr Семантическая паутина и Wiki-системы
title_full_unstemmed Семантическая паутина и Wiki-системы
title_short Семантическая паутина и Wiki-системы
title_sort семантическая паутина и wiki-системы
topic Експертні та інтелектуальні інформаційні системи
topic_facet Експертні та інтелектуальні інформаційні системи
url https://nasplib.isofts.kiev.ua/handle/123456789/86652
work_keys_str_mv AT glibovecan semantičeskaâpautinaiwikisistemy
AT glibovecnn semantičeskaâpautinaiwikisistemy
AT pokopcevde semantičeskaâpautinaiwikisistemy
AT sidorenkomo semantičeskaâpautinaiwikisistemy