The practical approach for realization Semantic Web applications
It is well understood that the key for successful Semantic Web applications depends the availability of machine understandable metadata. In this paper, we describe a practical approach to the Semantic Web called Information Grid. Information Grid resources span all the data in the organization and a...
Gespeichert in:
| Datum: | 2026 |
|---|---|
| Hauptverfasser: | , , |
| Format: | Artikel |
| Sprache: | Russisch |
| Veröffentlicht: |
PROBLEMS IN PROGRAMMING
2026
|
| Schlagworte: | |
| Online Zugang: | https://pp.isofts.kiev.ua/index.php/ojs1/article/view/943 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
| Назва журналу: | Problems in programming |
| Завантажити файл: | |
Institution
Problems in programming| _version_ | 1866844966922223616 |
|---|---|
| author | Deretskiy, V.A. Bogdanova, M.M. Goroshansky, S.I. |
| author_facet | Deretskiy, V.A. Bogdanova, M.M. Goroshansky, S.I. |
| author_institution_txt_mv | [
{
"author": "V.A. Deretskiy",
"institution": "Institute of Software Systems NAS of Ukraine"
},
{
"author": "M.M. Bogdanova",
"institution": "Institute of Software Systems NAS of Ukraine"
},
{
"author": "S.I. Goroshansky",
"institution": null
}
] |
| author_sort | Deretskiy, V.A. |
| baseUrl_str | https://pp.isofts.kiev.ua/index.php/ojs1/oai |
| collection | OJS |
| datestamp_date | 2026-06-01T06:02:58Z |
| description | It is well understood that the key for successful Semantic Web applications depends the availability of machine understandable metadata. In this paper, we describe a practical approach to the Semantic Web called Information Grid. Information Grid resources span all the data in the organization and all the metadata required to make it meaningful. This data maybe structured, semistructured, or unstructured; stored anywhere; and created by any application. We present an architecture that integrates Semantic Web techniques into existing technologies in a novel way. We show the design and implementation of a prototype that demonstrates the ideas presented in the paper.Problems in programming 2010; 2-3: 494-501 |
| first_indexed | 2026-06-02T01:01:37Z |
| format | Article |
| fulltext |
Інформаційні системи
© В.А. Дерецкий, М.М. Богданова, С.И. Горошанский, 2010
494 ISSN 1727-4907. Проблеми програмування. 2010. № 2–3. Спеціальний випуск
УДК 681.3
ПРАКТИЧЕСКИЙ ПОДХОД К РЕАЛИЗАЦИИ ПРИЛОЖЕНИЙ
СЕМАНТИЧЕСКОГО ВЕБ
В.А. Дерецкий, М.М. Богданова, С.И. Горошанский
Институт программных систем НАН Украины,
03187, Киев-187, проспект Академика Глушкова, 40,
тел.: 38 044 526 4342, 38 044 526 6249, e-mail: {dva, bmm}@isofts.kiev.ua
НТЦ ГП НАЭК «Энергоатом»
01054, Киев-54, ул. Б. Хмельницкого, 63-А,
тел.: 38 044 206 9727, e-mail: s.goroshansky@ntc.atom.gov.ua
Одной из ключевых характеристик приложений семантического Веб является доступность машинно-читаемых метаданных. В
данной работе описывается практический подход к семантическому Веб, который охватывает данные и метаданные на
предприятии. Эти данные могут быть структурированными, слабоструктурированными или неструктурированными; хранящиеся в
любых базах данных и созданные любым приложением. В работе представлена архитектура, которая новым способом интегрирует
возможности семантического Веб в существующие технологии. Ключевая цель архитектуры состоит в том, чтобы позволить
организациям видеть сервисы в Интернете с унифицированным семантическим описанием. Приведен также прототип практической
реализации подхода.
It is well understood that the key for successful Semantic Web applications depends the availability of machine understandable metadata. In
this paper, we describe a practical approach to the Semantic Web called Information Grid. Information Grid resources span all the data in the
organization and all the metadata required to make it meaningful. This data maybe structured, semistructured, or unstructured; stored
anywhere; and created by any application. We present an architecture that integrates Semantic Web techniques into existing technologies in a
novel way. We show the design and implementation of a prototype that demonstrates the ideas presented in the paper.
Введение
Существуют два подхода к управлению данными: виртуализация и конвергенция. Виртуализация
вычислительных ресурсов позволяет приложениям быть независимыми от отдельных конкретных элементов
Grid. Она определяет структуру для разделения ресурсов в различных средах выполнения и приводит к
снижению стоимости приложения. Среда Grid-вычислений обеспечивает не только виртуализацию
информационных ресурсов, таких как хранилища данных, каналы передачи данных, вычислительные ресурсы,
но обеспечивает также свободную связь между приложениями и модулями, которые больше не являются
монолитными клиентами и серверами. Слабосвязанные приложения выполняются различными модулями на
виртуальных Веб-узлах, могут инициировать выполнение функций удаленных Веб-сервисов, обмениваться
метаданными и другой информацией и проводить оркестровку модулей процесса. Технологии XML
поддерживают слабосвязанные приложения Grid-вычислений. Архитектура распределенных вычислений
основана на принципах SOA (Service Oriented Architectures).
Конвергенция направлена на централизацию и стремится согласовать управление всеми данными. В
настоящее время менее 10 процентов информации, полученной при сборе, хранении, индексировании, поиске,
анализе данных, относится к категории структурированных данных. Конвергенция дает возможность управлять
оставшейся частью данных. Существуют модели данных, которые способны представлять структурированные
данные (реляционные), текстовые неструктурированные данные (документы) и слабоструктурированные
данные (сообщения, шаблоны, деловые документы или метаданные). Стандартизация форматов документов на
основе XML позволяет приложениям динамически настраиваться в соответствии с изменяющимися
требованиями бизнеса. Создавая информационное наполнение с использованием XML, поставщики облегчают
задачи информационного наполнения. XML является инструментом для совместного и повторного
использования информации серверными приложениями, порталами и другими информационными сервисами.
Когда неструктурированная информация становится ресурсом, она может быть интегрирована в большое
число процессов, таких как поиск и согласование. Пользователи могут искать информацию, которая ранее
хранилась в хранилищах, например, файловые системы, репозитории документов, Веб-сайты и электронная
почта. Согласование может быть осуществлено единообразно во всех средствах. Унификация удаленного
доступа к компонентам архитектуры Grid и возможность сбора, обработки и анализа информации о состоянии
компонент распределенной системы в сочетании с управлением их состоянием является краеугольным камнем
концепции, а архитектура управления данными, основанная на XML, является ключевой для построения новых
информационных систем.
Інформаційні системи
495
1. Информационный Grid
Grid-вычисления для большинства пользователей представляются как вычислительные кластеры,
которые нашли применение в Grid-приложениях. В работе рассматриваются подходы, применяемые в Grid для
информационных систем.
Ресурсами в информационном Grid являются данные, а также метаданные, необходимые для описания
этих данных. Данные могут быть структурированными, слабоструктурированными или неструктурированными,
они могут храниться в базах данных, локальных файловых системах, почтовых серверах или создаваться
любым приложением. Основой для построения информационного Grid является семантический Веб, цель
которого состоит в том, чтобы дать пользователям доступ к Интернет ресурсам с использованием
унифицированного семантического доступа. В Grid приложениях отдельные модули, созданные на различных
платформах, могут совместно использоваться как Веб-сервисы. Каждый модуль жестко связан со своими
данными (база данных, файловая система, почтовый сервер). Сведения о данных должны компилироваться в
модуле приложения. В информационном Grid, наоборот, модули приложений сами могут осуществлять поиск
источников, определять какими данными они обладают, существует ли жизненный цикл этих данных и как
данные нужно интерпретировать. Информационный Grid строится на инфраструктуре Grid-приложений.
Например, на производстве заинтересованы в отслеживании дефектов выпускаемой продукции. Данные
о дефектах поступают на производство из различных источников – электронная почта, непосредственно от
заказчика, газетные материалы, телефонные звонки в службу поддержки и т.п. На прикладном уровне,
организация могла бы построить параллельно анализ электронной почты, RSS-поиска или отслеживать дефекты
с использованием модулей CRM, но в каждом таком модуле анализируется только один вид данных. При
появлении новых видов данных о дефектах, которые являются непредвиденными (например, Интернет блоги
становятся главным источником информации о дефектах), то модули, которые жестко закодированы для
заданного вида данных, невозможно применить и Grid-приложение нельзя применить в данном случае.
Информационный Grid, в котором могут быть описаны данные о дефекте, является более гибким подходом для
понимания семантики.
2. Компоненты информационного Grid
Далее рассмотрим основные компоненты информационного Grid.
2.1. Репозиторий метаданных, управление сервисами. Недостающим звеном для эффективного
совместного и многократного использования данных в Веб является недостаток машино-читаемых стандартов
для контента различных областей семантического Веб. Семантический Веб часто связывается с основанными
на XML стандартах метаданных для описания общей семантики, например, с использованием RDF и OWL.
Каждый продукт или сервис предприятия представлен в виде XML-файла, который содержит описание данных
стандартным образом для их использования другими приложениями. XML является основным стандартом для
обмена финансовой отчетности (XBRL), при наполнении Веб-узла (RSS), при обмене юридической
информацией (LegalXML) и т.п. В дополнение к стандартам форматов обмена появляются стандарты
управления подобно языку разметки управления доступом (Access Control Markup Language – XACML) или
цифровое управление правами интеллектуальной собственности (digital intellectual property rights management –
XRML).
Информационный Grid использует семантическую информацию для того, чтобы сделать каждый ресурс
данных доступным любому процессу в Grid приложениях, без требований априорной связи между ресурсами и
Grid-процессами. На практике такая возможность возлагается на метаданные, описывающие значения и
взаимоотношения между элементами данных, реализацию форматов обмена и стандартов управления.
Реляционная модель данных была одной из ранних реализаций технологии метаданных. XML является
следующим шагом эволюции метаданных. Центральную часть информационного Grid представляет XML
репозиторий метаданных. Этот репозиторий (физически может находиться на Веб-узлах и дисках) содержит
информацию об информации, которая помогает организовать все ресурсы, участвующие в информационном
Grid, в иерархические отношения, например, записи о счетах, находящиеся в базе данных А, логически
принадлежат папке под названием Клиент, которая находится в файловой системе В, описание этого клиента
должно быть в CRM-приложении C, взаимодействие с клиентом зарегистрировано в почтовом сервере D”.
Данные связи автоматически выводятся из тэгов XML.
Метаданные порождаются онтологиями различных видов. Онтологии могут определять не только
предметную область (“дефектом может быть фактический отказ или возможный отказ”), но и определять
задачи (“как вычислить вероятность возможного отказа”). Они могут быть персонифицированными
(“представление дефекта от Legal, Support, Marketing или Finance perspectives”), а также содержать
аргументацию (“почему данные о дефекте были собраны, почему это было смоделировано таким способом, кто
с этим соглашается и кто возражает”) и т.д.
Репозиторий приложения содержит сервис управления событиями, например, реагирующий на ситуацию
(“что сделать, если клиент удален”), бизнес-правила (“как вычисляются оптовые скидки”), контроль версий
(“определить новую версию счета, отображающего оптовую скидку”), сервис управления доступом (“кто может
видеть номер кредитной карточки клиента”) и т.д.
Інформаційні системи
496
Последние поколения базы данных Oracle включают модель данных XML, в том числе поддержку
стандарта XML Schema для реализации обмена. Oracle также включает встроенную XML функциональность
репозитория метаданных, поддерживающую управление событиями, бизнес-правила, управление версиями,
контроль доступа, управление правами и другие.
2.2. Семантические поисковые механизмы. В Интернете поисковые механизмы обеспечиваются
поисковыми агентами [1] для выявления метаданных информационных ресурсов, проводят их индексирование
для дальнейшего поиска по ключевым словам. Поисковые серверы обеспечивают такую же возможность в
пределах Grid. В информационном Grid семантические поисковые агенты извлекают метаданные из средств,
используя существующие разметки и применяя различные эвристики для определения взаимоотношений между
информационными элементами в методах поиска текстовой информации. В момент поступления сообщения на
почтовый сервер семантический поисковик определяет наличие сообщения и получение ответа, указывающего
на уровень удовлетворенности клиента. По запросу имени клиента поисковый сервер может нанести цветную
маркировку на результаты поиска, что указывает насколько клиент удовлетворен полученными результатами.
В настоящий момент, поисковые механизмы являются плохими примерами семантической обработки,
обычно два пользователя на один и тот же запрос получают одинаковый результат, даже если один искал
насекомое (cricket – сверчок), а другой игру (cricket). В результате семантической неоднозначности,
полученные результаты поиска являются нерелевантными запросам. В идеале поисковый запрос будет уточнен
контекстом пользователя и данными контекста создателя и, в случае совпадения контекстов, будут получены
однозначные результаты.
В Интранет поисковые агенты участвуют в реализации политики безопасности, информационном
управлении жизненным циклом и политике конфиденциальности. Лучшие поисковые серверы объединяют
безопасность, семантическую релевантность возвращаемых результатов и способность разумно представлять
контекстную информацию.
Другой аспект информационного Grid состоит в интеграции. Дополнительно к поиску по ключевым
словам необходимо выполнять запросы к другим источникам данных, например, выполнить расширенный
запрос SQL или OLAP. Данные в информационном Grid не всегда реляционные, поэтому не всегда возможно
использование механизма SQL; однако, если все информационные ресурсы будут описаны с помощью XML, то
может быть использован язык запросов, основанный на XML. Появление стандарта XQuery, объединенного с
технологией J2EE Connector Architecture, дает возможность использовать запросы через присоединение
документов (joins), выраженных XML и реляционных данных, также выраженных XML. Мощность XQuery
позволяет выражать запросы ко всем видам данных, физически сохраненных в XML форматах. Например, для
определения количества людей приславших запросы, можно присоединить к системе электронной почты имя
клиента, полученного из базы данных и т.п.
2.3. Информационное представление и визуализация. Люди обрабатывают информацию более
эффективно если она представлена графически, а не словесно. Известно что «одно изображение стоит тысячу
слов». Способ представления информации может воздействовать на принятое решение. Недостаточная или
неправильная интерпретация информации может привести к ошибочным решениям и упущенным
возможностям.
Для большого количества информации в информационном Grid методы визуализации могут помочь
пользователям обрабатывать большие объемы данных, создавая краткие аннотации и механизмы
интерпретации определенных контекстов. В различных приложениях пользователи должны иметь возможность
увидеть взаимосвязь между информацией и контекстом.
3. Обзор технологии Oracle
Далее рассмотрим основные особенности базы данных Oracle в контексте информационного Grid.
3.1. Репозиторий XDB. Oracle XDB обеспечивает независимое хранение, независимый контент и
независимую инфраструктуру языка программирования для хранения и управления данными XML. Он
предоставляет новые методы навигации в запросах для XML и использует репозиторий XML для управления
иерархиями XML документов [2].
Репозиторий XDB позволяет авторам работать напрямую с XML контентом, хранящимся в базе данных.
Большинство инструментов, используемых для написания XML, могут использовать протоколы доступа типа
HTTP, FTP и WebDAV. XDB предоставляет средства поддержки этих протоколов, обеспечивая прямой доступ к
контенту, управляемому хранилищем XDB.
3.2. API поиска. Oracle обеспечивает API полнотекстового поиска, который может использоваться при
построении приложений. Являясь расширением структуры Oracle, API поиска обеспечивает
специализированные текстовые индексы для поисковых приложений типа механизмов поиска в Интранет,
текстовых хранилищах и каталогов приложений. Инфраструктура обеспечивает развитый язык для
спецификации запросов. Существует также набор пакетов PL/SQL, которые содержат средства доступа к
текстам подобно классификаторам и кластерам.
3.3. Поддержка RDF. Современная поддержка RDF основана пространственной сетевой модели данных
(Spatial Network Data Model – NDM), которая является решением для управления графами в пределах базы
данных Oracle. Модель данных RDF поддерживает три типа объектов базы данных: модель (RDF, состоящая из
набора троек), rulebase – набора правил и индекса правил (граф RDF) [3, 4].
Інформаційні системи
497
4. Прототип приложения
Далее рассмотрим прототип приложения, который демонстрирует вышеописанные концепции. Для
построения прототипа используется коллекция DBLP, которая обеспечивает копию набора данных в RDF
и простую онтологию OWL [5].
Архитектура, используемая в прототипе, состоит из нескольких серверных прикладных процессов,
которые собирают данные, извлекают метаданные и создают индексы наряду с другими процессами, которые
управляют набором данных RDF. Другим аспектом архитектуры является сервлет (servlet), который
обеспечивает поиск, просмотр, кластеризацию и возможности визуализации.
Прототип написан на Java и усиливает Oracle10gR2 возможностями XML.
Есть несколько способов включения новых источников данных в приложении. В случае DBLP копия
набора данных RDF доступна в Веб. Используя утилиты загрузчика SAX анализируем и заполняем
внутреннюю схему. Другие подходы основаны на непосредственной загрузке информации в базу данных.
Существуют два основных индекса для поиска и выборки. Каталогизация, кластеризация и пакетный вывод
обеспечивают постобработку данных RDF. На рис. 1 показаны основные серверные компоненты приложения.
Рис. 1. Основные серверные компоненты приложения
Сервлет обеспечивает простой и расширенный поиск, просмотр онтологии и кластеризацию. Существует
также уровень визуализации, обеспечивающий промежуточное представление в виде карты иерархии для
кластера или граф социальной сети. На рис. 2 показаны основные компоненты сервлета Веб-приложения.
4.1. Представление RDF и OWL в базе данных. Данные в формате RDF представлены как единый файл
с корневым узлом RDF [6]. Этот узел содержит большую коллекцию элементов описания. В данном примере
информационное наполнение было представлено в виде нескольких описаний для обеспечения доступа к
контексту каждого элемента.
Технология обработки SAX позволяет эффективно обрабатывать контент RDF. Каждый элемент
описания помещается в таблицу XML (rdf_document_table).
Для управления системой метафор и доступа к элементам описания была сформирована иерархия папок
онтологий (OWL), связанных с данными RDF. Каждый элемент описания был “упакован” согласно
классификации, с использованием пакета dbms_xdb.createResource.
Рис. 2. Веб-приложение сервлета приложения
Рис. 2
SAX загрузчик
DBLP
Web
Источники
данных
XML
индекс
Полнотекстовый
индекс
Группирование
Кластеризация
Вывод
Карта
текста
Социальная
сеть
Уровень визуализации
Кластеризация
Браузер
онтологий
Поиск и
расширенный
поиск
Сервлет
Інформаційні системи
498
БД Oracle XML включает репозиторий, который позволяет организовать контент как набор файлов и
папок. Содержимое в репозитории доступно через URL таким же образом, как в реляционной таблице
содержимое может быть доступно через первичный ключ. Папки и файлы могут быть получены из SQL через
стандартные протоколы, такие как HTTP, FTP и WebDAV.
Инструментальные средства редактирования XML и XML-схем стали стандартом для пользователей, в
том числе для пользователей, которые работают и определяют онтологии для организаций. В качестве
редактора OWL используются средства SemanticWorks, которые обеспечивают возможность редактирования
кода RDF и работы с данными на уровне UML [7].
4.2. Запросы к базе данных. Для извлечения данных можно использовать несколько механизмов
запросов, доступных через SQL. Для примера представим запросы «Выборка авторов» и «Выборка публикаций
в журналах», в которых используются различные операторы.
Выборка авторов:
select value(auth).getClobVal()
from rdf_document_table, table(xmlsequence(
extract(
object_value,'/rdf:Description/author','xmlns:rdf=
"http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns="http://example.org/"');
Выборка публикаций в журналах, содержащих контент Software:
select extractValue (object_value,
'/rdf:Description/title',
'xmlns:rdf=http://www.w3.org/1999/02/22-rdfsyntax-ns# xmlns="http://example.org/"')
from rdf_document_table where
contains(object_value,'Software
inpath(/rdf:Description/journal)')>0;
Язык запросов достаточно гибок, что позволяет пользователям выполнять традиционные SQL запросы,
XPath, полнотекстовый поиск или любую их комбинацию.
4.3. Интерфейс пользователя. Пользовательский интерфейс в современных средствах поиска в
Интернете состоит из единого окна поиска, для основного, поиска и нескольких добавочных полей –
для расширенного поиска. Вообще пользовательский интерфейс привязан к серверу и ограничивается
возможностями настройки. Другими словами, средства поиска позволяют пользователю проводить поиск по
определенным полям. Поисковый двигатель нуждается в достаточном пространстве для размещения служебной
информации.
Интерфейс пользователя приложения состоит из трех представлений для доступа к контенту. Первое
представление должно обеспечить просмотр статей, используя классы онтологий. Второе представление
использует метки или тэги, основанные на кластерах, как альтернатива схеме классификации. Третье
представление – предложено окно поиска, которое обеспечивает прямой доступ к любому элементу.
Одно из преимуществ наличия классов в OWL является то, что мы можем построить простой механизм
для просмотра контента. Следующий запрос SQL возвращает иерархию верхнего уровня, представленную как
путь:
select path from path_view where
under_path(RES,'/home/DBLP/DocumentHierarchy')=1;
На следующим примере представлена процедура добавления уровней иерархии и представления
результатов для Веб интерфейса:
String statementText = "select distinct extractValue"
+" object_value, "
+" ′ /rdf:Description/title′, 'xmlns:rdf=\"http://www.w3.org/1999/02/22-rdf-syntax-ns#\ " "
+" xmlns:rdf=\"http://www.w3.org/2000/01/rdf-schema#\" xmlns:dc=\"http://pur1.org/dc/elements/1.1/ \" "
+" xmlns=\"http://exemple.org/ \ " ')title, "
+" from RDF_DOCUMENT_TABLE "
+" where existsNode ( "
+" object_value, ′/rdf:Description/rdf:type[@rdf:resource=\http://exemple.org/#"+displayPath+"\"]',"
+" 'xmlns:rdf=\http://www.w3.org/1999/02/22-rdf-syntax-ns#\
xmlns:rdf=\"http://www.w3.org/2000/01/rdf-schema#\"
+" xmlns:dc=\"http://pur1.org/dc/elements/1.1/\" xmlns=\"http://exemple.org/ \ " ') = 1 ";
OracleDriver ora = new OracleDriver ( );
connection = ora.defautConnection( );
Інформаційні системи
499
OracleCallableStatement statement = (OracleCallableStatement) connection.prepareCall(statementText);
statement.execute(statementText);
ResultSet rs = statement.executeQuery(statementText);
out.printIn("<table width=\"100%\" cellpadding=2 cellspacing=0 border=0><tbody>");
while(rs.next( ) )
{
Для улучшения результатов поиска необходимо использовать кластеризацию [8], которая используется
также как альтернативный подход группирования информации [9]. Пользователи используют кластеризацию
при исследовании данных или создании краткого обзора по теме [10].
В прототипе приложения объединяются эти два подхода. Большинство популярных кластеров основаны
на заголовках публикаций, которые используют традиционные подходы, подобно k-методам [11]. Размер
шрифта в метке прямо указывает на качество кластера. Второй подход состоит в кластеризации результатов
поиска. Используется список совпадений кластеризации, основанный на суффиксных деревьях, который более
точно соответствует контекстным результатам [12].
Существует также возможность представления кластеров в виде карты деревьев.
В любом современном поисковом механизме есть возможность осуществить поиск по умолчанию с
опцией переключения в расширенный режим. В отличие от простых поисковых механизмов Интернет,
расширенный режим обеспечивает интерфейс, который позволяет пользователям искать поля в зависимости от
доступности различных источников.
Как вышеуказано, в ядре системы есть мощный механизм для обнаружения и формирования метаданных
XML. Использование AJAX (Асинхронный JavaScript и XML) (как основную методику) предоставляет
возможность строить гибкий механизм для динамического поиска источника и атрибутов. Компонент загрузки
метаданных формирует запрос к базе данных. Извлекаются все метаданные источника данных и индексы,
которые возвращаются в виде XML (для каждого источника данных).
Генератор интерфейса пользователя использует объект xmlHttpRequest для заполнения определенных
элементов интерфейса пользователя наряду с JavaScript и CSS. Результатом генерации является интерфейс,
который дает пользователю возможность осуществить расширенный поиск. На рис. 3 показаны основные
компоненты интерфейса пользователя с применением AJAX.
Пользователь выбирает источник данных, а интерфейс автоматически отображает доступные атрибуты
для поиска.
4.4. Информационная визуализация. Существует несколько способов визуализации больших наборов
данных. В приложении используются карты деревьев для кластерной визуализации [13].
В прототипе визуализации карта деревьев кластера читает конфигурацию в форме XML, а также данные,
полученные с использованием SQL. Применяется встроенная в Oracle технология XML, как основной подход к
интеграции.
4.5. Социальные сети. Одна из наиболее перспективных особенностей семантического Веб состоит в
представлении предметной области приложений в соответствии с понятиями и выводами.
Рис. 3
Расширенный интерфейс
пользователя (UI)
UI генератор
Загрузчик метаданных
Метаданные
источников данных
Индекс
метаданных
Oracle 10g
SQL
XML
XML
xmlHttpRequest
JavaScript, CSS
и HTML
Інформаційні системи
500
Рассмотрено использование функциональности Oracle для управления RDF и OWL. Информационный
Grid содержит более одного источника данных. Возможность подключения различных источников и работы с
содержанием является ключевой частью процесса. Например, мы хотели бы добавить к нашему приложению
подробную информацию об исследователях. Используя имена исследователей и эвристики в поисковом агенте,
можно получить документы XML, которые содержат желаемую информацию.
Когда новые источники данных становятся доступными и документы первый раз попадают в
репозиторий, индексируется содержимое документов и их метаданные становятся доступными в расширенном
интерфейсе пользователя. Полученную информацию можно использовать для вывода (computing inference).
Например, мы хотим знать, действительно ли публично отображается персональная информация об
исследователе и его социальной сети. Как только документ XML, который представляет исследователя,
доступен в системе можно получить вывод о некоторых взаимоотношениях авторов, которые представлены в
социальной сети. Идея состоит в том, чтобы осуществлять вывод, используя: а) описание RDF в базе данных
или b) механизм логического вывода.
Социальные сети могут служить мощными инструментами для интеллектуального сбора информации и
разработки приложений.
5. Другие приложения семантического Веб
Рассмотрим некоторые приложения, которые поддерживают концепции семантического Веб.
Один из подходов к разработке программных приложений с использованием семантических
Веб-сервисов рассмотрен в [14].
Haystack – это система для слабоструктурированного управления данными с ориентацией на конечных
пользователей [15]. Данный подход обеспечивает просмотр информации, определяя важность данных.
PiggyBank наследует некоторые идеи, исследованные в Haystack, и делает их доступными на
Веб-браузере [16]. В нем используется комбинация поиска и категорий или кластеров. Подход основан на
открытой технологии (open source) и зависит от единой платформы управления данными. Обеспечивается
потребность клиентов быть более “семантически осведомленными”.
Swoogle [17] предлагает новую перспективу в поиске и индексировании семантического контента. Он
заменяет или расширяет нынешнюю методику ранжирования.
Magnet [18] и BANKS [19] представляют собой примеры систем управления и просмотра больших
наборов данных. Прототип приложения обеспечивает просмотр как основную особенность системы.
Представленный в виде RDF контент [20] является важным аспектом любых семантических приложений.
WEESA – хороший пример автоматизации процесса генерации метаинформации [21]. Реализация
осуществлена в рамках Apache. Подобные результаты могут быть использованы в инструментальных средствах
Oracle XML.
Заключение
Представлен информационный Grid как новая перспектива управления семантической информацией.
В работе рассмотрены новые подходы и архитектура, которая может быть использована при построении
Grid-приложений.
Продемонстрировано практическое применение идей семантического Веб, их реализация на прототипе
приложения с использованием набора данных DBLP и существующих технологий Oracle 10gR2.
Предлагаемый подход основан на использовании существующих инструментальных средств XML для
расширенного использования семантического контента, представленного в OWL / RDF. Следующий шаг
должен обеспечить сервисы, которые могут использовать в своих интересах семантику как поиск, класте-
ризацию, вывод и социальные сети. Метаданные XML позволят легко разрабатывать сложные методологии
визуализации и новые подходы к разработке интерфейсов пользователя.
1. Андон П. І., Дерецкий В О. Проблеми побудови сервіс-орієнтованих прикладних інформаційних систем в Semantic web середовищі на
основі агентного підходу // Проблеми програмування. − 2006. − № 2–3. − C. 493–502.
2. Oracle Database 10g Release 2 XML DB Application developers guide. Oracle Corp. – 2005.
3. Oracle Spatial Resource Description Framework (RDF) 10g Release 2 Reference. Oracle Corp. – 2005.
4. E. Chong et al. An Efficient SQL-based RDF Querying Scheme. VLDB – 2005.
5. http://dblp.uni-trier.de
6. http://www.semanticweb.org/
7. http://www.altova.com
http://dblp.uni-trier.de/
http://www.semanticweb.org/
http://www.altova.com/
Інформаційні системи
501
8. http://www.vivisimo.com
9. http://www.flickr.com/
10. Aula A., Jhaveri N. and M. Kaki Information Search and Re-access Strategies of Experienced Web Users WWW. – 2005.
11. Jain A., Murty M., Flynn P. Data clustering: a review, ACM Computing Surveys. – 1999.
12. Zamir O. and Etzioni O.Web document clustering: a feasibility demonstration. SIGIR. – 1998.
13. Card S., Mackinl J. and Shneiderman B. Readings in Information Visualization. Morgan Kaufman, San Francisco, 1999.
14. Дерецкий В., Богданова M., Горошанский С. Подход к разработке программных приложений с использованием семантических
Веб-сервисов // Проблеми програмування. − 2009. − № 4. − C. 59–70.
15. Karger D. et al. Haystack A Customizable. General-Purpose Information Management Tool for End Users of Semistructured Data. CIDR –
2003.
16. Huynh D., Mazzocchi S. and D. Karger PiggyBank. Experience the Semantic Web Inside Your Web Browser // In4th International Semantic
Web Conf. ISWC. – 2005.
17. Ding L. et al. Swoogle A Search and Metadata Engine for the Semantic Web. CIKM. – 2004.
18. Sinha V. and Karger D.Magnet: Supporting Navigation in Semistructured Data Environment, SIGMOD. – 2005.
19. Bhalotia G. et al. Keyword Searching and Browsing in Databases using BANKS. ICDE. – 2002.
20. Rutledge L., J. van Ossenbrunggen and L. Hardman Making RDF Presentable. WWW. – 2005.
21. Reif G., Gall H. and Jazayeri M. WEESA – Web Engineering for Semantic Web Applications WWW. – 2005.
http://www.vivisimo.com/
http://www.flickr.com/
|
| id | pp_isofts_kiev_ua-article-943 |
| institution | Problems in programming |
| keywords_txt_mv | keywords |
| language | Russian |
| last_indexed | 2026-06-02T01:01:37Z |
| publishDate | 2026 |
| publisher | PROBLEMS IN PROGRAMMING |
| record_format | ojs |
| resource_txt_mv | ppisoftskievua/bc/60125702c37049b978a36d22f2d0a7bc.pdf |
| spelling | pp_isofts_kiev_ua-article-9432026-06-01T06:02:58Z The practical approach for realization Semantic Web applications Практический подход к реализации приложений семантического ВЕБ Deretskiy, V.A. Bogdanova, M.M. Goroshansky, S.I. UDC 681.3 УДК 681.3 It is well understood that the key for successful Semantic Web applications depends the availability of machine understandable metadata. In this paper, we describe a practical approach to the Semantic Web called Information Grid. Information Grid resources span all the data in the organization and all the metadata required to make it meaningful. This data maybe structured, semistructured, or unstructured; stored anywhere; and created by any application. We present an architecture that integrates Semantic Web techniques into existing technologies in a novel way. We show the design and implementation of a prototype that demonstrates the ideas presented in the paper.Problems in programming 2010; 2-3: 494-501 Одной из ключевых характеристик приложений семантического Веб является доступность машинно-читаемых метаданных. В данной работе описывается практический подход к семантическому Веб, который охватывает данные и метаданные на предприятии. Эти данные могут быть структурированными, слабоструктурированными или неструктурированными; хранящиеся в любых базах данных и созданные любым приложением. В работе представлена архитектура, которая новым способом интегрирует возможности семантического Веб в существующие технологии. Ключевая цель архитектуры состоит в том, чтобы позволить организациям видеть сервисы в Интернете с унифицированным семантическим описанием. Приведен также прототип практической реализации подхода.Problems in programming 2010; 2-3: 494-501 PROBLEMS IN PROGRAMMING ПРОБЛЕМЫ ПРОГРАММИРОВАНИЯ ПРОБЛЕМИ ПРОГРАМУВАННЯ 2026-06-01 Article Article application/pdf https://pp.isofts.kiev.ua/index.php/ojs1/article/view/943 PROBLEMS IN PROGRAMMING; No 2-3 (2010); 494-501 ПРОБЛЕМЫ ПРОГРАММИРОВАНИЯ; No 2-3 (2010); 494-501 ПРОБЛЕМИ ПРОГРАМУВАННЯ; No 2-3 (2010); 494-501 1727-4907 ru https://pp.isofts.kiev.ua/index.php/ojs1/article/view/943/1012 Copyright (c) 2026 PROBLEMS IN PROGRAMMING |
| spellingShingle | UDC 681.3 Deretskiy, V.A. Bogdanova, M.M. Goroshansky, S.I. The practical approach for realization Semantic Web applications |
| title | The practical approach for realization Semantic Web applications |
| title_alt | Практический подход к реализации приложений семантического ВЕБ |
| title_full | The practical approach for realization Semantic Web applications |
| title_fullStr | The practical approach for realization Semantic Web applications |
| title_full_unstemmed | The practical approach for realization Semantic Web applications |
| title_short | The practical approach for realization Semantic Web applications |
| title_sort | practical approach for realization semantic web applications |
| topic | UDC 681.3 |
| topic_facet | UDC 681.3 УДК 681.3 |
| url | https://pp.isofts.kiev.ua/index.php/ojs1/article/view/943 |
| work_keys_str_mv | AT deretskiyva thepracticalapproachforrealizationsemanticwebapplications AT bogdanovamm thepracticalapproachforrealizationsemanticwebapplications AT goroshanskysi thepracticalapproachforrealizationsemanticwebapplications AT deretskiyva praktičeskijpodhodkrealizaciipriloženijsemantičeskogoveb AT bogdanovamm praktičeskijpodhodkrealizaciipriloženijsemantičeskogoveb AT goroshanskysi praktičeskijpodhodkrealizaciipriloženijsemantičeskogoveb AT deretskiyva practicalapproachforrealizationsemanticwebapplications AT bogdanovamm practicalapproachforrealizationsemanticwebapplications AT goroshanskysi practicalapproachforrealizationsemanticwebapplications |