Development of intelligent information analytical webportals based on semantic Wiki technologies: problems and challenges
We analyse the main functions of modern web portals that differ them from other types of sites. In this work we consider intelligent information-analytical web portals as a specific subset of intelligent information-analytical systems, and their features and development trends that have an influence...
Збережено в:
Дата: | 2023 |
---|---|
Автор: | |
Формат: | Стаття |
Мова: | Ukrainian |
Опубліковано: |
Інститут програмних систем НАН України
2023
|
Теми: | |
Онлайн доступ: | https://pp.isofts.kiev.ua/index.php/ojs1/article/view/583 |
Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
Назва журналу: | Problems in programming |
Завантажити файл: |
Репозитарії
Problems in programmingid |
pp_isofts_kiev_ua-article-583 |
---|---|
record_format |
ojs |
resource_txt_mv |
ppisoftskievua/6e/49a9ae504ab019c53bd5cf409688c96e.pdf |
spelling |
pp_isofts_kiev_ua-article-5832024-04-28T11:55:00Z Development of intelligent information analytical webportals based on semantic Wiki technologies: problems and challenges Розробка інтелектуальних інформаційно-аналітичних вебпорталів на основі семантичних вікітехнологій: проблеми та перспективи Rogushina, J.V. information and analytical web portal; ontology; wiki technology; services UDC 681.3 інформаційно-аналітичний вебпортал; онтологія; вікітехнологія; сервіси УДК 681.3 We analyse the main functions of modern web portals that differ them from other types of sites. In this work we consider intelligent information-analytical web portals as a specific subset of intelligent information-analytical systems, and their features and development trends that have an influence on their semanticization are analysed. As a part of such analysis we considered knowledge models and technologies of their processing that can be used for this aim. We determine standards and tools of the Semantic Web that can be used for the semanticization of web portals and describe the ways of such use on practical examples. Some basic requirements for technologies and instrumental tools used for development of semantic portals are considered. We analyse and classify typical problems related to the processing, structuring, and analysis of large volumes of data that arise in the process of creating and deploying such portals, and the criteria for evaluating the development opportunities of existing web portals are considered. On example of web portal based on semantic Wiki technologies we investigate practical problems of implementation and scaling of portal knowledge processing tools and services and propose some ways of their prevention and solution.Prombles in programming 2023; 3: 66-80 Проаналізовано основні функції сучасних вебпорталів та їхні відмінності від інших типів сайтів. Розглянуто тенденції розвитку інформаційно-аналітичних вебпорталів, що стосуються їхньої семантизації, та технології обробки знань, які можуть для цього застосовуватися. Проаналізовао типові проблеми, що виникають у процесі створення та розгортання таких порталів. На прикладі порталу, що базується на семантичних вікітехнологіях, досліджено практичні проблеми впровадження та масштабування засобів та сервісів обробки знань на порталі, запропоновано шляхи їх запобігання та розв’язання.Prombles in programming 2023; 3: 66-80 Інститут програмних систем НАН України 2023-10-06 Article Article application/pdf https://pp.isofts.kiev.ua/index.php/ojs1/article/view/583 10.15407/pp2023.03.066 PROBLEMS IN PROGRAMMING; No 3 (2023); 66-80 ПРОБЛЕМЫ ПРОГРАММИРОВАНИЯ; No 3 (2023); 66-80 ПРОБЛЕМИ ПРОГРАМУВАННЯ; No 3 (2023); 66-80 1727-4907 10.15407/pp2023.03 uk https://pp.isofts.kiev.ua/index.php/ojs1/article/view/583/633 Copyright (c) 2023 PROBLEMS IN PROGRAMMING |
institution |
Problems in programming |
baseUrl_str |
https://pp.isofts.kiev.ua/index.php/ojs1/oai |
datestamp_date |
2024-04-28T11:55:00Z |
collection |
OJS |
language |
Ukrainian |
topic |
information and analytical web portal ontology wiki technology services UDC 681.3 |
spellingShingle |
information and analytical web portal ontology wiki technology services UDC 681.3 Rogushina, J.V. Development of intelligent information analytical webportals based on semantic Wiki technologies: problems and challenges |
topic_facet |
information and analytical web portal ontology wiki technology services UDC 681.3 інформаційно-аналітичний вебпортал онтологія вікітехнологія сервіси УДК 681.3 |
format |
Article |
author |
Rogushina, J.V. |
author_facet |
Rogushina, J.V. |
author_sort |
Rogushina, J.V. |
title |
Development of intelligent information analytical webportals based on semantic Wiki technologies: problems and challenges |
title_short |
Development of intelligent information analytical webportals based on semantic Wiki technologies: problems and challenges |
title_full |
Development of intelligent information analytical webportals based on semantic Wiki technologies: problems and challenges |
title_fullStr |
Development of intelligent information analytical webportals based on semantic Wiki technologies: problems and challenges |
title_full_unstemmed |
Development of intelligent information analytical webportals based on semantic Wiki technologies: problems and challenges |
title_sort |
development of intelligent information analytical webportals based on semantic wiki technologies: problems and challenges |
title_alt |
Розробка інтелектуальних інформаційно-аналітичних вебпорталів на основі семантичних вікітехнологій: проблеми та перспективи |
description |
We analyse the main functions of modern web portals that differ them from other types of sites. In this work we consider intelligent information-analytical web portals as a specific subset of intelligent information-analytical systems, and their features and development trends that have an influence on their semanticization are analysed. As a part of such analysis we considered knowledge models and technologies of their processing that can be used for this aim. We determine standards and tools of the Semantic Web that can be used for the semanticization of web portals and describe the ways of such use on practical examples. Some basic requirements for technologies and instrumental tools used for development of semantic portals are considered. We analyse and classify typical problems related to the processing, structuring, and analysis of large volumes of data that arise in the process of creating and deploying such portals, and the criteria for evaluating the development opportunities of existing web portals are considered. On example of web portal based on semantic Wiki technologies we investigate practical problems of implementation and scaling of portal knowledge processing tools and services and propose some ways of their prevention and solution.Prombles in programming 2023; 3: 66-80 |
publisher |
Інститут програмних систем НАН України |
publishDate |
2023 |
url |
https://pp.isofts.kiev.ua/index.php/ojs1/article/view/583 |
work_keys_str_mv |
AT rogushinajv developmentofintelligentinformationanalyticalwebportalsbasedonsemanticwikitechnologiesproblemsandchallenges AT rogushinajv rozrobkaíntelektualʹnihínformacíjnoanalítičnihvebportalívnaosnovísemantičnihvíkítehnologíjproblemitaperspektivi |
first_indexed |
2024-09-16T04:08:06Z |
last_indexed |
2024-09-16T04:08:06Z |
_version_ |
1818568358676660224 |
fulltext |
Експертні та інструментальні інформаційні системи
66
УДК 681.3 http://doi.org/10/15407/pp2023.03.66
Ю.В. Рогушина
РОЗРОБКА ІНТЕЛЕКТУАЛЬНИХ
ІНФОРМАЦІЙНО-АНАЛІТИЧНИХ ВЕБПОРТАЛІВ
НА ОСНОВІ СЕМАНТИЧНИХ ВІКІТЕХНОЛОГІЙ:
ПРОБЛЕМИ ТА ПЕРСПЕКТИВИ
Проаналізовано основні функції сучасних вебпорталів та їхні відмінності від інших типів сайтів. Роз-
глянуто тенденції розвитку інформаційно-аналітичних вебпорталів, що стосуються їхньої семантизації,
та технології обробки знань, які можуть для цього застосовуватися. Проаналізовао типові проблеми, що
виникають у процесі створення та розгортання таких порталів. На прикладі порталу, що базується на се-
мантичних вікітехнологіях, досліджено практичні проблеми впровадження та масштабування засобів та
сервісів обробки знань на порталі, запропоновано шляхи їх запобігання та розв’язання.
Ключові слова: інформаційно-аналітичний вебпортал, онтологія, вікітехнологія, сервіси
Вступ
Сьогодні інтелектуалізація інформа-
ційних технологій (ІІТ) є одним із базових
напрямків їхнього розвитку, який має як
широке теоретичне підґрунтя, так і значні
практичні результати, пов’язані із розроб-
кою інтелектуальних застосувань у різних
сферах. Саме ці засоби семантизації ши-
роко застосовуються для вдосконалення та
інтелектуалізації таких розповсюджених
джерел інформації, як вебпортали. Потре-
ба в інтелектуальних засобах аналізу ін-
формації обумовлюється тим, що зростає
обсяг даних, які потребують обробки, стає
більше їх зовнішніх і внутрішніх джерел,
вони стають складнішими за структурою
та різноманітнішими за формами подання,
використовують різні схеми індексації (ре-
ляційні, багатовимірні, noSQL тощо). Крім
того, все більша кількість застосовних сис-
тем призначаються зараз для функціюван-
ня у відкритому середовищі (Web або його
певних частинах).
Одним із найвідоміших проєктів з ін-
телектуалізації Web-середовища є Semantic
Web, в рамках якого розроблено велику
кількість стандартів та засобів подання й
обробки інформації на рівні змісту, біль-
шість з яких базується на онтологічному
аналізі. Тому обробку знань в ІІС усе часті-
ше пов’язують зі створенням, використан-
ням та обробкою онтологій, які підтриму-
ються такими стандартами Semantic Web,
як OWL та RDF, а також різноманітними
інструментальними засобами. Але, попри
це, інтелектуалізація вебзастосувань ве-
ликого обсягу та зі складною структурою,
до яких належать вебпортали, залишається
складною та комплексною проблемою, що
потребує як розвитку моделей керування
знаннями, так і методів їх практичного за-
стосування.
Семантичні системи є підкласом
інтелектуальних систем, в яких засоби по-
дання знань явно відокремлені від засобів
обробки. Вони можуть отримувати знання,
потрібні для функціювання системи та за-
доволення інформаційних потреб корис-
тувачів, з будь-яких зовнішніх джерел та
репозиторіїв [1], що відповідають умовам
системи. В такому підході довільна зов-
нішня онтологія розглядається як “чорний
ящик”, про який невідомо нічого, крім його
метаданих (які також можуть бути некорек-
тними – застарілими, помилковими або опи-
саними на основі іншої терміносистеми).
Саме тому семантизація систем, орієнова-
них на відкрите інформаційне середовище,
дозволяє значно розширити функціонал та-
ких застосунків та підвищити ефективність
їх роботи, але водночас призводить до ба-
гатьох складнощів у процедурах аналізу та
інтеграції отриманих відомостей.
Сьогодні користувачі Web мають до-
ступ до величезної кількості вебсторінок і
©Ю.В. Рогушина, 2023
ISSN 1727-4907. Проблеми програмування. 2023. №3
Експертні та інструментальні інформаційні системи
67
сервісів, але з усього цього розмаїття біль-
шість з них зазвичай використовують лише
обмежений набір інформаційних ресурсів
(ІР), що відповідають їхнім інтересам та
потребам. Водночас кожен з користувачів
використовує різні підмножини сторінок та
сервісів (хоча можна визначати певні групи
із подібними потребами, що використову-
ють однакові або подібні набори). Тому до-
цільно виокремлювати такі набори потреб
та створювати ІІС, які забезпечують доступ
до віповідних ресурсів та підтримують сер-
віси їх обробки. Саме до такого функціона-
лу ІІС, що орієнтовані на функціювання у
вебсередовищі, найближче подібне поняття
вебпорталу.
Вебпортали дозволяють користува-
чам отримувати швидкий доступ саме до
тих наборів вебсторінок, якими вони зазви-
чай користуються, і сервісів, орієнтованих
на обробку саме таких сторінок. Уся інфор-
мація та сервіси, пропоновані на порталі,
можуть розглядатися як спроба автоматизо-
вано сформувати та зафіксувати саме таку
підмножину інформації, яку обрав би сам
користувач, якби мав достатній час і дос-
від для створення персонального набору
вебсторінок [2]. Тому вебпортали доцільно
розглядати як засіб персоніфікованої та за-
дача-орієнтованої інтеграції відомостей та
послуг, доступ до яких забезпечує вебсере-
довище. Саме такий підхід дозволяє ефек-
тивніше аналізувати потенційні напрямки
розвитку вебпорталів, визначати існуючі
проблеми та шляхи їх розв’язання на основі
сучасних технологій обробки інформації та
аналізу даних.
Серед усього розмаїття вебпорталів
можна виділити підмножину інформацій-
но-аналітичних вебпорталів, які забезпе-
чують ширший набір аналітичних сервісів
та засобів здобуття знань з наявної сирої
інформації. Вони передбачають можливість
обробки контенту на рівні знань та викори-
стання елементів Data Mining, машинного
навчання та логічного виведення. Такі ін-
формаційно-аналітичні вебпортали потре-
бують більш складних моделей контенту
для інтеграції, порівняння, узгодження та
візуалізації інформації, що надається ко-
ристувачам.
Як і інші напрямки розвитку інфор-
маційних систем, вебпортали можуть за-
стосовувати засоби інтелектуалізації, ме-
неджменту знань та машинного навчання
для забезпечення користувачів більш роз-
ширеним функціоналом, однак вони мають
враховувати специфіку роботи у відкрито-
му середовищі та потребу в інтеграції різ-
них моделей подання знань. Потрібно розу-
міти, що інтелектуальні вебпортали є лише
досить обмеженою підмножиною всіх існу-
ючих вебпорталів, і не всі з таких порталів
можуть бути в майбутньому інтелектуалі-
зовані (через обрані технології розробки,
моделі контенту або особливості викори-
стання). Крім того, вибір інформаційних
технологій, що припускають можливість
інтелектуалізації, не забезпечує автоматич-
ну обробку контенту вебпорталу на рівні
знань, а лише надає відповідні інструмен-
тальні засоби для їх створення.
Основні властивості
вебпорталів
Аналізуючи перспективи розвитку
та можливості інтелектуалізації інформа-
ційно-аналітичних вебпорталів, необхідно
спочатку визначити, яку саме підмножину
вебресурсів ми розглядаємо як вебпортали
та які спільні властивості та функції від-
різняють їх від інших типів сайтів. Наразі
створено та розвивається багато різних ти-
пів порталів, і тому в літературі зустріча-
ється багато різних визначень та наборів
таких характеристик, що дозволяють нази-
вати певний вебсайт порталом.
Вебпортал – це сайт, організований
як багаторівневе об’єднання різних ресур-
сів і сервісів, засобів навігації та інформа-
ційних служб. Він може використовувати-
ся як точка входу в мережу, що підтримує
специфічні інформаційні потреби окремих
користувачів або їх груп.
Можна розглядати портал як певний
шлюз для доступу до ресурсів мережі, але
зараз майже будь-яка вебсторінка відпові-
дає цьому критерію. У Веб можна знайти
велику кількість визначень, наприклад, [3]
визначає вебпортал як спеціально розро-
блений вебсайт, який уніфікує надання ін-
формації з різних джерел на одній платфор-
Експертні та інструментальні інформаційні системи
68
мі, допомагає в навігації та персоналізації
сповіщень із розширеними функціями, та-
кими як керування завданнями, співпраця,
бізнес-аналітика тощо.
Основні функції вебпорталу:
− оновлення контенту сайту: портал
має містити набір інструментів, які покра-
щують пошук інформації, підвищують її
якість;
− покращення взаємодії з корис-
тувачами сайту: портал надає додаткові
можливості спілкування власників сайту
з користувачами, для вдосконалення їхніх
взаємин з клієнтами, надаючи високоякісну
та відфільтровану інформацію на зручній і
комплексній платформі;
− орієнтація на домен: вебпортал
пов’язаний з певною предметною областю і
має забезпечувати різноманітні потреби ко-
ристувачів, які шукають відповідну інфор-
мацію та послуги;
Розробка та дизайн вебпорталу є
складним процесом, оскільки його функці-
ональні можливості досить важко заздале-
гідь визначити, формалізувати та реалізува-
ти. В цілому процес розробки вебпорталу
містить усі кроки, необхідні для розробки
будь якого вебсайту. Однак різниця полягає
в складності реалізації кожного з цих кроків
та в наявності додаткових етапів, що стосу-
ються визначення його функцій, кодування,
тестування та інтеграції. Отож, вебпортали
відрізняються від інших типів вебсайтів ще
й тими аспектами, що останні в основному
зосереджені на залученні трафіка, тоді як
вебпортали призначені для його скорочен-
ня за рахунок ефективнішого та персоніфі-
кованого аналізу. Тому мови програмування
та фреймворки, які в основному використо-
вуються у розробці вебпорталів, мають пев-
ну специфіку та потребують значно шир-
шого функціоналу, а поширеність їхнього
застосування різниться порівняно з вико-
ристанням для створення інших вебсайтів.
У [4] наводять набір найбільш поширених
фреймворків для створення вебпорталів:
AngularJS, Laravel, React.JS, NodeJS, Ruby
on Rails.
Вебпортал забезпечує легкість на-
вігації та підвищення продуктивності в
обробці інформації. Він забезпечує універ-
сальний вхід і за потреби забезпечує інте-
грацію з іншими програмами та системами.
Хоча можна знайти багато різнома-
нітних характеристик вебпорталів, біль-
шість із них певним чином визначаються
саме орієнтацією на деяку обмежену ауди-
торію користувачів та можливістю надати
інтегрований набір найбільш корисних по-
слуг, які підтримують більшість потрібних
функцій та не потребують використання
зовнішніх сервісів та джерел інформації.
Портали можна розглядати як си-
стеми управління знаннями, які дозволя-
ють створювати, обмінюватися та повторно
використовувати знання. Вони містять ве-
личезну кількість інформації, в тому числі
і мультимедійної, що реалізується за раху-
нок зберігання контенту не в базах даних, а
в сховищах і вітринах даних.
Вебпортал є окремим випадком веб-
сайту. Портал, зазвичай, значною мірою
орієнтований на кожного окремого корис-
тувача, тоді як вебсайт може не містити еле-
ментів персоніфікації. Контент вебпорталу
є динамічним і часто змінюється. Вебпор-
тал містить елементи захисту від входу в
систему і може підтримувати інформаційну
взаємодію, що є специфічною для користу-
вача, а його інтерфейс може бути загальним
або приватним. Контент порталу збирається
з різних джерел і може бути унікальним для
користувача на основі його персональних
налаштувань. Портали спрямовані на забез-
печення різних типів сервісів, які можуть
знадобитися користувачам для отримання
та обробки його контенту. Тому вибір серві-
сів, які підтримуються порталами, великою
мірою залежить від тематики порталу та
потреб його користувачів.
У [5] вебпортал визначають як веб-
сайт, який спеціально розроблений так,
щоб бути єдиною точкою доступу до інфор-
мації. Його також можна вважати бібліоте-
кою персоналізованого та категоризованого
контенту. Вебпортали допомагають у пошу-
ку та навігації, забезпечують персоналіза-
цію та інтеграції сповіщень, а також часто
надають сервіси, що стосуються керування
завданнями, співпраці, бізнес-аналітики та
інтеграції з іншими застосунками. Досить
часто вирізняють відмінності вебпорта-
Експертні та інструментальні інформаційні системи
69
лів від інших типів сайтів (таблиця 1), що
дозволяють визначити, які саме додаткові
функції та обмеження потрібні для розроб-
ки таких порталів та які переваги надають
ці додаткові ускладнення.
Таблиця 1. Відмінності вебпорталів від
інших типів сайтів
Вебсайт Вебпортал
Доступ через
унікальну
адресу URL
Також використовують
для доступу пароль та
логін
Всі бачать весь
контент
Тільки члени спільноти
користувачів, що мають
паролі, отримують
доступ до всього
контенту
Всі користувачі
отримують
однаковий
контент
Контент відрізняється
для різних груп
користувачів
Сайтом керує
єдина команда
адміністраторів
Для різних рівнів
роботи з контентом
застосовують різні
команди адміністраторів
Контент
є досить
стабільним
Динамічний контент
часто змінюється, що
потребує спеціальних
інструментів
Розрахований
на анонімних
користувачів
та публічний
доступ
Дозволяє
персоніфікувати контент
та сервіси, що доступні
користувачам, підтримує
різні рівні доступу до
інформації з різних
джерел
Зазвичай, вебпортали забезпечують
доступ із різних платформ та видів при-
строїв, таких як персональні комп’ютери та
смартфони.
Вебпортал можна розглядати як
сайт, що надає інформацію та сервіси для
використання цієї інформації.
Тенденції розвитку порталів пов’я-
зані із вдосконаленням усіх цих типів сер-
вісів та зі створенням інформаційної інф-
раструктури порталу, яка забезпечує більш
ефективне виконання цих сервісів.
Класифікація вебпорталів
Існує багато типів класифікації пор-
талів, найбільш поширеними з яких є:
– за цільовою аудиторією;
– за типом контенту;
– за призначенням;
– за технічними ознаками.
За цільовою аудиторією порталів:
публічні і корпоративні. Публічні портали
орієнтовані на всіх користувачів, а корпора-
тивні – тільки на певну підмножину, напри-
клад, співробітників і партнерів організації.
Крім цього, портали також поділяють за ін-
шими параметрами на інтернаціональні та
регіональні. Інтернаціональні портали орі-
єнтовані на всіх користувачів, незалежно
від місця їх проживання і мовної приналеж-
ності, тоді як регіональні орієнтовані на ко-
ристувачів із певної місцевості або мовної
групи. Приклади горизонтальних порталів
— Yahoo! (англомовний), Ukr.net.
За типом контенту вебпортали поді-
ляють на горизонтальні і вертикальні: пер-
ші націлені на великі спільноти користува-
чів, другі ж більш специфічні щодо вмісту
та об’єктів. Вертикальні портали містять
контент, що стосується однієї теми, а гори-
зонтальні портали охоплюють одночасно
багато різних тем, але надають однаковий
набір сервісів для обробки інформації з різ-
них напрямків. Вертикальний портал – це
точка доступу до певної галузі, ринкової
ніші чи сфери інтересів, що стосуються об-
меженої тематики, торкаючись лише однієї
теми або одного типу тем, таких як страху-
вання, освіта або охорона здоров’я. Напри-
клад, вертикальний портал www.contractor.
com містить інформацію та сервіси для бу-
дівельної галузі.
Тенденції розвитку
вебпорталів
Основні напрямки розвитку вебпор-
талів можна поділити на кілька напрямків
(хоча на практиці вони досить часто вико-
ристовуються разом та у різних комбінаці-
ях): персоніфікацію, вдосконалення серві-
сів та інтелектуалізацію.
Тенденції розробки інформаційно-а-
налітичних вебпорталів теж стосуються цих
трьох напрямків, але передбачають більшу
Експертні та інструментальні інформаційні системи
70
увагу до визначення набору сервісів, що на-
дає портал, та додаткові вимоги до подання
контенту, які підтримують виконання цих
сервісів.
Багато підходів та визначень під-
креслюють важливу роль персоніфікації
інформації на вебпорталах та можливість
застосування знань із зовнішніх джерел та
досвіду роботи самого порталу. Така пер-
соніфікація передбачає індивідуальні на-
лаштування та надання індивідуалізовано-
го набору послуг. У найбільш розвинутих
порталах – можливість враховувати дос-
від взаємодії з користувачем та навчатися
на цьому досвіді. Але цей параметр більш
важливий для вертикальних порталів, де
основні відмінності між користувачами
стосуються саме вибору підмножини кон-
тенту та засобів його обробки. Для горизон-
тальних порталів це менш важливо і багато
в чому залежить від спрямованості порталу.
Наприклад, для інформаційних та енцикло-
педичних порталів персоніфікація зазвичай
стосується визначення повноважень, ство-
рення персональної сторінки та збереження
історії запитів.
Тому питання персоніфікації пов’я-
зане із захистом інформації вебпорталу, а
саме – з визначенням набору функцій, що
дозволяються певному користувачеві, як
щодо перегляду контенту, так і щодо мож-
ливостей його редагування.
Сучасні інформаційно-пошукові си-
стеми (зокрема, Google) та сервіси прагнуть
накопичувати й використовувати досвід вза-
ємодії з конкретним користувачем. Перспек-
тивні напрямки розвитку вебпорталів мають
також підтримувати ці можливості та забез-
печувати доступ як до зовнішніх пошукових
сервісів, так і надавати розширений функці-
онал пошуку в контенті порталу з урахуван-
ням індивідуальних потреб користувача та
досвіду його взаємодії з порталом.
Для того, щоб формалізувати інфор-
маційні потреби користувачів та описати
структуру й властивості потрібних йому
інформаційних об’єктів (ІО), на порталі мо-
жуть використовувати такі джерела знань
про учасників процесу пошуку:
– персональний профіль користува-
ча, у якому містяться відомості про індиві-
дуальні особливості та переваги користува-
ча у споживанні інформації: дані, отримані
при реєстрації користувача; результати його
анкетування; заявлений користувачем рі-
вень компетентності в різних ПрО, історію
його попередніх запитів, модель ПрО його
інтересів тощо;
– знання щодо предметної області
пошуку (наприклад, онтологія відповідної
ПрО, тезаурус задачі, посилання на зовніш-
ні БЗ);
– досвід взаємодії користувача з пор-
талом: історії запитів цього та інших корис-
тувачів, чимось подібних до нього;
– зовнішні джерела знань, обрані
користувачем і доступні через Web (напри-
клад, Вікіпедію, словники, Web-сайти).
Значною мірою можливості семан-
тизації порталу визначаються: загальною
концепцією розробки порталу, його ціля-
ми та призначенням; обраним програм-
ним забезпеченням; моделлю та структу-
рою бази знань порталу; виразною здат-
ністю реалізованих пошукових сервісів;
засобами та методами структурування
контенту порталу, можливостями експор-
ту зовнішніх баз знань.
Але слід зазначити, що вдалий ви-
бір моделі подання контенту, набору серві-
сів та їх програмної реалізації не є автома-
тичною запорукою створення дійсно ефек-
тивного семантичного порталу. Необхідно
враховувати, що вебпортал функціонує у
відкритому інформаційному середовищі,
що безперервно змінюється, і тому розроб-
ка порталу потребує постійного оновлен-
ня та інтеграції як моделі знань, що вико-
ристовуються на порталі, так і самого кон-
тенту, щоб забезпечити його актуальність
та несуперечність.
Набір сервісів, що надається вебпор-
талом, значною мірою визначає його функ-
ціонал та сферу застосування. Тому тенден-
ції розвитку вебпорталів мають врахову-
вати розширення набору таких сервісів та
вдосконалення якості їхньої роботи. Саме
сервіси вебпорталів є одним із важливих
критеріїв їх порівняння. Важливо відріз-
няти, які сервіси дійсно підтримуються на
порталі, а які лише декларуються або нада-
ються з обмеженим функціоналом .
Експертні та інструментальні інформаційні системи
71
Багато дослідників пропонують різ-
номанітні методи, що дозволяють ранжу-
вати вебпортали на основі їхніх умов та
політики надання послуг. Наприклад, в [6]
розглядаються методи, які застосовують
машинне навчання та нейронну мережу
обробки природної мови, для порівняння
сайтів. Для цього аналізуються умови на-
дання сервісів та угоди, що визначають
набір правил, які повинен виконати корис-
тувач для того, щоб використовувати по-
слугу, що надається вебсайтом або пошу-
ковою системою.
Напрямки семантизації
вебпорталів
Основні тенденції розвитку порталів
стосуються їхньої семантизації та можли-
вості повторного використання інформації.
Обидві ці тенденції безпосередньо пов’я-
зані із проєктом Semantic Web та широко
застосовують стандарти й мови подання
знань, створених в рамках цього проєкту.
Технології Semantic Web (SW) [7] і Linked
Data [8] є багатообіцяючим підходом для
вирішення проблем семантичної сумісності
в середовищі створення розподіленого кон-
тенту. На основі комп’ютерно «зрозумілих»
зв’язаних великих даних можна створювати
інтелектуальні програми для дослідників
цифрових гуманітарних наук (DH) і громад-
ськості.
Наприклад, у [9] автори розгляда-
ють набір семантичних порталів, що під-
тримує поєднання портальних технологій
з засобами та стандартами обробки роз-
поділених знань та забезпечує створення
національної онтологічної інфраструкту-
ри культурної спадщини та семантичних
порталів “Sampo” (таких як BookSampo,
BiographySampo, AcademySampo) на осно-
ві пов’язаних даних (Linked Data), техно-
логій Semantic Web та принципів відкритої
науки FAIR [10]. Модель Sampo містить
три основні компоненти: 1. бізнес-модель
для узгодження, агрегування та публікації
різнорідного, розподіленого контенту на
основі спільної інфраструктури онтології;
2. дизайн інтерфейсу, де дані можна повтор-
но використовувати та отримувати доступ
незалежно від різних точок програми, тоді
як дані знаходяться в одній кінцевій точці
SPARQL; 3. двоетапну модель для доступу
та аналізу даних, де фокус інтересу спочат-
ку фільтрується за допомогою фасетного
семантичного пошуку, а потім візуалізуєть-
ся та аналізується за допомогою інструмен-
тів порталу.
У [11] наводяться базові вимоги до
технологій створення семантичних порта-
лів. Бажані функції семантичного порталу
разом із вимогами до інструментів для їх
створення, які поділяються на дві групи:
− вимоги, яким повинні відповідати
інструменти для реалізації інтерфейсів ко-
ристувача семантичного порталу :
– швидке створення застосунків для
конкретних випадків використання;
– можливість запитувати дані безпо-
середньо з кінцевої точки SPARQL [12];
– дослідження ієрархічних даних за
допомогою онтологій;
– підтримка масштабування для
обробки великої кількості ІО за обраним
сценарієм, використовуючи обмежену кіль-
кість ресурсів;
– інтуїтивно зрозумілих і зручних ін-
терфейсів користувача;
– можливість візуалізацій, які авто-
матично адаптуються до доступних ресур-
сів;
− вимоги, які стосуються структу-
ри та функціональних можливостей інтер-
фейсів користувача семантичних порталів:
– наявність кількох точок зору для
доступу до графів знань або онтологій, що
відображають структуру бази знань вебпор-
талу;
– можливість перегляду, пошуку та
дослідження структуру бази знань вебпор-
талу;
– підтримка різних парадигм пошу-
ку в контенті вебпорталу (наприклад, шука-
ти екземпляри певного класу з подібними
значеннями властивостей);
– наявність різних форм подання ре-
зультатів пошуку (як-от, на географічних
картах, на часовій шкалі або у вигляді гра-
фічної діаграми);
– можливість перегляду та аналізу
структури ІО порталу та його конкретних
екземплярів;
Експертні та інструментальні інформаційні системи
72
– користувачі можуть досліджувати
посиланнями між екземплярами ІО ;
– користувачі можуть експортувати
результати пошуку у різні формати відпо-
відно до їхніх потреб.
Технології Semantic Web
для керування знаннями
вебпорталів
Проєкт Semantic Web розвивається
вже багато років та залишається на сьогодні
джерелом найбільш ефективних технологій
керування знаннями у вебсередовищі. Основ-
на ідея цього проєкту пов’язана з прагненням
перетворити Web на глобальну базу знань
та з розробкою стандартів, мов і програмних
засобів для семантичного пошуку інформації
в цих ресурсах. Саме ці засоби дозволяють
розширювати функціонал вебпорталів та ін-
тегрувати їх з іншими ресурсами.
Semantic Web – це потужний напрям
для підвищення ефективності розподілено-
го й сумісного доступу до інформації та її
використання прикладними програмами.
Це досить ефективна спроба інтеграції за-
стосовних Web-технологій з науковими роз-
робками у сфері подання знань (knowledge
representation, KR), що є підгалуззю штуч-
ного інтелекту. В рамках проєкту Semantic
Web створюються засоби для керування ве-
ликою кількістю інформації та інформацій-
них послуг. Урахування семантики інфор-
маційних ресурсів дає змогу зробити інфор-
мацію більш корисною. Але це потребує
створення нових засобів подання даних, які
покращують здатність до збирання й спіль-
ного використання знань, а також нових
конструкцій програмування та інструмен-
тів, що уможливлюють обробку цієї інфор-
мації в прикладних програмах.
Використання елементів Semantic
Web дозволяє підтримувати важливі для ін-
формаційно-аналітичних порталів функції:
− індексація та пошук інформації;
− розробка та підтримка метаданих;
− розробка та підтримка методів ано-
тування;
− подання контенту у вигляді інтеро-
перабельної бази даних;
− організація машинного здобуття
даних;
− виявлення й надання вебсервісів;
− інтеграція та аналіз контенту;
− дослідження в галузі інтелектуаль-
них програмних агентів;
− розвиток підтримки інтерфейсів різ-
них пристроїв і всепроникні обчис-
лення.
Основними компонентами Semantic
Web, які безпосередньо стосуються розвит-
ку портальних технологій, є онтології та
вебсервіси. Для того, щоб використовувати
їх у застосовних програмах, у рамках про-
єкту Semantic Web розроблено такі відкриті
стандарти, що дають змогу формалізувати
семантику ІР і програмних засобів їх пошу-
ку та обробки: RDF – мова опису метаданих;
OWL – мова подання онтологій; SPARQL –
мова запитів до RDF та OWL; SWRL – мова
визначення правил.Semantic Web продов-
жує активно розвиватися, про що свідчать
розробка й удосконалення мов і стандартів
роботи з розподіленими знаннями.
У контексті Semantic Web вебпортал
розглядається як вебсайт, що надає інфор-
мацію та забезпечує можливості обміну
для певної спільноти на основі технологій
Semantic Web [13]. У такому порталі виріз-
няють три рівні (рис.1):1. доступ до інфор-
мації для користувачів; 2. засоби обробки
інформації на порталі; 3. базові технології.
Рис.1. Рівні вебпорталу Semantic Web
Елементи, що використовуються на
кожному рівні, можуть значно різнитися
залежно від реалізації. Наприклад, можуть
використовуватися різні типи онтологій,
що можуть мати різний обсяг та виразність,
Експертні та інструментальні інформаційні системи
73
але вони мають застосовуватися замість
неформалізованих природномовних описів
предметної області вебпорталу. Залежно
від типу онтології можуть бути реалізовані
різні види логічного виведення (перевірка
наявності елементів класу, виявлення
симетричних або транзитивних відношень
між ІО тощо), але портал має підтримувати
сервіси для здобуття та аналізу поданих в
онтології знань.
Фундаментальна семантична про-
блема публікації, інтеграції, аналізу та ви-
користання на основі порталів полягає в
тому, як зробити різнорідну інформацію
семантично сумісною, щоб можна було шу-
кати потрібні користувачам відомості, з’єд-
нувати їх між собою та представляти узго-
дженим способом із різних наборів даних.
Проблема пов’язана зі способом створення
контенту порталів: дані збираються, збері-
гаються та публікуються різними суб’єкта-
ми, які використовують власні стандарти та
найкращі практики, що можуть бути несу-
місними між собою. Важливо розуміти, що
використання для цього методів створення
інтелектуальних інформаційно-аналітич-
них систем та впровадження вже існуючих
семантичних вебтехнологій, має враховува-
ти такі важливі аспекти функціювання веб-
порталів, як динамічність контенту, можли-
вість масштабування як сервісів, так і моде-
лей подання знань.
У семантизації порталів можна ви-
ділити кілька досить тісно пов’язаних ас-
пектів: 1. семантичний пошук; 2. імпорт
знань із зовнішніх інформаційних джерел;
3. експорт інформації з порталу в сучасних
форматах подання знань (таких як RDF та
OWL); 4. створення метаданих, що опи-
сують контент порталу на семантичному
рівні.
Наразі швидке зростання обсягу ін-
формації, доступ до якої забезпечують пор-
тали, а також ускладнення її структури зу-
мовлюють потребу в розвитку різноманіт-
них сервісів для знаходження необхідних
користувачам відомостей [14]. Ці сервіси
мають позбавити користувачів рутинного
аналізу інформації, яка не стосується їх-
ніх інтересів, та виокремлювати відомо-
сті щодо ІО, потрібних цим користувачам.
Використання порталів має забезпечувати
більш ефективний пошук порівняно зі спро-
бами шукати інформацію безпосередньо
за місцем її збереження – у базах даних та
інших джерелах структурованої інформації
(наприклад, XML-документах і сховищах)
або на тих вебсайтах, що застосовуються
як джерела контента порталу. Для кожного
типу інформаційних джерел і кожного типу
ІО, які шукає користувач, доцільно мати
свій набір пошукових компонентів з уніфі-
кованим інтерфейсом взаємодії.
Якщо в процесі пошуку інформа-
ції використовують зовнішні знання щодо
предметної області, яка цікавить корис-
тувача, та засоби керування знаннями, то
йдеться про семантичний або інтелекту-
альний пошук.
Семантичний пошук – це один з
підкласів інформаційного пошуку, в яко-
му релевантність знайденої інформації до
запиту користувача оцінюється за близькі-
стю змісту для ефективнішого задоволення
інформаційних потреб користувача. Такий
пошук іноді розглядають як інтелектуальну
надбудову над традиційним інформаційним
пошуком. Тож можна вважати, що сервіси
семантичного пошуку на порталі розширю-
ють його функціонал та доповнюють тра-
диційні пошукові сервіси (за ключовими
словами, категоріями тощо). Наприклад, у
порталах на основі семантичних вікітехно-
логій підтримуються рідні види пошуку на
основі семантичних властивостей сторінок
та їхніх значень.
Для семантичного пошуку на веб-
порталі, що виконується у відкритому се-
редовищі, характерним є те, що потрібні
для пошуку знання також динамічно здо-
буваються з цього відкритого середовища,
а не закладаються в систему в процесі її
створення. Те, які саме знання використову-
ються для цього, залежить як від специфіки
та типу порталу, так і від концепції, обраної
його розробниками.
Результати пошуку можуть автома-
тично вбудовуватися до відповідних сто-
рінок порталу. Зокрема, портали на основі
семантичних вікітехнологій можуть місти-
ти знайдені дані для автоматичного онов-
лення контенту (рис.2).
Експертні та інструментальні інформаційні системи
74
Рис. 2. Результати виконання вбудованого
запиту для генерації контенту
Слід враховувати, що семантичний
пошук на вебпорталі зазвичай забезпечує
знаходження екземплярів типових ІО, харак-
терних для даного порталу, а також специ-
фічних сукупностей таких об’єктів (напри-
клад, портал транспортних послуг дозволяє
знаходити узгоджену сукупність переміщень
між обраними пунктами, а портал освітньої
установи дозволяє знаходити навчальний
курс з обраним набором компетенцій).
Під час створення таких систем вар-
то враховувати, з яких саме зовнішніх баз
знань можуть здобуватися відомості щодо
структури таких ІО, та регулярно перевіря-
ти, чи не змінюється контент цих баз.
БЗ вебпорталу можуть змінювати
структуру й доступність незалежно від роз-
робників ІПС. Тому результати пошуку у Web
є функцією ще й від вмісту зовнішніх БЗ.
Підтримка парадигми FAIR
у контенті вебпорталів
Одним із перспективних напрямків
вдосконалення вебпорталів є можливість
забезпечення повторного використання їх-
нього контенту на основі парадигми від-
критих даних. Це потребує розв’язання
різноманітних проблем, що стосуються збе-
реження великих масивів даних, дотриман-
ня прав власників цих даних, забезпечення
безпечного інформаційного і правового се-
редовища для користувачів тощо. Ці про-
блеми можуть бути досить ефективно вирі-
шені для обробки результатів наукових до-
сліджень. Але технології, що підтримують
пошук та повторне використання специфіч-
них наукових ресурсів, виявляються при-
датними і для вдосконалення портальних
технологій. Наприклад, FAIR дані (FAIR_
data) – це дані, які відповідають принципам
знаходжуваності, доступності, інтеропера-
бельності та повторного використання [15].
Якщо вебпортал надає дані та сервіси, що
відповідають цій парадигмі, то це гарантує
користувачам більший функціонал для ана-
літичної обробки та практичного застосу-
вання інформації.
Такі дані мають наступні властивості:
− Findable: щоб використовувати дані,
їх необхідно спочатку знайти там, де
вони зберігаються. Тому дані та їх
метаописи мають бути доступними
як для людей, так і для комп’ютер-
них програм.
− Accessible: Коли користувач знахо-
дить потрібні дані, він/вона повинен
знати, як отримати доступ до них
(можливо, включаючи аутентифі-
кацію та авторизацію). І дані, і їхні
метаописи мають бути зрозумілими
людині та придатними для автомати-
зованої обробки.
− Interoperable: дані мають бути придат-
ними для інтеграції з іншими даними
та для обробки іншими застосунками.
− Reusable: дані та метадані повинні
бути описані з відповідною виразні-
стю, щоб їх можна було відтворюва-
ти та/або комбінувати в різних нала-
штуваннях.
Згідно FAIR, сервіси пошуку, здо-
буття і представлення даних реалізують не
користувачі, а інформаційна система. Вод-
ночас мова йде не тільки про власне дані і
метадані, а і про алгоритми й інструменти
керування ними.
Керівні принципи FAIR не потребу-
ють будь-якої стандартизації чи конкретної
технології їхньої підтримки. Тому вони до-
сить незалежні від конкретних програмних
рішень, що можуть застосовуватися для їх-
ньої реалізації.
Практична реалізація нових
тенденцій у створенні вебпорталів
Сьогодні один із перспективних на-
прямків створення семантичних вебпор-
талів з відкритими даними базується на
Експертні та інструментальні інформаційні системи
75
вікітехнологіях та їх семантичному розши-
ренні. Прикладом реалізації такого підходу
є портал Великої української енциклопедії
(vue.gov.ua). Зараз цей портал відповідає
багатьом вимогам, пов’язаним з тенденція-
ми розвитку порталів, але потребує подаль-
шої роботи та підтримання структури та
контенту у відповідності до змін відкритого
середовища та змін в інформаційних ресур-
сах, котрі є джерелами його контенту.
Семантизовані Wiki-ресурси, такі як
Semantic MediaWiki, що дозволяють ство-
рювати семантичні дані та базуються на
використанні стандартів Semantic Web, да-
ють потужне рішення для спільного редагу-
вання даних та їхніх метаописів, створен-
ня різних довільних наборів властивостей
у шаблонах цих метаописів, з одночасним
поданням їх як в машинно-оброблюваній
формі, так і формі, придатній для розуміння
людиною, що в результаті дає можливість
оперувати цими даними, автоматизовано
керувати, здійснювати аналіз, публікувати.
Використання вікітехнології на ос-
нові MediaWiki [16] та його семантичного
розширення Semantic MediaWiki [17], яке
історично себе показало досить потужним
інструментом, має широку спільноту вико-
ристання, відкритий код та відкриті прин-
ципи розробки і підтримки, постійно розви-
вається, забезпечує відповідність створено-
го інформаційного ресурсу вимогам FAIR
[18] та надає достатній функціонал для ро-
боти з контентом [19].
Але потрібно зауважити, що усклад-
нення структури порталу та розширення
його функціоналу може викликати появу ба-
гатьох додаткових проблем: обробка контен-
ту на рівні семантики є значно складнішою
за традиційну, а орієнтація на відкрите сере-
довище вимагає враховування різноманітних
форм подання інформації, знаходження шля-
хів розв’язання неоднозначностей, виявлен-
ня помилок та визначення процедур інтегра-
ції як даних, так і їхніх моделей [20], а також
більш якісно обирати інформаційні джерела,
які забезпечують якісні дані та застосовують
релевантні формати їх представлення.
Як бачимо, сучасні тенденції потре-
бують від розробників порталу значно вищої
кваліфікації та більшого часу на генерацію
контенту, адже додавання нової інформації
має супроводжуватися її семантичною роз-
міткою, структуризацією та узгодженням
з уже наявними даними. Але створений та-
ким чином контент є значно зручнішим для
користувачів, тому що забезпечує автома-
тизоване виконання різноманітних сервісів,
пов’язаних із аналітичною обробкою та уза-
гальненням даних. Крім того, такі портали
дозволяють генерувати персоніфіковані бази
знань за запитами користувачів, і саме це
дозволяє користувачам ефективніше реалізо-
вувати свої інформаційні потреби у взаємодії
з іншими інтелектуальними застосунками.
Критерії оцінки можливостей
розвитку вебпорталів
Як показує наведений вище аналіз
перспективних напрямків розвитку вебпор-
талів, вдосконалення вже існуючих порта-
лів базується на наявності:
– відкритого програмного забезпечен-
ня, що підтримує масштабованість
контенту та має достатню виразність
для подання інформації зі складною
структурою;
– моделі представлення знань порталу,
що сумісна із технологіями менедж-
менту знань у відкритому середовищі
та підтримує імпорт та експорт знань
із зовнішніх інформаційних ресурсів;
– семантичного структурування кон-
тенту та створення мета даних, що
характеризують цей контент;
– засобів перевірки узгодженості кон-
тенту та його автоматизованої гене-
рації на основі семантичної розмітки;
– набору сервісів для пошуку та наві-
гації на порталі, для аналізу контен-
ту та його автоматизованої генерації
за запитами.
Важливо розрізняти потенційні тех-
нологічні можливості та їхню практичну
реалізацію. Наприклад, використання се-
мантичних розширень вікітехнологій за-
безпечує можливість семантичної розмітки
контенту та явного визначення змісту поси-
лань між окремими сторінками. Але ці ви-
значення потрібно створювати (і цю роботу
мають виконувати експерти предметної об-
ласті, що розуміють зміст таких зв’язків, а
Експертні та інструментальні інформаційні системи
76
не оператори). Саме наявність повноцінної
семантичної розмітки є необхідною умо-
вою ефективного виконання різноманітних
пошукових запитів.
Важливо розрізняти потенційні тех-
нологічні можливості розвитку вебпорталів
та їхню практичну реалізацію.
Розглянемо це на прикладі порта-
лу Великої української енциклопедії (vue.
gov.ua). У Таблиці 2 наведено технологічні
можливості семантичного вікісередовища,
в якому реалізовано цей портал, та ступінь
їхнього практичного використання.
Таблиця 2. Реалізація тенденцій
розвитку вебпорталів
Напрямок
розвитку
Практична
реалізація
Персоніфікація Тільки для розроб-
ників контенту
Захист персональних
даних
– можливість
прогляду
+ (простори імен
сторінок)
– можливість
редагування
+ (тільки для зареє-
строваних користу-
вачів, але без града-
ції повноважень)
Експорт знань у
відкриті формати
Потрібно писати та
виконувати запити
сторінок, де такі за-
пити вбудовано
Імпорт знань із
зовнішніх джерел
Зараз не підтриму-
ється (було у попе-
редніх версіях)
Розширений набір
сервісів навігації
– спеціальні
сторінки
Для зареєстрованих
користувачів
– інтерфейс порталу обмежено
Сервіси пошуку
– спеціальні
сторінки
+
– інтерфейс порталу частково
Семантична розмітка
контенту
– типових ІО частково
– довільних ІО та
посилань між сто-
рінками
Менше 1%
Семантичний пошук
– типових ІО частково
– довільних ІО Менше 1%
Підтримка парадиг-
ми FAIR
Зараз не використо-
вується
Інтелектуальні серві-
си аналізу контенту
Тільки у тестових
версіях
Тож бачимо, що такий портал потен-
ційно має великі можливості для вдоскона-
лення, але наразі значна частина таких мож-
ливостей не реалізована практично (або реа-
лізована лише частково). Слід відзначити, що
семантичне розширення вікітехнологій на
основі плагіну Semantic MediaWiki підтри-
мує більшість тенденцій розвитку вебпорта-
лів, але сама технічна можливість не забез-
печує автоматично відповідний функціонал.
Наявність семантично розміченого контенту
є необхідною умовою розвитку порталу та
можливості створення набору сервісів, що
задовольняють потреби користувачів.
Проблеми у створенні
семантичних вебпорталів
У створенні та розвитку семантич-
них вебпорталів виникає ціла низка про-
блем, специфічних саме для систем оброб-
ки та аналізу знань, які оперують з велики-
ми обсягами інформації та з гетерогенними
моделями ІО. Їх умовно можна поділити на
такі категорії: 1. проблеми моделювання та
подання семантики; 2. проблеми масштабу-
вання; 3. організаційні проблеми.
Значна частина проблем подання
семантичного контенту пов’язана з необ-
хідністю обробки даних, які є неточними,
розпливчастими, невизначеними, непослі-
довними, неповними тощо і тому не можуть
бути віднесені до класичних даних. Цей
термін близький до брудних даних, але для
систем обробки знань вони доповнюються
семантично некоректними даними різних
типів. Дані вважаються брудними, якщо
Експертні та інструментальні інформаційні системи
77
програма, що працює коректно, не в змозі
отримати результат їхньої обробки, або от-
римує неправильний результат. Водночас
потрібно аналізувати два різні аспекти – з
якої причини дані стали брудними та що
можна зробити, щоб вони стали придатни-
ми для аналізу. Наприклад, джерелами бруд-
них даних можуть бути помилки введення
або оновлення даних, помилки передавання
даних або некоректно обрана форма подан-
ня даних. Семантично некоректні дані мож-
на виявити тільки на етапі їх інтерпретації,
якщо їхні значення не відповідають обме-
женням та правилам предметної області
(наприклад, у загальному випадку вік люди-
ни може бути довільно позитивним числом,
але вік працівника не може бути менше пев-
ного значення). Для семантичних даних ви-
никає також необхідність перевірки змістов-
ної узгодженості даних щодо ІО, між якими
існують певні семантичні зв’язки (як-от, рік
народження дитини має бути менше року
народження її батьків).
Причини появи на порталі такої ін-
формації можуть бути різними. В деяких
випадках інформація може перетворювати-
ся у класичні дані автоматично або автома-
тизовано, в інших потребує участі експерта
предметної області або інженера зі знань
(наприклад, для інтеграції різних онтоло-
гічних моделей однієї області). В деяких ви-
падках дані не можуть бути перетворені на
класичні через відсутність, неповноту або
надлишковість інформації. Класифікація та-
ких даних для семантичного вебпорталу на
основі Wiki-технології наводиться у [19].
Участь великої кількості спеціаліс-
тів у створенні вебпорталів викликає роз-
біжності у розумінні правил подання та
структурування даних. Тому виникає не
тільки необхідність додаткової верифікації
контенту, а й створення детальної методо-
логії семантизації та узгодження з модел-
лю предметної області. Для цього потрібно
створювати формалізовані та масштабовані
рішення для опрацювання різноманітних
типів нечіткості, неповноти та семантичної
некоректності контенту. Однак наявність
таких рішень та методологій є не достат-
ньою, а лише необхідною умовою побудови
семантичного вебпорталу.
Як показує практика розробки се-
мантичних вебпорталів, проблеми обробки
знань значно різняться на етапі створення й
розгортання та на етапі масового поповнен-
ня контенту. Якщо в першому випадку біль-
шість проблем пов’язані із невідповідністю
моделі об’єктам реального світу та потре-
бують внесення принципових змін (напри-
клад, припускати кілька значень певного
параметру, зміни структури), то у другому
випадку такі моделі потребують уточнення
та розширення, щоб коректно обробляти
більш специфічні випадки, які не врахову-
вали початкові варіанти.
Проблеми масштабування виникають
у процесі ускладнення бази знань порталу,
коли інформація про взаємодію великої кіль-
кості ІО різних типів має бути інтегрованою
та узгодженою. Як правило, існуючі порталь-
ні технології не підтримують такі функції
безпосередньо, але допускають можливість
застосування зовнішніх сервісів, призначе-
них для менеджменту знань. Інша проблема
масштабування пов’язана з тим, що зі зрос-
танням кількості складних ІО кількість зв’яз-
ків між ними може зростати нелінійно, й це
може призвести до збільшення часу аналізу
інформації та виконання пошукових запитів.
У таких випадках потрібно знаходити певний
компроміс між прийнятним часом обробки
та необхідною виразністю моделі. Крім того,
деякі складні для виконання аналітичні запи-
ти доцільно виносити на окремі сторінки, а
не пропонувати усім користувачам.
Організаційні проблеми пов’язані з
тим, що на початку розробки семантичного
вебпорталу основні роботи, як правило, ви-
конує команда кваліфікованих спеціалістів з
менеджменту знань. Але після формування
основи структури бази знань порталу обсяг
робіт для таких спеціалістів зменшується, і
це може призвести до спроб зменшення та-
кої команди через поєднання функцій або
припинення розвитку певних напрямків се-
мантизації. Об’єднуючи дані з різних дже-
рел, можна отримувати нову інформацію за
допомогою різноманітних засобів аналізу
даних. Але якість нової інформації залежить
не лише від алгоритмів аналізу, а й від яко-
сті даних. Внаслідок цього через деякий час
структура бази знань не оновлюється та пе-
Експертні та інструментальні інформаційні системи
78
рестає відповідати потребам доданого кон-
тенту, нові працівники порталу з недостат-
ньою кваліфікацією некоректно вносять се-
мантичну розмітку (або не вносять її взагалі,
тому що це не впливає явно на формальні ха-
рактеристики порталу). Через це семантичні
запити та аналітичні сервіси працюють неко-
ректно (вони обробляють некоректно задані
дані або не мають потрібних відомостей). І
тому портал, що формально вважається се-
мантичним, втрачає значну частку своїх пе-
реваг як аналітична інформаційна система,
але надалі продовжує витрачати додаткові
обчислювальні потужності на підтримку се-
мантичної складової.
Практичні рекомендації
зі створення семантичних
вебпорталів
На основі наведеного вище аналізу
можна сформулювати наступні практичні
рекомендації зі створення семантичних ве-
бпорталів, спрямованих на запобігання та
розв’язання проблем обробки знань:
1) модель бази знань вебпорталу,
створену на основі початкового набору кон-
тенту, потрібно постійно вдосконалювати
та узгоджувати з усіма особливими випад-
ками інформаційних ІО, які могли не зу-
стрічатися у початковому наборі даних;
2) моделі ІО бажано не змінювати,
а доповнювати додатковими властивостя-
ми, а типи даних, що використовуються для
опису їх значень, змінювати на ширші, а не
на більш специфічні (наприклад, замінюва-
ти “Число” на “Текст”, але не навпаки) – це
має забезпечити узгодженість моделі з по-
передньо оприлюдненим контентом;
3) необхідно постійно генерувати се-
мантичну розмітку контенту, яка є основою
функціювання усіх семантичних сервісів:
потрібно явно визначати семантику всіх
(або хоча б більшість) зв’язків між елемен-
тами контенту;
4) набір семантичних відношень між
елементами контенту має постійно попов-
нюватися, щоб коректно відображати все
розмаїття таких зв’язків, але разом із зрос-
танням кількості таких відношень доцільно
розробити систему їх класифікації (напри-
клад, таксономію або тезаурус), надавати
чіткі формальні описи та намагатися запо-
бігати дублюванню;
5) виконання складних аналітичних
та пошукових запитів доцільно виносити в
окремі сторінки або пункти меню, щоб ви-
конувати їх тільки тоді, коли це потрібно
користувачам. Це дозволяє економити об-
числювальні ресурси порталу;
6) постійно проводити інструктуван-
ня персоналу, який готує контент, щоб забез-
печити коректність створюваної семантичної
розмітки, та чітко розрізняти функції зі ство-
рення моделі такої розмітки та її застосуван-
ня (для складних порталів це підтримується
за рахунок детальнішого визначення повно-
важень різних груп розробників);
7) здійснювати регулярні опера-
ції для оновлення структури бази знань,
створення її резервних копій та контролю
змістовної цілісності (як з використанням
внутрішніх можливостей порталу, так і за
допомогою зовнішніх систем менеджменту
знань), для запобігання появи значних се-
мантичних некоректностей даних.
Висновки
Основна мета даної роботи полягає
в здійсненні наукових досліджень та експе-
риментальних перевірок отриманих резуль-
татів у створенні інтелектуальних інформа-
ційних систем, які використовують Semantic
Web, онтологічний аналіз та вікітехнології
для забезпечення можливості аналізу та ви-
користання для практичних цілей великих
обсягів і потоків інформації різних типів. У
роботі аналізуються вебпортали, які є одним
з перспективних засобів інтеграції та аналі-
зу великих обсягів інформації, переробки
масивів гетерогенних «сирих» даних у фор-
му, що забезпечує їх уніфіковане подання,
здобуття з них корисних знань та повторне
використання. Розглядаються можливості,
які надає семантизація вебпорталів. Розви-
ток таких систем потребує поєднання пор-
тальних технологій з можливостями засобів
аналізу та обробки знань у відкритому се-
редовищі, і таке поєднання призводить до
появи специфічних проблем.
Наступним кроком розвитку вебпор-
талів можуть стати портали випадкового
виявлення знань, де інструменти базують-
Експертні та інструментальні інформаційні системи
79
ся на техніках штучного інтелекту і здатні
автоматично знаходити випадкові цікаві
явища та дослідницькі питання в даних і
вирішувати проблеми користувачів за допо-
могою пояснень.
Література
1. Гладун А. Я., Рогушина Ю. В. Репозитории
онтологии как средство повторного исполь-
зования знаний для распознавания инфор-
мационных объектов. Онтология проекти-
рования, 1 (7), 2013, с.35-50.
2. Strauss H. Web portals: the future of
information access and distribution. In Trans-
forming Serials, 2021, pp. 27-35.
3. What is the Difference between Website
and Web Portal. www.geeksforgeeks.org/
difference-website-web-portal/ [Accessed
4/09/2023].
4. Difference between Website and Web Por-
tal. forum.huawei.com/enterprise/en/Differ-
ence-between-Website-and-Web-Portal [Ac-
cessed 4/09/2023].
5. Web Portal. https://www.techopedia.com/
definition/17352/web-portal [Accessed
4/09/2023].
6. Bhat M. U. D., Singh S. Automatic Method to
Rate Websites Based on Terms of Services.
Journal Of Creative Writing , 4(2), 2020.
7. Berners-Lee T., Hendler, J., Lassila, O. The se-
mantic web. Scientific american, 284(5), 2001,
pp.34-43.
8. Bizer C., Heath T., Berners-Lee, T. Linked
data: The story so far. In Semantic services, in-
teroperability and web applications: emerging
concepts, 2011, pp. 205-227.
9. Hyvönen E. “Sampo” model and semantic
portals for digital humanities on the Semantic
Web. In Proceedings of the Digital Humanities
in the Nordic Countries 5th Conference (DHN
2020), 2020, pp.374-378.
10. FAIR_data. https://en.wikipedia.org/wiki/
FAIR_data. [Accessed 4/09/2023].
11. Ikkala E., Hyvönen E., Rantala H., Koho M.
Sampo-UI: A full stack JavaScript framework
for developing semantic portal user interfaces.
Semantic Web, 13(1), 2022, pp.69-84. https://
content.iospress.com/articles/semantic-web/
sw210428.
12. Koho M., Heino E., Hyvönen E. SPARQL
Faceter-Client-side Faceted Search Based on
SPARQL. In LIME/SemDev@ ESWC. 2016.
https://www.seco.tkk.fi/publications/2016/ko-
ho-et-al-sparql-faceter.pdf.
13. Lausen H. , Ding Y. , Stollberg M. , Fensel D.,
Lara Hernández R, Han S.-K. Semantic web
portals: State-of-the-art survey, Journal of
Knowledge Management 9: (5), 2005, pp.40–
49. doi:10.1108/13673270510622447.
14. Gladun A., Rogushina J., Schreurs J., Salem
A. B. Ontology-based knowledge recognition
in service-oriented virtual research environ-
ments. In 7th International Conference on In-
formation Technology, 2015, pp. 148-155.
15. The FAIR data principles. Available from:
https://www.force11.org/group/fairgroup/fair-
principles [Accessed 4/09/2023].
16. MediaWiki. Available from: https://www.me-
diawiki.org/wiki/MediaWiki/.
17. Krötzsch M., Vrandečić D., Völkel M. Seman-
tic mediawiki. International semantic web con-
ference, 2006, pp. 935-942. https://link.spring-
er.com/content/pdf/10.1007/11926078_68.pdf.
18. Rogushina J. Use of ontologies and Semantic
Mediawiki for representation and retrival of
scientific data in the FAIR paradigm Proc.of In-
ternational scientific conference “Information
technologies and management in higher educa-
tion and sciences”, 2023, pp.69-74. https://doi.
org/10.30525/978-9934-26-277-7-200.
19. Рогушина Ю. В., Гришанова І. Ю. Пробле-
ми масштабування семантичних інформа-
ційних ресурсів зі складною структурою.
Проблеми програмування, 2022, № 2-3,
c.171-182.
20. Рогушина Ю. В. Нечіткі дані у семантичних
wiki-ресурсах: моделі, джерела та методи
обробки. Проблеми програмування, 2023,
№2, c. 67-83. URL: pp.isofts.kiev.ua/index.
php/ojs1/article/viewFile/569/620.
References
1. Gladun A., Rogushina J. (2013). Ontology re-
positories as a means of reusing knowledge for
recognizing information objects. Design On-
tology, 1 (7), 35-50 (in Russuan).
2. Strauss H. (2021) Web portals: the future of
information access and distribution. In Trans-
forming Serials, 7-35.
3. What is the Difference between Website and Web
Portal. www.geeksforgeeks.org/difference-web-
site-web-portal/ [Accessed 4/09/2023].
Експертні та інструментальні інформаційні системи
80
4. Difference between Website and Web Por-
tal. forum.huawei.com/enterprise/en/Differ-
ence-between-Website-and-Web-Portal [Ac-
cessed 4/09/2023].
5. Web Portal. https://www.techopedia.com/
definition/17352/web-portal [Accessed
4/09/2023].
6. Bhat M. U. D., Singh S. (2020) Automatic
Method to Rate Websites Based on Terms of
Services. Journal Of Creative Writing , 4(2).
7. Berners-Lee T., Hendler, J., Lassila, O. (2001)
The semantic web. Scientific american, 284(5),
34-43.
8. Bizer C., Heath T., Berners-Lee, T. Linked
data: The story so far. In Semantic services, in-
teroperability and web applications: emerging
concepts, 2011, pp. 205-227.
9. Hyvönen E. (2020) “Sampo” model and se-
mantic portals for digital humanities on the
Semantic Web. In Proceedings of the Digital
Humanities in the Nordic Countries 5th Con-
ference (DHN 2020), 374-378.
10. FAIR_data. https://en.wikipedia.org/wiki/
FAIR_data. [Accessed 4/09/2023].
11. Ikkala E., Hyvönen E., Rantala H., Koho M.
(2022) Sampo-UI: A full stack JavaScript
framework for developing semantic portal
user interfaces. Semantic Web, 13(1), 69-84.
https://content.iospress.com/articles/seman-
tic-web/sw210428.
12. Koho M., Heino E., Hyvönen E. (2016) SPAR-
QL Faceter-Client-side Faceted Search Based
on SPARQL. In LIME/SemDev@ ESWC. .
https://www.seco.tkk.fi/publications/2016/ko-
ho-et-al-sparql-faceter.pdf.
13. Lausen H. , Ding Y. , Stollberg M. , Fensel D.,
Lara Hernández R, Han S.-K. (2005) Seman-
tic web portals: State-of-the-art survey, Jour-
nal of Knowledge Management 9: (5), 40–49.
doi:10.1108/13673270510622447.
14. Gladun A., Rogushina J., Schreurs J., Salem A.
B. (2015) Ontology-based knowledge recogni-
tion in service-oriented virtual research envi-
ronments. In 7th International Conference on
Information Technology, 148-155.
15. The FAIR data principles. Available from:
https://www.force11.org/group/fairgroup/fair-
principles [Accessed 4/09/2023].
16. MediaWiki. Available from: https://www.
mediawiki.org/wiki/MediaWiki/ [Accessed
4/09/2023].
17. Krötzsch M., Vrandečić D., Völkel M. (2006)
Semantic mediawiki. International semantic
web conference, 935-942. https://link.springer.
com/content/pdf/10.1007/11926078_68.pdf.
18. Rogushina J. (2023) Use of ontologies and
Semantic Mediawiki for representation and re-
trival of scientific data in the FAIR paradigm
Proc.of International scientific conference “In-
formation technologies and management in
higher education and sciences”, 69-74. https://
doi.org/10.30525/ 978-9934-26-277-7-200.
19. Rogushina J., Gryshanova I. (2022) Problems
of scaling semantic information resources with
a complex structure. Problems of program-
ming, , 2-3, 171-182.(in Ukrainian).
20. Rogushina J., (2023). Fuzzy data in semantic
Wiki-resources: models, sources and process-
ing methods. Problems in programming, (2),
67-83 .(in Ukrainian)..
Одержано: 26.08.2023
Про авторів:
Рогушина Юлія Віталіївна,
Канд.фіз.-мат.наук, с.н.с.
Публікації в українських виданнях – 220,
Публікації в іноземних журналах – 40.
Індекс Хірша: Scopus – 5,
Google Scholar – 21.
ORCID http://orcid.org/0000-0001-7958-2557.
Місце роботи авторів:
Інститут програмних систем
НАН України, 03181, Київ-187,
проспект Академіка Глушкова, 40,
e-mail: ladamandraka2010@gmail.com,
066 550 1999.
|