Досвід використання семантичних технологій для створення інтелектуальних ВЕБ-енциклопедій (на прикладі розробки порталу E-BYE)
Розглянуто концепцію розробки Великої української енциклопедії (ВУЕ), проаналізовано основні переваги, які надає створення її портальної версії е-ВУЕ. Для обґрунтування вибору технологічної платформи для побудови такого порталу автори роботи детально розглянули ідею та мету проекту, специфіку подан...
Gespeichert in:
| Datum: | 2020 |
|---|---|
| Hauptverfasser: | , , , , , , |
| Format: | Artikel |
| Sprache: | Ukrainian |
| Veröffentlicht: |
Інститут програмних систем НАН України
2020
|
| Schriftenreihe: | Проблеми програмування |
| Schlagworte: | |
| Online Zugang: | https://nasplib.isofts.kiev.ua/handle/123456789/180470 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Zitieren: | Досвід використання семантичних технологій для створення інтелектуальних ВЕБ-енциклопедій (на прикладі розробки порталу E-BYE) / П.І. Андон, Ю.В. Рогушина, І.Ю. Гришанова, В.А. Резніченко, А.М. Киридон, А.В. Арістова, А.О. Тищенко // Проблеми програмування. — 2020. — № 2-3. — С. 246-258. — Бібліогр.: 27 назв. — укр. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| id |
nasplib_isofts_kiev_ua-123456789-180470 |
|---|---|
| record_format |
dspace |
| spelling |
nasplib_isofts_kiev_ua-123456789-1804702025-02-23T19:10:30Z Досвід використання семантичних технологій для створення інтелектуальних ВЕБ-енциклопедій (на прикладі розробки порталу E-BYE) Опыт использования семантических технологий для создания интеллектуальных ВЕБ-энциклопедий (на примере разработки портала E-BYE) Experience of the semantic technologies use for intelligent Web encyclopedia creation (on example of the Great Ukrainian Encyclopedia portal) Андон, П.І. Рогушина, Ю.В. Гришанова, І.Ю. Резніченко, В.А. Киридон, А.М. Арістова, А.В. Тищенко, А.О. Моделі та засоби систем баз даних і знань Розглянуто концепцію розробки Великої української енциклопедії (ВУЕ), проаналізовано основні переваги, які надає створення її портальної версії е-ВУЕ. Для обґрунтування вибору технологічної платформи для побудови такого порталу автори роботи детально розглянули ідею та мету проекту, специфіку подання інформації в е-ВУЕ (типи та обсяг контенту, засоби його структурування, відношення між окремими елементами, бізнес-процеси публікації статей, вимоги до дизайну), оцінили доцільність використання Wiki-технології, а саме – можливості та обмеження використання MediaWiki. Аналіз основних технологічних складових портальної версії е-ВУЕ дозволив запропонувала напрямки розширення функціоналу е-ВУЕ на основі застосування сучасних засобів керування знаннями та форматів їх інтероперабельного подання. Також враховано проблеми захисту інформації та визначення прав доступу до різних елементів контенту. Для розробки портальної версії Великої української енциклопедії виникає потреба у застосуванні сучасних інтелектуальних Web-технологій, які мають забезпечити можливість подання та аналізу складної системи знань. Це обумовлює необхідність в дослідженні сучасних Web-технологій та співставлення їх можливостей та виразності зі специфічними вимогами, що випливають з концепції е-ВУЕ. Пропонується розробити розширення таких відкритих програмних засобів з використанням онтологічного аналізу та стандартів Semantic Web, обґрунтовуються основні напрямки такого семантичного розширення та переваги, які надає їх використання. З точки зору концепції Semantic Web е-ВУЕ можна розглядати як розподілену БЗ, яку можуть використовувати як люди, так і інтелектуальні програми. Нами були виділені типові інформаційні об’єкти, характерні для ВУЕ, визначено їх характерні ознаки та приклади. Ця інформація формально представлена у вигляді Wiki-онтології е-ВУЕ. Основні принципи організації БЗ е-ВУЕ, яка базується на застосуванні категорій Wiki та семантичних властивостей Semantic MediaWiki, дозволяють відобразити відношення та характеристики типових інформаційних об’єктів, які представлені в е-ВУЕ. Використання цих характеристик забезпечує виконання пошукових запитів на семантичному рівні, дозволяє вдосконалити навігацію між елементами порталу та інтегрувати відомості з різних сторінок. Рассмотрена концепция разработки Большой Украинской энциклопедии (БУЭ), проанализированы основные преимущества, которые предоставляет создания ее портальной версии е-БУЭ. Для обоснования выбора технологической платформы для построения такого портала авторы работы подробно рассмотрели идею и цель проекта, специфику представления информации в электронной БУЭ (типы и объем контента, средства его структурирования, отношение между отдельными элементами, бизнес-процессы публикации статей, требования к дизайну) , оценили целесообразность использования Wiki-технологии, а именно – возможности и ограничения использования MediaWiki. Анализ технологических составляющих портальной версии е-БУЭ позволил предложила направления расширения функционала электронной Вуэ на основе применения современных средств управления знаниями и форматов их интероперабельного представления. Также учтено проблемы защиты информации и определения прав доступа к различным элементам контента. Для разработки портальной версии Великой Украинской энциклопедии возникает потребность в применении современных интеллектуальных Web-технологий, которые должны обеспечить возможность представления и анализа сложной системы знаний. Это обусловливает необходимость в исследовании современных Web-технологий и сопоставление их возможностей и выразительности со специфическими требованиями, вытекающими из концепции е-Вуэ. Предлагается разработать расширение таких открытых программных средств с использованием онтологического анализа и стандартов Semantic Web, обосновываются основные направления такого семантического расширения и преимущества, которые предоставляет их использования. С точки зрения концепции Semantic Web э-БУЭ можно рассматривать как распределенную БЗ, которую могут использовать как люди, так и интеллектуальные программы. Нами были выделены типичные информационные объекты, характерные для, определены их характерные признаки и примеры. Эта информация формально представлена в виде Wiki-онтологии е- БУЭ. Основные принципы организации БЗ е-БУЭ, основанная на применении категорий Wiki и семантических свойств Semantic MediaWiki, позволяют отразить отношение и характеристики типовых информационных объектов, которые представлены в электронной БУЭ. Использование этих характеристик обеспечивает выполнение запросов на семантическом уровне, позволяет усовершенствовать навигацию между элементами портала и интегрировать сведения из разных страниц. We consider the conceptual principles of the Great Ukrainian Encyclopedia development and analyze the main advantages of its portal version – e-VUE. This portal version requires the relevant technological platform with high-level expressiveness and efficiency. Development of e-VUE with complex knowledge structure causes the study of modern Web-technologies and matching their capabilities with the specific requirements of encyclopedia. Therefore we consider in details the project idea and purposes, the specifics of e-VUE information representation (number and volume of articles, content types and sources, relations between content elements and their properties, business processes of article publication, design requirements) and processing (navigation, requests, integration and matching means) to estimate the Wiki-technology feasibility use (namely - opportunities and restrictions of MediaWiki technological platform). Also attention is paid to the means of information security ensuring and semantic-based establishment of content access rights. The results of such analysis show that MediaWiki with semantic plugins can be used as a base for e-VUE portal construction but needs in extension of its functionality based on modern knowledge management tools and formats of their interoperable representation. Now we are oriented on use of ontological analysis and Semantic Web standards (OWL, RDF, SPARQL). In terms of the Semantic Web, e-VUE is a distributed database with heterogeneous types of information objects that can be used both by humans and by external software (e.g. by intelligent agents). The main principles of e-VUE knowledge base organization are grounded on Wiki categories and semantic properties of Semantic MediaWiki that are used for formal representation of the e-VUE typical information objects (TIO). Such approach allows to express TIO relations, properties and characteristics that can be used by logical inference and semantic retrieval to improve the navigation between portal elements and integration of data from various Wiki pages. 2020 Article Досвід використання семантичних технологій для створення інтелектуальних ВЕБ-енциклопедій (на прикладі розробки порталу E-BYE) / П.І. Андон, Ю.В. Рогушина, І.Ю. Гришанова, В.А. Резніченко, А.М. Киридон, А.В. Арістова, А.О. Тищенко // Проблеми програмування. — 2020. — № 2-3. — С. 246-258. — Бібліогр.: 27 назв. — укр. 1727-4907 DOI: https://doi.org/10.15407/pp2020.02-03.246 https://nasplib.isofts.kiev.ua/handle/123456789/180470 004.853, 004.55 uk Проблеми програмування application/pdf Інститут програмних систем НАН України |
| institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| collection |
DSpace DC |
| language |
Ukrainian |
| topic |
Моделі та засоби систем баз даних і знань Моделі та засоби систем баз даних і знань |
| spellingShingle |
Моделі та засоби систем баз даних і знань Моделі та засоби систем баз даних і знань Андон, П.І. Рогушина, Ю.В. Гришанова, І.Ю. Резніченко, В.А. Киридон, А.М. Арістова, А.В. Тищенко, А.О. Досвід використання семантичних технологій для створення інтелектуальних ВЕБ-енциклопедій (на прикладі розробки порталу E-BYE) Проблеми програмування |
| description |
Розглянуто концепцію розробки Великої української енциклопедії (ВУЕ), проаналізовано основні переваги, які надає створення її портальної версії е-ВУЕ. Для обґрунтування вибору технологічної платформи для побудови такого порталу автори роботи детально розглянули ідею та мету проекту, специфіку подання інформації в е-ВУЕ (типи та обсяг контенту, засоби його структурування, відношення між окремими елементами, бізнес-процеси публікації статей, вимоги до дизайну), оцінили доцільність використання Wiki-технології, а саме – можливості та обмеження використання MediaWiki. Аналіз основних технологічних складових портальної версії е-ВУЕ дозволив запропонувала напрямки розширення функціоналу е-ВУЕ на основі застосування сучасних засобів керування знаннями та форматів їх інтероперабельного подання. Також враховано проблеми захисту інформації та визначення прав доступу до різних елементів контенту. Для розробки портальної версії Великої української енциклопедії виникає потреба у застосуванні сучасних інтелектуальних Web-технологій, які мають забезпечити можливість подання та аналізу складної системи знань. Це обумовлює необхідність в дослідженні сучасних Web-технологій та співставлення їх можливостей та виразності зі специфічними вимогами, що випливають з концепції е-ВУЕ. Пропонується розробити розширення таких відкритих програмних засобів з використанням онтологічного аналізу та стандартів Semantic Web, обґрунтовуються основні напрямки такого семантичного розширення та переваги, які надає їх використання. З точки зору концепції Semantic Web е-ВУЕ можна розглядати як розподілену БЗ, яку можуть використовувати як люди, так і інтелектуальні програми. Нами були виділені типові інформаційні об’єкти, характерні для ВУЕ, визначено їх характерні ознаки та приклади. Ця інформація формально представлена у вигляді Wiki-онтології е-ВУЕ. Основні принципи організації БЗ е-ВУЕ, яка базується на застосуванні категорій Wiki та семантичних властивостей Semantic MediaWiki, дозволяють відобразити відношення та характеристики типових інформаційних об’єктів, які представлені в е-ВУЕ. Використання цих характеристик забезпечує виконання пошукових запитів на семантичному рівні, дозволяє вдосконалити навігацію між елементами порталу та інтегрувати відомості з різних сторінок. |
| format |
Article |
| author |
Андон, П.І. Рогушина, Ю.В. Гришанова, І.Ю. Резніченко, В.А. Киридон, А.М. Арістова, А.В. Тищенко, А.О. |
| author_facet |
Андон, П.І. Рогушина, Ю.В. Гришанова, І.Ю. Резніченко, В.А. Киридон, А.М. Арістова, А.В. Тищенко, А.О. |
| author_sort |
Андон, П.І. |
| title |
Досвід використання семантичних технологій для створення інтелектуальних ВЕБ-енциклопедій (на прикладі розробки порталу E-BYE) |
| title_short |
Досвід використання семантичних технологій для створення інтелектуальних ВЕБ-енциклопедій (на прикладі розробки порталу E-BYE) |
| title_full |
Досвід використання семантичних технологій для створення інтелектуальних ВЕБ-енциклопедій (на прикладі розробки порталу E-BYE) |
| title_fullStr |
Досвід використання семантичних технологій для створення інтелектуальних ВЕБ-енциклопедій (на прикладі розробки порталу E-BYE) |
| title_full_unstemmed |
Досвід використання семантичних технологій для створення інтелектуальних ВЕБ-енциклопедій (на прикладі розробки порталу E-BYE) |
| title_sort |
досвід використання семантичних технологій для створення інтелектуальних веб-енциклопедій (на прикладі розробки порталу e-bye) |
| publisher |
Інститут програмних систем НАН України |
| publishDate |
2020 |
| topic_facet |
Моделі та засоби систем баз даних і знань |
| url |
https://nasplib.isofts.kiev.ua/handle/123456789/180470 |
| citation_txt |
Досвід використання семантичних технологій для створення інтелектуальних ВЕБ-енциклопедій (на прикладі розробки порталу E-BYE) / П.І. Андон, Ю.В. Рогушина, І.Ю. Гришанова, В.А. Резніченко, А.М. Киридон, А.В. Арістова, А.О. Тищенко // Проблеми програмування. — 2020. — № 2-3. — С. 246-258. — Бібліогр.: 27 назв. — укр. |
| series |
Проблеми програмування |
| work_keys_str_mv |
AT andonpí dosvídvikoristannâsemantičnihtehnologíjdlâstvorennâíntelektualʹnihvebenciklopedíjnaprikladírozrobkiportaluebye AT rogušinaûv dosvídvikoristannâsemantičnihtehnologíjdlâstvorennâíntelektualʹnihvebenciklopedíjnaprikladírozrobkiportaluebye AT grišanovaíû dosvídvikoristannâsemantičnihtehnologíjdlâstvorennâíntelektualʹnihvebenciklopedíjnaprikladírozrobkiportaluebye AT rezníčenkova dosvídvikoristannâsemantičnihtehnologíjdlâstvorennâíntelektualʹnihvebenciklopedíjnaprikladírozrobkiportaluebye AT kiridonam dosvídvikoristannâsemantičnihtehnologíjdlâstvorennâíntelektualʹnihvebenciklopedíjnaprikladírozrobkiportaluebye AT arístovaav dosvídvikoristannâsemantičnihtehnologíjdlâstvorennâíntelektualʹnihvebenciklopedíjnaprikladírozrobkiportaluebye AT tiŝenkoao dosvídvikoristannâsemantičnihtehnologíjdlâstvorennâíntelektualʹnihvebenciklopedíjnaprikladírozrobkiportaluebye AT andonpí opytispolʹzovaniâsemantičeskihtehnologijdlâsozdaniâintellektualʹnyhvebénciklopedijnaprimererazrabotkiportalaebye AT rogušinaûv opytispolʹzovaniâsemantičeskihtehnologijdlâsozdaniâintellektualʹnyhvebénciklopedijnaprimererazrabotkiportalaebye AT grišanovaíû opytispolʹzovaniâsemantičeskihtehnologijdlâsozdaniâintellektualʹnyhvebénciklopedijnaprimererazrabotkiportalaebye AT rezníčenkova opytispolʹzovaniâsemantičeskihtehnologijdlâsozdaniâintellektualʹnyhvebénciklopedijnaprimererazrabotkiportalaebye AT kiridonam opytispolʹzovaniâsemantičeskihtehnologijdlâsozdaniâintellektualʹnyhvebénciklopedijnaprimererazrabotkiportalaebye AT arístovaav opytispolʹzovaniâsemantičeskihtehnologijdlâsozdaniâintellektualʹnyhvebénciklopedijnaprimererazrabotkiportalaebye AT tiŝenkoao opytispolʹzovaniâsemantičeskihtehnologijdlâsozdaniâintellektualʹnyhvebénciklopedijnaprimererazrabotkiportalaebye AT andonpí experienceofthesemantictechnologiesuseforintelligentwebencyclopediacreationonexampleofthegreatukrainianencyclopediaportal AT rogušinaûv experienceofthesemantictechnologiesuseforintelligentwebencyclopediacreationonexampleofthegreatukrainianencyclopediaportal AT grišanovaíû experienceofthesemantictechnologiesuseforintelligentwebencyclopediacreationonexampleofthegreatukrainianencyclopediaportal AT rezníčenkova experienceofthesemantictechnologiesuseforintelligentwebencyclopediacreationonexampleofthegreatukrainianencyclopediaportal AT kiridonam experienceofthesemantictechnologiesuseforintelligentwebencyclopediacreationonexampleofthegreatukrainianencyclopediaportal AT arístovaav experienceofthesemantictechnologiesuseforintelligentwebencyclopediacreationonexampleofthegreatukrainianencyclopediaportal AT tiŝenkoao experienceofthesemantictechnologiesuseforintelligentwebencyclopediacreationonexampleofthegreatukrainianencyclopediaportal |
| first_indexed |
2025-11-24T15:05:56Z |
| last_indexed |
2025-11-24T15:05:56Z |
| _version_ |
1849684662511730688 |
| fulltext |
Моделі і засоби систем баз даних та знань
© П.І. Андон, Ю.В. Рогушина, І.Ю. Гришанова, В.А. Резніченко,
А.М. Киридон, А.В. Арістова , А.О. Тищенко , 2020
246 ISSN 1727-4907. Проблеми програмування. 2020. № 2–3. Спеціальний випуск
УДК 004.853, 004.55 https://doi.org/10.15407/pp2020.02-03.246
ДОСВІД ВИКОРИСТАННЯ СЕМАНТИЧНИХ ТЕХНОЛОГІЙ
ДЛЯ СТВОРЕННЯ ІНТЕЛЕКТУАЛЬНИХ ВЕБ-ЕНЦИКЛОПЕДІЙ
(НА ПРИКЛАДІ РОЗРОБКИ ПОРТАЛУ Е-ВУЕ)
П.І. Андон, Ю.В. Рогушина, І.Ю. Гришанова, В.А. Резніченко,
А.М. Киридон, А.В. Арістова, А.О. Тищенко
Розглянуто концепцію розробки Великої української енциклопедії (ВУЕ), проаналізовано основні переваги, які надає створення
її портальної версії е-ВУЕ. Для обґрунтування вибору технологічної платформи для побудови такого порталу автори роботи
детально розглянули ідею та мету проекту, специфіку подання інформації в е-ВУЕ (типи та обсяг контенту, засоби його
структурування, відношення між окремими елементами, бізнес-процеси публікації статей, вимоги до дизайну), оцінили
доцільність використання Wiki-технології, а саме – можливості та обмеження використання MediaWiki. Аналіз основних
технологічних складових портальної версії е-ВУЕ дозволив запропонувала напрямки розширення функціоналу е-ВУЕ на основі
застосування сучасних засобів керування знаннями та форматів їх інтероперабельного подання. Також враховано проблеми
захисту інформації та визначення прав доступу до різних елементів контенту. Для розробки портальної версії Великої
української енциклопедії виникає потреба у застосуванні сучасних інтелектуальних Web-технологій, які мають забезпечити
можливість подання та аналізу складної системи знань. Це обумовлює необхідність в дослідженні сучасних Web-технологій та
співставлення їх можливостей та виразності зі специфічними вимогами, що випливають з концепції е-ВУЕ. Пропонується
розробити розширення таких відкритих програмних засобів з використанням онтологічного аналізу та стандартів Semantic Web,
обґрунтовуються основні напрямки такого семантичного розширення та переваги, які надає їх використання. З точки зору
концепції Semantic Web е-ВУЕ можна розглядати як розподілену БЗ, яку можуть використовувати як люди, так і інтелектуальні
програми. Нами були виділені типові інформаційні об’єкти, характерні для ВУЕ, визначено їх характерні ознаки та приклади.
Ця інформація формально представлена у вигляді Wiki-онтології е-ВУЕ. Основні принципи організації БЗ е-ВУЕ, яка базується
на застосуванні категорій Wiki та семантичних властивостей Semantic MediaWiki, дозволяють відобразити відношення та
характеристики типових інформаційних об’єктів, які представлені в е-ВУЕ. Використання цих характеристик забезпечує
виконання пошукових запитів на семантичному рівні, дозволяє вдосконалити навігацію між елементами порталу та інтегрувати
відомості з різних сторінок.
Ключові слова: онтологія, семантичні Wiki–технології, семантичний пошук, Велика українська енциклопедія.
Рассмотрена концепция разработки Большой Украинской энциклопедии (БУЭ), проанализированы основные преимущества,
которые предоставляет создания ее портальной версии е-БУЭ. Для обоснования выбора технологической платформы для
построения такого портала авторы работы подробно рассмотрели идею и цель проекта, специфику представления информации в
электронной БУЭ (типы и объем контента, средства его структурирования, отношение между отдельными элементами, бизнес-
процессы публикации статей, требования к дизайну) , оценили целесообразность использования Wiki-технологии, а именно –
возможности и ограничения использования MediaWiki. Анализ технологических составляющих портальной версии е-БУЭ
позволил предложила направления расширения функционала электронной Вуэ на основе применения современных средств
управления знаниями и форматов их интероперабельного представления. Также учтено проблемы защиты информации и
определения прав доступа к различным элементам контента. Для разработки портальной версии Великой Украинской
энциклопедии возникает потребность в применении современных интеллектуальных Web -технологий, которые должны
обеспечить возможность представления и анализа сложной системы знаний. Это обусловливает необходимость в исследовании
современных Web-технологий и сопоставление их возможностей и выразительности со специфическими требованиями,
вытекающими из концепции е-Вуэ. Предлагается разработать расширение таких открытых программных средств с
использованием онтологического анализа и стандартов Semantic Web, обосновываются основные направления такого
семантического расширения и преимущества, которые предоставляет их использования. С точки зрения концепции Semantic
Web э-БУЭ можно рассматривать как распределенную БЗ, которую могут использовать как люди, так и интеллектуальные
программы. Нами были выделены типичные информационные объекты, характерные для, определены их характерные признаки
и примеры. Эта информация формально представлена в виде Wiki-онтологии е- БУЭ. Основные принципы организации БЗ
е-БУЭ, основанная на применении категорий Wiki и семантических свойств Semantic MediaWiki, позволяют отразить
отношение и характеристики типовых информационных объектов, которые представлены в электронной БУЭ. Использование
этих характеристик обеспечивает выполнение запросов на семантическом уровне, позволяет усовершенствовать навигацию
между элементами портала и интегрировать сведения из разных страниц.
Ключевые слова: онтология, семантические Wiki-технологии, семантический поиск, Большая украинская энциклопедия.
We consider the conceptual principles of the Great Ukrainian Encyclopedia development and analyze the main advantages of its
portal version – e-VUE. This portal version requires the relevant technological platform with high-level expressiveness and
efficiency. Development of e-VUE with complex knowledge structure causes the study of modern Web-technologies and matching
their capabilities with the specific requirements of encyclopedia. Therefore we consider in details the project idea and purposes, the
specifics of e-VUE information representation (number and volume of articles, content types and sources, relations between content
elements and their properties, business processes of article publication, design requirements) and processing (navigation, requests ,
integration and matching means) to estimate the Wiki-technology feasibility use (namely - opportunities and restrictions of
MediaWiki technological platform). Also attention is paid to the means of information security ensuring and semantic -based
establishment of content access rights. The results of such analysis show that MediaWiki with semantic plugins can be used as a base
for e-VUE portal construction but needs in extension of its functionality based on modern knowledge management tools and formats
of their interoperable representation. Now we are oriented on use of ontological analysis and Semantic Web standards (OWL, RD F,
SPARQL). In terms of the Semantic Web, e-VUE is a distributed database with heterogeneous types of information objects that can
Моделі і засоби систем баз даних та знань
247
be used both by humans and by external software (e.g. by intelligent agents). The main principles of e -VUE knowledge base
organization are grounded on Wiki categories and semantic properties of Semantic MediaWiki that are used for formal
representation of the e-VUE typical information objects (TIO). Such approach allows to express TIO relations, properties and
characteristics that can be used by logical inference and semantic retrieval to improve the navigation between portal elements and
integration of data from various Wiki pages.
Key words: ontology, semantic Wiki technology, semantic search, the Great Ukrainian Encyclopedia.
Велика українська енциклопедія, її призначення та особливості
Від 2013 р. в Україні активно розгортається процес зі створення Великої української енциклопедії
(ВУЕ). Її публікація запланована на 2013–2026 роки згідно з Указами Президента України № 1/2013 «Про
Велику українську енциклопедію» та № 7/2015 «Питання підготовки та видання Великої української
енциклопедії» через Державну наукову установу «Енциклопедичне видавництво». Велика українська
енциклопедія за характером інформації – універсальна енциклопедія, яка має стати виявом духовної зрілості
нації, своєрідним підсумком її цивілізаційного розвитку впродовж століть, одним із провідних
ретрансляторів національної ідеї та національної культури. ВУЕ подає найважливіші довідкові матеріали
практично з усіх галузей знань та виробничої діяльності. До універсальних енциклопедій за довідкою
звертаються найширші кола читачів з різним рівнем підготовки. У цій ситуації важливого значення набуває
проблема удоступнення інформації.
Концептуально «Велика українська енциклопедія» передбачає створення не лише сучасного
компендіуму людських знань, який базується на виробленому досвідом провідних національних універсальних
енциклопедій рівні, але й систематизацію та репрезентацію в доступному вигляді (друкованій та електронній
версіях) напрацювань попередніх поколінь. Концепція «Великої української енциклопедії» зорієнтована на
сучасне наукове осмислення картини світу, історії людської цивілізації, внеску в неї українського народу. У ній
представлені найвидатніші події та постаті світової історії, науки, культури, мистецтв, інших сфер людської
діяльності; інтерпретовані найважливіші відкриття людського розуму і витвори людських рук, суспільні
інституції та господарські структури, що вплинули на долю світу і народів; відображено рух політичних і
культурних ідей та динаміку наукових уявлень [1]. Також знайшли відображення докорінні зміни в політичній
карті світу, сучасні вчення в галузі природничих наук, філософії, історії, політології, соціології, культурології,
естетики тощо.
Розвиток енциклопедичних видань безпосередньо пов’язаний з їх представленням в Web. Саме
онлайнові версії енциклопедій є найдоступнішими для найширших кіл користувачів, вони можуть постійно
оновлюватися та містити актуальні факти [2]. Крім того, використання сучасних інформаційних технологій
дозволяє підключати різноманітні мультимедійні ресурси, безпосередньо посилатися на першоджерела та на
пов’язані статті. Це значно полегшує сприйняття інформації та зменшує час на її пошук.
Особливість і унікальність проекту ВУЕ полягає в тому, що фактично створюються два пов’язаних, але
окремих інформаційних продукти – друкована версія енциклопедії та її інтелектуальна портальна версія е-ВУЕ
[3] – інформаційний Web-ресурс, який концептуальною відрізняється від друкованого аналогу значно більшим
обсягом, семантично розширеним функціоналом для навігації та пошуку, нелінійною організацією контенту та
наявністю інтерактивних та мультимедійних об’єктів.
Властивості портальної версії ВУЕ як інноваційного інформаційного ресурсу
Однією з основних цілей розробки е-ВУЕ є надання користувачам повсюдного доступу до контенту
енциклопедії. е-ВУЕ побудована як інтелектуальна інформаційна система [4], яка містить базу знань та
сервіси обробки цих знань. Для створення цього інноваційного інформаційного ресурсу (ІР), що не має
аналогів в Україні, на базі сучасних знання-орієнтованих технологій та оригінальних розробок, проводиться
дослідження відповідних моделей, методів подання та обробки інформації, здійснюється їх програмна
реалізація. У разі необхідності розробляються оригінальні програмні рішення, що базуються на сучасному
науковому підґрунті.
Використання сучасних технологій керування знаннями у Web надає користувачам значно більше
можливостей для аналізу та пошуку інформації. На жаль, навіть найрозвиненіші та популярні онлайнові
енциклопедії практично не використовують методи та засоби подання знань, які вже стали фактично
стандартом для інтелектуальних Web-застосувань. Приміром, широко відома Вікіпедія [5] базується
на Wiki-технологіях [6], але не використовує їх семантичне розширення. Внаслідок цього знання, що
містяться в таких ІР, не можуть оброблятися сучасними засобами аналізу даних. Це значно звужує як функціонал
самих енциклопедичних видань, так і сферу їх використання. Але вибір засобів семантизації Wiki-технологій
є окремою науковою проблемою та має враховувати специфіку тієї конкретної задачі, для якої ці технології
застосовуються [7]. При розробці е-ВУЕ [8] було прийнято рішення використовувати технологічну платформу
MediaWiki [9] з відкритим кодом та її семантичне розширення Semantic MediaWiki (SMW) [10], що
забезпечує формальне визначення та обробку змісту зв’язків між Wiki-сторінками з урахуванням стандартів
Semantic Web [11].
Моделі і засоби систем баз даних та знань
248
Особливості е-ВУЕ:
- це наукове видання надає перевірені факти та експертні знання в вигляді рецензованих авторських
статей;
- у підготовці контенту приймають участь територіально розподілені виконавці;
- підготовка статей до публікації має чіткий технологічний алгоритм;
- інформація, подана на сторінках, здебільшого унікальна та має певні ліцензії з прав використання;
- крім тексту, сторінки можуть містити різні типи мультимедійного контенту (зображення, відео, аудіо
тощо) та посилання на інші довірені джерела;
- для подання контенту використовуються Wiki-технології, розширені спеціалізованими програмними
рішеннями, які використовують сучасні технології керування знаннями, стандарти Semantic Web, елементи
штучного інтелекту, онтологічного аналізу, інтелектуального пошуку тощо.
Постановка задачі
Для розробки портальної версії Великої української енциклопедії виникає потреба у застосуванні
сучасних інтелектуальних Web-технологій, які мають забезпечити можливість подання та аналізу складної
системи знань. Це обумовлює необхідність в дослідженні сучасних Web-технологій та співставлення їх
можливостей та виразності зі специфічними вимогами, що випливають з концепції е-ВУЕ. Пропонується,
використовуючи онтологічний аналіз та стандарти Semantic Web, розробити розширення таких відкритих
програмних засобів, як MediaWiki з семантичним плагіном Semantic MediaWiki. В роботі обґрунтовано
основні напрямки такого семантичного розширення, на прикладах розглянуто ті переваги, які надає їх
використання.
Технологічний та науковий базис е-ВУЕ
Wiki-технологія – це Web-орієнтована технологія побудови розподіленого інформаційного ресурсу (ІР),
що дозволяє його розробникам додавати нові матеріали та редагувати вже існуючий контент без використання
додаткових програм, не потребуючи спеціальних знань. Зміни, внесені користувачами у контенті, одразу
набувають чинності, при цьому забезпечується можливість повернення до попередніх версій [12].
Формат Wiki-сторінок (Wiki-text) – це спрощена мова розмітки, яка використовується для того, щоб
вказати різні структурні та візуальні елементи контенту. Wiki-сторінка може містити не тільки текст, але й
різноманітний мультимедійний контент (зображення, аудіо, відео). Кожна Wiki-система має власний стиль та
синтаксис залежно від реалізації. Використання Wiki-середовища надає такі важливі можливості, як спільне
редагування контенту, гнучка система прав користувачів, масштабованість, орієнтованість на роботу в Web.
MediaWiki. Широко вживаним рішенням для створення Wiki-ресурсів є технологічна платформа
MediaWiki, розроблена для створення найбільш відомого Wiki-ресурсу – Вікіпедії. MediaWiki, що
побудована на основі PHP і MySQL, містить редактор для обробки текстового та мультимедійного контенту
та забезпечує інтерфейс для роботи з базою Wiki-сторінок. Щоб користувачі мали можливість
використовувати на Wiki-сторінках графіку, аудіофайли та відео, надаються засоби для завантаження
відповідних файлів. У системі підтримується розмежування прав доступу до адміністрування системи і
доступу до контенту. Використання різноманітних плагінів дозволяє користувачам розширювати функції
системи відповідно до власних потреб – приміром, відображати математичні формули, експортувати ти
імпортувати різні формати даних.
До переваг MediaWiki можна віднести безкоштовність програмного забезпечення, підтримку
розподіленої роботи багатьох користувачів та можливість розгортання як в локальній мережі установи, так і у
Web. Більш детально архітектуру, базові можливості та обмеження MediaWiki проаналізовано в [13]. Для
структурування контенту використовуються категорії, які дозволяють групувати сторінки з подібною
тематикою (наприклад, “Країни”, “Письменники”, “Свята”), походженням тощо, та шаблони, вміст яких може
вбудовуватися в інші сторінки для відображення повторюваних елементів з урахуванням значень їх параметрів .
Практичне використання ІР на основі MediaWiki потребує розв’язання проблем, пов’язаних із
узгодженістю контенту, ефективністю пошуку та забезпеченням повторного використання знань. Шляхи для
цього надає використання семантизації Wiki-платформи.
Семантизація MediaWiki. SMW – семантичне розширення MediaWiki, що дозволяє користувачеві
автоматично інтегрувати інформацію з різних Wiki-сторінок, генерувати відповіді на складні семантичні
запити, будувати бази знань та візуалізувати їх результати, що відображають знання щодо семантичних
властивостей та категорій інформаційних об’єктів, виконувати логічне виведення тощо, тобто обробляти
інформацію на рівні знань. Для цього в SMW використовуються категорії, семантичні властивості і запити.
Семантичні властивості дозволяють описувати семантику зв'язків між двома сторінками (наприклад, “Місце
народження”) та між сторінкою та даними (наприклад, “Рік народження”). Вони можуть використовуватися як
Моделі і засоби систем баз даних та знань
249
параметри шаблонів. Для запитів використовують просту мову запитів, в якій умови запитів задаються за
допомогою категорій, семантичних властивостей та їх значень. Такі запити можна вбудовувати у
Wiki-сторінки.
SMW надає інтерфейси доступу до інструментів Semantic Web. Формальні описи однієї або кількох
статей в OWL/RDF-форматі [14] можуть бути отримані з Web-інтерфейсу для зовнішнього використання.
Можна також імпортувати дані з онтологій OWL [15], відображати Wiki-анотації на існуючі словники (такі
як FOAF). Оскільки SMW дотримується стандарту OWL DL, експортована інформація може бути повторно
використана в різних застосуваннях. Крім того, SMW надає сервіс для підтримки SPARQL запитів.
Основні технологічні складові портальної версії е-ВУЕ
Основні складові порталу е-ВУЕ: ядро MediaWiki, база даних (БД), що містить основний контент;
користувацький інтерфейс, що специфікує відображення контенту сторінок та засобів навігації відповідно до
потреб енциклопедії; додаткові плагіни, які розширюють функціональні можливості MediaWiki.
Ядро MediaWiki. Це програмне забезпечення, що забезпечує базовий набір функцій для створення та
функціювання Wiki-ресурсу. Воно дозволяє генерувати Wiki-сторінки, які отримує користувач порталу,
використовуючи вміст БД. Головною точкою доступу в MediaWiki є index.php, який керує більшістю запитів,
поданих до серверу, та може підтримувати різні дії, вказані в параметрах URL-запиту (наприклад, перегляд
або редагування вмісту статті).
База даних е-ВУЕ. Проект e-VUE використовує стандартну для MediaWiki реляційну БД MySQL. У
цій БД містяться дані про контент (наприклад, page, revision, category, recentchanges), про користувачів (user,
user_groups), про мультимедійні файли (image, filearchive), кешування (objectcache, l10n_cache, querycache),
внутрішні засоби (job – для виконання черги задач), а також інші додаткові дані, що необхідні для
встановлених в е-ВУЕ плагінів.
В проекті багато уваги приділено мультимедійному контенту, і всі мультимедійні файли (аудіо,
відео, зображення тощо) мають розширений метаопис, якій містить як технічні характеристики, назву,
опис, джерела і авторські права використання, так і змістовний опис інформації, що також зберігається
у БД. Багато сторінок супроводжуються озвученням, тобто містять посилання на аудіофайл з дикторським
текстом.
Користувацький інтерфейс. В е-ВУЕ реалізовано оригінальний інтерфейс користувача, який
відповідає специфіці енциклопедії та значно відрізняється від традиційного Wiki-інтерфейсу. Дизайн
е-ВУЕ забезпечує естетичне та ергономічне об’єднання тексту, зображень, аудіо- та відеоелементів у
просторі екрану. Його задачею є цілісна візуалізація мультимедійного контенту, яка має, з одного боку,
співвідноситися зі стилем друкованого видання «Велика українська енциклопедія», а з іншого – відповідати
специфіці подання інформації в Web (наприклад, підтримувати доступ з мобільних пристроїв).
Для оформлення сторінок (розташування елементів навігації, інформаційних блоків та кнопок,
визначення розміру, кольору та типу шрифтів для різних типів контенту, фону сторінок та їх елементів тощо)
в е-ВУЕ використовується спеціально налаштований набір стилів оформлення (скін) Foreground, який
фокусується на виділенні контенту, підтримує адаптивні макети та має спеціальні заздалегідь визначені
класи для підтримки функціоналу Semantic MediaWiki. Це повністю змінює макет зовнішнього відображення
Wiki-сторінки та дозволяє додавати нові елементи інтерфейсу. Крім традиційних елементів, сторінка гасла е-
ВУЕ містить специфічні для енциклопедичного видання елементи: посилання на автора тексту сторінки;
покликання на гасло; основні семантичні властивості сторінки, що задані відповідним шаблоном; семантичну
розмітку; гіперпосилання на певні мультимедійні об`єкти; структурний розподіл контенту тощо. Всі
функціональні меню в е-ВУЕ перенесені в окремий випадаючий список, що знаходиться в правій частині
сторінки і відображається тільки для зареєстрованих користувачів. Створено нові навігаційні пункти меню,
які дозволяють переміщатися порталом за таксономіями категорій е-ВУЕ (“Персоналії”, “Природа”,
“Цивілізація”, “Галузі знань”), та окремі посилання на категорії “Автори”, “Бібліотека”, “Медіафайли”,
“Семантичний пошук”, розміщені в верхньому горизонтальному меню (рис. 1). В розширеному підвалі
містяться посилання, що пов’язані із навігацією, інформація про співпрацю з ВУЕ та засоби зв’язку з ї ї
розробниками.
Завдяки використанню Foreground також вдалося відділити метод обробки першої сторінки е-ВУЕ від
решти сторінок порталу і розробити для неї унікальний функціонал та дизайн, що демонструє користувачам
усі можливості порталу (рис. 2). Перша сторінка е-ВУЕ містить контент, що динамічно генерується за
допомогою виконання API-запитів. Це три блоки нових гасел е-ВУЕ – “Персоналії”, “Природа” і
“Цивілізація”. Кожне гасло представлена назвою Wiki-сторінки, зображенням, короткою дефініцією і
посиланням на повну версію гасла. В правій колонці знаходиться блок з динамічними банерами, що надають
доступ до актуальних статей, на які хоче звернути увагу редакція ВУЕ.
Моделі і засоби систем баз даних та знань
250
Рис. 1. Базові елементи сторінки в е-ВУЕ
Рис. 2. Функціональні елементи першої сторінки е-ВУЕ
Моделі і засоби систем баз даних та знань
251
Розширення е-ВУЕ. Для розширення функціоналу MediaWiki припускає встановлення додаткових
плагінів, склад яких визначається специфікою ІР [16]. Найважливіші розширення, що використовуються нині
в е-ВУЕ:
- Semantic MediaWiki – плагін семантизації, який дозволяє визначати семантичні властивості
Wiki-сторінок та застосовувати їх у пошуку;
- ContactPageVUE (оригінальне вдосконалення плагіну ContactPage) – форма зворотного зв’язку, яка
відповідає до потреб проекту е-ВУЕ;
- Replace Text – плагін, який дозволяє адміністраторам виконувати глобальний пошук і заміну тексту на
всіх звичайних Wiki-сторінках;
- CategoryTree – AJAX-компонента для відображення структури категорій Wiki [17];
- EmbedVideo – плагін, який додає можливість вставляти відеоконтент [18];
- PDF Handler – плагін для перегляду pdf-файлів в режимі зображень;
- Shariff – плагін для додання кнопок соціальних мереж.
База знань е-ВУЕ
З точки зору концепції Semantic Web [19] е-ВУЕ можна розглядати як розподілену БЗ, яку можуть
використовувати як люди, так і інтелектуальні програми, що орієнтовані на роботу зі знаннями у Web [20].
Тому доцільно більш детально описати її структуру, виразність та специфіку.
Структура БЗ враховує можливості постійного оновлення інформаційного контенту (введення нових
статей з різноманітними наборами структурних елементів, актуалізація раніше представлених матеріалів),
використання сучасних форматів подання для мультимедійного ілюстративного матеріалу (малюнки, рисунки,
фотографії, відео, аудіо, карти, діаграми, креслення) та розширення функціоналу порталу з подальшим
вдосконаленням дизайну. Крім того, БЗ е-ВУЕ повинна бути основою для інтелектуалізації засобів навігації та
пошуку відомостей на порталі, задовольняючи інформаційні потреби користувачів, враховуючи їх семантику та
специфіку фізіологічних, технологічних та інтелектуальних можливостей.
Базові принципи організації БЗ е-ВУЕ:
- основним інструментом організації БЗ є категорії та семантичні властивості SMW [21];
- для структурованого подання інформації використовується набір незалежних таксономій (наприклад,
“Галузі знань”, “Географічні об’єкти”, “Статус статті”), і кожна Wiki-сторінка може відноситися до довільного
набору існуючих категорій;
- для інтеграції набору семантичних властивостей виділяються типові інформаційні об’єкти (ТІО) е-
ВУЕ – енциклопедичні гасла, що мають спільні властивості та набір категорій;
- в процесі вдосконалення БЗ е-ВУЕ множина семантичних властивостей ІО тільки розширюється; це
забезпечує можливість обробки раніше описаних ТІО без необхідності внесення змін (якщо певні властивості
виявляються зайвими та не використовуються на практиці, вони не видаляються, але не враховуються при
заповненні нових гасел).
В процесі проектування БЗ е-ВУЕ в результаті дослідження енциклопедійного контенту та засобів його
подання виділено наступні сутності:
- категорії Wiki-сторінок, відношення між якими зафіксовано за допомогою ієрархічних відношень
“клас-підклас” різних таксономій (наприклад, таксономії галузей знань та таксономія мультимедійних
елементів);
- типові інформаційні об’єкти е-ВУЕ, що характеризуються сталим набором категорій та семантичних
властивостей, які визначаються для кожного екземпляра ТІО, та поділяються на суб’єкти е-ВУЕ (автори гасел
е-ВУЕ, модератори наукових напрямків, автори ілюстрацій та відео, редактори, диктори тощо), які своїми діями
можуть вносити зміни до контенту енциклопедії, та об’єкти е-ВУЕ (гасла енциклопедії, мультимедійні
елементи, сторінки категорій та службові Wiki-сторінки);
- семантичні властивості ТІО, що поєднують суб’єкти та об’єкти е-ВУЕ змістовними зв’язками;
- припустимі області значення та визначення семантичних властивостей, які визначають сферу їх
використання та діапазон припустимих значень;
- характеристики семантичних властивостей (такі, як симетричність, транзитивність та
рефлексивність), які можуть застосовуватися для логічного виведення нових знань;
- семантичні запити, параметрами яких є категорії та значення семантичних властивостей.
Для більшості ТІО побудовано шаблони, які забезпечують уніфіковане подання інформації та
полегшують введення значень. Крім того, саме за параметрами шаблонів ТІО, що пов’язані із семантичними
властивостями Wiki-сторінок, можна виконувати семантичні запити (рис. 3) [23] . Дуже важливо запобігти
повторному використанню імен у різних, не співпадаючих розуміннях, та використанню різних імен для тих
самих значень (наприклад, ввести категорію “Персоналія” заміст категорії “Персоналії”, категорію “Українські
міста” заміст категорії “Міста України”. В е-ВУЕ розроблено також шаблони та стандартизований набір
властивостей для мультимедійного контенту.
Моделі і засоби систем баз даних та знань
252
Виразна здатність Semantic MediaWiki є достатньою для подання такої структури знань, але для її аналізу
та формалізації всіх аспектів доцільно застосовувати більш розвинуті засоби менеджменту знань, орієнтовані на
обробку онтологій. Крім того, використання онтологій дозволяє імпортувати знання із зовнішніх репозиторіїв
[22]. Тому зараз структура БЗ е-ВУЕ формально зафіксована за допомогою відповідної Wiki-онтології, яка є
результатом співпраці експертів ПрО (у даному випадку – модераторів галузей знань, що представлені в
енциклопедії) із інженерами зі знань.
Рис. 3. Використання шаблону “Персоналія” для семантичного запиту
Використання онтологій для побудови БЗ е-ВУЕ
Для використання Wiki-ресурсу як розподіленої БЗ постає необхідність у побудові Wiki-онтології, що є
формалізованою моделлю знань цього ресурсу та дозволяє фіксувати характеристики його елементів, зв’язків,
властивостей та відношень у формі, придатній для автоматичного оброблення, логічного виведення та аналізу.
Використання елементів Wiki-онтології для семантичної розмітки забезпечує уніфіковане формування набору
ієрархічно пов’язаних категорій, шаблонів типових інформаційних об’єктів, їхніх семантичних властивостей та
запитів, що їх використовують.
Wiki-онтологія є окремим випадком комп’ютерної онтології, що відображає особливості технології Wiki
та її семантичного розширення. Її виразні можливості обмежені в області використання аксіом ПрО та не
припускають застосування характеристик для об’єктних властивостей та властивостей даних [24]. Така
онтологія може бути побудована автоматизовано за семантично розміченим Wiki-ресурсом (набором Wiki
сторінок, що містять семантичну розмітку), але на практиці зазвичай спочатку розробляють Wiki-онтологію, а
вже на її основі здійснюється реалізація самого Wiki-ресурсу.
Wiki-онтологія е-ВУЕ (рис. 4) дозволяє більш глибоко та формалізовано визначати наявність або
відсутність ієрархічних зв’язків між категоріями е-ВУЕ, припустимість або неприпустимість їх перетину;
відображати зв’язки між категоріями та ТІО ; вказувати, які саме семантичні властивості Wiki-сторінок, що
відображають змістовні відношення між різними сторінками енциклопедії, і для яких ТІО припустимі ті або
інші відношення, притаманні кожному з цих ТІО; описувати властивості категоризованих гасел е-ВУЕ та
визначати характеристики цих властивостей. Більш детально структура та властивості Wiki-онтологій
проаналізовано в [25], але важливо відмітити, що для кожного ІР його Wiki-онтологія створюється окремо та
відображає як специфіку домену, так і призначення такого ІР. Ця онтологія дозволяє формалізувати знання про
Моделі і засоби систем баз даних та знань
253
основні елементи цього енциклопедійного видання, чітко та однозначно встановити відношення між
семантичними властивостями різних типів Wiki-сторінок та їх областю визначення [26]. Наприклад, це
дозволяє явно вказати, що семантична властивість “Місце народження” приймає значення не просто типу
“Сторінка”, а тільки серед сторінок категорій “Місто” та “Країна” (таке твердження неможливо зафіксувати
вбудованими засобами SMW).
Рис. 4. Елемент Wiki-онтології е-ВУЕ, що формалізує ТІО “Персоналія” (фрагменти)
ТІО е-ВУЕ та використання шаблонів Semantic MediaWiki для їх побудови
Для побудови інформаційної системи основним етапом її розробки є визначення тих ТІО, які ця система
обробляє, та методів їх обробки. Система таких ТІО – це інформаційна модель об’єкта певної предметної
області (ПрО), яка формалізує його структуру, параметри, їх типи та можливі значення, відношення з іншими
ТІО тощо.
ПрО е-ВУЕ є комплексною, а сама енциклопедія має уніфіковано відображати знання різних галузей
знань. Тому в процесі побудови порталу виникли наступні задачі, пов’язані з побудовою БЗ е-ВУЕ та зі
створенням методів аналізу знань, що містяться у цій БЗ, у зручній для користувачів формі:
1. Визначення груп ТІО зі спільними семантичними властивостями та структурою (наприклад, в е-ВУЕ
ТІО – це “Море”, “Місто”, “Організація”).
2. Знаходження відповідностей між ТІО та категоріями або наборами категорій (наприклад, в е-ВУЕ ТІО
“Персоналія” відповідає категорія “Персоналії”).
3. Визначення семантичних властивостей, характерних для кожної групи ТІО, дослідження їх перетинів
та типів, особливо – для зв’язків між семантичними властивостями та ТІО, до яких належать значення
властивостей (наприклад, в е-ВУЕ ТІО “Персоналія” має семантичну властивість “Місце народження”, яка
може мати значення з ТІО “Місто” та “Країна”).
4. Аналіз характеристик семантичних властивостей, характерних для кожної групи ТІО – чи
обов’язковим є визначення їх значень для всіх ТІО, чи можуть вони мати більше одного значення (наприклад, в
е-ВУЕ ТІО семантичну властивість “Місце народження” може мати одне або кілька значень чи не бути
визначеним).
Моделі і засоби систем баз даних та знань
254
5. Аналіз того, яку інформацію щодо ТІО потрібно повідомляти користувачам та в якій саме формі
(наприклад, семантичну властивість “Місце народження” потрібно супроводжувати відповідним поясненням, а
дату, місяць та рік народження виводити разом, а значення властивості “Стать” не виводити – воно потрібне
тільки для автоматизованої обробки).
6. Створення шаблонів ТІО, які враховують результати попередніх етапів аналізу (наприклад, в е-ВУЕ
створено шаблони для ТІО “Персоналія”, “Місто”, “Країна”, “Організація”, що використовуються у гаслах
різних галузей знань).
7. Розробка семантичних запитів, що базуються на інформації щодо ТІО .
8. Створення шаблонів, які використовують ці семантичні запити (наприклад, в е-ВУЕ створено
шаблони з семантичними запитами, які знаходять модераторів галузей знань для поточної сторінки, статті
авторів для сторінок авторів, відомих мешканців міст та країн тощо).
Створення системи ІО, релевантних ПрО, є предметом системного аналізу, а відображення цієї системи у
вигляді онтологічної структури – предметом онтологічного аналізу. Слід відмітити, що створення таких
моделей може базуватися як на навичках інженера зі знань та досвіді експертів ПрО, так і на засобах Data
Mining, що використовують методи машинного навчання.
Основні етапи створення статті в е-ВУЕ
Процес створення гасел е-ВУЕ потребує дотримання чіткого технологічного алгоритму, що складається
з основних етапів, на яких задіяні різні суб’єкти створенні енциклопедії [27]:
Етап 1. Підготовка статті до завантаження на портал (модератор напряму, автор статті).
Етап 2. Редагування статті (літературний редактор, науковий редактор, художній редактор, бібліограф).
Етап 3. Контроль (модератор напряму, завідувач редакційним відділом, автор статті).
З точки зору Wiki-технології та її семантичного розширення 2-й етап цього процесу пов’язаний із
виконанням наступних кроків побудови відповідної Wiki-сторінки:
1) формування галузевих словників гасел, які визначають, які саме Wiki-сторінки будуть присутні в е-
ВУЕ;
2) створення короткої дефініції гасла та додання категорій;
3) генерація Wiki-сторінки, що містить назву та дефініцію гасла;
4) підготовка автором, що є спеціалістом у відповідному науковому напрямку, енциклопедійної статті;
5) рецензування та перевірка статті науковими та літературними редакторами;
6) внесення тексту статті на Wiki-сторінку на порталі;
7) внесення Wiki-розмітки на сторінку гасла, яка структурує представлену інформацію;
8) уточнення та доповнення переліку категорій, до яких відноситься сторінка гасла;
9) додання семантичних шаблонів-інтеграторів (“Покликання”, “Модератор”, за потреби додаються та
заповнюються шаблони відповідних ТІО, вносяться елементи семантичної розмітки (наприклад, “Автор”);
10) доповнення статті пертинентним мультимедійним матеріалом (відповідні файли завантажуються на
портал, для них створюються сторінки з метаописами, у текст Wiki-сторінки гасла додаються посилання на ці
файли);
11) за потреби створюється аудіофайл озвучення, який завантажується на портал, і до сторінки додається
програвач цього файлу;
12) після остаточної перевірки та узгодження контенту фіксується дата оприлюднення остаточного
варіанту статті, і Wiki-сторінка стає доступною для всіх користувачів (в процесі створення сторінки гасла її
контент є доступним лише для зареєстрованих користувачів, що є розробниками цього ІР).
Більшість з цих етапів можуть виконуватися тільки вручну відповідними спеціалістами, але деякі з них
можуть бути автоматизовані за допомогою спеціально розробленого для цього програмного забезпечення.
Наприклад, задача масової публікації гасел з дефініціями на порталі на основі тексту галузевого словника
потребує такого рішення. Фахівці з галузей знань формують окремо галузеві словники, які містять списки
гасел з короткими дефініціями, що відносяться до певних ПрО. Кожен такий словник представлено pdf-файлом,
який містить 3-5 тисяч гасел. Потрібно автоматизувати процес співставлення гасел у словниках з набором гасел
на порталі: якщо гасло не заведено на портал (тобто не існує відповідної Wiki-сторінки), необхідно створити
відповідну сторінку, внести дефініцією та, використовуючи відповідні шаблони, визначити семантичні
властивості такої сторінки, що стосуються її статусу.
Проблема ускладнюється тим, що частина гасел вже заведена на портал, деякі з них вже подані
завершеними статтями, тоді як інші не мають навіть дефініції або ж цю дефініцію потрібно замінити на
дефініцію зі словника. Аналіз тексту показав, що також зустрічаються випадки, коли гасла в словнику і на
порталі різняться в написанні. Крім того, виникають складності із розпізнаванням абзаців тексту, що
відповідають гаслу (зазвичай гасло з дефініцією – це один абзац, але іноді гасло представлено кількома
абзацами).
Моделі і засоби систем баз даних та знань
255
Для автоматизованої обробки через відсутність стандартизованого відокремлення ланцюжка символів
гасла від ланцюжка символів дефініції було прийнято рішення створити утиліту, яка б реалізувала
напівавтоматичне введення відсутніх гасел, беручи за основу гасла перше слово абзацу, яке чітко відокремлено
пробілом, але прийняття рішення стосовно того чи іншого гасла покласти на відповідно підготовленого
оператора. Враховуючи великий обсяг файлів, процес обробки словників займає багато часу, тому, щоб не
перевантажувати сервер, робота може виконуватись частинами. Вхідні дані для утиліти – це текстовий файл,
що містить гасла з дефініціями та БД порталу е-ВУЕ. В результаті виконання пошуку оператор отримує Web-
сторінку з таблицею із трьома стовпчиками (рис. 5), перший з яких містить інформацію про гасло зі словника,
другий показує сторінки з БД е-ВУЕ для цього гасла, а третій – форму, де оператор може відредагувати текст
гасла і дефініції, що додається до е-ВУЕ.
Ця утиліта виконує пошук у БД та додає гасла до е-ВУЕ за допомогою виклику MediaWiki API. Для
захисту від несанкціонованого втручання операції зміни контенту в MediaWiki за допомогою API виконуються
з авторизацією та фіксують того, хто виконав відповідну операцію.
Рис. 5. Утиліта занесення гасел словника на портал (на прикладі обробки словника з філософії)
Перспективи розширення функціоналу е-ВУЕ
В результаті проведених досліджень завершено розробку структурної схеми БЗ е-ВУЕ та обумовлено
наявність в цій структурі окремих елементів та зв’язків між ними. На основі аналізу специфіки знань, що
представлені в е-ВУЕ, обґрунтовано доцільність застосування онтологічного аналізу та необхідність побудови
онтологічної моделі е-ВУЕ для формального та однозначного відображення та аналізу структури та контенту
бази знань онлайн-версії «Великої української енциклопедії».
е-ВУЕ – це інноваційний інформаційний продукт, в якому забезпечена технологічна підтримка
інтелектуальної обробки інформації. Це уможливлює кілька принципових переваг цього ІР:
- можливість автоматизованого та інтегрованого оновлення контенту для забезпечення актуальності
інформації;
- поєднання різних засобів подання інформації для різнорівневої аудиторії за допомогою перехресних
посилань та інтеграція мультимедійних елементів на семантичному рівні;
- можливість обміну знаннями з іншими інтелекуальними системами на основі форматів Semantic Web;
Моделі і засоби систем баз даних та знань
256
- гнучка та інтелектуальна система пошуку та навігації, яка враховує змістовні звязки між гаслами
енциклопедії.
Подальші наукові дослідження, спрямовані на вдосконалення розробки портальної версії е-ВУЕ,
спрямовані на її подальшу інтелектуалізацію та вдосконалення її сервісів. Планується подальший розвиток
функціоналу порталу у наступних напрямках:
- використання елементів штучного інтелекту та машинного навчання для здобуття знань з контенту
е–ВУЕ та підтримки його цілісності;
- розробка засобів автоматичної генерації контенту з використанням бази знань е–ВУЕ та її
онтологічної моделі;
- аналіз та розширення структури ТІО для створення додаткових шляхів навігації між семантично
пов’язаними гаслами за змістовними параметрами;
- вдосконалення засобів семантичного пошуку для знаходження інформаційних об’єктів певного типу,
що задовольняють умовам користувача;
- вдосконалення процесу оприлюднення інформації на порталі;
- персоніфікація та керування доступом до контенту;
- подальша інтеграція порталу із застосуваннями Semantic Web для імпорту та експорту знань.
Література
1. Наукові засади та теоретико-методологічні принципи створення сучасних енциклопедій: колективна монографія / За ред. д.і.н., проф.
Киридон А.М. К.: Державна наукова установа «Енциклопедичне видавництво». 2015. 160 с.
2. Encyclopaedia Britannica. https://www.britannica.com.
3. Велика українська енциклопедія. https://vue.gov.ua.
4. Андон Ф.И., Яшунин А.Е., Резниченко В.А. Логические модели интеллектуальных информационных систем. К.: Наукова думка. 1999.
396 с.
5. Wikipedia – https:// www. wikipedia.org.
6. Leuf B., Cunningham W. The Wiki way: collaboration and sharing on the Internet, 2001,
http://www.citeulike.org/group/13847/article/7659081.
7. Rogushina J.V. Semantic Wiki-resources and their use for the construction of personalized ontologies. Problems in programming, (2-3), 2018,
P. 188–195.
8. Рогушина Ю.В. Сучасні Вікі-технології як основа керування знаннями в електронних енциклопедичних виданнях. Традиції та сучасні
концепти енциклопедичної справи в Україні: колективна монографія / За ред. Киридон А.М. К.: Державна наукова установа
«Енциклопедичне видавництво». 2018. С. 225–233. https://ev.vue.gov.ua/wp-content/uploads/2019/11/Traditions.pdf
9. MediaWiki. – https://www.mediawiki.org/wiki/MediaWiki.
10. Krötzsch M., Vrandečić D., Völkel M. Semantic MediaWiki. International semantic web conference. 2006. P. 935–942.
https://link.springer.com/content/pdf/10.1007/11926078_68.pdf.
11. Davies J., Fensel D., van Harmelen F. Towards the Semantic Web: Ontology-driven knowledge management. John Wiley & Sons Ltd, England,
2002. 288 p.
12. Foley B., Chang T. Wiki as a professional development tool. Society for Information Technology & Teacher Education International
Conference. 2008. P. 2959–2966.
13. Гришанова І.Ю., Рогушина Ю.В. Розробка методів керування доступом до інформації у wiki-ресурсах. Проблеми програмування. № 1,
2020. С. 33-46.
14. Resource Description Framework (RDF) Model and Syntax Specification. W3C Proposed Recommendation. http://www.w3.org/TR/PR-rdf-
syntax.
15. OWL Web Ontology Language. Overview. W3C Recommendation: W3C, 2009. http://www.w3.org/TR/owl-features/.
16. Manual:Extensions. https://www.mediawiki.org/wiki/Manual:Extensions.
17. Extension:CategoryTree. https://www.mediawiki.org/wiki/Extension:CategoryTree.
18. Extension:EmbedVideo. https://www.mediawiki.org/wiki/Extension:EmbedVideo.
19. W3C Semantic Web Activity. http://www.w3.org/2001/sw/Activity/.
20. Гладун А.Я., Рогушина Ю.В. Семантичні технології: принципи та практики. К.: ТОВ "ВД "АДЕФ-Україна". 2016. 308 с.
21. Рогушина Ю.В. Використання семантичних властивостей Wiki-ресурсів для розширення функціональних можливостей «Великої
української енциклопедії». Енциклопедичні видання в сучасному інформаційному просторі: колективна монографія. За ред. д.і.н.,
проф. Киридон А.М. К.: Державна наукова установа «Енциклопедичне видавництво», 2017. С. 104–115.
22. Рогушина Ю.В. Знание-ориентированные средства поддержки семантического поиска в Web // OSTIS-2014, Минск, БГУИР, 2014.
С. 339–352.
23. Гладун А.Я., Рогушина Ю.В. Репозитории онтологий как средство повторного использования знаний для распознавания
информационных объектов. Онтология проектирования. 2013. № 1 (7). С. 35–50.
24. Rogushina J. Analysis of Automated Matching of the Semantic Wiki Resources with Elements of Domain Ontologies. International Journal of
Mathematical Sciences and Computing (IJMSC). 2017. Vol. 3. N 3. P. 50–58.
25. Rogushina J. Semantic Wiki resources and their use for the construction of personalized ontologies. CEUR Workshop Proceedings 1631, 2016.
P. 188–195.
26. Рогушина Ю.В., Гришанова І.Ю. Онтологічна модель бази знань онлайн-версії «Великої української енциклопедії» та методи її
застосування для семантичного пошуку та навігації. Енциклопедичний контент і виклики сучасного світу: Збірник матеріалів наукової
конференції / За ред. Киридон А.М. К.: Державна наукова установа «Енциклопедичне видавництво». 2019. С. 69–74.
27. Методичні рекомендації з підготовки, редагування та оформлення статей до «Великої української енциклопедії». За ред. д.і.н., проф.
Киридон А.М. К.: Державна наукова установа «Енциклопедичне видавництво». 2015. 120 с.
http://www.citeulike.org/group/13847/article/7659081
http://www.w3.org/TR/PR-rdf-syntax
http://www.w3.org/TR/PR-rdf-syntax
http://www.w3.org/TR/owl-features/
Моделі і засоби систем баз даних та знань
257
References
1. Scientific basis, theoretical and methodological principles of modern encyclopedias creation: a collective monograph (2015) Ed. Kiridon A.M.
K .: State Scientific Institution "Encyclopedic Publishing House". 160 p. (in Ukrainian)
2. Encyclopaedia Britannica. https://www.britannica.com.
3. The Great Ukrainian Encyclopedia. https://vue.gov.ua.
4. Andon F.I., Yashunin A.E., Reznichenko V.A. Logical models of intellectual information systems. K.: Naukova Dumka. 1999. 396 p. (in
Russian)
5. Wikipedia – https:// www. wikipedia.org.
6. Leuf B., Cunningham W. The Wiki way: collaboration and sharing on the Internet, 2001,
http://www.citeulike.org/group/13847/article/7659081.
7. Rogushina J.V. Semantic Wiki-resources and their use for the construction of personalized ontologies. Problems in programming. (2-3), 2018,
P. 188–195.
8. Rogushina J. (2018) Modern Wiki Technologies as a Basis for Knowledge Management in Electronic Encyclopedic Editions // Traditions and
Modern Concepts of Encyclopedic Affairs in Ukraine: A Collective Monograph / Ed. Kiridon A.M. K.: State Scientific Institution
«Encyclopedic Publishing House». P. 225–233. https://ev.vue.gov.ua/wp-content/uploads/2019/11/Traditions.pdf. (in Ukrainian)
9. MediaWiki. – https://www.mediawiki.org/wiki/MediaWiki.
10. Krötzsch M., Vrandečić D., Völkel M. Semantic MediaWiki. International semantic web conference. 2006. P. 935–942.
https://link.springer.com/content/pdf/10.1007/11926078_68.pdf.
11. Davies J., Fensel D., van Harmelen F. Towards the Semantic Web: Ontology-driven knowledge management. John Wiley & Sons Ltd, England,
2002. 288 p.
12. Foley B., Chang T. Wiki as a professional development tool. Society for Information Technology & Teacher Education International
Conference. 2008. P. 2959–2966.
13. Grishanova I. & Rogushina J. Development of methods for controlling access to information in wiki resources. Problems in programming.
2020. N 1. P. 33–46. (in Ukrainian)
14. Resource Description Framework (RDF) Model and Syntax Specification. W3C Proposed Recommendation. http://www.w3.org/TR/PR-rdf-
syntax.
15. OWL Web Ontology Language. Overview. W3C Recommendation: W3C, 2009. http://www.w3.org/TR/owl-features/.
16. Manual:Extensions. https://www.mediawiki.org/wiki/Manual:Extensions.
17. Extension:CategoryTree. https://www.mediawiki.org/wiki/Extension:CategoryTree.
18. Extension:EmbedVideo. https://www.mediawiki.org/wiki/Extension:EmbedVideo.
19. W3C Semantic Web Activity. http://www.w3.org/2001/sw/Activity/.
20. Gladun A. & Rogushina J. (2016) Semantic technologies: principles and practices. K.: ADEF-Ukraine LLC, 308 p. (in Ukrainian)
21. Rogushina J. (2017) The use of semantic properties of Wiki-resources for enhancing the functionality of the Great Ukrainian Encyclopedia //
Encyclopedic publications in the modern information space: a collective monograph / Ed. Prof. Kiridon A.M. - K .: State Scientific Institution
"Encyclopedic Publishing House". P. 104–115. (in Ukrainian)
22. Rogushina J. (2014) Knowledge-oriented tools for semantic search supporting in the Web // OSTIS-2014, Minsk. P. 339–352. (in Russian)
23. Gladun A. & Rogushina J. (2013) Ontology repositorias as a mean of knowledge reuse for recognition of information objects. Ontology for
design, N 1 (7). P. 35–50.
24. Rogushina J. Analysis of Automated Matching of the Semantic Wiki Resources with Elements of Domain Ontologies. International Journal of
Mathematical Sciences and Computing (IJMSC). 2017. Vol. 3. N 3. P. 50–58.
25. Rogushina J. Semantic Wiki resources and their use for the construction of personalized ontologies. CEUR Workshop Proceedings 1631, 2016.
P. 188–195.
26. Rogushina J., Grishanova I. (2019) Ontological model of knowledge base of online version of Great Ukrainian Encyclopedia and methods of its
use for semantic search and navigation. Encyclopaedic content and challenges of modern world / Ed. Kyrydon A.M., Kyiv, P. 69–74. (in
Ukrainian)
27. Methodical recommendations for the preparation, editing and design of articles for the Great Ukrainian Encyclopedia (2015) / Ed. . Kiridon
A.M. K.: State Scientific Institution "Encyclopedic Publishing House". 120 p. (in Ukrainian)
Одержано 17.02.2020
Про авторів:
Андон Пилип Іларіонович,
академік НАН України,
директор Інституту програмних систем НАН України.
Кількість наукових публікацій в українських виданнях – 400.
Кількість наукових публікацій в зарубіжних індексованих виданнях – 10.
https://orcid.org/0000-0002-2204-1554.
E-mail: andon@isofts.kiev.ua,
Рогушина Юлія Віталіївна,
кандидат фізико-математичних наук,
старший науковий співробітник.
Кількість наукових публікацій в українських виданнях – 151.
Кількість наукових публікацій в зарубіжних виданнях – 31.
http://orcid.org/0000-0001-7958-2557.
E-mail: ladamandraka2010@gmail.com,
http://www.citeulike.org/group/13847/article/7659081
http://www.w3.org/TR/PR-rdf-syntax
http://www.w3.org/TR/PR-rdf-syntax
http://www.w3.org/TR/owl-features/
https://mail.google.com/mail/u/0/h/1l3lym3hdqf9j/?&cs=wh&v=b&to=andon@isofts.kiev.ua
mailto:ladamandraka2010@gmail.com
Моделі і засоби систем баз даних та знань
258
Гришанова Ірина Юріївна,
науковий співробітник Інституту програмних систем НАН України.
Кількість наукових публікацій в українських виданнях – 20.
Кількість наукових публікацій в зарубіжних виданнях – 3.
http://orcid.org/0000-0003-4999-6294.
E-mail: i26031966@gmail.com,
Резніченко Валерій Анатолійович,
провідний науковий співробітник Інституту програмних систем НАН України.
Кількість наукових публікацій в українських виданнях – 61.
Кількість наукових публікацій в зарубіжних виданнях – 4.
http://orcid.org/0000-0002-4451-8931.
E-mail: vreznichenko_47@mail.ru, inna_islyamova@ukr.net,
Киридон Алла Миколаївна,
доктор історичних наук, професор,
заслужений діяч науки і техніки України,
директор Державної наукової установи «Енциклопедичне видавництво» (Київ)
http://orcid.org/0000-0003-4375-5350.
E-mail: akyrydon@ukr.net,
Арістова Алла Вадимівна,
доктор філософських наук, професор,
завідувач відділом соціогуманітарних наук
Державної наукової установи "Енциклопедичне видавництво".
http://orcid.org/ 0000-0002-9207-778Х.
E-mail: alvadar.ntu@gmail.com,
Тищенко Андрій Олександрович,
науковий співробітник відділу соціогуманітарних наук
Державної наукової установи "Енциклопедичне видавництво".
http://orcid.org/ 0000-0002-9847-2991.
E-mail: poetor@ukr.net.
Місце роботи авторів:
Інститут програмних систем НАН України,
03181, Київ-187, проспект Академіка Глушкова, 40.
Тел.: 066 550 1999.
Державна наукова установа "Енциклопедичне видавництво".
mailto:i26031966@gmail.com
mailto:akyrydon@ukr.net
|