About technologies of use of external data on creating and editing of encyclopedic texts
The paper discusses developing of Wikidata project, the query web service and the query language. The workflow of the web service, query language and result output forms are demonstrated with plenty of examples. Wikidata usage technology by third-party systems is developed.In this concern ExternalD...
Збережено в:
Дата: | 2018 |
---|---|
Автори: | , |
Формат: | Стаття |
Мова: | rus |
Опубліковано: |
Інститут програмних систем НАН України
2018
|
Теми: | |
Онлайн доступ: | https://pp.isofts.kiev.ua/index.php/ojs1/article/view/223 |
Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
Назва журналу: | Problems in programming |
Завантажити файл: |
Репозитарії
Problems in programmingid |
pp_isofts_kiev_ua-article-223 |
---|---|
record_format |
ojs |
resource_txt_mv |
ppisoftskievua/99/c265ff752ce5f12f5d80c5ef81b8af99.pdf |
spelling |
pp_isofts_kiev_ua-article-2232024-04-28T11:56:41Z About technologies of use of external data on creating and editing of encyclopedic texts О технологии использования внешних данных при создании и редактировании энциклопедических текстов Про технологію використання зовнішніх даних при створенні і редагуванні енциклопедичних текстів Proskudina, G.Yu. Kudim, K.A. digital encyclopedia; database Wikidata; query service UDC 004.82 электронная энциклопедия; база Викиданные; сервис запросов; язык запросов УДК 004.82 електронна енциклопедія; база Вікідані; сервіс запитів; мова запитів УДК 004.82 The paper discusses developing of Wikidata project, the query web service and the query language. The workflow of the web service, query language and result output forms are demonstrated with plenty of examples. Wikidata usage technology by third-party systems is developed.In this concern ExternalData extension which is part of MediaWiki software is considered. Additionally the instruction for installation and configuration of the extension is presented. During test period ExternalData extension was improved. procedure for automatic list generation in wiki page is developed.Problems in programming 2017; 1: 67-82 В работе обсуждается развивающийся проект Викиданные, веб-сервис запросов и язык запросов. Работа веб-сервиса, языка запросов и форм вывода результатов демонстрируется на многочисленных примерах. Разработана технология использования Викиданных сторонними системами. Учитывая это, рассматривается расширение ExternalData, разработанное для программного обеспечения MediaWiki. В ходе тестовой эксплуатации расширение ExternalData было доработано. Расширение используется для вставки запросов данных к внешним источникам, в нашем случае к базе знаний Викиданные, и их результатов в викиразметку создаваемых текстов статей. Разработана процедура создания страницы-списка.Problems in programming 2017; 1: 67-82 У роботі обговорюється проект Вікідані, веб-сервіс запитів і мова запитів. Робота веб-сервісу, мова запитів і форм виведення результатів демонструється на численних прикладах. Розроблено технологію використання Вікіданих сторонніми системами. У зв’язку з цим розглядається розширення ExternalData, розроблене для програмного забезпечення MediaWiki. В ході тестової експлуатації розширення ExternalData було доопрацьовано. Розширення використовується для вставки запитів даних до зовнішніх джерел, в нашому випадку, до бази знань Вікідані і їх результатів у вікі-розмітку, створюваних текстів статей. Розроблена процедура створення сторінки-списку.Problems in programming 2017; 1: 67-82 Інститут програмних систем НАН України 2018-11-20 Article Article application/pdf https://pp.isofts.kiev.ua/index.php/ojs1/article/view/223 10.15407/pp2017.01.067 PROBLEMS IN PROGRAMMING; No 1 (2017); 67-82 ПРОБЛЕМЫ ПРОГРАММИРОВАНИЯ; No 1 (2017); 67-82 ПРОБЛЕМИ ПРОГРАМУВАННЯ; No 1 (2017); 67-82 1727-4907 10.15407/pp2017.01 rus https://pp.isofts.kiev.ua/index.php/ojs1/article/view/223/216 Copyright (c) 2018 ПРОБЛЕМИ ПРОГРАМУВАННЯ |
institution |
Problems in programming |
baseUrl_str |
https://pp.isofts.kiev.ua/index.php/ojs1/oai |
datestamp_date |
2024-04-28T11:56:41Z |
collection |
OJS |
language |
rus |
topic |
digital encyclopedia database Wikidata query service UDC 004.82 |
spellingShingle |
digital encyclopedia database Wikidata query service UDC 004.82 Proskudina, G.Yu. Kudim, K.A. About technologies of use of external data on creating and editing of encyclopedic texts |
topic_facet |
digital encyclopedia database Wikidata query service UDC 004.82 электронная энциклопедия база Викиданные сервис запросов язык запросов УДК 004.82 електронна енциклопедія база Вікідані сервіс запитів мова запитів УДК 004.82 |
format |
Article |
author |
Proskudina, G.Yu. Kudim, K.A. |
author_facet |
Proskudina, G.Yu. Kudim, K.A. |
author_sort |
Proskudina, G.Yu. |
title |
About technologies of use of external data on creating and editing of encyclopedic texts |
title_short |
About technologies of use of external data on creating and editing of encyclopedic texts |
title_full |
About technologies of use of external data on creating and editing of encyclopedic texts |
title_fullStr |
About technologies of use of external data on creating and editing of encyclopedic texts |
title_full_unstemmed |
About technologies of use of external data on creating and editing of encyclopedic texts |
title_sort |
about technologies of use of external data on creating and editing of encyclopedic texts |
title_alt |
О технологии использования внешних данных при создании и редактировании энциклопедических текстов Про технологію використання зовнішніх даних при створенні і редагуванні енциклопедичних текстів |
description |
The paper discusses developing of Wikidata project, the query web service and the query language. The workflow of the web service, query language and result output forms are demonstrated with plenty of examples. Wikidata usage technology by third-party systems is developed.In this concern ExternalData extension which is part of MediaWiki software is considered. Additionally the instruction for installation and configuration of the extension is presented. During test period ExternalData extension was improved. procedure for automatic list generation in wiki page is developed.Problems in programming 2017; 1: 67-82 |
publisher |
Інститут програмних систем НАН України |
publishDate |
2018 |
url |
https://pp.isofts.kiev.ua/index.php/ojs1/article/view/223 |
work_keys_str_mv |
AT proskudinagyu abouttechnologiesofuseofexternaldataoncreatingandeditingofencyclopedictexts AT kudimka abouttechnologiesofuseofexternaldataoncreatingandeditingofencyclopedictexts AT proskudinagyu otehnologiiispolʹzovaniâvnešnihdannyhprisozdaniiiredaktirovaniiénciklopedičeskihtekstov AT kudimka otehnologiiispolʹzovaniâvnešnihdannyhprisozdaniiiredaktirovaniiénciklopedičeskihtekstov AT proskudinagyu protehnologíûvikoristannâzovníšníhdanihpristvorennííredaguvanníenciklopedičnihtekstív AT kudimka protehnologíûvikoristannâzovníšníhdanihpristvorennííredaguvanníenciklopedičnihtekstív |
first_indexed |
2024-09-16T04:07:36Z |
last_indexed |
2024-09-16T04:07:36Z |
_version_ |
1818527824676388864 |
fulltext |
Експертні та інтелектуальні інформаційні системи
© Г.Ю. Проскудина, К.А. Кудим, 2017
ISSN 1727-4907. Проблеми програмування. 2017. № 1 67
УДК 004.82
Г.Ю. Проскудина, К.А. Кудим
О ТЕХНОЛОГИИ ИСПОЛЬЗОВАНИЯ
ВНЕШНИХ ДАННЫХ ПРИ СОЗДАНИИ
И РЕДАКТИРОВАНИИ ЭНЦИКЛОПЕДИЧЕСКИХ ТЕКСТОВ
В работе обсуждается развивающийся проект Викиданные, веб-сервис запросов и язык запросов. Рабо-
та веб-сервиса, языка запросов и форм вывода результатов демонстрируется на многочисленных при-
мерах. Разработана технология использования Викиданных сторонними системами. Учитывая это,
рассматривается расширение ExternalData, разработанное для программного обеспечения MediaWiki. В
ходе тестовой эксплуатации расширение ExternalData было доработано. Расширение используется для
вставки запросов данных к внешним источникам, в нашем случае к базе знаний Викиданные, и их ре-
зультатов в вики-разметку создаваемых текстов статей. Разработана процедура создания страницы-
списка.
Ключевые слова: электронная энциклопедия, база Викиданные, сервис запросов, язык запросов.
Введение
Технология создания и поддержки
функционирования электронной Большой
украинской энциклопедии1 предполагает
оперативное и своевременное ее наполне-
ние из уже имеющихся внешних источни-
ков. Важным и необходимым источником
данных может стать Википедия, Свободная
энциклопедия один из крупнейших и по-
пулярнейших веб-сайтов мира2.
Концепция Википедии хорошо из-
вестна и довольно проста это открытая
энциклопедия знаний, где любой человек
может вносить и редактировать информа-
цию. На сегодняшний день ее англоязыч-
ный раздел (английская Википедия) насчи-
тывает более 5 млн. статей, 11 Википедий,
в том числе немецкая, французская, рус-
ская, итальянская и некоторые другие
насчитывают от 1 до 4 миллионов статей.
Украинский раздел Википедии по состоя-
нию на 9 января 2017 года содержит
671 977 статей различной тематики; по
данному показателю украинская Википе-
дия занимает 16 место из более чем 287
языковых разделов.
В настоящее время незаметно для
большинства своих читателей эта попу-
1
Работа выполнена в рамках первого этапа проекта
"Разработка проекта компьютерного варианта и
технологии создания и поддержки функционирова-
ния Большой украинской энциклопедии" програм-
мы информатизации НАНУ.
2https://ru.wikipedia.org/wiki/Википедия
лярная онлайновая система претерпевает
значительные изменения, учитывая то, что
связанный с Википедией проект, Викидан-
ные3, управляя фактологической информа-
цией Википедии, вводит новую много-
язычную так называемую "Википедию
данных" свободную и открытую базу
данных, которая собирает многоязычные
структурированные данные Википедии в
одном месте и представляет их в общий
свободный доступ для копирования, ис-
пользования и распространения, открывая
новые возможности для многих других
приложений4.
Как и Википедия, Викиданные ор-
ганизованы постранично. Каждый экзем-
пляр данных имеет свою страницу, на ко-
торой можно редактировать его свойства.
Свойства описывают объект и связывают
его с другими страницами данных, напри-
мер, с классом, представителем которого
он является, как то: персона, место, собы-
тие и многие другие. Например, элемент
города Рим может иметь свойство Населе-
ние со значением 2.777.979. Можно зада-
вать горные вершины, места и географиче-
ские координаты зданий. Можно связать
человека с его или ее местом рождения,
родом занятий или с его номером в базе
данных органа управления; связать поли-
3https://ru.wikipedia.org/wiki/Викиданные
4https://www.wikidata.org/wiki/Wikidata:Introduction/
ru
https://docs.google.com/document/d/1BMxqnBzczUeTjmDosMrmMIrcws-973E98RXLNMFL-Bc/edit#heading=h.fw2d5481s88y
https://docs.google.com/document/d/1BMxqnBzczUeTjmDosMrmMIrcws-973E98RXLNMFL-Bc/edit#heading=h.fw2d5481s88y
https://ru.wikipedia.org/wiki/Википедия
https://ru.wikipedia.org/wiki/Викиданные
https://www.wikidata.org/wiki/Wikidata:Introduction/ru
https://www.wikidata.org/wiki/Wikidata:Introduction/ru
Експертні та інтелектуальні інформаційні системи
68
тика со своей политической партией; свя-
зать населенный пункт со своей более вы-
сокой административной единицей; свя-
зать страну с ее высшим руководством и ее
национальным гимном и т. д. Данная ин-
формация может быть показана на любом
языке, даже если данные собраны на дру-
гом языке. При доступе к этим значениям
вики-клиент покажет самые последние
данные в актуальном состоянии.
Сегодня почти каждая страница Ви-
кипедии на разных языках включает в себя
содержимое от Викиданных. Все больше и
больше редактируемых вручную инфобок-
сов (таблицы с основной, фактической ин-
формацией по теме статьи) используют
Викиданные в качестве базы данных сер-
верной части, поэтому отображаемая ин-
формация будет одинакова во всех издани-
ях Википедии.
Цель данной работы использовать
внешний надежный источник данных та-
кой, как Википедия, при создании страниц
электронной Большой украинской энцик-
лопедии. Для чего предлагается техноло-
гия включения внешних данных, которую
можно рассматривать в качестве одной из
составляющих технологии создания статей
для энциклопедии. Это позволяет на своем
ресурсе запрашивать нужную информацию
из Википедии и формировать на основе
полученных данных свои страницы или
фрагменты страниц.
Разработке такой технологии и по-
священа настоящая работа. Здесь подробно
обсуждается новый перспективный и раз-
вивающийся проект Википедии Вики-
данные, веб-сервис запросов к базе данных
Викиданные и язык запросов. Работа веб-
сервиса, языка запросов и форм вывода
результатов демонстрируется на много-
численных примерах. Затем речь пойдет о
том, как можно использовать Викиданные
в сторонних системах, а не только в Вики-
педии. При этом используется разработан-
ное для программного обеспечения
MediaWiki расширение ExternalData для
вставки запросов данных к внешним ис-
точникам (в нашем случае к базе данных
Викиданные) и их результатов в вики-
разметку создаваемых текстов статей. В
ходе тестовой эксплуатации расширение
ExternalData было доработано. Разработана
и приводится процедура создания страни-
цы-списка.
В нашей экспериментальной энцик-
лопедии5 можно посмотреть ряд статей,
имеющих на своих страницах запросы к
внешней базе данных Викиданные: "Реки и
озера Украины", "Национальные парки
Украины", "Города Украины", “ВУЗы
Украины", "Писатели и поэты, родившиеся
в Украине", "Знаменитые музыканты
Украины", "Выдающиеся ученые и инже-
неры Украины".
1. Викиданные
Первоначально задуманная как тек-
стовый ресурс, Википедия собирает рас-
тущее количество структурированных
данных: числа, даты, координаты, разные
типы отношений. Эти данные стали ресур-
сом огромной ценности с потенциальным
применением во всех областях науки, тех-
ники и культуры.
Такое развитие событий не удиви-
тельно, учитывая, что Википедия пред-
ставляет "всеобщее видение мира, в кото-
ром каждый человек может свободно об-
мениваться суммой всех знаний". Тогда не
шла речь о том, что эти знания должны
включать в себя данные, которые могут
быть найдены, проанализированы и ис-
пользованы повторно.
Может вызвать удивление тот факт,
что Википедия не обеспечивает прямого
доступа к большинству этих данных, ни
через сервисы запросов, ни через выгружа-
емый экспорт данных. Фактически исполь-
зование данных происходит редко и часто
ограничено очень специфическими частя-
ми информации, такими, например, как
гео-теги статей Википедии, используемые
в Google Maps. Причина этого поразитель-
ного разрыва между видением и реально-
стью является то, что данные Википедии
спрятаны внутри 30 млн. статей на 287
языках, откуда очень трудно извлечь нуж-
ную информацию.
Такая ситуация, во-первых, не
устраивает тех, кто будет использовать
данные, но и, во-вторых, возрастает опас-
5 http://sew.isofts.kiev.ua
http://sew.isofts.kiev.ua/
Експертні та інтелектуальні інформаційні системи
69
ность для основной цели Википедии
обеспечение современными и точными эн-
циклопедическими знаниями. Одна и та же
информация часто появляется в статьях на
разных языках и во многих статьях в пре-
делах одного языка. Численность населе-
ния Рима, например, можно найти в ан-
глийской и итальянской статье о Риме, но
также и в английской статье о городах
Италии. Все эти цифры могут быть отли-
чаться друг от друга.
Цель Викиданные преодолеть эти
проблемы путем создания новых средств
Википедии управлять своими данными в
глобальном масштабе. Результат этих про-
должающихся усилий можно увидеть на
сайте wikidata.org.
Викиданные самый новый проект
Викимедиа, это совместно редактируемая,
свободная база знаний, которую можно
читать и редактировать людьми и маши-
нами. Хороший обзор на эту тему пред-
ставлен в [1]. На данный момент достигну-
ты следующие результаты:
централизация связей между
разноязычными изданиями Википедии и
другими сайтами проекта Викимедиа. К
примеру все статьи Википедии об "энцик-
лопедии" (на любом языке) связаны с од-
ним элементом Викиданных с идентифи-
катором Q5292. Эти так называемые ссыл-
ки на сайты и другие данные о
сущности, известной как "энциклопедия",
можно посмотреть на странице
https://www.wikidata.org/wiki/Q5292;
централизация инфобоксов. Все
больше и больше измененных вручную
инфобоксов, таблиц с основной, фактиче-
ской информацией по теме статьи, намере-
ваются использовать Викиданные в каче-
стве базы данных серверной части, поэто-
му отображаемая информация будет оди-
накова во всех изданиях Википедии;
обеспечение интерфейса для
различных запросов. Содержание Вики-
данных можно запросить через открытый
интерфейс SPARQL на сервисе
https://query.wikidata.org. В дальнейшем
результаты запроса планируется интегри-
ровать на страницы в Википедии и других
проектов, как списки, таблицы, карты и
другие формы.
Модель данных Викиданных не ре-
ляционная и не на основе RDF, хотя и су-
ществуют отображения в RDF, но она от-
ражает стратегию Викиданных на хране-
ние утверждений вместо фактов. Каждое
утверждение должно быть получено с по-
мощью ссылок, а противоречивые утвер-
ждения намеренно не запрещены. Утвер-
ждения могут дополнительно контролиро-
ваться уточнителями, такими как домен
или дата действия, в конечном счете, под-
держивая п-арные отношения между сущ-
ностями (элементами) Викиданных. Свой-
ства Викиданных определяются консенсу-
сом сообщества. Например, P571 иденти-
фицирует свойство зарождение (inception),
чтобы заявить дату, когда-то что-то было
создано или основано. Названия (labels) и
область применения (scope notes) могут
быть отредактированы независимо от
утверждений с поддержкой синонимов и
омонимов.
1.1. Руководящие принципы базы
данных Викиданные. Приведем перечень
конструктивных решений, характеризую-
щий подход, принятый в базе данных Ви-
киданные.
Открытое редактирование. Также
как и Википедия, Викиданные позволяют
каждому пользователю сайта расширять и
редактировать сохраненную информацию,
даже без создания учетной записи. Интер-
фейс на основе форм делает редактирова-
ние легким и удобным.
Контроль сообщества. Под кон-
тролем сообщества вкладчиков находятся
не только фактологические данные, но и
схема данных. Авторы, редактирующие
численность населения Рима, в первую
очередь на их взгляд вносят самое пра-
вильное число.
Множественность. Поскольку мно-
гие факты оспариваются или просто не
определены, было бы наивно ожидать гло-
бального соглашения об "истинных" дан-
ных. Викиданные позволяют противоречи-
вым данным сосуществовать и обеспечи-
вают механизмы для организации такого
множества данных.
Вторичные данные. Викиданные
собирают факты, опубликованные в пер-
https://www.wikidata.org/wiki/Q5292
https://query.wikidata.org/
Експертні та інтелектуальні інформаційні системи
70
вичных источниках, вместе со ссылками на
эти источники. Там нет такого понятия,
как "истинное население Рима", но есть
"население Рима, опубликованное в городе
Риме в 2011 году".
Многоязычность данных. Боль-
шинство данных не привязаны к одному
языку: цифры, даты и координаты имеют
универсальное значение; заголовки
(labels), например, Рим или Население, пе-
реведены на многие языки. Викиданные
это многоязычный проект. Есть только
один сайт Викиданные, в то время как Ви-
кипедия имеет независимые издания для
каждого языка, т.е. Википедия имеет
множество сайтов.
Легкий доступ. Цель Викиданные
предоставлять данные не только Вики-
педии, но и другим внешним приложени-
ям. Данные экспортируются через веб-
сервисы или API в нескольких форматах,
включая XML, JSON, RDF. Данные публи-
куются в соответствии с юридическими
условиями по лицензии CC06, позволяю-
щие максимально широкое повторное ис-
пользование.
Непрерывная эволюция. В луч-
ших традициях Википедии, Викиданные
растут вместе с сообществом и задачами.
Вместо того, чтобы разработать совершен-
ную систему, которая была бы представ-
лена миру через несколько лет, новые воз-
можности разворачиваются постепенно и
как можно раньше. Все эти свойства ха-
рактеризуют Викиданные как специфиче-
ский вид curated (специально отобранных)
баз данных [2].
1.2. Краткая история проекта Ви-
киданные. Проект Викиданные был запу-
щен в октябре 2012 года. Тогда редакторы
могли только создавать элементы (items) и
соединять их со статьями Википедии. В
январе 2013 года три Википедии, сначала
венгерская, затем еврейская (на иврите) и
итальянская, подключились к Викиданные.
Между тем, сообщество уже создало более
трех миллионов элементов. В феврале
присоединилась английская Википедия, а в
6 https://creativecommons.org/choose/zero/
марте 2013 года уже все существующие
Википедии были подключены к БД Вики-
данные.
По состоянию на февраль 2014 года
Викиданные получали информацию от бо-
лее чем 40 тыс. участников. Начиная с мая
2013 года с Викиданные постоянно рабо-
тали более 3.5 тыс. активных участников
это те вкладчики, которые делают по
крайней мере пять изменений в течение
месяца. Учитывая это можно сделать вы-
вод, что в настоящее время Викиданные
один из наиболее активных проектов Ви-
кимедиа.
В марте 2013 года в качестве языка
сценариев Википедии введен язык Lua7,
который может использоваться для авто-
матического создания и обогащения неко-
торых частей статьи, например, упомяну-
тых инфобоксов. Скрипты Lua могут по-
лучить доступ к Викиданные, позволяя ре-
дакторам Википедии извлекать, обрабаты-
вать и отображать эти данные.
В настоящее время продолжаются
работы, относящиеся к поддержке произ-
вольных поисковых запросов с возможно-
стью использовать их результаты при ав-
томатическом обновлении различных
списков в статьях Википедии.
1.3. Из многих, один. Первона-
чальной задачей Викиданных было согла-
совать 287 языковых разделов Википедии
[1]. Для Викиданных, чтобы быть действи-
тельно многоязычными, объект, представ-
ляющий «Рим», должен быть одним и тем
же во всех языках. К счастью, Википедия
уже имеет механизм тесно связанный с
этим вопросом: ссылки на язык, отобража-
емые слева каждой статьи, соединяют ста-
тьи на разных языках. Эти ссылки были
созданы из отредактированных пользова-
телем исходных текстов в нижней части
каждой статьи, приводят к квадратному
числу таких ссылок по теме: каждая из 207
статей о Риме содержит список из 206
ссылок на все другие статьи о Риме это в
общей сложности 42,642 строк текста. В
итоге до появления проекта Викиданные в
статьях Википедии содержалось больше
7 https://www.lua.org/pil/p1.html
https://creativecommons.org/choose/zero/
https://www.lua.org/pil/p1.html
Експертні та інтелектуальні інформаційні системи
71
текста для разноязычных ссылок, чем фак-
тического содержания статьи.
Соответственно, лучше хранить и
управлять разноязычными ссылками в од-
ном месте, и это была первая задача для
Викиданных. Для каждой статьи Вики-
педии, создана отдельная страница на Ви-
киданных, где ссылки на соответствующие
статьи Википедии указаны на разных язы-
ках. Такие страницы на Викиданных назы-
ваются элементами (items). Первоначаль-
но для каждого элемента могло храниться
только ограниченное число данных: спи-
сок языковых ссылок-связей, имена, спи-
сок псевдонимов, краткое описание. Име-
на, псевдонимы и описания могут опреде-
ляться отдельно (на данный момент до 358
языков).
Сообщество Викиданных создало
боты для того, чтобы переместить языко-
вые ссылки из Википедии в Викиданные,
вследствие чего из Википедии можно было
удалить более 240 миллионов ссылок. И
сегодня, большинство языковых ссылок,
отображаемых в статьях Википедии, по-
даются с Викиданных. В статью еще мож-
но добавить пользовательские ссылки, ко-
торые необходимы в тех редких случаях,
когда ссылки не являются двунаправлен-
ным, например, некоторые статьи связаны
с более общими статьями на других язы-
ках, при этом Викиданные намеренно со-
единяет только те страницы, которые
охватывают один и тот же предмет. Им-
портируя языковые ссылки, Викиданные
получили огромное множество исходных
элементов, которые "обоснованы" реаль-
ными страницами Википедии.
1.4. Модель данных. Как и Вики-
педия, Викиданные организованы по-
странично, и такая организация также
совпадает со структурой самих данных
[3]. Каждый предмет (subject), по кото-
рому Викиданные структурируют свои
данные называется сущностью (entity), и
каждая сущность имеет свою страницу.
Система пока что различает два типа
сущностей: элементы (items) и свойства
(properties). Практически каждая статья
Википедии на любом языке имеет соот-
ветствующий элемент, представляющий
собой предмет (или тему) данной статьи.
Каждый элемент имеет страницу, на ко-
торой пользователи могут просматривать
и вводить данные. Так, например, стра-
ницу элемента английского писателя Ду-
гласа Адамса можно увидеть по ссылке:
https://www.wikidata.org/wiki /Q42 (рис. 1).
Каждый элемент Викиданных имеет
название (label), описание (description) и,
вероятно, один или несколько псевдонимов
(aliases). Ссылки на сайты (sitelinks) свя-
зывают каждый элемент с соответствую-
щими статьями на всех клиентах Вики-
педии. Утверждения (statements) описы-
вают детальные характеристики для каж-
дого элемента. Каждое утверждение со-
стоит из свойства (property) и его значения
(value).
В нашем примере, название страни-
цы "Q42", а не "Дуглас Адамс", так как
Викиданные многоязычный сайт. Поэто-
му элементы не идентифицируются
названием на конкретном языке, а
нейтральным идентификатором элемента,
который автоматически назначается при
его создании, и который не может быть
изменен в дальнейшем. Идентификаторы
элемента всегда начинаются с буквы "Q" с
последующим числом. Каждая страница
элемента содержит следующие основные
части:
название (например, "Дуглас
Адамс");
краткое описание (например,
"английский писатель и юморист");
список псевдонимов (например,
"Дуглас Ноэль Адамс");
список утверждений (самая об-
ширная часть данных, см. далее);
список ссылок на сайты (ссыл-
ки на страницы Википедии и другие про-
екты).
Первые три части данных (назва-
ние, описание, псевдонимы) известны под
общим названием термины. Они в основ-
ном используются для поиска и отображе-
ния элементов. Элемент может иметь
название на любом языке, поддерживае-
мом Викиданными. То, что отображается
на страницах, зависит от настройки языка
https://www.wikidata.org/wiki/Q42
https://www.wikidata.org/wiki/Special:MyLanguage/Help:Sitelinks
https://www.wikidata.org/wiki/Special:MyLanguage/Help:Statements
https://www.wikidata.org/wiki/Special:MyLanguage/Help:Properties
Експертні та інтелектуальні інформаційні системи
72
Рис. 1. Пример элемента Викиданные "Дуглас Адамс" Q42
пользователя. Ссылки могут быть предо-
ставлены для любой из 286 языковых вер-
сий Википедии, а также для нескольких
родственных проектов, таких например,
как Викигид и Викисклад. Ссылки на сай-
ты являются функционалом (не более од-
ной ссылки на сайт) и обратным функци-
оналом (не более одного элемента для
любой ссылки). В отличие от прежней си-
стемы языковых ссылок Википедии, ссыл-
ки должны использоваться только для ста-
тей, которые точно на эту тему, а не на
более широкую или более узкую, или
иным образом связанных с темой. Неко-
торые элементы не имеют каких-либо
ссылок, например, элемент "Женский"
(Q6581072), который используется в каче-
стве возможного значения для пола лиц.
1.4.1. Свойства и типы данных.
На рис. 2 показан простой пример утвер-
ждения (statement), которое близко напо-
минает RDF-тройку, где предмет “Ду-
глас Адамс” (Q42), свойство (property)
супруга (spouse) и значение (value) Jane
Belson.
Свойства, как предметы, описаны
на страницах и имеют идентификаторы,
начинающиеся с "Р". Например, свойство
супруг(а) на самом деле P26. Свойства то-
же имеют названия, псевдонимы и описа-
ния, но у них нет ссылок на сайты.
Кроме того, свойства Викиданных
также имеют тип, ограничивающий при-
нимаемое значения. Тип данных дата
рождения время, супруг(а) связан с
другим элементом. В табл. (рис. 2, [3]) в
левой колонке приведен список всех допу-
стимых типов данных. Общие медиа
(Commons Media) представляет собой осо-
бый тип данных для ссылок на медиа-
файлы в хранилище медиа-ресурсов Ви-
кисклад, используещееся всеми Википеди-
ями. Типы данных определяют структуру
значений, принимаемых свойствами.
Свойство может иметь простое значение
(как в случае типа элемент, item или как
для типа строка) или комплексное значе-
ние, которое требует несколько полей, как
для времени, сферических координат и
количества. Колонка справа (рис. 2) пока-
зывает возможные компоненты каждого
значения.
https://www.wikidata.org/wiki/Special:MyLanguage/Help:Properties
Експертні та інтелектуальні інформаційні системи
73
Рис. 2. Типы данных в Викиданных, их наборы и типы полей
Для времени, сохраняется допол-
нительное смещение (в минутах) для ча-
сового пояса и ссылка на календарную
модель, являющаяся предпочтительной
для отображения (например, по Юлиан-
скому календарю, Q1985786). Также мож-
но указать точность, чтобы выразить не-
определенные значения, такие как "сен-
тябрь 1547" или "3-е столетие". Детали
здесь не существенны. Для наиболее рас-
пространенных типов неточностей (точ-
ность до дня, месяца, года), чтобы зако-
дировать эту информацию непосред-
ственно в литералах, задавая основной
момент времени, используются специаль-
ные типы данных схемы XML (xsd:date,
xsd:gYearMonth, xsd:gYear).
Для получения сферических коор-
динат, в таблице представлено необычное
поле шар (globe), которое задает небес-
ное тело, например, координаты относят-
ся к Земле (Q2).
1.4.2. Сложные утверждения и
ссылки. Полная модель данных утвер-
ждений Викиданных немного сложнее,
чем можно предложить из рис. 1. С одной
стороны, утверждения могут иметь так
называемые квалификаторы (или уточни-
тели), предоставляющие дополнительную
контекстную информацию для данного
утверждения. С другой стороны, каждое
утверждение может включать в себя одну
или несколько ссылок, в поддержку этого
утверждения. Утверждение, где пред-
ставлены оба аспекта, показано на рис. 3.
Основная пара свойство-значение в
данном утверждении "spouse: Jane
Belson" (P26: Q14623681), но здесь суще-
ствует и контекстная информация.
Уточнители на рис. 3 "дата нача-
ла: 25 ноября 1991" и "дата окончания: 11
мая 2011", утверждают, что Дуглас
Адамс был женат на Джейн Белсон с 1991
года до своей смерти в 2011 году. Здесь
используются свойства дата начала
(P580) и дата окончания (P582) соответ-
ствующих типов времени. Эти пары свой-
ство-значение относятся к основной части
утверждения, а не к элементу на странице
(Дуглас Адамс).
В Викиданных уточнители исполь-
зуются в нескольких ситуациях. Наиболее
распространенным является указание на
время действия утверждения, так что слу-
чай на рис. 3 – довольно типичный. Тем
не менее, Викиданные использует многие
другие виды аннотаций, предоставляю-
щих контекстную информацию об утвер-
ждении. Например, автор таксона (P405,
важный контекст для биологических
названий таксонов) и таксономия асте-
роидов (P1016, контекстуализировать
Експертні та інтелектуальні інформаційні системи
74
Рис. 3. Часть сложного утверждения о жене Дугласа Адамса,
как показано в Викиданных
спектральную классификацию астерои-
дов). В некоторых случаях, уточнители-
предоставляют дополнительные аргумен-
ты отношений, которые имеют более двух
участников. Например, свойство (P553)
учетная запись веб-сайта определяет веб-
сайт (например, Twitter, Q918), но, оно
как правило, используется с уточнителем
P554, задающего имя учетной записи, ис-
пользуемого элементом на этом сайте.
Можно утверждать, что это тернарные
отношения, но граница между аннотацией
контекста и n-арной связью размыта.
Например, американский сериал, Звёзд-
ный путь: Следующее поколение (Q16290)
имеет свойство в ролях (P161) Брент
Спайнер (Q311453) с двумя значениями
уточнителя играет роль персонажа
(P453): Дейта (Q22983) и Lore
(Q2609295). Обратите внимание, что та-
кое же свойство может быть использовано
в нескольких уточнителях в одном утвер-
ждении.
Мы использовали пары свойство-
значение во многих местах: и в качестве
основных частей утверждений, и в каче-
стве уточнителей, и в ссылках. В каждом
из этих случаев Викиданные также под-
держивают два специальных “значения”:
ни один и некоторый (none и some). Зна-
чение ни один используется, например, в
утверждении: "Королева Англии Елиза-
вета I не имела супруга". Что позволило
получить простую форму для отрицания и
отличить его от случаев, когда информа-
ция является просто неполной. Это также
позволяет добавлять ссылки на негатив-
ные утверждения. Иногда это использует-
ся, когда известно, что это свойство имеет
значение, но нет возможности предоста-
вить более подробную информацию, как,
например, в утверждении: "Папа Линус
имел дату рождения, но она нам неиз-
вестна". Оба данных специальных "значе-
ния" можно использовать во всех местах,
где разрешены обычные значения
свойств, поэтому они, как правило, не
упоминаются в явном виде.
1.4.3 Порядок и ранг. Все данные
в Викиданных упорядочены псевдони-
мы, утверждения, пары свойство-значение
в качестве ссылки и т. д. Информация о
порядке в Викиданные используется
только для представления, и не считается
значимой для ответа на запросы.
Даже если в ответах на запрос не
нужно использовать порядок утвержде-
ний, иногда необходимо выделять неко-
торые из утверждений от остальных.
Експертні та інтелектуальні інформаційні системи
75
Например, Викиданные содержат много
исторических данных с подходящими
уточнителями, например, численность
населения городов в разное время. Такие
данные имеют множество применений, но
простой запрос для населения города не
должен возвращать длинный список чи-
сел. Чтобы упростить базовую фильтра-
цию данных, утверждениям Викиданных
можно присвоить один из трех рангов:
нормальный (используется по умолча-
нию), привилегированный (когда нужно
выделить предпочтительные значения) и
вызывает возражение (когда нужно по-
метить неправильно или непригодную
информацию, но по какой-то практиче-
ской причине ее хранят в системе).
1.5. Викиданные в цифрах. C мо-
мента своего запуска в октябре 2012 года
база данных Викиданные значительно вы-
росла. Некоторые статистические факты о
ее текущем содержании показаны на
рис. 4.
Статистика Викиданных сгенери-
рована внешним приложением, в данном
случае SQID (https://tools.wmflabs.org/
sqid/#/status). Внешние инструменты
программы, которые запускаются не на
серверах Викиданных, а на сторонних
серверах. Большинство из них полезны
для извлечения данных, предоставляемых
Викиданными [4–5].
1.6. Примеры использования Ви-
киданных сторонними приложениями.
Информация, собранная в Викиданных
интересна в своем собственном виде, по-
этому для более удобного и эффективного
доступа к ней могут быть построены мно-
гие внешние приложения. Например, при-
ложения общего просмотра данных, такие
как на рис. 5. Здесь страница Иоганн Се-
бастьян Бах автоматически сгенерирована
на основе данных, что были извлечены из
Викиданных. Или инструменты специаль-
ного назначения, например, древо жизни,
таблицы элементов, а также различные
инструменты для отображения.
Приложения могут использовать
API Викиданных для просмотра, запроса
и даже редактирования данных. Если не
достаточно возможностей простых запро-
сов, то в таком случае требуется локаль-
ная копия базы Викиданных.
Рис. 4. Статистика базы данных Викиданные
Експертні та інтелектуальні інформаційні системи
76
Рис. 5. Викиданные во внешних приложениях: "Резонатор" программа просмотра данных
2. Сервис запросов к Викиданным
Wikidata Query Service (WDQS)
представляет собой пакет программного
обеспечения и публичный сервис8, предна-
значенный для выполнения SPARQL-
запросов, позволяющий запрашивать дан-
ные из базы данных Викиданные. Время
выполнения каждого запроса ограничено
30 секундами. Это справедливо как для
графического интерфейса пользователя
(GUI), так и публичной точки доступа
SPARQL.
2.1. Набор данных. Сервис запро-
сов к Викиданным работает на множестве
данных из wikidata.org, представленных в
8 http://query.wikidata.org/
RDF. Предоставляется возможность ска-
чать еженедельную копию всех данных9,
представленных в Викиданные.
2.2. Семантическая тройка
"Предмет Предикат Объект" извест-
на как тройка или как утверждение о дан-
ных. Утверждение "Небо имеет голубой
цвет", состоит из предмета "небо", преди-
ката "имеет цвет" и объекта "голубой".
Тройка также используется в качестве
формы основной синтаксической схемы
запросов в WDQS. Допускается расширен-
ное использование троек, в том числе с ис-
пользованием троек в качестве объектов
или предметов других троек.
9 https://dumps.wikimedia.org/wikidatawiki/entities/
http://query.wikidata.org/
https://dumps.wikimedia.org/wikidatawiki/entities/
Експертні та інтелектуальні інформаційні системи
77
2.3. Графический интерфейс
пользователя. Домашняя страница GUI
позволяет редактировать и передавать
SPARQL-запросы механизму выполнения
запросов, результаты которых отобража-
ются в виде таблицы HTML. Каждый за-
прос имеет уникальный URL, который
может быть закладкой для последующего
использования. Переход к этому URL
вносит запрос в окно редактирования, но
без его выполнения (для его выполнения
нужно нажать кнопку "Выполнить").
Можно также генерировать корот-
кий URL для текущего запроса через сер-
вис укорачивания URL, выбрав опцию
Short URL to result на ссылке Link справа.
Также по этой ссылке имеется еще две
полезные опции: SPARQL-endpoint (точка
доступа SPARQL), по которой можно по-
лучить результирующий XML-файл те-
кущего запроса и Embed result (встроить
результат), когда по полученному коду
результат текущего запроса можно непо-
средственно вставлять в вики-разметку
вновь создаваемых или редактируемых
страниц приложений.
Кнопка "Добавить префиксы" фор-
мирует заголовок, содержащий стандарт-
ные префиксы для SPARQL-запросов.
Полный список полезных префиксов ука-
зан в документации о формате RDF10.
Наиболее распространенные префиксы
работают в автоматическом режиме.
GUI также имеет простой механизм
более детального анализа сущности, кото-
рый может быть активирован, нажав на
символ перед сущностью в резуль-
тирующей таблице (рис. 6). Щелчок на
идентификаторе Q-ID сущности приводит
к обращению на страницу самой сущно-
сти в wikidata.org.
При выполнении запроса WDQS в
GUI можно выбрать вид представления
его результатов, указав в начале запроса
комментарий: #defaultView:viewName. Ре-
зультаты запросов могут быть представ-
лены в виде таблицы, карты, сетки изоб-
ражений, временной шкалы, графа, ли-
нейной диаграммы, гистограммы, точеч-
ной диаграммы.
10 RDF format documentation
Рис. 6. Просмотр свойств, установленных
для сущности с идентификатором
Q2906022
2.4. Точка доступа SPARQL (API).
SPARQL запросы могут быть переданы
непосредственно в точку доступа SPARQL
запросом GET к https://query.wikidata.
org/sparql ?query=SPARQL (POST и другие
методы запросов запрещены). Результат
возвращается в виде XML по умолчанию,
или как JSON, если установлен либо пара-
метр запроса format=json, либо заголовок
Accept: application/sparql-results+json. Фор-
мат JSON является стандартным11. В
настоящее время точкой доступа SPARQL
поддерживаются следующие форматы вы-
вода результата запросов: XML, JSON,
TSV, CSV, бинарный RDF.
2.5. Автономный сервис. Посколь-
ку представляемый сервис запросов
программа с открытым исходным кодом,
его можно запустить на сервере любого
пользователя, используя инструкции12.
2.6. Примеры выполнения
SPARQL-запросов в WDQS. В документа-
ции13 приводится множество примеров
11 SPARQL 1.1 Query Results JSON Format
12
https://www.mediawiki.org/wiki/Wikidata_query_servi
ce/User_Manual#Standalone_service
13
https://www.wikidata.org/wiki/Wikidata:SPARQL_que
ry_service/queries/examples
https://www.mediawiki.org/wiki/Wikibase/Indexing/RDF_Dump_Format#Full_list_of_prefixes
https://www.w3.org/TR/sparql11-results-json/
https://www.mediawiki.org/wiki/Wikidata_query_service/
https://www.mediawiki.org/wiki/Wikidata_query_service/
https://www.wikidata.org/wiki/Wikidata:SPARQL_query_service/queries/examples
https://www.wikidata.org/wiki/Wikidata:SPARQL_query_service/queries/examples
Експертні та інтелектуальні інформаційні системи
78
SPARQL-запросов со ссылками на их вы-
полнение в представляемом сервисе WDQS.
Мы рассказали, как создавать и
отображать запросы к Викиданным в сер-
висе WDQS. Далее будем встраивать за-
просы и их результаты в разметку страниц
создаваемых энциклопедических статей.
Для этого можно воспользоваться одним
из расширений программной системы
MediaWiki, на основе которой строится
наш энциклопедический сайт –
ExternalData (https://www.mediawiki.org/
wiki/Extension:External_Data).
Расширение ExternalData позволяет
использовать и отображать значения, из-
влеченные из различных источников:
внешних URL-адресов, локальных вики-
страниц и локальных файлов.
3. Процедура создания
страницы-списка
Рассмотрим процедуру создания
страницы-списка "Музыканты, родившие-
ся в Украине" на примере одноименного
запроса (http://tinyurl.com/zmz8g27) к Ви-
киданным.
Шаг 1. Формулировка запроса на
языке SPARQL (рис. 7).
Рис. 7. Запрос "Музыканты, родившиеся в Украине" на языке SPARQL
Шаг 2. Проверка и отладка запроса в сервисе WDQS (рис. 8).
Рис. 8. Выполнение запроса "Музыканты, родившиеся в Украине" в сервисе WDQS
https://www.mediawiki.org/%20wiki/Extension:External_Data
https://www.mediawiki.org/%20wiki/Extension:External_Data
http://tinyurl.com/zmz8g27
Експертні та інтелектуальні інформаційні системи
79
Шаг 3. URL Decoder/Encoder. Да-
лее отлаженный текст запроса нужно за-
кодировать. Существует как минимум два
варианта выполнения этой операции. В
окне результата WDQS, во всплывающем
списке Link выбрать опцию Embed
result и в появившемся окне выбираем за-
кодированный код данного запроса. Либо,
используя сторонний инструмент, напри-
мер (http://meyerweb.com/eric/tools/den-
coder/).
Шаг 4. Получение результата в
виде XML-файла. Выбрав опцию
SPARQL-endpoint (точка доступа
PARQL) на ссылке Link справа в окне ре-
зультата запроса сервиса WDQS получа-
ем ответ в отдельном XML-файле. Фраг-
мент полученного файла показан на
рис. 9.
Шаг 5. Задание функции
#get_web_data расширения ExternalData.
Расписываем составляющие функции
#get_web_data для данного примера и вно-
сим в вики-разметку создаваемой страни-
цы "Музыканты, родившиеся в Украине"
(рис. 10).
Рис. 9. Фрагмент результата запроса в виде XML-файла
http://meyerweb.com/eric/tools/den%1fcoder/
http://meyerweb.com/eric/tools/den%1fcoder/
Експертні та інтелектуальні інформаційні системи
80
{{#get_web_data:url=https://query.wikidata.org
/sparql?query=SELECT%20DISTINCT%20%3Flabel
%20%3Fsubj%20%3FplaceLabel%20(year(%3Fdat
eOfBirth)%20as%20%3FyearOfBirth)%20%20(coal
esce(year(%3FdateOfDeath)%2C%20%27_%27)%
20as%20%3FyearOfDeath)%20%3Fpic%20%20W
HERE%20%7B%0A%20%20%20%3Fsubj%20wdt
%3AP106%20wd%3AQ639669%20.%0A%20%20
%20%3Fsubj%20wdt%3AP19%20%3Fplace%20.%
0A%20%20%20%3Fsubj%20wdt%3AP569%20%3
FdateOfBirth.%0A%20%20%20%3Fsubj%20wdt%
3AP570%20%3FdateOfDeath.%0A%20%20%20%
3Fsubj%20wdt%3AP18%20%3Fpic.%20%0A%20
%20%20%3Fplace%20wdt%3AP17%20wd%3AQ2
12%20.%0A%20%20%20%3Fsubj%20rdfs%3Alab
el%20%3Flabel%20filter%20(lang(%3Flabel)%20
%3D%20%22ru%22)%0A%20%20%20%20%20%
20%20%20%20%0A%20SERVICE%20wikibase%3
Alabel%20%7B%0A%20%20bd%3AserviceParam
%20wikibase%3Alanguage%20%22ru%22%20.%0
A%20%7D%0A%7D%20ORDER%20BY%20ASC(%
3Flabel)limit%20343&format=xml
|format=xml
|use xpath
|data=name=//binding[@name='label']/literal,item
=//binding[@name='subj']/uri,place=//binding[@n
ame='placeLabel']/literal,yearOfBirth=//binding[@n
ame='yearOfBirth']/literal,yearOfDeath=//binding[
@name='yearOfDeath']/literal,pic=//binding[@nam
e='pic']/uri}}
Рис. 10. Пример задания функции
#get_web_data в вики-разметке
Шаг 6. Отображение таблицы
значений, задание функции #for_exter-
nal_table расширения ExternalData. До-
бавляем в вики-разметку создаваемой
страницы следующий фрагмент, содержа-
щий описание заглавия таблицы результа-
та и имена внешних переменных (рис. 11).
{| class="wikitable"
! Имя
! URI
! Место рождения
! Годы жизни
! Фото
{{#for_external_table:<nowiki/>
{{!}}-
{{!}} {{{name}}}
{{!}} {{{item}}}
{{!}} {{{place}}}
{{!}} {{{yearOfBirth}}}-{{{yearOfDeath}}}
{{!}} <img src={{{pic}}} width=200px>
}}
Рис. 11. Пример задания функции
#for_external_table в вики-разметке
Сохраняем его и переходим в ре-
жим просмотра этой страницы14. Все дан-
ные таблицы получены из Википедии и
сопутствующих проектов. Далее показан
внешний вид страницы "Музыканты, ро-
дившиеся в Украине", рис. 12.
Рис. 12. Просмотр страницы
14 http://sew.isofts.kiev.ua/index.php/Музыканты,_
родившиеся_в_Украине
http://sew.isofts.kiev.ua/index.php/Музыканты,_%20родившиеся_в_Украине
http://sew.isofts.kiev.ua/index.php/Музыканты,_%20родившиеся_в_Украине
Експертні та інтелектуальні інформаційні системи
81
Аналогичным образом можно со-
здать страницы-списки "Поэты, родивши-
еся в Украине", "Писатели, родившиеся в
Украине" или страницы включающие дру-
гие подобные запросы.
Выводы
База Викиданные, её содержание и
основное программное обеспечение нахо-
дятся в стадии постоянного развития, ис-
ход которого трудно предвидеть. Учиты-
вая важную роль, которую играет база Ви-
киданные для Википедии, можно быть
уверенным в том, что этот проект будет
продолжать расти по размеру и качеству.
Многие захватывающие возможности ис-
пользования этих данных еще предстоит
исследовать.
1. Denny Vrandeciˇ, Markus Krötzsch Wiki-
data: A Free Collaborative Knowledgebase.
In. Proc. CACM-2014 – Communications of
the ACM. October 2014. Vol. 57, N 10.
P. 78–85. http://korrekt.org/papers/Wikidata-
CACM-2014.pdf
2. Peter Buneman, James Cheney, Wang-Chiew
Tan, Stijn Vansummeren. Curated databases.
In Maurizio Lenzerini and Domenico Lembo,
editors. In Proc. 27th Symposium on
Principles of Database Systems. PODS’09.
P. 1–12. http://citeseerx.ist.psu.edu/viewdoc/
download;jses sionid=9A9267DB6C3139BA
98E3C309E5DFA81F?doi=10.1.1.168.2515&
rep=rep1&type=pdf
3. Fredo Erxleben, Michael Günther, Markus
Krötzsch, Julian Mendez and Denny
Vrandeciˇ Introducing Wikidata to the Linked
Data Web. In Proc. The Semantic Web –
ISWC 2014. Lecture Notes in Computer
Science. Vol. 8796. P. 50–65.
http://korrekt.org/papers/Wikidata-RDF-
export-2014.pdf
4. Lucie-Aimée Kaffee Generating Article Place-
holders from Wikidata for Wikipedia: Increas-
ing Access to Free and Open Knowledge.
HTW Berlin University of Applied Sciences.
International Media and Computing Faculty
IV. A thesis for the degree of Bachelor of
Science. March 4, 2016. 62 p.
https://upload.wikimedia.org/wikipedia/comm
ons/9/99/Generating_Article_Placeholders_fr
om_Wikidata_for_Wikipedia_-_Increasing_
Access_to_Free_and_Open_Knowledge.pdf
5. Jakob Voß Classification of Knowledge
Organization Systems with Wikidata. In Proc.
15th European Networked Knowledge
Organization Systems Workshop. NKOS
2016. Hannover. September 9, 2016. Vol.
1676. P. 15–22.
http://ceur-ws.org/Vol-1676/paper2.pdf
References
1. Denny Vrandeciˇ, Markus Krötzsch Wiki-
data: A Free Collaborative Knowledgebase.
In. Proc. CACM-2014 – Communications of
the ACM. October 2014. Vol. 57, N 10.
P. 78–85. http://korrekt.org/papers/Wikidata-
CACM-2014.pdf
2. Peter Buneman, James Cheney, Wang-Chiew
Tan, Stijn Vansummeren. Curated databases.
In Maurizio Lenzerini and Domenico Lembo,
editors. In Proc. 27th Symposium on Princi-
ples of Database Systems. PODS’09.
P. 1–12. http://citeseerx.ist.psu.edu/viewdoc/
download;jses sionid=9A9267DB6C3139BA
98E3C309E5DFA81F?doi=10.1.1.168.2515&
rep=rep1&type=pdf
3. Fredo Erxleben, Michael Günther, Markus
Krötzsch, Julian Mendez and Denny
Vrandeciˇ Introducing Wikidata to the Linked
Data Web. In Proc. The Semantic Web –
ISWC 2014. Lecture Notes in Computer Sci-
ence. Vol. 8796. P. 50–65.
http://korrekt.org/papers/Wikidata-RDF-
export-2014.pdf
4. Lucie-Aimée Kaffee Generating Article
Placeholders from Wikidata for Wikipedia:
Increasing Access to Free and Open
Knowledge. HTW Berlin University of Ap-
plied Sciences. International Media and Com-
puting Faculty IV. A thesis for the degree of
Bachelor of Science. March 4, 2016. 62 p.
https://upload.wikimedia.org/wikipedia/comm
ons/9/99/Generating_Article_Placeholders_fr
om_Wikidata_for_Wikipedia_-_Increasing_
Access_to_Free_and_Open_Knowledge.pdf
5. Jakob Voß Classification of Knowledge Or-
ganization Systems with Wikidata. In Proc.
http://korrekt.org/papers/Wikidata-CACM-2014.pdf
http://korrekt.org/papers/Wikidata-CACM-2014.pdf
http://citeseerx.ist.psu.edu/viewdoc/%20download;jses%20sionid=9A9267DB6C3139BA%2098E3C309E5DFA81F?doi=10.1.1.168.2515&rep=rep1&type=pdf
http://citeseerx.ist.psu.edu/viewdoc/%20download;jses%20sionid=9A9267DB6C3139BA%2098E3C309E5DFA81F?doi=10.1.1.168.2515&rep=rep1&type=pdf
http://citeseerx.ist.psu.edu/viewdoc/%20download;jses%20sionid=9A9267DB6C3139BA%2098E3C309E5DFA81F?doi=10.1.1.168.2515&rep=rep1&type=pdf
http://citeseerx.ist.psu.edu/viewdoc/%20download;jses%20sionid=9A9267DB6C3139BA%2098E3C309E5DFA81F?doi=10.1.1.168.2515&rep=rep1&type=pdf
http://korrekt.org/papers/Wikidata-RDF-export-2014.pdf
http://korrekt.org/papers/Wikidata-RDF-export-2014.pdf
https://upload.wikimedia.org/wikipedia/commons/9/99/Generating_Article_Placeholders_from_Wikidata_for_Wikipedia_-_Increasing_
https://upload.wikimedia.org/wikipedia/commons/9/99/Generating_Article_Placeholders_from_Wikidata_for_Wikipedia_-_Increasing_
https://upload.wikimedia.org/wikipedia/commons/9/99/Generating_Article_Placeholders_from_Wikidata_for_Wikipedia_-_Increasing_
http://ceur-ws.org/Vol-1676/paper2.pdf
http://korrekt.org/papers/Wikidata-CACM-2014.pdf
http://korrekt.org/papers/Wikidata-CACM-2014.pdf
http://citeseerx.ist.psu.edu/viewdoc/%20download;jses%20sionid=9A9267DB6C3139BA%2098E3C309E5DFA81F?doi=10.1.1.168.2515&rep=rep1&type=pdf
http://citeseerx.ist.psu.edu/viewdoc/%20download;jses%20sionid=9A9267DB6C3139BA%2098E3C309E5DFA81F?doi=10.1.1.168.2515&rep=rep1&type=pdf
http://citeseerx.ist.psu.edu/viewdoc/%20download;jses%20sionid=9A9267DB6C3139BA%2098E3C309E5DFA81F?doi=10.1.1.168.2515&rep=rep1&type=pdf
http://citeseerx.ist.psu.edu/viewdoc/%20download;jses%20sionid=9A9267DB6C3139BA%2098E3C309E5DFA81F?doi=10.1.1.168.2515&rep=rep1&type=pdf
http://korrekt.org/papers/Wikidata-RDF-export-2014.pdf
http://korrekt.org/papers/Wikidata-RDF-export-2014.pdf
https://upload.wikimedia.org/wikipedia/commons/9/99/Generating_Article_Placeholders_from_Wikidata_for_Wikipedia_-_Increasing_
https://upload.wikimedia.org/wikipedia/commons/9/99/Generating_Article_Placeholders_from_Wikidata_for_Wikipedia_-_Increasing_
https://upload.wikimedia.org/wikipedia/commons/9/99/Generating_Article_Placeholders_from_Wikidata_for_Wikipedia_-_Increasing_
Експертні та інтелектуальні інформаційні системи
82
15th European Networked Knowledge Organ-
ization Systems Workshop. NKOS 2016.
Hannover. September 9, 2016. Vol. 1676.
P. 15–22.
http://ceur-ws.org/Vol-1676/paper2.pdf
Получено 10.01.2017
Об авторах:
Проскудина Галина Юрьевна,
научный сотрудник,
Количество научных публикаций в
украинских изданиях – 28.
Количество научных публикаций в
зарубежных изданиях – 15.
http://orcid.org/0000-0001-9094-1565.
Кудим Кузьма Алексеевич,
младший научный сотрудник,
Количество научных публикаций в
украинских изданиях – 12.
Количество научных публикаций в
зарубежных изданиях – 7.
http://orcid.org/0000-0001-9483-5495.
Место работы авторов:
Институт программных систем
НАН Украины,
03187, Киев-187,
проспект Академика Глушкова, 40.
Тел.: +38(044)526 6033.
Е-mail: gupros@isofts.kiev.ua,
kuzma@isofts.kiev.ua
http://ceur-ws.org/Vol-1676/paper2.pdf
|