Основні аспекти семантичного анотування великих даних
Семантичні анотації, в силу своєї структурованості, є невід’ємною складовою ефективного вирішення задач великих даних. Але, сама проблема визначення семантичних анотацій є досить не тривіальною. Ручне анотування є не прийнятним для великих даних з огляду на їх розмір та різнорідність, а також трудом...
Збережено в:
Дата: | 2020 |
---|---|
Автор: | |
Формат: | Стаття |
Мова: | Ukrainian |
Опубліковано: |
Інститут програмних систем НАН України
2020
|
Назва видання: | Проблеми програмування |
Теми: | |
Онлайн доступ: | http://dspace.nbuv.gov.ua/handle/123456789/180491 |
Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
Цитувати: | Основні аспекти семантичного анотування великих даних / О.В. Захарова // Проблеми програмування. — 2020. — № 4. — С. 22-33. — Бібліогр.: 23 назв. — укр. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of UkraineРезюме: | Семантичні анотації, в силу своєї структурованості, є невід’ємною складовою ефективного вирішення задач великих даних. Але, сама проблема визначення семантичних анотацій є досить не тривіальною. Ручне анотування є не прийнятним для великих даних з огляду на їх розмір та різнорідність, а також трудомісткість та вартосність самого процесу, задача повністю автоматичного анотування для великих даних поки що не має вирішення. Тобто вирішення задачі семантичного анотування вимагає сучасних змішаних підходів, які б на основі та із застосуванням існуючого теоретичного апарату, а саме методів та моделей машинного навчання, статистичного навчання, роботи з контентами різних форматів представлення, обробки текстів природньою мовою, тощо, забезпечували вирішення основних задач анотування: виявлення та витягнення сутностей та відношень з контенту будь-якого типу та визначення семантичних анотацій за основі існуючих джерел знань (словників, онтологій, тощо). Отримані анотації повинні бути точними та забезпечувати подальшу можливість вирішення прикладних задач з анотованими даними. Слід зазначити, що контенти великих даних є дуже різноманітними, як наслідок, дуже різняться їх властивості, що підлягають анотуванню. Це вимагає різних метаданих для опису даних та обумовлює наявність великої кількості різних стандартів метаданих для даних різних типів чи форматів представлення. Але, для ефективного вирішення задачі анотування треба мати узагальнену характеристику типів метаданих, в межах якої розглядати їх специфіку. Визначення загальної класифікації метаданих та спільних аспектів та підходів до семантичного анотування контенту великих даних за їх допомогою і є метою даної роботи. |
---|