2025-02-22T16:07:47-05:00 DEBUG: VuFindSearch\Backend\Solr\Connector: Query fl=%2A&wt=json&json.nl=arrarr&q=id%3A%22irk-123456789-150922%22&qt=morelikethis&rows=5
2025-02-22T16:07:47-05:00 DEBUG: VuFindSearch\Backend\Solr\Connector: => GET http://localhost:8983/solr/biblio/select?fl=%2A&wt=json&json.nl=arrarr&q=id%3A%22irk-123456789-150922%22&qt=morelikethis&rows=5
2025-02-22T16:07:47-05:00 DEBUG: VuFindSearch\Backend\Solr\Connector: <= 200 OK
2025-02-22T16:07:47-05:00 DEBUG: Deserialized SOLR response

Засоби та методи аналізу неструктурованих даних

Проаналізовано сучасні засоби аналізу неструктурованих даних (НСД) та вплив Big Data на актуальність цього напрямку досліджень. Розглянуто перспективи використання фонових знань для такого структурування. Обґрунтовано доцільність застосування для цього таких стандартів W3C, як RDF та OWL. Викорис...

Full description

Saved in:
Bibliographic Details
Main Author: Рогушина, Ю.В.
Format: Article
Language:Ukrainian
Published: Інститут програмних систем НАН України 2019
Series:Проблеми програмування
Subjects:
Online Access:http://dspace.nbuv.gov.ua/handle/123456789/150922
Tags: Add Tag
No Tags, Be the first to tag this record!
id irk-123456789-150922
record_format dspace
spelling irk-123456789-1509222019-04-19T01:25:04Z Засоби та методи аналізу неструктурованих даних Рогушина, Ю.В. Моделі та засоби систем баз даних і знань Проаналізовано сучасні засоби аналізу неструктурованих даних (НСД) та вплив Big Data на актуальність цього напрямку досліджень. Розглянуто перспективи використання фонових знань для такого структурування. Обґрунтовано доцільність застосування для цього таких стандартів W3C, як RDF та OWL. Використання семантичних Wiki-технологій для створення розподілених інформаційних ресурсів не тільки дозволяє досить легко додавати структурування до НСД, але й є джерелом фонових знань для аналізу довільних природномовних текстів відповідної предметної області. Запропоновані в роботі моделі та методи дозволяють вдосконалити процес генерації таких знань. Проанализированы современные средства анализа неструктурированных данных и влияние Big Data на актуальность этого направления исследований. Рассмотрены перспективы использования фоновых знаний для такого структурирования. Обоснована целесообразность применения для этого таких стандартов W3C, как RDF и OWL. Использование семантических Wiki-технологий для создания распределенных информационных ресурсов не только позволяет довольно легко добавлять структурирование к НСД, но и является источником фоновых знаний для анализа произвольных естественноязыковых текстов соответствующей предметной области. Предложенные в работе модели и методы позволяют усовершенствовать процесс генерации таких знаний. Analysis of the current trends in the unstructured text data wide usage and the development of software tools for their processing causes the high urgency of this research direction and the necessity of intelligent information systems in such processing. A signigicant part of Big Data consists of unstructured texts that require the further development of specific Text Mining and algorythms of machine learning. Unstructured data consisting of natural language text in the general case, do not have a predetermined data model. Their ambiguity, heterogeneity and context dependence considerably complicate the classification of documents, the identification of their components and the automated obtaining of user-oriented knowledge from their content, while the large volumes and dynamism of such data do not involve efficient manual processing. The means and methods of data structuring, their various software implementations are considered. The prospects of using background knowledge for such structuring are analyzed. The feasibility of application such W3C standards as RDF and OWL is substantiated. The use of semantic Wiki-technologies for development of distributed information resources simplifies the process of natural text structuring by users and also generates the source of background knowledge for the analysis of arbitrary texts of the corresponding domains. The models and methods proposed in the work allow to improve this process. 2019 Article Засоби та методи аналізу неструктурованих даних / Ю.В. Рогушина // Проблеми програмування. — 2019. — № 1. — С. 57-77. — Бібліогр.: 25 назв. — укр. 1727-4907 DOI: https://doi.org/10.15407/pp2019.01.057 http://dspace.nbuv.gov.ua/handle/123456789/150922 004.853, 004.55 uk Проблеми програмування Інститут програмних систем НАН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Ukrainian
topic Моделі та засоби систем баз даних і знань
Моделі та засоби систем баз даних і знань
spellingShingle Моделі та засоби систем баз даних і знань
Моделі та засоби систем баз даних і знань
Рогушина, Ю.В.
Засоби та методи аналізу неструктурованих даних
Проблеми програмування
description Проаналізовано сучасні засоби аналізу неструктурованих даних (НСД) та вплив Big Data на актуальність цього напрямку досліджень. Розглянуто перспективи використання фонових знань для такого структурування. Обґрунтовано доцільність застосування для цього таких стандартів W3C, як RDF та OWL. Використання семантичних Wiki-технологій для створення розподілених інформаційних ресурсів не тільки дозволяє досить легко додавати структурування до НСД, але й є джерелом фонових знань для аналізу довільних природномовних текстів відповідної предметної області. Запропоновані в роботі моделі та методи дозволяють вдосконалити процес генерації таких знань.
format Article
author Рогушина, Ю.В.
author_facet Рогушина, Ю.В.
author_sort Рогушина, Ю.В.
title Засоби та методи аналізу неструктурованих даних
title_short Засоби та методи аналізу неструктурованих даних
title_full Засоби та методи аналізу неструктурованих даних
title_fullStr Засоби та методи аналізу неструктурованих даних
title_full_unstemmed Засоби та методи аналізу неструктурованих даних
title_sort засоби та методи аналізу неструктурованих даних
publisher Інститут програмних систем НАН України
publishDate 2019
topic_facet Моделі та засоби систем баз даних і знань
url http://dspace.nbuv.gov.ua/handle/123456789/150922
citation_txt Засоби та методи аналізу неструктурованих даних / Ю.В. Рогушина // Проблеми програмування. — 2019. — № 1. — С. 57-77. — Бібліогр.: 25 назв. — укр.
series Проблеми програмування
work_keys_str_mv AT rogušinaûv zasobitametodianalízunestrukturovanihdanih
first_indexed 2023-05-20T17:36:02Z
last_indexed 2023-05-20T17:36:02Z
_version_ 1796153662747181056