2025-02-22T16:07:47-05:00 DEBUG: VuFindSearch\Backend\Solr\Connector: Query fl=%2A&wt=json&json.nl=arrarr&q=id%3A%22irk-123456789-150922%22&qt=morelikethis&rows=5
2025-02-22T16:07:47-05:00 DEBUG: VuFindSearch\Backend\Solr\Connector: => GET http://localhost:8983/solr/biblio/select?fl=%2A&wt=json&json.nl=arrarr&q=id%3A%22irk-123456789-150922%22&qt=morelikethis&rows=5
2025-02-22T16:07:47-05:00 DEBUG: VuFindSearch\Backend\Solr\Connector: <= 200 OK
2025-02-22T16:07:47-05:00 DEBUG: Deserialized SOLR response
Засоби та методи аналізу неструктурованих даних
Проаналізовано сучасні засоби аналізу неструктурованих даних (НСД) та вплив Big Data на актуальність цього напрямку досліджень. Розглянуто перспективи використання фонових знань для такого структурування. Обґрунтовано доцільність застосування для цього таких стандартів W3C, як RDF та OWL. Викорис...
Saved in:
Main Author: | |
---|---|
Format: | Article |
Language: | Ukrainian |
Published: |
Інститут програмних систем НАН України
2019
|
Series: | Проблеми програмування |
Subjects: | |
Online Access: | http://dspace.nbuv.gov.ua/handle/123456789/150922 |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
id |
irk-123456789-150922 |
---|---|
record_format |
dspace |
spelling |
irk-123456789-1509222019-04-19T01:25:04Z Засоби та методи аналізу неструктурованих даних Рогушина, Ю.В. Моделі та засоби систем баз даних і знань Проаналізовано сучасні засоби аналізу неструктурованих даних (НСД) та вплив Big Data на актуальність цього напрямку досліджень. Розглянуто перспективи використання фонових знань для такого структурування. Обґрунтовано доцільність застосування для цього таких стандартів W3C, як RDF та OWL. Використання семантичних Wiki-технологій для створення розподілених інформаційних ресурсів не тільки дозволяє досить легко додавати структурування до НСД, але й є джерелом фонових знань для аналізу довільних природномовних текстів відповідної предметної області. Запропоновані в роботі моделі та методи дозволяють вдосконалити процес генерації таких знань. Проанализированы современные средства анализа неструктурированных данных и влияние Big Data на актуальность этого направления исследований. Рассмотрены перспективы использования фоновых знаний для такого структурирования. Обоснована целесообразность применения для этого таких стандартов W3C, как RDF и OWL. Использование семантических Wiki-технологий для создания распределенных информационных ресурсов не только позволяет довольно легко добавлять структурирование к НСД, но и является источником фоновых знаний для анализа произвольных естественноязыковых текстов соответствующей предметной области. Предложенные в работе модели и методы позволяют усовершенствовать процесс генерации таких знаний. Analysis of the current trends in the unstructured text data wide usage and the development of software tools for their processing causes the high urgency of this research direction and the necessity of intelligent information systems in such processing. A signigicant part of Big Data consists of unstructured texts that require the further development of specific Text Mining and algorythms of machine learning. Unstructured data consisting of natural language text in the general case, do not have a predetermined data model. Their ambiguity, heterogeneity and context dependence considerably complicate the classification of documents, the identification of their components and the automated obtaining of user-oriented knowledge from their content, while the large volumes and dynamism of such data do not involve efficient manual processing. The means and methods of data structuring, their various software implementations are considered. The prospects of using background knowledge for such structuring are analyzed. The feasibility of application such W3C standards as RDF and OWL is substantiated. The use of semantic Wiki-technologies for development of distributed information resources simplifies the process of natural text structuring by users and also generates the source of background knowledge for the analysis of arbitrary texts of the corresponding domains. The models and methods proposed in the work allow to improve this process. 2019 Article Засоби та методи аналізу неструктурованих даних / Ю.В. Рогушина // Проблеми програмування. — 2019. — № 1. — С. 57-77. — Бібліогр.: 25 назв. — укр. 1727-4907 DOI: https://doi.org/10.15407/pp2019.01.057 http://dspace.nbuv.gov.ua/handle/123456789/150922 004.853, 004.55 uk Проблеми програмування Інститут програмних систем НАН України |
institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
collection |
DSpace DC |
language |
Ukrainian |
topic |
Моделі та засоби систем баз даних і знань Моделі та засоби систем баз даних і знань |
spellingShingle |
Моделі та засоби систем баз даних і знань Моделі та засоби систем баз даних і знань Рогушина, Ю.В. Засоби та методи аналізу неструктурованих даних Проблеми програмування |
description |
Проаналізовано сучасні засоби аналізу неструктурованих даних (НСД) та вплив Big Data на актуальність цього напрямку досліджень. Розглянуто перспективи використання фонових знань для такого структурування. Обґрунтовано доцільність застосування для цього таких стандартів W3C, як RDF та OWL. Використання семантичних Wiki-технологій для створення розподілених інформаційних ресурсів не тільки дозволяє досить легко додавати структурування до НСД, але й є джерелом фонових знань для аналізу довільних природномовних текстів відповідної предметної області. Запропоновані в роботі моделі та методи дозволяють вдосконалити процес генерації таких знань. |
format |
Article |
author |
Рогушина, Ю.В. |
author_facet |
Рогушина, Ю.В. |
author_sort |
Рогушина, Ю.В. |
title |
Засоби та методи аналізу неструктурованих даних |
title_short |
Засоби та методи аналізу неструктурованих даних |
title_full |
Засоби та методи аналізу неструктурованих даних |
title_fullStr |
Засоби та методи аналізу неструктурованих даних |
title_full_unstemmed |
Засоби та методи аналізу неструктурованих даних |
title_sort |
засоби та методи аналізу неструктурованих даних |
publisher |
Інститут програмних систем НАН України |
publishDate |
2019 |
topic_facet |
Моделі та засоби систем баз даних і знань |
url |
http://dspace.nbuv.gov.ua/handle/123456789/150922 |
citation_txt |
Засоби та методи аналізу неструктурованих даних / Ю.В. Рогушина // Проблеми програмування. — 2019. — № 1. — С. 57-77. — Бібліогр.: 25 назв. — укр. |
series |
Проблеми програмування |
work_keys_str_mv |
AT rogušinaûv zasobitametodianalízunestrukturovanihdanih |
first_indexed |
2023-05-20T17:36:02Z |
last_indexed |
2023-05-20T17:36:02Z |
_version_ |
1796153662747181056 |