Метод побудови текстового шаблону для екстракції інформації зі слабоструктурованих даних

80% світових даних є неструктурованими або слабоструктурованими. У зв’язку з цим, актуальною є проблема екстракції інформації та її подальше збереження у зручній для опрацювання формі. Для зручності екстракції даних у роботі запропоновано використання текстових шаблонів на основі словника ключових с...

Full description

Saved in:
Bibliographic Details
Date:2017
Main Authors: Шаховська, Н.Б, Швороб, І.Б.
Format: Article
Language:Ukrainian
Published: Інститут проблем штучного інтелекту МОН України та НАН України 2017
Series:Штучний інтелект
Subjects:
Tags: Add Tag
No Tags, Be the first to tag this record!
Journal Title:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Cite this:Метод побудови текстового шаблону для екстракції інформації зі слабоструктурованих даних / Н.Б. Шаховська, І.Б. Швороб // Штучний інтелект. — 2017. — № 2. — С. 60-69. — Бібліогр.: 6 назв. — укр.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id oai:nasplib.isofts.kiev.ua:123456789-133664
record_format dspace
spelling oai:nasplib.isofts.kiev.ua:123456789-1336642025-02-23T17:01:20Z Метод побудови текстового шаблону для екстракції інформації зі слабоструктурованих даних Method of constructing a text template for extracting information from semistructured data Шаховська, Н.Б Швороб, І.Б. Системи розпізнавання і сприйняття образів 80% світових даних є неструктурованими або слабоструктурованими. У зв’язку з цим, актуальною є проблема екстракції інформації та її подальше збереження у зручній для опрацювання формі. Для зручності екстракції даних у роботі запропоновано використання текстових шаблонів на основі словника ключових слів. Основною метою є розроблення методу виділення складових елементів для побудови текстового шаблону, а також розроблення методу кластеризації текстового шаблону. Проведено аналіз розроблених методів на прикладі роботи бібліотечної системи. 80% of world data is unstructured or semistructured. In this regard, the main task is the problem of extraction of information and its further preservation in a form suitable for processing. For the convenience of data extraction, we suggest using text templates based on the dictionary of keywords. The main goal is to develop a method for selecting component elements for constructing a text template, as well as developing a method for clustering a text template. The analysis of the developed methods on the example of work of the library system is carried out. 2017 Article Метод побудови текстового шаблону для екстракції інформації зі слабоструктурованих даних / Н.Б. Шаховська, І.Б. Швороб // Штучний інтелект. — 2017. — № 2. — С. 60-69. — Бібліогр.: 6 назв. — укр. 1561-5359 https://nasplib.isofts.kiev.ua/handle/123456789/133664 004.9:371.261 uk Штучний інтелект application/pdf Інститут проблем штучного інтелекту МОН України та НАН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Ukrainian
topic Системи розпізнавання і сприйняття образів
Системи розпізнавання і сприйняття образів
spellingShingle Системи розпізнавання і сприйняття образів
Системи розпізнавання і сприйняття образів
Шаховська, Н.Б
Швороб, І.Б.
Метод побудови текстового шаблону для екстракції інформації зі слабоструктурованих даних
Штучний інтелект
description 80% світових даних є неструктурованими або слабоструктурованими. У зв’язку з цим, актуальною є проблема екстракції інформації та її подальше збереження у зручній для опрацювання формі. Для зручності екстракції даних у роботі запропоновано використання текстових шаблонів на основі словника ключових слів. Основною метою є розроблення методу виділення складових елементів для побудови текстового шаблону, а також розроблення методу кластеризації текстового шаблону. Проведено аналіз розроблених методів на прикладі роботи бібліотечної системи.
format Article
author Шаховська, Н.Б
Швороб, І.Б.
author_facet Шаховська, Н.Б
Швороб, І.Б.
author_sort Шаховська, Н.Б
title Метод побудови текстового шаблону для екстракції інформації зі слабоструктурованих даних
title_short Метод побудови текстового шаблону для екстракції інформації зі слабоструктурованих даних
title_full Метод побудови текстового шаблону для екстракції інформації зі слабоструктурованих даних
title_fullStr Метод побудови текстового шаблону для екстракції інформації зі слабоструктурованих даних
title_full_unstemmed Метод побудови текстового шаблону для екстракції інформації зі слабоструктурованих даних
title_sort метод побудови текстового шаблону для екстракції інформації зі слабоструктурованих даних
publisher Інститут проблем штучного інтелекту МОН України та НАН України
publishDate 2017
topic_facet Системи розпізнавання і сприйняття образів
citation_txt Метод побудови текстового шаблону для екстракції інформації зі слабоструктурованих даних / Н.Б. Шаховська, І.Б. Швороб // Штучний інтелект. — 2017. — № 2. — С. 60-69. — Бібліогр.: 6 назв. — укр.
series Штучний інтелект
work_keys_str_mv AT šahovsʹkanb metodpobudovitekstovogošablonudlâekstrakcííínformacíízíslabostrukturovanihdanih
AT švorobíb metodpobudovitekstovogošablonudlâekstrakcííínformacíízíslabostrukturovanihdanih
AT šahovsʹkanb methodofconstructingatexttemplateforextractinginformationfromsemistructureddata
AT švorobíb methodofconstructingatexttemplateforextractinginformationfromsemistructureddata
first_indexed 2025-07-22T04:07:28Z
last_indexed 2025-07-22T04:07:28Z
_version_ 1838318615572512768