Метод побудови текстового шаблону для екстракції інформації зі слабоструктурованих даних

80% світових даних є неструктурованими або слабоструктурованими. У зв’язку з цим, актуальною є проблема екстракції інформації та її подальше збереження у зручній для опрацювання формі. Для зручності екстракції даних у роботі запропоновано використання текстових шаблонів на основі словника ключових с...

Повний опис

Збережено в:
Бібліографічні деталі
Опубліковано в: :Штучний інтелект
Дата:2017
Автори: Шаховська, Н.Б, Швороб, І.Б.
Формат: Стаття
Мова:Українська
Опубліковано: Інститут проблем штучного інтелекту МОН України та НАН України 2017
Теми:
Онлайн доступ:https://nasplib.isofts.kiev.ua/handle/123456789/133664
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Метод побудови текстового шаблону для екстракції інформації зі слабоструктурованих даних / Н.Б. Шаховська, І.Б. Швороб // Штучний інтелект. — 2017. — № 2. — С. 60-69. — Бібліогр.: 6 назв. — укр.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1862528792035065856
author Шаховська, Н.Б
Швороб, І.Б.
author_facet Шаховська, Н.Б
Швороб, І.Б.
citation_txt Метод побудови текстового шаблону для екстракції інформації зі слабоструктурованих даних / Н.Б. Шаховська, І.Б. Швороб // Штучний інтелект. — 2017. — № 2. — С. 60-69. — Бібліогр.: 6 назв. — укр.
collection DSpace DC
container_title Штучний інтелект
description 80% світових даних є неструктурованими або слабоструктурованими. У зв’язку з цим, актуальною є проблема екстракції інформації та її подальше збереження у зручній для опрацювання формі. Для зручності екстракції даних у роботі запропоновано використання текстових шаблонів на основі словника ключових слів. Основною метою є розроблення методу виділення складових елементів для побудови текстового шаблону, а також розроблення методу кластеризації текстового шаблону. Проведено аналіз розроблених методів на прикладі роботи бібліотечної системи. 80% of world data is unstructured or semistructured. In this regard, the main task is the problem of extraction of information and its further preservation in a form suitable for processing. For the convenience of data extraction, we suggest using text templates based on the dictionary of keywords. The main goal is to develop a method for selecting component elements for constructing a text template, as well as developing a method for clustering a text template. The analysis of the developed methods on the example of work of the library system is carried out.
first_indexed 2025-11-24T02:32:25Z
format Article
fulltext
id nasplib_isofts_kiev_ua-123456789-133664
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 1561-5359
language Ukrainian
last_indexed 2025-11-24T02:32:25Z
publishDate 2017
publisher Інститут проблем штучного інтелекту МОН України та НАН України
record_format dspace
spelling Шаховська, Н.Б
Швороб, І.Б.
2018-06-04T19:11:08Z
2018-06-04T19:11:08Z
2017
Метод побудови текстового шаблону для екстракції інформації зі слабоструктурованих даних / Н.Б. Шаховська, І.Б. Швороб // Штучний інтелект. — 2017. — № 2. — С. 60-69. — Бібліогр.: 6 назв. — укр.
1561-5359
https://nasplib.isofts.kiev.ua/handle/123456789/133664
004.9:371.261
80% світових даних є неструктурованими або слабоструктурованими. У зв’язку з цим, актуальною є проблема екстракції інформації та її подальше збереження у зручній для опрацювання формі. Для зручності екстракції даних у роботі запропоновано використання текстових шаблонів на основі словника ключових слів. Основною метою є розроблення методу виділення складових елементів для побудови текстового шаблону, а також розроблення методу кластеризації текстового шаблону. Проведено аналіз розроблених методів на прикладі роботи бібліотечної системи.
80% of world data is unstructured or semistructured. In this regard, the main task is the problem of extraction of information and its further preservation in a form suitable for processing. For the convenience of data extraction, we suggest using text templates based on the dictionary of keywords. The main goal is to develop a method for selecting component elements for constructing a text template, as well as developing a method for clustering a text template. The analysis of the developed methods on the example of work of the library system is carried out.
uk
Інститут проблем штучного інтелекту МОН України та НАН України
Штучний інтелект
Системи розпізнавання і сприйняття образів
Метод побудови текстового шаблону для екстракції інформації зі слабоструктурованих даних
Method of constructing a text template for extracting information from semistructured data
Article
published earlier
spellingShingle Метод побудови текстового шаблону для екстракції інформації зі слабоструктурованих даних
Шаховська, Н.Б
Швороб, І.Б.
Системи розпізнавання і сприйняття образів
title Метод побудови текстового шаблону для екстракції інформації зі слабоструктурованих даних
title_alt Method of constructing a text template for extracting information from semistructured data
title_full Метод побудови текстового шаблону для екстракції інформації зі слабоструктурованих даних
title_fullStr Метод побудови текстового шаблону для екстракції інформації зі слабоструктурованих даних
title_full_unstemmed Метод побудови текстового шаблону для екстракції інформації зі слабоструктурованих даних
title_short Метод побудови текстового шаблону для екстракції інформації зі слабоструктурованих даних
title_sort метод побудови текстового шаблону для екстракції інформації зі слабоструктурованих даних
topic Системи розпізнавання і сприйняття образів
topic_facet Системи розпізнавання і сприйняття образів
url https://nasplib.isofts.kiev.ua/handle/123456789/133664
work_keys_str_mv AT šahovsʹkanb metodpobudovitekstovogošablonudlâekstrakcííínformacíízíslabostrukturovanihdanih
AT švorobíb metodpobudovitekstovogošablonudlâekstrakcííínformacíízíslabostrukturovanihdanih
AT šahovsʹkanb methodofconstructingatexttemplateforextractinginformationfromsemistructureddata
AT švorobíb methodofconstructingatexttemplateforextractinginformationfromsemistructureddata