Розроблення інструментарію для аналізу текстів публічних та спеціалізованих джерел у завданнях передбачення та системного аналізу

A combined approach to extracting concepts and constructing classifiers and ontologies using open and proprietary software packages has been developed. Modern approaches, methods and models of storing large amounts of poorly structured information from Open Source software sets are studied. An ontol...

Повний опис

Збережено в:
Бібліографічні деталі
Видавець:The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute"
Дата:2020
Автор: Savastiyanov, Volodymyr
Формат: Стаття
Мова:Ukrainian
Опубліковано: The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2020
Теми:
Онлайн доступ:http://journal.iasa.kpi.ua/article/view/228316
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!

Репозиторії

System research and information technologies
id journaliasakpiua-article-228316
record_format ojs
spelling journaliasakpiua-article-2283162021-04-08T14:17:06Z Development of textual analytics tools for analysis of public and specialized sources in the tasks of foresight and system analysis Разработка инструментария для анализа текстов публичных и специализированных источников в задачах предвидения и системного анализа Розроблення інструментарію для аналізу текстів публічних та спеціалізованих джерел у завданнях передбачення та системного аналізу Savastiyanov, Volodymyr системний аналіз передбачення text mining NLP класифікатори онтології OpenSource Python Gensim системный анализ предвидение text mining NLP классификаторы онтологии OpenSource Python Gensim systems analysis foresight text mining NLP classifiers ontologies Open Source Python Gensim A combined approach to extracting concepts and constructing classifiers and ontologies using open and proprietary software packages has been developed. Modern approaches, methods and models of storing large amounts of poorly structured information from Open Source software sets are studied. An ontology was built, in the leaves of which a classifier based on Boolean rules was implemented using SAS(R) Content Categorization Software. To build the ontology, the approach of constructing vectors of related concepts is employed using the Open Source library of Gensim software, namely the Word2Vec model. A typical algorithm for constructing a classifying ontology has been developed. The results of the research can be used to build an ontology of subject areas, create classification ontologies and mark corpora of texts. Разработан комбинированный подход по извлечению понятий и построения классификаторов и онтологий с помощью открытых и проприетарных пакетов программного обеспечения. Исследованы современные подходы, методы и модели хранения больших объемов слабоструктурированной информации из наборов программного обеспечения OpenSource. Построена онтология, в листьях которой реализован классификатор на булевых правилах с применением программного обеспечения SAS (R) Content Categorization Software. Для построения онтологии используется подход построения векторов близких понятий с помощью библиотеки Open Source Gensim, а именно модель Word2Vec. Разработан типовой алгоритм построения классифицирующей онтологии. Результаты исследования могут быть использованы для построения онтологий предметных областей, создания классифицирующих онтологий и разметки корпусов текстов. Розроблено комбінований підхід до вилучення понять і побудови класифікаторів та онтологій за допомогою відкритих і пропрієтарних пакетів програмного забезпечення. Досліджено сучасні підходи, методи та моделі збереження великих обсягів слабко структурованої інформації з наборів програмного забезпечення OpenSource. Побудовано онтологію, у листях якої реалізовано класифікатор на булевих правилах із застосуванням програмного забезпечення SAS(R) Content Categorization Software. Для побудови онтології використано підхід до побудови векторів близьких понять за допомогою бібліотеки OpenSource програмного забезпечення Gensim — модель Word2Vec. Розроблено типовий алгоритм щодо побудови класифікуючої онтології. Результати дослідження можуть бути використані для побудови онтології предметних галузей, створення класифікуючих онтологій та розмічення корпусів текстів. The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2020-12-29 Article Article application/pdf http://journal.iasa.kpi.ua/article/view/228316 10.20535/SRIT.2308-8893.2020.4.02 System research and information technologies; No. 4 (2020); 15-28 Системные исследования и информационные технологии; № 4 (2020); 15-28 Системні дослідження та інформаційні технології; № 4 (2020); 15-28 2308-8893 1681-6048 uk http://journal.iasa.kpi.ua/article/view/228316/227443
institution System research and information technologies
collection OJS
language Ukrainian
topic системний аналіз
передбачення
text mining
NLP
класифікатори
онтології
OpenSource
Python
Gensim
системный анализ
предвидение
text mining
NLP
классификаторы
онтологии
OpenSource
Python
Gensim
systems analysis
foresight
text mining
NLP
classifiers
ontologies
Open Source
Python
Gensim
spellingShingle системний аналіз
передбачення
text mining
NLP
класифікатори
онтології
OpenSource
Python
Gensim
системный анализ
предвидение
text mining
NLP
классификаторы
онтологии
OpenSource
Python
Gensim
systems analysis
foresight
text mining
NLP
classifiers
ontologies
Open Source
Python
Gensim
Savastiyanov, Volodymyr
Розроблення інструментарію для аналізу текстів публічних та спеціалізованих джерел у завданнях передбачення та системного аналізу
topic_facet системний аналіз
передбачення
text mining
NLP
класифікатори
онтології
OpenSource
Python
Gensim
системный анализ
предвидение
text mining
NLP
классификаторы
онтологии
OpenSource
Python
Gensim
systems analysis
foresight
text mining
NLP
classifiers
ontologies
Open Source
Python
Gensim
format Article
author Savastiyanov, Volodymyr
author_facet Savastiyanov, Volodymyr
author_sort Savastiyanov, Volodymyr
title Розроблення інструментарію для аналізу текстів публічних та спеціалізованих джерел у завданнях передбачення та системного аналізу
title_short Розроблення інструментарію для аналізу текстів публічних та спеціалізованих джерел у завданнях передбачення та системного аналізу
title_full Розроблення інструментарію для аналізу текстів публічних та спеціалізованих джерел у завданнях передбачення та системного аналізу
title_fullStr Розроблення інструментарію для аналізу текстів публічних та спеціалізованих джерел у завданнях передбачення та системного аналізу
title_full_unstemmed Розроблення інструментарію для аналізу текстів публічних та спеціалізованих джерел у завданнях передбачення та системного аналізу
title_sort розроблення інструментарію для аналізу текстів публічних та спеціалізованих джерел у завданнях передбачення та системного аналізу
title_alt Development of textual analytics tools for analysis of public and specialized sources in the tasks of foresight and system analysis
Разработка инструментария для анализа текстов публичных и специализированных источников в задачах предвидения и системного анализа
description A combined approach to extracting concepts and constructing classifiers and ontologies using open and proprietary software packages has been developed. Modern approaches, methods and models of storing large amounts of poorly structured information from Open Source software sets are studied. An ontology was built, in the leaves of which a classifier based on Boolean rules was implemented using SAS(R) Content Categorization Software. To build the ontology, the approach of constructing vectors of related concepts is employed using the Open Source library of Gensim software, namely the Word2Vec model. A typical algorithm for constructing a classifying ontology has been developed. The results of the research can be used to build an ontology of subject areas, create classification ontologies and mark corpora of texts.
publisher The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute"
publishDate 2020
url http://journal.iasa.kpi.ua/article/view/228316
work_keys_str_mv AT savastiyanovvolodymyr developmentoftextualanalyticstoolsforanalysisofpublicandspecializedsourcesinthetasksofforesightandsystemanalysis
AT savastiyanovvolodymyr razrabotkainstrumentariâdlâanalizatekstovpubličnyhispecializirovannyhistočnikovvzadačahpredvideniâisistemnogoanaliza
AT savastiyanovvolodymyr rozroblennâínstrumentaríûdlâanalízutekstívpublíčnihtaspecíalízovanihdžereluzavdannâhperedbačennâtasistemnogoanalízu
first_indexed 2024-04-08T15:07:45Z
last_indexed 2024-04-08T15:07:45Z
_version_ 1795779582426611712