Розроблення інструментарію для аналізу текстів публічних та спеціалізованих джерел у завданнях передбачення та системного аналізу
A combined approach to extracting concepts and constructing classifiers and ontologies using open and proprietary software packages has been developed. Modern approaches, methods and models of storing large amounts of poorly structured information from Open Source software sets are studied. An ontol...
Збережено в:
Видавець: | The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" |
---|---|
Дата: | 2020 |
Автор: | |
Формат: | Стаття |
Мова: | Ukrainian |
Опубліковано: |
The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute"
2020
|
Теми: | |
Онлайн доступ: | http://journal.iasa.kpi.ua/article/view/228316 |
Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
Репозиторії
System research and information technologiesid |
journaliasakpiua-article-228316 |
---|---|
record_format |
ojs |
spelling |
journaliasakpiua-article-2283162021-04-08T14:17:06Z Development of textual analytics tools for analysis of public and specialized sources in the tasks of foresight and system analysis Разработка инструментария для анализа текстов публичных и специализированных источников в задачах предвидения и системного анализа Розроблення інструментарію для аналізу текстів публічних та спеціалізованих джерел у завданнях передбачення та системного аналізу Savastiyanov, Volodymyr системний аналіз передбачення text mining NLP класифікатори онтології OpenSource Python Gensim системный анализ предвидение text mining NLP классификаторы онтологии OpenSource Python Gensim systems analysis foresight text mining NLP classifiers ontologies Open Source Python Gensim A combined approach to extracting concepts and constructing classifiers and ontologies using open and proprietary software packages has been developed. Modern approaches, methods and models of storing large amounts of poorly structured information from Open Source software sets are studied. An ontology was built, in the leaves of which a classifier based on Boolean rules was implemented using SAS(R) Content Categorization Software. To build the ontology, the approach of constructing vectors of related concepts is employed using the Open Source library of Gensim software, namely the Word2Vec model. A typical algorithm for constructing a classifying ontology has been developed. The results of the research can be used to build an ontology of subject areas, create classification ontologies and mark corpora of texts. Разработан комбинированный подход по извлечению понятий и построения классификаторов и онтологий с помощью открытых и проприетарных пакетов программного обеспечения. Исследованы современные подходы, методы и модели хранения больших объемов слабоструктурированной информации из наборов программного обеспечения OpenSource. Построена онтология, в листьях которой реализован классификатор на булевых правилах с применением программного обеспечения SAS (R) Content Categorization Software. Для построения онтологии используется подход построения векторов близких понятий с помощью библиотеки Open Source Gensim, а именно модель Word2Vec. Разработан типовой алгоритм построения классифицирующей онтологии. Результаты исследования могут быть использованы для построения онтологий предметных областей, создания классифицирующих онтологий и разметки корпусов текстов. Розроблено комбінований підхід до вилучення понять і побудови класифікаторів та онтологій за допомогою відкритих і пропрієтарних пакетів програмного забезпечення. Досліджено сучасні підходи, методи та моделі збереження великих обсягів слабко структурованої інформації з наборів програмного забезпечення OpenSource. Побудовано онтологію, у листях якої реалізовано класифікатор на булевих правилах із застосуванням програмного забезпечення SAS(R) Content Categorization Software. Для побудови онтології використано підхід до побудови векторів близьких понять за допомогою бібліотеки OpenSource програмного забезпечення Gensim — модель Word2Vec. Розроблено типовий алгоритм щодо побудови класифікуючої онтології. Результати дослідження можуть бути використані для побудови онтології предметних галузей, створення класифікуючих онтологій та розмічення корпусів текстів. The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2020-12-29 Article Article application/pdf http://journal.iasa.kpi.ua/article/view/228316 10.20535/SRIT.2308-8893.2020.4.02 System research and information technologies; No. 4 (2020); 15-28 Системные исследования и информационные технологии; № 4 (2020); 15-28 Системні дослідження та інформаційні технології; № 4 (2020); 15-28 2308-8893 1681-6048 uk http://journal.iasa.kpi.ua/article/view/228316/227443 |
institution |
System research and information technologies |
collection |
OJS |
language |
Ukrainian |
topic |
системний аналіз передбачення text mining NLP класифікатори онтології OpenSource Python Gensim системный анализ предвидение text mining NLP классификаторы онтологии OpenSource Python Gensim systems analysis foresight text mining NLP classifiers ontologies Open Source Python Gensim |
spellingShingle |
системний аналіз передбачення text mining NLP класифікатори онтології OpenSource Python Gensim системный анализ предвидение text mining NLP классификаторы онтологии OpenSource Python Gensim systems analysis foresight text mining NLP classifiers ontologies Open Source Python Gensim Savastiyanov, Volodymyr Розроблення інструментарію для аналізу текстів публічних та спеціалізованих джерел у завданнях передбачення та системного аналізу |
topic_facet |
системний аналіз передбачення text mining NLP класифікатори онтології OpenSource Python Gensim системный анализ предвидение text mining NLP классификаторы онтологии OpenSource Python Gensim systems analysis foresight text mining NLP classifiers ontologies Open Source Python Gensim |
format |
Article |
author |
Savastiyanov, Volodymyr |
author_facet |
Savastiyanov, Volodymyr |
author_sort |
Savastiyanov, Volodymyr |
title |
Розроблення інструментарію для аналізу текстів публічних та спеціалізованих джерел у завданнях передбачення та системного аналізу |
title_short |
Розроблення інструментарію для аналізу текстів публічних та спеціалізованих джерел у завданнях передбачення та системного аналізу |
title_full |
Розроблення інструментарію для аналізу текстів публічних та спеціалізованих джерел у завданнях передбачення та системного аналізу |
title_fullStr |
Розроблення інструментарію для аналізу текстів публічних та спеціалізованих джерел у завданнях передбачення та системного аналізу |
title_full_unstemmed |
Розроблення інструментарію для аналізу текстів публічних та спеціалізованих джерел у завданнях передбачення та системного аналізу |
title_sort |
розроблення інструментарію для аналізу текстів публічних та спеціалізованих джерел у завданнях передбачення та системного аналізу |
title_alt |
Development of textual analytics tools for analysis of public and specialized sources in the tasks of foresight and system analysis Разработка инструментария для анализа текстов публичных и специализированных источников в задачах предвидения и системного анализа |
description |
A combined approach to extracting concepts and constructing classifiers and ontologies using open and proprietary software packages has been developed. Modern approaches, methods and models of storing large amounts of poorly structured information from Open Source software sets are studied. An ontology was built, in the leaves of which a classifier based on Boolean rules was implemented using SAS(R) Content Categorization Software. To build the ontology, the approach of constructing vectors of related concepts is employed using the Open Source library of Gensim software, namely the Word2Vec model. A typical algorithm for constructing a classifying ontology has been developed. The results of the research can be used to build an ontology of subject areas, create classification ontologies and mark corpora of texts. |
publisher |
The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" |
publishDate |
2020 |
url |
http://journal.iasa.kpi.ua/article/view/228316 |
work_keys_str_mv |
AT savastiyanovvolodymyr developmentoftextualanalyticstoolsforanalysisofpublicandspecializedsourcesinthetasksofforesightandsystemanalysis AT savastiyanovvolodymyr razrabotkainstrumentariâdlâanalizatekstovpubličnyhispecializirovannyhistočnikovvzadačahpredvideniâisistemnogoanaliza AT savastiyanovvolodymyr rozroblennâínstrumentaríûdlâanalízutekstívpublíčnihtaspecíalízovanihdžereluzavdannâhperedbačennâtasistemnogoanalízu |
first_indexed |
2024-04-08T15:07:45Z |
last_indexed |
2024-04-08T15:07:45Z |
_version_ |
1795779582426611712 |