Автоматизована система формування сценарію аналітичної діяльності

Проведено дослідження щодо тенденцій інтелектуалізації програмних компонентів у сучасних аналітичних системах. Показано що однією з головних вимог до сучасних аналітичних систем є комфортність самого процесу спілкування з системою за рахунок їхньої інтелектуалізації, тобто здатність системи пропонув...

Повний опис

Збережено в:
Бібліографічні деталі
Опубліковано в: :Реєстрація, зберігання і обробка даних
Дата:2019
Автори: Додонов, О.Г., Коваль, О.В., Сенченко, В.Р., Шпурик, В.В.
Формат: Стаття
Мова:Українська
Опубліковано: Інститут проблем реєстрації інформації НАН України 2019
Теми:
Онлайн доступ:https://nasplib.isofts.kiev.ua/handle/123456789/169080
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Автоматизована система формування сценарію аналітичної діяльності / О.Г. Додонов, О.В. Коваль, В.Р. Сенченко, В.В. Шпурик // Реєстрація, зберігання і обробка даних. — 2019. — Т. 21, № 1. — С. 11–22. — Бібліогр.: 15 назв. — укр.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1860241892192550912
author Додонов, О.Г.
Коваль, О.В.
Сенченко, В.Р.
Шпурик, В.В.
author_facet Додонов, О.Г.
Коваль, О.В.
Сенченко, В.Р.
Шпурик, В.В.
citation_txt Автоматизована система формування сценарію аналітичної діяльності / О.Г. Додонов, О.В. Коваль, В.Р. Сенченко, В.В. Шпурик // Реєстрація, зберігання і обробка даних. — 2019. — Т. 21, № 1. — С. 11–22. — Бібліогр.: 15 назв. — укр.
collection DSpace DC
container_title Реєстрація, зберігання і обробка даних
description Проведено дослідження щодо тенденцій інтелектуалізації програмних компонентів у сучасних аналітичних системах. Показано що однією з головних вимог до сучасних аналітичних систем є комфортність самого процесу спілкування з системою за рахунок їхньої інтелектуалізації, тобто здатність системи пропонувати корстувачеві найбільш імовірній крок сценарію, виходячи з аналізу попередніх дій і накопичених знань. Запропоновано підхід до вирішення задачі інтелектуалізації процесу формування сценарію аналітичної діяльності, що заснований на розвитку методів машинного навчання, а саме розвитку навчання деревами класифікації і регресії (Classification and Regression Trees) з використанням комбінації метрик оцінок ефективності запропонованого варіанта — коефіцієнта Gini або розрахунку ентропії корисності інформації. На підставі запропонованого підходу виконано реалізацію алгоритму у вигляді програми мовою Python, яка дозволяє пропонувати ймовірний крок сценарію аналітичної діяльності, навчаючись на діях користувача. Проведено исследование тенденций интеллектуализации программных компонентов в современных аналитических системах. Показано что одним из главных требований к современным аналитическим системам является комфортность самого процесса общения с системой за счет их интеллектуализации, то есть способность системы предлагать пользователю наиболее вероятный шаг сценария, исходя из анализа предыдущих действий и накопленных знаний. Предложен подход к решению задачи интеллектуализации процесса формирования сценария аналитической деятельности, основанный на развитии методов машинного обучения, а именно развития обучения деревьями классификации и регрессии (Classification and Regression Trees) с использованием комбинации метрик оценки эффективности предложенного варианта — коэффициента Спи или расчета энтропии полезности информации. На основании предложенного подхода выполнена реализация алгоритма в виде программы на языке Руйюп, которая позволяет предлагать вероятный шаг сценария аналитической деятельности, обучаясь на действиях пользователя. An analytical activity scenario has considered as a certain representation of knowledge, used to describe the sequence of related events — in the form of Directed Acyclic Graph. The article proposes an approach to solving the problem of intellectualization of the process of forming a scenario of analytical activity, based on the development of methods of machine learning, namely Classification and Regression Trees. This approach using a combination of metrics for evaluation of the effectiveness has been applied.
 The authors have proposed an own version of the intellectualization software, that implement of the Classification and Regression Trees method on Python programming language. This version differs from the known, the possibility of using different metrics in analyzing the quality of the partition and through it the choice of the next step of the probable actions of analytical scenarios. Unlike existing approaches, the authors have offered the choice of the most optimal metric for assessing the quality of approximation to the desired learning result — the Gini coefficient or the method of calculating the entropy of utility information by Shannon.
first_indexed 2025-12-07T18:30:43Z
format Article
fulltext - ISSN 1560-9189 , , 2019, . 21, 1 11 004.5 . . 1, . . 2, . . 1, . . 2 1 . . , 2, 03113 , 2 « » , 37, 03056 , . - - , , - . , , (Classification and Regression Trees) - — Gini . Python, , . : , , - , Gini, , , Python. - , [2]. ’ , ’ . ’ - , , , . , ( , , , - ), , - © . . , . . , . . , . . . . , . . , . . , . . 12 , , , , , - , , , , - , . , - , , , . - ’ — - , - . , ’ , ’ . - - . , . , , , , - , [2, 3]. , - , - . , , , ’ — - . (pattern) , , , [4]. , (Direc- ted Acyclic Graph — DAG). , DAG ’ — , [5]. - (Single Source Shortest Path) [6]. , . - , - , . , , (Classification and Regression Trees — CART) . ISSN 1560-9189 , , 2019, . 21, 1 13 , - (Single Source Shortest Path). - Graph Algorithms in Neo4j, Javascript library [7] free and open-source javascript. Graph Algorithms in Neo4j ( ) . Shortest Path Dijkstra - , , - . - , , ’ , , , - , , [1]. - - ’ , - , - [3]. . 1. - - . 2. - . 3. , - , . 4. , ’ , . 5. — ’ , . 6. ( , ), . 7. ( ) ’ ( , ). . 1 , - . . , - , - . - - , - . - . . . , . . , . . , . . 14 . 1. , , , - Data Mining Text Mining ? ISSN 1560-9189 , , 2019, . 21, 1 15 [1, 3], - Classification and Regression Trees, [7, 8] , . - , - — - Gini [11] [12]. . 2. , - , , , , - , data mi- ning ( , — Classification and Regression Trees), - . . 2. . . 3 Gr(Sc), Data mining , Gini Gini . . , . . , . . , . . 16 . ( ) - , , - — - , (« », « », « »). , , . . 3. , ( ) , - ( CART) - ( ), - . : n – 2 n – 1 ( . 3). , - CART ( n), - n + 1 ( ). - , , , - , , X2 Y2 Z1. « » ( . 4). . 4. - Gr(Sc), ’ ( ), - . - ISSN 1560-9189 , , 2019, . 21, 1 17 , , . . , , , ( . 5). . 5. Gr(Sc) ( ( . 5) — - . ’ - Python v 3.6.4 [9]. , : ’ - , , , [10]. Gr(Sc) (« » « », « »), - — . . . , . . , . . , . . 18 , - , - , , - , - . - , , - ( ), Z1 Z2 ( . 6). . 6. , . . - . Gini (Gini coef- ficient) [11]. Gini — ( )GiniK D - (D), 0 1, 0 ( - ), 1 . ( )GiniK D - (D). - — 1 . Gini - [11]: 2 1 ( ) 1 n Gini i K D P . . 7 ( )GiniK D . - . Gini ( )GiniK D - — - ( ). . . 2 1 n i P , , - ISSN 1560-9189 , , 2019, . 21, 1 19 , . , , . 0 , ,1-2 . . 7. ( , Z1) D1 D2, ( )GiniK D - : Z1 1 2 ( ) ( 1) ( 2).Gini Gini Gini D D K D K D K D D D Z1 ( )GiniK D Z2. — ( )gr D ( ), [12]: 2 2 1 1 1( ) = log = log ( ). I I gr i i i i ii D P P P P , - ( )gr D , . — , , . : , . , - . - «True» «False», - . . , . . , . . , . . 20 , . , , , - ( . 8) , - , , , - ( )gr D . . 8. - , , «True» «False». («True» «False») - - «if – then». - Gini ( )GiniK D — - ( . 9). plugin, , graphviz [15], . . . 10 , ’ . - ( ) . ISSN 1560-9189 , , 2019, . 21, 1 21 . 9. «if – then» . 10. , — - , - , «if – then» . - , - , - , - Gini, . - ’ Signatur 26.5 Gini = 0,362 Entropy = 0,926 26,5 Signat = 26,58 Gini = 0,123 Entropy = 0,76 24,5 Signat = 24,37 Gini = 0,862 Entropy = 0,92 Signat = 25,58 Gini = 0,023 Entropy = 0,67 Signat = 23,27 Gini = 0,062 Entropy = 0,45 FalseTrue Signat = 26,58 Gini = 0,123 Entropy = 0,76 ’ Signat = 24,37 Gini = 0,862 Entropy = 0,92 . . , . . , . . , . . 22 - . - ( Python). - , . - - , , - . 1. . ., . , . , . . ’ - - : / : , 2017. 239 . 2. Novogrudska R.L., Globa L.S., Koval O.V., Senchenko V.R. Ontology for Applications Development. hapter 2 Ontology in Information Science. Book edited by Ciza Thomas. Print ISBN 978- 953-51-3887-7. Published: March 8, 2018. P. 29–53. http://dx.doi.org/10.5772/intechopen.74042 3. Novogrudska R., Globa L., Koval O. The Method of User’s Tasks Scenario Formation. The 9th IEEE International Conference on Intelligent Data Acquisition and Advanced Computing Systems: Technology and Applications 21–23 September, 2017. Bucharest, Romania 4. . ., . ., . . - . , . . 2018. . 20. 3. . 91–101. 5. Malcolm Barrett, An Introduction to Directed Acyclic Graphs. URL: https://cran.r-project.org/ web/packages/ggdag/vignettes/intro-to-dags.html 6. The Single Source Shortest Path algorithm. URL: https://neo4j.com/docs/graph-algorithms/ current/algorithms/single-source-shortest-path/ 7. Graph Algorithms in Neo4j: Single Source Shortest Path. URL: https://dzone.com/ articles/graph-algorithms-in-neo4j-single-source-shortest-p 8. Decision Tree Classification in Python. URL: https://www.datacamp.com/community/tutorials/ decision-tree-classification-python 9. Python 3.6.4. URL: https://www.python.org/downloads/release/python-364// 10. Python 3.7.3 documentation. URL: https://docs.python.org/3/ 11. . URL: https://dyakonov.org/2015/12/15/ 12. . URL: http://victor-safronov.ru/systems-analysis/books/simankov-lucenko/ 17.html 13. . ., . . ’ . « ». : , . 2014. 61. . 43–48. 14. . ., . ., . . - - . . 2015. 1. . 57–61. 15. Graphviz — Graph Visualization Software. URL: https://graphviz.gitlab.io/download/ 11.03.2019 http://dx.doi.org/10.5772/intechopen.74042 https://cran.r-project.org/ https://neo4j.com/docs/graph-algorithms/ https://dzone.com/ https://www.datacamp.com/community/tutorials/ https://www.python.org/downloads/release/python-364// https://docs.python.org/3/ https://dyakonov.org/2015/12/15/ http://victor-safronov.ru/systems-analysis/books/simankov-lucenko/ https://graphviz.gitlab.io/download/
id nasplib_isofts_kiev_ua-123456789-169080
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 1560-9189
language Ukrainian
last_indexed 2025-12-07T18:30:43Z
publishDate 2019
publisher Інститут проблем реєстрації інформації НАН України
record_format dspace
spelling Додонов, О.Г.
Коваль, О.В.
Сенченко, В.Р.
Шпурик, В.В.
2020-06-04T07:21:39Z
2020-06-04T07:21:39Z
2019
Автоматизована система формування сценарію аналітичної діяльності / О.Г. Додонов, О.В. Коваль, В.Р. Сенченко, В.В. Шпурик // Реєстрація, зберігання і обробка даних. — 2019. — Т. 21, № 1. — С. 11–22. — Бібліогр.: 15 назв. — укр.
1560-9189
DOI: https://doi.org/10.35681/1560-9189.2019.1.1.179167
https://nasplib.isofts.kiev.ua/handle/123456789/169080
004.5
Проведено дослідження щодо тенденцій інтелектуалізації програмних компонентів у сучасних аналітичних системах. Показано що однією з головних вимог до сучасних аналітичних систем є комфортність самого процесу спілкування з системою за рахунок їхньої інтелектуалізації, тобто здатність системи пропонувати корстувачеві найбільш імовірній крок сценарію, виходячи з аналізу попередніх дій і накопичених знань. Запропоновано підхід до вирішення задачі інтелектуалізації процесу формування сценарію аналітичної діяльності, що заснований на розвитку методів машинного навчання, а саме розвитку навчання деревами класифікації і регресії (Classification and Regression Trees) з використанням комбінації метрик оцінок ефективності запропонованого варіанта — коефіцієнта Gini або розрахунку ентропії корисності інформації. На підставі запропонованого підходу виконано реалізацію алгоритму у вигляді програми мовою Python, яка дозволяє пропонувати ймовірний крок сценарію аналітичної діяльності, навчаючись на діях користувача.
Проведено исследование тенденций интеллектуализации программных компонентов в современных аналитических системах. Показано что одним из главных требований к современным аналитическим системам является комфортность самого процесса общения с системой за счет их интеллектуализации, то есть способность системы предлагать пользователю наиболее вероятный шаг сценария, исходя из анализа предыдущих действий и накопленных знаний. Предложен подход к решению задачи интеллектуализации процесса формирования сценария аналитической деятельности, основанный на развитии методов машинного обучения, а именно развития обучения деревьями классификации и регрессии (Classification and Regression Trees) с использованием комбинации метрик оценки эффективности предложенного варианта — коэффициента Спи или расчета энтропии полезности информации. На основании предложенного подхода выполнена реализация алгоритма в виде программы на языке Руйюп, которая позволяет предлагать вероятный шаг сценария аналитической деятельности, обучаясь на действиях пользователя.
An analytical activity scenario has considered as a certain representation of knowledge, used to describe the sequence of related events — in the form of Directed Acyclic Graph. The article proposes an approach to solving the problem of intellectualization of the process of forming a scenario of analytical activity, based on the development of methods of machine learning, namely Classification and Regression Trees. This approach using a combination of metrics for evaluation of the effectiveness has been applied.
 The authors have proposed an own version of the intellectualization software, that implement of the Classification and Regression Trees method on Python programming language. This version differs from the known, the possibility of using different metrics in analyzing the quality of the partition and through it the choice of the next step of the probable actions of analytical scenarios. Unlike existing approaches, the authors have offered the choice of the most optimal metric for assessing the quality of approximation to the desired learning result — the Gini coefficient or the method of calculating the entropy of utility information by Shannon.
uk
Інститут проблем реєстрації інформації НАН України
Реєстрація, зберігання і обробка даних
Інформаційно-аналітичні системи обробки даних
Автоматизована система формування сценарію аналітичної діяльності
Автоматизированная система формирования сценария аналитической деятельности
An automated scenario generation system for analytical activities
Article
published earlier
spellingShingle Автоматизована система формування сценарію аналітичної діяльності
Додонов, О.Г.
Коваль, О.В.
Сенченко, В.Р.
Шпурик, В.В.
Інформаційно-аналітичні системи обробки даних
title Автоматизована система формування сценарію аналітичної діяльності
title_alt Автоматизированная система формирования сценария аналитической деятельности
An automated scenario generation system for analytical activities
title_full Автоматизована система формування сценарію аналітичної діяльності
title_fullStr Автоматизована система формування сценарію аналітичної діяльності
title_full_unstemmed Автоматизована система формування сценарію аналітичної діяльності
title_short Автоматизована система формування сценарію аналітичної діяльності
title_sort автоматизована система формування сценарію аналітичної діяльності
topic Інформаційно-аналітичні системи обробки даних
topic_facet Інформаційно-аналітичні системи обробки даних
url https://nasplib.isofts.kiev.ua/handle/123456789/169080
work_keys_str_mv AT dodonovog avtomatizovanasistemaformuvannâscenaríûanalítičnoídíâlʹností
AT kovalʹov avtomatizovanasistemaformuvannâscenaríûanalítičnoídíâlʹností
AT senčenkovr avtomatizovanasistemaformuvannâscenaríûanalítičnoídíâlʹností
AT špurikvv avtomatizovanasistemaformuvannâscenaríûanalítičnoídíâlʹností
AT dodonovog avtomatizirovannaâsistemaformirovaniâscenariâanalitičeskoideâtelʹnosti
AT kovalʹov avtomatizirovannaâsistemaformirovaniâscenariâanalitičeskoideâtelʹnosti
AT senčenkovr avtomatizirovannaâsistemaformirovaniâscenariâanalitičeskoideâtelʹnosti
AT špurikvv avtomatizirovannaâsistemaformirovaniâscenariâanalitičeskoideâtelʹnosti
AT dodonovog anautomatedscenariogenerationsystemforanalyticalactivities
AT kovalʹov anautomatedscenariogenerationsystemforanalyticalactivities
AT senčenkovr anautomatedscenariogenerationsystemforanalyticalactivities
AT špurikvv anautomatedscenariogenerationsystemforanalyticalactivities