Автоматизована система формування сценарію аналітичної діяльності
Проведено дослідження щодо тенденцій інтелектуалізації програмних компонентів у сучасних аналітичних системах. Показано що однією з головних вимог до сучасних аналітичних систем є комфортність самого процесу спілкування з системою за рахунок їхньої інтелектуалізації, тобто здатність системи пропонув...
Збережено в:
| Опубліковано в: : | Реєстрація, зберігання і обробка даних |
|---|---|
| Дата: | 2019 |
| Автори: | , , , |
| Формат: | Стаття |
| Мова: | Українська |
| Опубліковано: |
Інститут проблем реєстрації інформації НАН України
2019
|
| Теми: | |
| Онлайн доступ: | https://nasplib.isofts.kiev.ua/handle/123456789/169080 |
| Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Цитувати: | Автоматизована система формування сценарію аналітичної діяльності / О.Г. Додонов, О.В. Коваль, В.Р. Сенченко, В.В. Шпурик // Реєстрація, зберігання і обробка даних. — 2019. — Т. 21, № 1. — С. 11–22. — Бібліогр.: 15 назв. — укр. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraine| _version_ | 1860241892192550912 |
|---|---|
| author | Додонов, О.Г. Коваль, О.В. Сенченко, В.Р. Шпурик, В.В. |
| author_facet | Додонов, О.Г. Коваль, О.В. Сенченко, В.Р. Шпурик, В.В. |
| citation_txt | Автоматизована система формування сценарію аналітичної діяльності / О.Г. Додонов, О.В. Коваль, В.Р. Сенченко, В.В. Шпурик // Реєстрація, зберігання і обробка даних. — 2019. — Т. 21, № 1. — С. 11–22. — Бібліогр.: 15 назв. — укр. |
| collection | DSpace DC |
| container_title | Реєстрація, зберігання і обробка даних |
| description | Проведено дослідження щодо тенденцій інтелектуалізації програмних компонентів у сучасних аналітичних системах. Показано що однією з головних вимог до сучасних аналітичних систем є комфортність самого процесу спілкування з системою за рахунок їхньої інтелектуалізації, тобто здатність системи пропонувати корстувачеві найбільш імовірній крок сценарію, виходячи з аналізу попередніх дій і накопичених знань. Запропоновано підхід до вирішення задачі інтелектуалізації процесу формування сценарію аналітичної діяльності, що заснований на розвитку методів машинного навчання, а саме розвитку навчання деревами класифікації і регресії (Classification and Regression Trees) з використанням комбінації метрик оцінок ефективності запропонованого варіанта — коефіцієнта Gini або розрахунку ентропії корисності інформації. На підставі запропонованого підходу виконано реалізацію алгоритму у вигляді програми мовою Python, яка дозволяє пропонувати ймовірний крок сценарію аналітичної діяльності, навчаючись на діях користувача.
Проведено исследование тенденций интеллектуализации программных компонентов в современных аналитических системах. Показано что одним из главных требований к современным аналитическим системам является комфортность самого процесса общения с системой за счет их интеллектуализации, то есть способность системы предлагать пользователю наиболее вероятный шаг сценария, исходя из анализа предыдущих действий и накопленных знаний. Предложен подход к решению задачи интеллектуализации процесса формирования сценария аналитической деятельности, основанный на развитии методов машинного обучения, а именно развития обучения деревьями классификации и регрессии (Classification and Regression Trees) с использованием комбинации метрик оценки эффективности предложенного варианта — коэффициента Спи или расчета энтропии полезности информации. На основании предложенного подхода выполнена реализация алгоритма в виде программы на языке Руйюп, которая позволяет предлагать вероятный шаг сценария аналитической деятельности, обучаясь на действиях пользователя.
An analytical activity scenario has considered as a certain representation of knowledge, used to describe the sequence of related events — in the form of Directed Acyclic Graph. The article proposes an approach to solving the problem of intellectualization of the process of forming a scenario of analytical activity, based on the development of methods of machine learning, namely Classification and Regression Trees. This approach using a combination of metrics for evaluation of the effectiveness has been applied.
The authors have proposed an own version of the intellectualization software, that implement of the Classification and Regression Trees method on Python programming language. This version differs from the known, the possibility of using different metrics in analyzing the quality of the partition and through it the choice of the next step of the probable actions of analytical scenarios. Unlike existing approaches, the authors have offered the choice of the most optimal metric for assessing the quality of approximation to the desired learning result — the Gini coefficient or the method of calculating the entropy of utility information by Shannon.
|
| first_indexed | 2025-12-07T18:30:43Z |
| format | Article |
| fulltext |
-
ISSN 1560-9189 , , 2019, . 21, 1 11
004.5
. . 1, . . 2, . . 1, . . 2
1
. . , 2, 03113 ,
2
« »
, 37, 03056 ,
.
-
-
,
, -
.
,
,
(Classification and Regression Trees)
-
— Gini
.
Python,
,
.
: , , -
, Gini, , , Python.
-
,
[2]. ’ , ’ .
’ -
, , , . ,
( , , ,
- ), , -
© . . , . . , . . , . .
. . , . . , . . , . .
12
, , , , , -
, , , , -
, .
, -
, , , . -
’ — -
, -
. , ’ ,
’ . -
-
.
, .
,
, ,
, -
, [2, 3]. ,
-
, -
.
,
, ,
’ — -
.
(pattern) ,
, , [4]. ,
(Direc-
ted Acyclic Graph — DAG). , DAG
’ — ,
[5]. -
(Single Source Shortest Path) [6]. ,
. -
, -
, .
,
,
(Classification and Regression Trees — CART)
.
ISSN 1560-9189 , , 2019, . 21, 1 13
, -
(Single Source Shortest Path). -
Graph Algorithms in Neo4j,
Javascript library [7] free and open-source javascript.
Graph Algorithms in Neo4j ( )
.
Shortest Path Dijkstra -
, , -
.
-
, , ’ ,
, , -
,
, [1]. -
-
’ , -
, -
[3]. .
1. - -
.
2. -
.
3. , -
, .
4. , ’
, .
5. —
’ , .
6. ( , ),
.
7. ( )
’ ( , ).
. 1 , -
.
.
, -
, -
. -
-
, -
. -
.
. . , . . , . . , . .
14
. 1.
,
, ,
-
Data Mining
Text Mining
?
ISSN 1560-9189 , , 2019, . 21, 1 15
[1, 3], -
Classification and Regression Trees, [7,
8]
,
. -
, -
— -
Gini [11] [12].
. 2. , -
,
, , , -
, data mi-
ning ( , —
Classification and Regression Trees), -
.
. 2.
. . 3
Gr(Sc),
Data mining
,
Gini
Gini
. . , . . , . . , . .
16
. ( ) -
, , -
— -
, (« », « »,
« »). ,
,
.
. 3.
, (
) , -
( CART) -
( ), -
.
: n – 2 n – 1 ( . 3). , -
CART ( n), -
n + 1 ( ). -
, , , -
, ,
X2 Y2 Z1.
« » ( . 4).
. 4.
-
Gr(Sc), ’ ( ), -
. -
ISSN 1560-9189 , , 2019, . 21, 1 17
, , .
. ,
, ,
( . 5).
. 5.
Gr(Sc) ( ( . 5) — -
.
’ - Python v 3.6.4 [9].
, :
’ - , , ,
[10].
Gr(Sc)
(« » « », « »), -
— .
. . , . . , . . , . .
18
, - , -
, , - ,
-
.
-
, , -
( ),
Z1 Z2 ( . 6).
. 6.
, .
. -
.
Gini (Gini coef-
ficient) [11]. Gini — ( )GiniK D -
(D), 0 1, 0 ( -
), 1 . ( )GiniK D -
(D).
-
— 1 . Gini -
[11]:
2
1
( ) 1
n
Gini
i
K D P .
. 7 ( )GiniK D
.
-
.
Gini ( )GiniK D -
— -
( ).
.
.
2
1
n
i
P , , -
ISSN 1560-9189 , , 2019, . 21, 1 19
,
. , , .
0 , ,1-2
.
. 7.
( , Z1)
D1 D2, ( )GiniK D -
:
Z1
1 2
( ) ( 1) ( 2).Gini Gini Gini
D D
K D K D K D
D D
Z1
( )GiniK D Z2.
—
( )gr D ( ), [12]:
2 2
1 1
1( ) = log = log ( ).
I I
gr i i i
i ii
D P P P
P
, -
( )gr D ,
.
—
, , .
: , .
, -
.
-
«True» «False», -
. . , . . , . . , . .
20
, . ,
, , -
( . 8)
, -
,
, , -
( )gr D .
. 8.
-
, , «True»
«False».
(«True» «False») -
-
«if – then». -
Gini ( )GiniK D — -
( . 9).
plugin, , graphviz [15],
.
.
. 10
, ’
. -
(
)
.
ISSN 1560-9189 , , 2019, . 21, 1 21
. 9. «if – then»
. 10.
, —
-
, -
, «if – then» .
-
, -
, -
, -
Gini, . -
’
Signatur 26.5
Gini = 0,362
Entropy = 0,926
26,5
Signat = 26,58
Gini = 0,123
Entropy = 0,76
24,5
Signat = 24,37
Gini = 0,862
Entropy = 0,92
Signat = 25,58
Gini = 0,023
Entropy = 0,67
Signat = 23,27
Gini = 0,062
Entropy = 0,45
FalseTrue
Signat = 26,58
Gini = 0,123
Entropy = 0,76
’
Signat = 24,37
Gini = 0,862
Entropy = 0,92
. . , . . , . . , . .
22
-
.
-
( Python).
-
, .
-
-
, , -
.
1. . ., . , . , . . ’ -
- : / : , 2017. 239 .
2. Novogrudska R.L., Globa L.S., Koval O.V., Senchenko V.R. Ontology for Applications
Development. hapter 2 Ontology in Information Science. Book edited by Ciza Thomas. Print ISBN 978-
953-51-3887-7. Published: March 8, 2018. P. 29–53. http://dx.doi.org/10.5772/intechopen.74042
3. Novogrudska R., Globa L., Koval O. The Method of User’s Tasks Scenario Formation. The 9th
IEEE International Conference on Intelligent Data Acquisition and Advanced Computing Systems:
Technology and Applications 21–23 September, 2017. Bucharest, Romania
4. . ., . ., . . -
. , . . 2018.
. 20. 3. . 91–101.
5. Malcolm Barrett, An Introduction to Directed Acyclic Graphs. URL: https://cran.r-project.org/
web/packages/ggdag/vignettes/intro-to-dags.html
6. The Single Source Shortest Path algorithm. URL: https://neo4j.com/docs/graph-algorithms/
current/algorithms/single-source-shortest-path/
7. Graph Algorithms in Neo4j: Single Source Shortest Path. URL: https://dzone.com/
articles/graph-algorithms-in-neo4j-single-source-shortest-p
8. Decision Tree Classification in Python. URL: https://www.datacamp.com/community/tutorials/
decision-tree-classification-python
9. Python 3.6.4. URL: https://www.python.org/downloads/release/python-364//
10. Python 3.7.3 documentation. URL: https://docs.python.org/3/
11. . URL: https://dyakonov.org/2015/12/15/
12. . URL: http://victor-safronov.ru/systems-analysis/books/simankov-lucenko/
17.html
13. . ., . . ’
. « ». : , . 2014.
61. . 43–48.
14. . ., . ., . . - -
. . 2015.
1. . 57–61.
15. Graphviz — Graph Visualization Software. URL: https://graphviz.gitlab.io/download/
11.03.2019
http://dx.doi.org/10.5772/intechopen.74042
https://cran.r-project.org/
https://neo4j.com/docs/graph-algorithms/
https://dzone.com/
https://www.datacamp.com/community/tutorials/
https://www.python.org/downloads/release/python-364//
https://docs.python.org/3/
https://dyakonov.org/2015/12/15/
http://victor-safronov.ru/systems-analysis/books/simankov-lucenko/
https://graphviz.gitlab.io/download/
|
| id | nasplib_isofts_kiev_ua-123456789-169080 |
| institution | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| issn | 1560-9189 |
| language | Ukrainian |
| last_indexed | 2025-12-07T18:30:43Z |
| publishDate | 2019 |
| publisher | Інститут проблем реєстрації інформації НАН України |
| record_format | dspace |
| spelling | Додонов, О.Г. Коваль, О.В. Сенченко, В.Р. Шпурик, В.В. 2020-06-04T07:21:39Z 2020-06-04T07:21:39Z 2019 Автоматизована система формування сценарію аналітичної діяльності / О.Г. Додонов, О.В. Коваль, В.Р. Сенченко, В.В. Шпурик // Реєстрація, зберігання і обробка даних. — 2019. — Т. 21, № 1. — С. 11–22. — Бібліогр.: 15 назв. — укр. 1560-9189 DOI: https://doi.org/10.35681/1560-9189.2019.1.1.179167 https://nasplib.isofts.kiev.ua/handle/123456789/169080 004.5 Проведено дослідження щодо тенденцій інтелектуалізації програмних компонентів у сучасних аналітичних системах. Показано що однією з головних вимог до сучасних аналітичних систем є комфортність самого процесу спілкування з системою за рахунок їхньої інтелектуалізації, тобто здатність системи пропонувати корстувачеві найбільш імовірній крок сценарію, виходячи з аналізу попередніх дій і накопичених знань. Запропоновано підхід до вирішення задачі інтелектуалізації процесу формування сценарію аналітичної діяльності, що заснований на розвитку методів машинного навчання, а саме розвитку навчання деревами класифікації і регресії (Classification and Regression Trees) з використанням комбінації метрик оцінок ефективності запропонованого варіанта — коефіцієнта Gini або розрахунку ентропії корисності інформації. На підставі запропонованого підходу виконано реалізацію алгоритму у вигляді програми мовою Python, яка дозволяє пропонувати ймовірний крок сценарію аналітичної діяльності, навчаючись на діях користувача. Проведено исследование тенденций интеллектуализации программных компонентов в современных аналитических системах. Показано что одним из главных требований к современным аналитическим системам является комфортность самого процесса общения с системой за счет их интеллектуализации, то есть способность системы предлагать пользователю наиболее вероятный шаг сценария, исходя из анализа предыдущих действий и накопленных знаний. Предложен подход к решению задачи интеллектуализации процесса формирования сценария аналитической деятельности, основанный на развитии методов машинного обучения, а именно развития обучения деревьями классификации и регрессии (Classification and Regression Trees) с использованием комбинации метрик оценки эффективности предложенного варианта — коэффициента Спи или расчета энтропии полезности информации. На основании предложенного подхода выполнена реализация алгоритма в виде программы на языке Руйюп, которая позволяет предлагать вероятный шаг сценария аналитической деятельности, обучаясь на действиях пользователя. An analytical activity scenario has considered as a certain representation of knowledge, used to describe the sequence of related events — in the form of Directed Acyclic Graph. The article proposes an approach to solving the problem of intellectualization of the process of forming a scenario of analytical activity, based on the development of methods of machine learning, namely Classification and Regression Trees. This approach using a combination of metrics for evaluation of the effectiveness has been applied.
 The authors have proposed an own version of the intellectualization software, that implement of the Classification and Regression Trees method on Python programming language. This version differs from the known, the possibility of using different metrics in analyzing the quality of the partition and through it the choice of the next step of the probable actions of analytical scenarios. Unlike existing approaches, the authors have offered the choice of the most optimal metric for assessing the quality of approximation to the desired learning result — the Gini coefficient or the method of calculating the entropy of utility information by Shannon. uk Інститут проблем реєстрації інформації НАН України Реєстрація, зберігання і обробка даних Інформаційно-аналітичні системи обробки даних Автоматизована система формування сценарію аналітичної діяльності Автоматизированная система формирования сценария аналитической деятельности An automated scenario generation system for analytical activities Article published earlier |
| spellingShingle | Автоматизована система формування сценарію аналітичної діяльності Додонов, О.Г. Коваль, О.В. Сенченко, В.Р. Шпурик, В.В. Інформаційно-аналітичні системи обробки даних |
| title | Автоматизована система формування сценарію аналітичної діяльності |
| title_alt | Автоматизированная система формирования сценария аналитической деятельности An automated scenario generation system for analytical activities |
| title_full | Автоматизована система формування сценарію аналітичної діяльності |
| title_fullStr | Автоматизована система формування сценарію аналітичної діяльності |
| title_full_unstemmed | Автоматизована система формування сценарію аналітичної діяльності |
| title_short | Автоматизована система формування сценарію аналітичної діяльності |
| title_sort | автоматизована система формування сценарію аналітичної діяльності |
| topic | Інформаційно-аналітичні системи обробки даних |
| topic_facet | Інформаційно-аналітичні системи обробки даних |
| url | https://nasplib.isofts.kiev.ua/handle/123456789/169080 |
| work_keys_str_mv | AT dodonovog avtomatizovanasistemaformuvannâscenaríûanalítičnoídíâlʹností AT kovalʹov avtomatizovanasistemaformuvannâscenaríûanalítičnoídíâlʹností AT senčenkovr avtomatizovanasistemaformuvannâscenaríûanalítičnoídíâlʹností AT špurikvv avtomatizovanasistemaformuvannâscenaríûanalítičnoídíâlʹností AT dodonovog avtomatizirovannaâsistemaformirovaniâscenariâanalitičeskoideâtelʹnosti AT kovalʹov avtomatizirovannaâsistemaformirovaniâscenariâanalitičeskoideâtelʹnosti AT senčenkovr avtomatizirovannaâsistemaformirovaniâscenariâanalitičeskoideâtelʹnosti AT špurikvv avtomatizirovannaâsistemaformirovaniâscenariâanalitičeskoideâtelʹnosti AT dodonovog anautomatedscenariogenerationsystemforanalyticalactivities AT kovalʹov anautomatedscenariogenerationsystemforanalyticalactivities AT senčenkovr anautomatedscenariogenerationsystemforanalyticalactivities AT špurikvv anautomatedscenariogenerationsystemforanalyticalactivities |