Методика предобработки данных в задаче секвенциального анализа

Статья посвящена разработке методики предобработки данных при проведении секвенциального анализа. Выделены и экспериментально подтверждены проблемы предобработки в данной области: зашумленность данных, избыточность алфавита, возможное наличие циклических повторов. Предложены способы их решения. Эффе...

Повний опис

Збережено в:
Бібліографічні деталі
Дата:2017
Автори: Молдавская, А.В., Рувинская, В.М.
Формат: Стаття
Мова:Russian
Опубліковано: Інститут проблем реєстрації інформації НАН України 2017
Назва видання:Реєстрація, зберігання і обробка даних
Теми:
Онлайн доступ:https://nasplib.isofts.kiev.ua/handle/123456789/131666
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Методика предобработки данных в задаче секвенциального анализа / А.В. Молдавская, В.М. Рувинская // Реєстрація, зберігання і обробка даних. — 2017. — Т. 19, № 1. — С. 40-49. — Бібліогр.: 14 назв. — рос.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id nasplib_isofts_kiev_ua-123456789-131666
record_format dspace
spelling nasplib_isofts_kiev_ua-123456789-1316662025-02-23T18:27:21Z Методика предобработки данных в задаче секвенциального анализа Методика попередньої обробки даних у задачі секвенційного аналізу Methodology of data preprocessing in problem of sequential analysis Молдавская, А.В. Рувинская, В.М. Технічні засоби отримання і обробки даних Статья посвящена разработке методики предобработки данных при проведении секвенциального анализа. Выделены и экспериментально подтверждены проблемы предобработки в данной области: зашумленность данных, избыточность алфавита, возможное наличие циклических повторов. Предложены способы их решения. Эффективность и результативность предложенных подходов показана на экспериментах. Статтю присвячено розробці методики попередньої обробки даних задля проведення секвенційного аналізу. Виділено та експериментально підтверджено проблеми попередньої обробки у даній галузі: зашумленість даних, надлишковість алфавіту, можлива наявність циклічних повторів. Запропоновано способи їхнього вирішення. Ефективність і результативність запропонованих методів показано на дослідах. A data preprocessing technique for sequential analysis is described. It is outlined and experimentally demonstrated the problems of this field of data mining: noisy data, alphabet redundancy, eventual presence of cyclic repeats. It is proposed the solution of these problems, effectivity of which is shown experimentally. 2017 Article Методика предобработки данных в задаче секвенциального анализа / А.В. Молдавская, В.М. Рувинская // Реєстрація, зберігання і обробка даних. — 2017. — Т. 19, № 1. — С. 40-49. — Бібліогр.: 14 назв. — рос. 1560-9189 https://nasplib.isofts.kiev.ua/handle/123456789/131666 ru Реєстрація, зберігання і обробка даних application/pdf Інститут проблем реєстрації інформації НАН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Russian
topic Технічні засоби отримання і обробки даних
Технічні засоби отримання і обробки даних
spellingShingle Технічні засоби отримання і обробки даних
Технічні засоби отримання і обробки даних
Молдавская, А.В.
Рувинская, В.М.
Методика предобработки данных в задаче секвенциального анализа
Реєстрація, зберігання і обробка даних
description Статья посвящена разработке методики предобработки данных при проведении секвенциального анализа. Выделены и экспериментально подтверждены проблемы предобработки в данной области: зашумленность данных, избыточность алфавита, возможное наличие циклических повторов. Предложены способы их решения. Эффективность и результативность предложенных подходов показана на экспериментах.
format Article
author Молдавская, А.В.
Рувинская, В.М.
author_facet Молдавская, А.В.
Рувинская, В.М.
author_sort Молдавская, А.В.
title Методика предобработки данных в задаче секвенциального анализа
title_short Методика предобработки данных в задаче секвенциального анализа
title_full Методика предобработки данных в задаче секвенциального анализа
title_fullStr Методика предобработки данных в задаче секвенциального анализа
title_full_unstemmed Методика предобработки данных в задаче секвенциального анализа
title_sort методика предобработки данных в задаче секвенциального анализа
publisher Інститут проблем реєстрації інформації НАН України
publishDate 2017
topic_facet Технічні засоби отримання і обробки даних
url https://nasplib.isofts.kiev.ua/handle/123456789/131666
citation_txt Методика предобработки данных в задаче секвенциального анализа / А.В. Молдавская, В.М. Рувинская // Реєстрація, зберігання і обробка даних. — 2017. — Т. 19, № 1. — С. 40-49. — Бібліогр.: 14 назв. — рос.
series Реєстрація, зберігання і обробка даних
work_keys_str_mv AT moldavskaâav metodikapredobrabotkidannyhvzadačesekvencialʹnogoanaliza
AT ruvinskaâvm metodikapredobrabotkidannyhvzadačesekvencialʹnogoanaliza
AT moldavskaâav metodikapoperednʹoíobrobkidanihuzadačísekvencíjnogoanalízu
AT ruvinskaâvm metodikapoperednʹoíobrobkidanihuzadačísekvencíjnogoanalízu
AT moldavskaâav methodologyofdatapreprocessinginproblemofsequentialanalysis
AT ruvinskaâvm methodologyofdatapreprocessinginproblemofsequentialanalysis
first_indexed 2025-11-24T10:18:53Z
last_indexed 2025-11-24T10:18:53Z
_version_ 1849666602863165440
fulltext 40 004.622 . . 1, . . , 1, 65044 , 1e-mail: am.poly@ya.ru . : - , , - . . - - . : , , , , . (data mining) - , , , , , . - - . - — , . - . - : — , ; — - , , . — - , . © . . , . . mailto:am.poly@ya.ru ISSN 1560-9189 , , 2017, . 19, 1 41 - [1]. 1. - . . ( ) . , - . 2. . , - . - , - [2]. 3. ( ) . , . . 4. . . . , , - . 5. . , - , , - ( , ). 6. . . 7. . - , - . , . - — - , [4]. - , - [3], , - . - . , data mining [3, 5, 6]. . 1. . , . , , , . . , . . 42 [3]. , . 2. : . - , . : = « ». 3. : , . . : = «0». - — , - . 4. : . , , - . : = «30», = «01/01/2016». 5. [7]. , : — , - (feature extraction) [8]; — - ( ); — ; — ; — ( ) - ; — ; — [9]. , . , , , - . — . — (itemsets) — - [10]. - : S = <{a},{a, b, c},{b},{b, c},{a, d}>. - , : S = <{s},{t}, {r},{o},{k},{a}>. , - , . , - , , , , - . . , , - — - ISSN 1560-9189 , , 2017, . 19, 1 43 [10]. , , , , . - , . - [11]. , , - . (Bide+, CloSpan, SPADE, PrefixSpan ) , - SPMF [12]. , . . , . - : — - ; — , ; — - ( ). , - . : , , , . , - - 100 %, . . , . - , , — . - . , - . , « » , 4- : , / , , . , . . . , . . 44 , — - , — - , . , - . , . , . - . ( , — - , - ) . . - , - . - , ( ) . , , - , . - , . . 1 2012–2015 . 1. S 01 02 03 04 05 06 07 08 09 10 11 12 2012 19404 20278 18324 15800 13938 12585 12132 12097 12013 12318 15893 18545 2013 20360 21349 19314 16800 14284 14284 11034 10225 9758 9025 11338 14241 2014 16449 16963 14535 12401 11418 10475 10376 10274 10395 11158 14026 16998 2015 17790 18082 16965 14761 13504 12113 11246 10526 10472 10627 13296 16267 , : - — . - , , . - 3. S . S' . 2. S' Bide+ Clospan. - , . - . 3, « » - , - . ISSN 1560-9189 , , 2017, . 19, 1 45 2. S' 01 02 03 04 05 06 07 08 09 10 11 12 2012 3 3 3 3 2 2 1 1 1 1 2 2 2013 3 3 3 2 2 1 1 1 1 1 2 2 2014 3 3 3 2 2 1 1 1 1 2 2 3 2015 3 3 3 2 2 2 1 1 1 1 2 3 3. , S' Bide+ CloSpan 2 3 3 3 2 2 1 1 1 1 2 2 3 3 3 2 2 1 1 1 1 2 3 3 3 3 3 2 2 1 1 1 1 3 3 3 2 2 2 2 3 3 3 3 2 2 1 1 1 1 2 2 3 3 3 2 2 1 1 1 1 2 3 3 3 3 3 2 2 1 1 1 1 3 3 3 2 2 2 2 3 3 3 3 3 2 2 1 1 1 1 2 3 3 3 2 2 1 1 1 1 3 3 3 3 2 2 2 2 3 3 3 2 2 1 1 1 1 2 3 3 3 2 2 1 1 1 1 3 3 3 3 2 2 2 2 4 3 3 3 2 2 1 1 1 1 3 3 3 3 3 3 3 2 2 1 1 1 1 3 3 3 3 , , , - . . , - , - ( ), , , [13]. , . . , - , . , , , - , , - . , , - . - , . , « » « » « », - , . . , . - 80 80 , . . , . . 46 . . 4. , . 4. ClaSP Bide+ CloSpan 20 27 193 32 80 12 49 19 140 9 98 16 200 11 51 17 260 10 50 15 , , - , . - , , , . . , . , - . [14]. , . . , , - . . 200 - , — 100 , - — 20. - , . « - » . SPMF, [12]. . 5 - . . , - . PrefixSpan , - , ISSN 1560-9189 , , 2017, . 19, 1 47 - . 344 — 38513 , 4 . SPADE. Bide+ CloSpan - . - . 5. Bide+ SPADE ClaSP PrefixSpan - , , , , , , , , 1 1467 50 282 22,5 687 31 344 27 2 6727 193 2889 52 5264 242 1777 98 3 14709 194 81281 62 52014 836 21962 494 4 38513 195 1272619 212 687 31 38513 527 , , , . , , . , [14]. - - . , - . , , . . 6 , . - . 6. , Bide+ SPADE ClaSP PrefixSpan , 49 22 29 25 , 1633 253 687 295 , , - . . . , . . 48 . , . , : , - . - , . - . : . - : Bide+ 75 % 96 % ; ClaSP 96 % 98,7 % ; SPADE 64,5 % 99,7 % ; - PrefixSpan 95 % 98,6 % . , - , - , - , . . . 1. . . 1999. URL: http://neural.narod.ru/Arsen.htm 2. . . . . 2003. 2(3). . 74–77. 3. . . - . . 2005. 3–4. . 104–106. 4. . . . - . : , , . 2012. 23. 5. . . Knowledge Discovery and Data Mining . : , 2009. URL: http://www.isras.ru/Davydov_Knowledge.html 6. Markov Z., Larose D.T. Data-mining the Web: uncovering patterns in Web content, structure, and usage. John Wiley & Sons Inc., 2007. 218 p. 7. . ., . . : - . . . . . URL: http://elibrary.sgu.ru/uch_lit/1141.pdf 8. Guyon I., Elisseeff A. An introduction to feature extraction. Feature extraction. Springer Berlin Heidelberg, 2006. . 1–25. 9. . ., . ., . ., . . - data mining. . 2009. . 9. C. 197–210. 10. Agrawal R. and Srikant R. Mining Sequential. Journal Intelligent Systems. 1997. Vol. 9. N 1. . 33–56. http://neural.narod.ru/Arsen.htm http://www.isras.ru/Davydov_Knowledge.html http://elibrary.sgu.ru/uch_lit/1141.pdf ISSN 1560-9189 , , 2017, . 19, 1 49 11. . . . . 2016. 2/3. . 158–163. 12. Fournier-Viger P., Lin C.W., Gomariz A., Gueniche T., Soltani A., Deng Z., Lam H.T. The SPMF Open-Source Data Mining Library Version 2. Proc. 19-th European Conference on Principles of Data Mining and Knowledge Discovery (PKDD 2016). Part III. Springer LNCS 9853, 2016. . 36–40. 13. . . - . : - . . . , 2013. 14. 26 . ( . - . . . ). 14. . . , 2006. 496 . 13.03.2017