Методика предобработки данных в задаче секвенциального анализа
Статья посвящена разработке методики предобработки данных при проведении секвенциального анализа. Выделены и экспериментально подтверждены проблемы предобработки в данной области: зашумленность данных, избыточность алфавита, возможное наличие циклических повторов. Предложены способы их решения. Эффе...
Збережено в:
| Дата: | 2017 |
|---|---|
| Автори: | , |
| Формат: | Стаття |
| Мова: | Russian |
| Опубліковано: |
Інститут проблем реєстрації інформації НАН України
2017
|
| Назва видання: | Реєстрація, зберігання і обробка даних |
| Теми: | |
| Онлайн доступ: | https://nasplib.isofts.kiev.ua/handle/123456789/131666 |
| Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Цитувати: | Методика предобработки данных в задаче секвенциального анализа / А.В. Молдавская, В.М. Рувинская // Реєстрація, зберігання і обробка даних. — 2017. — Т. 19, № 1. — С. 40-49. — Бібліогр.: 14 назв. — рос. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraine| id |
nasplib_isofts_kiev_ua-123456789-131666 |
|---|---|
| record_format |
dspace |
| spelling |
nasplib_isofts_kiev_ua-123456789-1316662025-02-23T18:27:21Z Методика предобработки данных в задаче секвенциального анализа Методика попередньої обробки даних у задачі секвенційного аналізу Methodology of data preprocessing in problem of sequential analysis Молдавская, А.В. Рувинская, В.М. Технічні засоби отримання і обробки даних Статья посвящена разработке методики предобработки данных при проведении секвенциального анализа. Выделены и экспериментально подтверждены проблемы предобработки в данной области: зашумленность данных, избыточность алфавита, возможное наличие циклических повторов. Предложены способы их решения. Эффективность и результативность предложенных подходов показана на экспериментах. Статтю присвячено розробці методики попередньої обробки даних задля проведення секвенційного аналізу. Виділено та експериментально підтверджено проблеми попередньої обробки у даній галузі: зашумленість даних, надлишковість алфавіту, можлива наявність циклічних повторів. Запропоновано способи їхнього вирішення. Ефективність і результативність запропонованих методів показано на дослідах. A data preprocessing technique for sequential analysis is described. It is outlined and experimentally demonstrated the problems of this field of data mining: noisy data, alphabet redundancy, eventual presence of cyclic repeats. It is proposed the solution of these problems, effectivity of which is shown experimentally. 2017 Article Методика предобработки данных в задаче секвенциального анализа / А.В. Молдавская, В.М. Рувинская // Реєстрація, зберігання і обробка даних. — 2017. — Т. 19, № 1. — С. 40-49. — Бібліогр.: 14 назв. — рос. 1560-9189 https://nasplib.isofts.kiev.ua/handle/123456789/131666 ru Реєстрація, зберігання і обробка даних application/pdf Інститут проблем реєстрації інформації НАН України |
| institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| collection |
DSpace DC |
| language |
Russian |
| topic |
Технічні засоби отримання і обробки даних Технічні засоби отримання і обробки даних |
| spellingShingle |
Технічні засоби отримання і обробки даних Технічні засоби отримання і обробки даних Молдавская, А.В. Рувинская, В.М. Методика предобработки данных в задаче секвенциального анализа Реєстрація, зберігання і обробка даних |
| description |
Статья посвящена разработке методики предобработки данных при проведении секвенциального анализа. Выделены и экспериментально подтверждены проблемы предобработки в данной области: зашумленность данных, избыточность алфавита, возможное наличие циклических повторов. Предложены способы их решения. Эффективность и результативность предложенных подходов показана на экспериментах. |
| format |
Article |
| author |
Молдавская, А.В. Рувинская, В.М. |
| author_facet |
Молдавская, А.В. Рувинская, В.М. |
| author_sort |
Молдавская, А.В. |
| title |
Методика предобработки данных в задаче секвенциального анализа |
| title_short |
Методика предобработки данных в задаче секвенциального анализа |
| title_full |
Методика предобработки данных в задаче секвенциального анализа |
| title_fullStr |
Методика предобработки данных в задаче секвенциального анализа |
| title_full_unstemmed |
Методика предобработки данных в задаче секвенциального анализа |
| title_sort |
методика предобработки данных в задаче секвенциального анализа |
| publisher |
Інститут проблем реєстрації інформації НАН України |
| publishDate |
2017 |
| topic_facet |
Технічні засоби отримання і обробки даних |
| url |
https://nasplib.isofts.kiev.ua/handle/123456789/131666 |
| citation_txt |
Методика предобработки данных в задаче секвенциального анализа / А.В. Молдавская, В.М. Рувинская // Реєстрація, зберігання і обробка даних. — 2017. — Т. 19, № 1. — С. 40-49. — Бібліогр.: 14 назв. — рос. |
| series |
Реєстрація, зберігання і обробка даних |
| work_keys_str_mv |
AT moldavskaâav metodikapredobrabotkidannyhvzadačesekvencialʹnogoanaliza AT ruvinskaâvm metodikapredobrabotkidannyhvzadačesekvencialʹnogoanaliza AT moldavskaâav metodikapoperednʹoíobrobkidanihuzadačísekvencíjnogoanalízu AT ruvinskaâvm metodikapoperednʹoíobrobkidanihuzadačísekvencíjnogoanalízu AT moldavskaâav methodologyofdatapreprocessinginproblemofsequentialanalysis AT ruvinskaâvm methodologyofdatapreprocessinginproblemofsequentialanalysis |
| first_indexed |
2025-11-24T10:18:53Z |
| last_indexed |
2025-11-24T10:18:53Z |
| _version_ |
1849666602863165440 |
| fulltext |
40
004.622
. . 1, . .
, 1, 65044 ,
1e-mail: am.poly@ya.ru
.
: -
, , -
. . -
-
.
: ,
, , , .
(data mining) -
, , ,
, ,
. -
-
. -
— ,
.
-
. -
:
—
, ;
— -
, ,
.
— -
, .
© . . , . .
mailto:am.poly@ya.ru
ISSN 1560-9189 , , 2017, . 19, 1 41
-
[1].
1. -
. .
( ) .
, -
.
2. . , -
. -
, -
[2].
3. ( ) .
, .
.
4. .
.
. ,
, -
.
5. . , -
,
, - ( ,
).
6. .
.
7. . -
, -
.
, . -
— -
, [4]. -
, -
[3],
, -
. -
.
,
data mining [3, 5, 6].
.
1. . ,
. ,
, ,
. . , . .
42
[3].
, .
2. : . -
,
. : = « ».
3. : ,
.
. : = «0». -
— , -
.
4. :
. , , -
. : = «30», = «01/01/2016».
5. [7].
, :
— , -
(feature extraction) [8];
— -
( );
— ;
— ;
— ( ) -
;
— ;
— [9].
,
.
,
, , -
. — .
— (itemsets) — -
[10]. -
: S = <{a},{a, b, c},{b},{b, c},{a, d}>. -
, : S = <{s},{t},
{r},{o},{k},{a}>. , -
, .
, -
, ,
, , -
. .
, , -
— -
ISSN 1560-9189 , , 2017, . 19, 1 43
[10].
, , ,
, .
-
, . -
[11]. ,
, -
.
(Bide+, CloSpan,
SPADE, PrefixSpan ) , -
SPMF
[12]. ,
.
.
,
. -
:
— -
;
— ,
;
— -
( ).
, -
.
:
, ,
, . , -
-
100 %, . . ,
. -
, , —
. -
. ,
-
. , « » ,
4-
: , / ,
, .
, .
. . , . .
44
, — -
, — -
,
.
, -
.
, .
, .
-
. ( , — -
, -
) .
. -
, -
. -
,
( ) .
, , -
, . -
, . .
1 2012–2015 .
1. S
01 02 03 04 05 06 07 08 09 10 11 12
2012 19404 20278 18324 15800 13938 12585 12132 12097 12013 12318 15893 18545
2013 20360 21349 19314 16800 14284 14284 11034 10225 9758 9025 11338 14241
2014 16449 16963 14535 12401 11418 10475 10376 10274 10395 11158 14026 16998
2015 17790 18082 16965 14761 13504 12113 11246 10526 10472 10627 13296 16267
, : -
— . -
,
, . -
3. S
. S' . 2.
S' Bide+ Clospan. -
, . -
. 3, « » -
, -
.
ISSN 1560-9189 , , 2017, . 19, 1 45
2. S'
01 02 03 04 05 06 07 08 09 10 11 12
2012 3 3 3 3 2 2 1 1 1 1 2 2
2013 3 3 3 2 2 1 1 1 1 1 2 2
2014 3 3 3 2 2 1 1 1 1 2 2 3
2015 3 3 3 2 2 2 1 1 1 1 2 3
3. , S'
Bide+ CloSpan
2 3 3 3 2 2 1 1 1 1 2 2
3 3 3 2 2 1 1 1 1 2 3
3 3 3 3 2 2 1 1 1 1
3 3 3 2 2 2 2 3
3 3 3 2 2 1 1 1 1 2 2
3 3 3 2 2 1 1 1 1 2 3
3 3 3 3 2 2 1 1 1 1
3 3 3 2 2 2 2 3
3 3 3 3 2 2 1 1 1 1 2
3 3 3 2 2 1 1 1 1 3
3 3 3 2 2 2 2
3 3 3 2 2 1 1 1 1 2
3 3 3 2 2 1 1 1 1 3
3 3 3 2 2 2 2
4 3 3 3 2 2 1 1 1 1
3 3 3 3
3 3 3 2 2 1 1 1 1
3 3 3 3
, ,
,
- .
. , -
, -
( ), ,
, [13].
, .
. , -
, .
, , , -
, , -
. , , -
. -
, . ,
« » « » «
», -
, .
. ,
. -
80 80 ,
. . , . .
46
.
. 4. ,
.
4.
ClaSP Bide+ CloSpan
20 27 193 32
80 12 49 19
140 9 98 16
200 11 51 17
260 10 50 15
,
, -
, . -
, ,
, .
. ,
.
, -
.
[14].
,
.
.
, ,
-
.
. 200 -
, — 100 , -
— 20. -
, . « -
» .
SPMF,
[12]. . 5
-
.
.
, -
. PrefixSpan , -
,
ISSN 1560-9189 , , 2017, . 19, 1 47
- .
344 — 38513 ,
4 .
SPADE. Bide+ CloSpan -
.
- .
5.
Bide+ SPADE ClaSP PrefixSpan
-
, , , , , , , ,
1 1467 50 282 22,5 687 31 344 27
2 6727 193 2889 52 5264 242 1777 98
3 14709 194 81281 62 52014 836 21962 494
4 38513 195 1272619 212 687 31 38513 527
,
, ,
. ,
, .
, [14]. -
-
.
, -
.
,
,
. . 6
, . -
.
6. ,
Bide+ SPADE ClaSP PrefixSpan
, 49 22 29 25
, 1633 253 687 295
,
, -
.
. . , . .
48
.
,
.
,
: , -
. -
, .
-
.
: . -
: Bide+ 75 %
96 % ; ClaSP 96 % 98,7 %
; SPADE 64,5 % 99,7 % ; -
PrefixSpan 95 % 98,6 % . , -
, -
, -
, . . .
1. . . 1999. URL:
http://neural.narod.ru/Arsen.htm
2. . .
. . 2003. 2(3). . 74–77.
3. . . -
. . 2005. 3–4. . 104–106.
4. . .
. - . :
, , . 2012. 23.
5. . . Knowledge Discovery and Data Mining . :
, 2009. URL: http://www.isras.ru/Davydov_Knowledge.html
6. Markov Z., Larose D.T. Data-mining the Web: uncovering patterns in Web content, structure,
and usage. John Wiley & Sons Inc., 2007. 218 p.
7. . ., . . : -
. . . . . URL:
http://elibrary.sgu.ru/uch_lit/1141.pdf
8. Guyon I., Elisseeff A. An introduction to feature extraction. Feature extraction. Springer Berlin
Heidelberg, 2006. . 1–25.
9. . ., . ., . ., . . -
data mining. .
2009. . 9. C. 197–210.
10. Agrawal R. and Srikant R. Mining Sequential. Journal Intelligent Systems. 1997. Vol. 9. N 1.
. 33–56.
http://neural.narod.ru/Arsen.htm
http://www.isras.ru/Davydov_Knowledge.html
http://elibrary.sgu.ru/uch_lit/1141.pdf
ISSN 1560-9189 , , 2017, . 19, 1 49
11. . . .
. 2016. 2/3. . 158–163.
12. Fournier-Viger P., Lin C.W., Gomariz A., Gueniche T., Soltani A., Deng Z., Lam H.T. The
SPMF Open-Source Data Mining Library Version 2. Proc. 19-th European Conference on Principles of
Data Mining and Knowledge Discovery (PKDD 2016). Part III. Springer LNCS 9853, 2016. . 36–40.
13. . . -
. : -
. . . , 2013. 14. 26 . ( . - . . .
).
14. . . , 2006.
496 .
13.03.2017
|