Методика предобработки данных в задаче секвенциального анализа

Статья посвящена разработке методики предобработки данных при проведении секвенциального анализа. Выделены и экспериментально подтверждены проблемы предобработки в данной области: зашумленность данных, избыточность алфавита, возможное наличие циклических повторов. Предложены способы их решения. Эффе...

Full description

Saved in:
Bibliographic Details
Published in:Реєстрація, зберігання і обробка даних
Date:2017
Main Authors: Молдавская, А.В., Рувинская, В.М.
Format: Article
Language:Russian
Published: Інститут проблем реєстрації інформації НАН України 2017
Subjects:
Online Access:https://nasplib.isofts.kiev.ua/handle/123456789/131666
Tags: Add Tag
No Tags, Be the first to tag this record!
Journal Title:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Cite this:Методика предобработки данных в задаче секвенциального анализа / А.В. Молдавская, В.М. Рувинская // Реєстрація, зберігання і обробка даних. — 2017. — Т. 19, № 1. — С. 40-49. — Бібліогр.: 14 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
Description
Summary:Статья посвящена разработке методики предобработки данных при проведении секвенциального анализа. Выделены и экспериментально подтверждены проблемы предобработки в данной области: зашумленность данных, избыточность алфавита, возможное наличие циклических повторов. Предложены способы их решения. Эффективность и результативность предложенных подходов показана на экспериментах. Статтю присвячено розробці методики попередньої обробки даних задля проведення секвенційного аналізу. Виділено та експериментально підтверджено проблеми попередньої обробки у даній галузі: зашумленість даних, надлишковість алфавіту, можлива наявність циклічних повторів. Запропоновано способи їхнього вирішення. Ефективність і результативність запропонованих методів показано на дослідах. A data preprocessing technique for sequential analysis is described. It is outlined and experimentally demonstrated the problems of this field of data mining: noisy data, alphabet redundancy, eventual presence of cyclic repeats. It is proposed the solution of these problems, effectivity of which is shown experimentally.
ISSN:1560-9189