Порівняння представлень k-мер-даних ДНК для класифікації через нейронні мережі

Ключовим завданням геноміки, яке сприяє розумінню генетичних розладів і розробці точної медицини, є класифікація послідовностей ДНК здорових та хворих людей. Потужним інструментом для його вирішення стали нейронні мережі внаслідок своєї здатності моделювати складні шаблони у великих наборах даних. Ф...

Full description

Saved in:
Bibliographic Details
Published in:Проблеми керування та інформатики
Date:2024
Main Author: Терпіловський, Є.О.
Format: Article
Language:Ukrainian
Published: Інститут кібернетики ім. В.М. Глушкова НАН України 2024
Subjects:
Online Access:https://nasplib.isofts.kiev.ua/handle/123456789/211261
Tags: Add Tag
No Tags, Be the first to tag this record!
Journal Title:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Cite this:Порівняння представлень k-мер-даних ДНК для класифікації через нейронні мережі / Є.О. Терпіловський // Проблеми керування та інформатики. — 2024. — № 6. — С. 61-69. — Бібліогр.: 7 назв. — укр.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
Description
Summary:Ключовим завданням геноміки, яке сприяє розумінню генетичних розладів і розробці точної медицини, є класифікація послідовностей ДНК здорових та хворих людей. Потужним інструментом для його вирішення стали нейронні мережі внаслідок своєї здатності моделювати складні шаблони у великих наборах даних. Фундаментальним кроком у цьому процесі стало представлення послідовностей ДНК у вигляді наборів k-мерів, які є підпослідовностями фіксованої довжини k. У статті оцінюються та порівнюються два методи представлення k-мер-даних. Classifying DNA sequences as healthy or diseased is a crucial task in genomics, with significant implications for understanding genetic disorders and developing precision medicine. Neural networks have emerged as a powerful tool for this classification due to their ability to model complex patterns in large datasets. A foundational step in this process involves representing DNA sequences as sets of k-mers, which are subsequences of a fixed length (k). This study evaluates and compares two methods for representing k-mer data.
ISSN:0572-2691