Порівняння представлень k-мер-даних ДНК для класифікації через нейронні мережі

Ключовим завданням геноміки, яке сприяє розумінню генетичних розладів і розробці точної медицини, є класифікація послідовностей ДНК здорових та хворих людей. Потужним інструментом для його вирішення стали нейронні мережі внаслідок своєї здатності моделювати складні шаблони у великих наборах даних. Ф...

Повний опис

Збережено в:
Бібліографічні деталі
Опубліковано в: :Проблеми керування та інформатики
Дата:2024
Автор: Терпіловський, Є.О.
Формат: Стаття
Мова:Українська
Опубліковано: Інститут кібернетики ім. В.М. Глушкова НАН України 2024
Теми:
Онлайн доступ:https://nasplib.isofts.kiev.ua/handle/123456789/211261
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Порівняння представлень k-мер-даних ДНК для класифікації через нейронні мережі / Є.О. Терпіловський // Проблеми керування та інформатики. — 2024. — № 6. — С. 61-69. — Бібліогр.: 7 назв. — укр.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
Опис
Резюме:Ключовим завданням геноміки, яке сприяє розумінню генетичних розладів і розробці точної медицини, є класифікація послідовностей ДНК здорових та хворих людей. Потужним інструментом для його вирішення стали нейронні мережі внаслідок своєї здатності моделювати складні шаблони у великих наборах даних. Фундаментальним кроком у цьому процесі стало представлення послідовностей ДНК у вигляді наборів k-мерів, які є підпослідовностями фіксованої довжини k. У статті оцінюються та порівнюються два методи представлення k-мер-даних. Classifying DNA sequences as healthy or diseased is a crucial task in genomics, with significant implications for understanding genetic disorders and developing precision medicine. Neural networks have emerged as a powerful tool for this classification due to their ability to model complex patterns in large datasets. A foundational step in this process involves representing DNA sequences as sets of k-mers, which are subsequences of a fixed length (k). This study evaluates and compares two methods for representing k-mer data.
ISSN:0572-2691