Использование EM-алгоритма для классификации генов

Рассмотрены EM-алгоритм для задачи разделения смесей распределений, описанных цепями Маркова, и связанная с ней проблема максимизации взвешенного правдоподобия. Предложены вспомогательные алгоритмы для выбора начального приближения и оптимального числа компонентов смеси, а также метод аппроксимации...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Кибернетика и системный анализ
Datum:2015
Hauptverfasser: Сергиенко, И.В., Гупал, А.М., Островский, А.В.
Format: Artikel
Sprache:Russisch
Veröffentlicht: Інститут кібернетики ім. В.М. Глушкова НАН України 2015
Schlagworte:
Online Zugang:https://nasplib.isofts.kiev.ua/handle/123456789/124757
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:Использование EM-алгоритма для классификации генов / И.В. Сергиенко, А.М. Гупал, А.В. Островский // Кибернетика и системный анализ. — 2015. — Т. 51, № 1. — С. 48-58. — Бібліогр.: 11 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
Beschreibung
Zusammenfassung:Рассмотрены EM-алгоритм для задачи разделения смесей распределений, описанных цепями Маркова, и связанная с ней проблема максимизации взвешенного правдоподобия. Предложены вспомогательные алгоритмы для выбора начального приближения и оптимального числа компонентов смеси, а также метод аппроксимации смеси распределений на основе известных данных с помощью метода опорных векторов. Полученные результаты применены к задаче классификации фрагментов генов. Розглянуто EM-алгоритм для задачі поділу сумішей ймовірнісних розподілів, які описуються ланцюжками Маркова, та пов’язану з нею проблему максимізації зваженої правдоподібності. Запропоновано допоміжні алгоритми для вибору початкового наближення та оптимального числа компонентів суміші, а також метод апроксимації суміші розподілів на основі відомих даних з використанням методу опорних векторів. Отримані результати застосовано до задачі класифікації фрагментів генів. The EM algorithm is considered for the problem of separating probability distribution mixtures with components described by Markov chains, together with the related weighted log likelihood maximization problem. Auxiliary algorithms to select initial approximation and optimal mixture size are proposed, as well as a method for approximating the mixture with given data using support vector machines. The results are applied to boost the quality of gene fragment classifiers
ISSN:0023-1274