Использование EM-алгоритма для классификации генов
Рассмотрены EM-алгоритм для задачи разделения смесей распределений, описанных цепями Маркова, и связанная с ней проблема максимизации взвешенного правдоподобия. Предложены вспомогательные алгоритмы для выбора начального приближения и оптимального числа компонентов смеси, а также метод аппроксимации...
Gespeichert in:
| Veröffentlicht in: | Кибернетика и системный анализ |
|---|---|
| Datum: | 2015 |
| Hauptverfasser: | , , |
| Format: | Artikel |
| Sprache: | Russisch |
| Veröffentlicht: |
Інститут кібернетики ім. В.М. Глушкова НАН України
2015
|
| Schlagworte: | |
| Online Zugang: | https://nasplib.isofts.kiev.ua/handle/123456789/124757 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Zitieren: | Использование EM-алгоритма для классификации генов / И.В. Сергиенко, А.М. Гупал, А.В. Островский // Кибернетика и системный анализ. — 2015. — Т. 51, № 1. — С. 48-58. — Бібліогр.: 11 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| Zusammenfassung: | Рассмотрены EM-алгоритм для задачи разделения смесей распределений, описанных цепями Маркова, и связанная с ней проблема максимизации взвешенного правдоподобия. Предложены вспомогательные алгоритмы для выбора начального приближения и оптимального числа компонентов смеси, а также метод аппроксимации смеси распределений на основе известных данных с помощью метода опорных векторов. Полученные результаты применены к задаче классификации фрагментов генов.
Розглянуто EM-алгоритм для задачі поділу сумішей ймовірнісних розподілів, які описуються ланцюжками Маркова, та пов’язану з нею проблему максимізації зваженої правдоподібності. Запропоновано допоміжні алгоритми для вибору початкового наближення та оптимального числа компонентів суміші, а також метод апроксимації суміші розподілів на основі відомих даних з використанням методу опорних векторів. Отримані результати застосовано до задачі класифікації фрагментів генів.
The EM algorithm is considered for the problem of separating probability distribution mixtures with components described by Markov chains, together with the related weighted log likelihood maximization problem. Auxiliary algorithms to select initial approximation and optimal mixture size are proposed, as well as a method for approximating the mixture with given data using support vector machines. The results are applied to boost the quality of gene fragment classifiers
|
|---|---|
| ISSN: | 0023-1274 |