Отбор переменных в логистическую регрессию генетическим алгоритмом

В статье исследуются эффективные процедуры отбора переменных в бинарные классифицирующие
 модели на основе логистической регрессии. Для этого используется генетический алгоритм, причем в
 функцию фитнеса особи параметр штрафа за включение в модель новых переменных изменяется в&#x...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Datum:2008
1. Verfasser: Паклин, Н.Б.
Format: Artikel
Sprache:Russisch
Veröffentlicht: Інститут проблем штучного інтелекту МОН України та НАН України 2008
Schlagworte:
Online Zugang:https://nasplib.isofts.kiev.ua/handle/123456789/7157
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:Отбор переменных в логистическую регрессию генетическим алгоритмом / Н.Б. Паклин // Штучний інтелект. — 2008. — № 3. — С. 714-719. — Бібліогр.: 5 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
Beschreibung
Zusammenfassung:В статье исследуются эффективные процедуры отбора переменных в бинарные классифицирующие
 модели на основе логистической регрессии. Для этого используется генетический алгоритм, причем в
 функцию фитнеса особи параметр штрафа за включение в модель новых переменных изменяется в
 зависимости от рассчитанного значения площади под ROC-кривой. Проведены эксперименты на
 модельных наборах данных и в задаче кредитного скоринга. У статті досліджуються ефективні процедури відбору змінних в бінарні класифікуючі моделі на
 основі логістичної регресії. Для цього використовується генетичний алгоритм, причому у функцію
 фітнеса особини параметр штрафу за включення в модель нових змінних змінюється залежно від
 розрахованого значення площі під ROC-кривою. Проведені експерименти на модельних наборах
 даних і в задачі кредитного скорингу. In the paper we discuss effective procedures for а feature selection problem in a binary logistic regression
 model. A genetic algorithm was used to find best feature combinations, with the special fitness function
 based on a penalty parameter for including new variables. This parameter depends on ROC-curve index on
 current epoch. Experiments on Madelon data set and credit scoring classification problem were made.
ISSN:1561-5359