Сравнение методов интеллектуального анализа данных при оценивании кредитоспособности физических лиц
Розглянуто задачу оцінювання ризиків при кредитуванні фізичних осіб за методами інтелектуального аналізу даних — кластерного аналізу, дерев рішень, штучних нейронних мереж, регресійних моделей дискретного вибору та мереж Байєса з метою їх порівняння. Для побудови моделей використовується база даних...
Saved in:
| Published in: | Проблемы управления и информатики |
|---|---|
| Date: | 2009 |
| Main Authors: | , , , |
| Format: | Article |
| Language: | Russian |
| Published: |
Інститут кібернетики ім. В.М. Глушкова НАН України
2009
|
| Subjects: | |
| Online Access: | https://nasplib.isofts.kiev.ua/handle/123456789/210620 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| Journal Title: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Cite this: | Сравнение методов интеллектуального анализа данных при оценивании кредитоспособности физических лиц / А.Н. Терентьев, П.И. Бидюк, А.В. Миронова, Н.Ю. Медин // Проблемы управления и информатики. — 2009. — № 5. — С. 141-149. — Бібліогр.: 5 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| _version_ | 1859984236020236288 |
|---|---|
| author | Терентьев, А.Н. Бидюк, П.И. Миронова, А.В. Медин, Н.Ю. |
| author_facet | Терентьев, А.Н. Бидюк, П.И. Миронова, А.В. Медин, Н.Ю. |
| citation_txt | Сравнение методов интеллектуального анализа данных при оценивании кредитоспособности физических лиц / А.Н. Терентьев, П.И. Бидюк, А.В. Миронова, Н.Ю. Медин // Проблемы управления и информатики. — 2009. — № 5. — С. 141-149. — Бібліогр.: 5 назв. — рос. |
| collection | DSpace DC |
| container_title | Проблемы управления и информатики |
| description | Розглянуто задачу оцінювання ризиків при кредитуванні фізичних осіб за методами інтелектуального аналізу даних — кластерного аналізу, дерев рішень, штучних нейронних мереж, регресійних моделей дискретного вибору та мереж Байєса з метою їх порівняння. Для побудови моделей використовується база даних клієнтів першої філії VAB-банку. Отримані скорингові моделі оцінено з використанням таких критеріїв: загальна точність, похибки 1- та 2-го роду. Наведено експериментальні результати, опис методів та приклади скорингових моделей.
An analysis of the task of risk evaluation for crediting clients using the methods of intellectual data analysis, namely cluster analysis, decision trees, artificial neural networks, discrete choice models and Bayesian networks is performed with the purpose of their comparison. For construction of scoring models the database of clients of the first branch of VAB bank was used. The scoring models constructed are estimated with the use of the following criteria: common accuracy, errors of the first and second type. Experimental results, description of methods and examples of scoring models are also presented.
|
| first_indexed | 2025-12-17T12:04:21Z |
| format | Article |
| fulltext |
© А.Н. ТЕРЕНТЬЕВ, П.И. БИДЮК, А.В. МИРОНОВА, Н Ю. МЕДИН, 2009
Проблемы управления и информатики, 2009, № 5 141
УДК 62-50
А.Н. Терентьев, П.И. Бидюк, А.В. Миронова, Н.Ю. Медин
СРАВНЕНИЕ МЕТОДОВ ИНТЕЛЛЕКТУАЛЬНОГО
АНАЛИЗА ДАННЫХ ПРИ ОЦЕНИВАНИИ
КРЕДИТОСПОСОБНОСТИ ФИЗИЧЕСКИХ ЛИЦ
Введение
На протяжении последних десяти лет в Украине быстрыми темпами развива-
ется кредитование физических лиц. При этом увеличивается количество дефолтов
(невозвращение кредитов). По некоторым продуктам (например, потребительские
кредиты на покупку товаров) объемы потерь составляют около 15 %. По данным
рейтинговой компании Standard and Poor’s (состоянием на конец 2008 г.) каждый
третий выданный в Украине кредит проблемный. Standard and Poor’s относит бан-
ковскую систему Украины к последней, самой слабой группе 10. Кроме Украины,
в эту группу входят Венесуэла, Ямайка и Боливия. Для сравнения, Белоруссия
входит в 9-ю группу, а Россия в 7-ю.
Постановка задачи
Построить скоринговые модели оценивания кредитоспособности физических
лиц с использованием самых известных современных методов интеллектуального
анализа данных (ИАД) — кластерного анализа, деревьев решений, искусственных
нейронных сетей (ИНС), регрессионных моделей дискретного выбора и байесов-
ских сетей. Выполнить сравнительный анализ результатов моделирования и пред-
ложить лучший метод оценивания кредитоспособности физических лиц.
Описание входных данных
Для построения скоринговых моделей используется база данных клиентов
первого филиала VAB-банка. Обучающая выборка данных создана из 3247 за-
писей о клиентах; для определения качества прогнозирования использовано
100 записей, которые не учитывались при построении скоринговой модели.
В качестве переменных процесса выбраны десять атрибутов: 1x — пол; 2x —
возраст; 3x — семейное положение; 4x — количество детей; 5x — муж (жена) ра-
ботает; 6x — образование; 7x — тип трудозанятости; 8x — поручитель; 9x —
сумма кредита; y — результат (кредитоспособен или нет).
Статистические критерии определения качества скоринговой модели
Для оценивания построенных моделей обычно используют такие критерии:
общая точность модели (CA — common accuracy), вычисляется как отноше-
ние правильно спрогнозированных значений к общему количеству значений N:
;
значенийованныхспрогнозирправильноколичество
N
CA
погрешности первого и второго рода приведены в табл. 1; погрешности
первого рода — прямые потери банка, а второго — нереализованный доход.
142 ISSN 0572-2691
Таблица 1
Вывод
Прогноз: нормальный
(кредитоспособный)
Прогноз: дефолт
(некредитоспособный)
Нормальный Правильная классификация Погрешность 2-го рода
Дефолт Погрешность 1-го рода Правильная классификация
Деревья решений
Метод деревьев решений (decision trees или answer tree) — один из популяр-
ных методов решения задач классификации и прогнозирования. Иногда этот ме-
тод ИАД называют также деревьями решающих правил, деревьями классифика-
ции и регрессии.
Впервые деревья решений были предложены Ховилендом (Hoveland) и Хан-
том (Hunt) в конце 50-х годов прошлого века. Самой ранней публикацией, в кото-
рой излагается суть деревьев решений, является работа Ханта «Эксперименты
в индукции» («Experіments іn Іnductіon») [1], опубликованная в 1966 г.
Назовем самые популярные методы построения деревьев решений.
— CHAІD (CHi-squared Automatic Interaction Detector). Это самый известный
метод построения деревьев решений, в котором для получения оптимального раз-
биения используется критерий связи между категориальными переменными 2
(если целевая переменная является количественной, используется F-критерий).
Данные анализа целевой переменной и переменных-факторов могут быть как ко-
личественные, так и категориальные, но количественные переменные-факторы
при построении дерева преобразуются в категориальные.
— CART (Classification and regression trees). Метод, известный также как
«метод построения деревьев регрессии и классификации». Он основан не на ста-
тистических критериях, а на уменьшении неоднородности сегментов (узлов). Хо-
рошо работает в том случае, если все переменные в анализе количественные.
В методе могут использоваться как количественные, так и категориальные целе-
вые переменные и переменные-факторы.
— QUEST (Quick, Unbiased and Efficient Statistical Tree). В данном методе для
выбора факторов используются разные критерии, в зависимости от типа потенци-
ального фактора. Он позволяет избежать сдвигов, обусловленных выбором фак-
торов с большим количеством категорий, но целевая переменная в этом случае
должна быть категориальной. Переменные-факторы могут быть как количествен-
ные, так и категориальные.
Если зависимая, т.е. целевая переменная принимает дискретные значения, то
с помощью метода деревьев решений решается задача классификации. Если же
зависимая переменная принимает непрерывные значения, то дерево решений
устанавливает зависимость этой переменной от независимых переменных, т.е.
решается задача численного прогнозирования.
В простом виде дерево решений — это способ представления правил в
иерархической, последовательной структуре. Основа такой структуры — ответы
«Да» или «Нет» на ряд возможных вопросов.
На рис. 1 приведена скоринговая система в виде деревьев решений, по-
строенного по методу CHAID, задачей которой является получение ответов на
вопрос: «Выдавать ли кредит?». Чтобы решить эту задачу, необходимо опреде-
лить вероятность дефолта клиента банка. Для этого необходимо ответить на
ряд вопросов, которые находятся в узлах (вершинах) этого дерева, начиная
Проблемы управления и информатики, 2009, № 5 143
с его корня. Вершина «Поручитель» — вершина проверки, т.е. условие. Если
ответ положителен, то происходит переход к верхней части дерева к вершине
«Возраст», если отрицательный — к нижней части дерева. Таким образом,
внутренний узел (вершина) дерева — это узел проверки определенного усло-
вия. Дальше идет следующий вопрос и так далее, пока не будет достигнут по-
следний узел (вершина) дерева, который является узлом решения. Для нашего
дерева конечный узел — вершина «Результат», которая принимает два значе-
ния: T и F (T — true и F — false) (в %), где F — вероятность невозвращения
клиентом кредита выданного банком (дефолт).
Поручитель
Возраст
Сумма кредита
Количество детей
Результат
T=91,4
F=8,6
Результат
T=77,2
F=22,8
Результат
T=64,5
F=35,5
Результат
T=91,7
F=8,3
Результат
T=76,3 %
F=23,7 %
Результат
T=96,9
F=3,1
Результат
T=99,9
F=0,1
Результат
T=99,2
F=0,8
Результат
T=98,4 %
F=1,6 %
Результат
T=91,6
F=8,4
Результат
T=93
F=7
Муж (жена) работает
Возраст
Количество детей
Пол
М
Ж
0
1, 2
Да
Нет
0
1, 2, 3
> 2471
≤ 1000
(1000, 2471)
Нет
Да
≤ 28
(28, 38)
> 38
≤ 25
> 25
Рис. 1
144 ISSN 0572-2691
В результате прохождения от корня дерева «Поручитель» к его конечной
вершине «Результат» решается задача классификации. На основании полученных
значений вероятностей T и F определяется степень кредитоспособности клиента и
принимается решение, касающееся выдачи или отказа предоставления кредита.
Построение скоринговых моделей создано по трем описанным методам в си-
стеме статистических расчетов SPSS 16. Как видно из табл. 2, наилучший резуль-
тат среди деревьев решений получено по методу CHAID.
Таблица 2
Название
метода
Погрешность Точность
модели
Процент
погрешностей при
классификации 1-го рода 2-го рода Общая
Вероятность возвращения кредита 90 %
CHAID 76 275 351 0,895 10
CART 68 299 367 0,891 20
QUEST 47 546 593 0,823 15
Наилучшие иерархические методы кластеризации с использованием квадратичной меры Евклида
Взвешенный
центроидный
174 93 267 0,92 15
Варда 146 296 442 0,868 15
Наилучшие иерархические методы кластеризации с использованием коэффициента Пирсона
Связь между
группами
177 26 203 0,939 20
Связь внутри
групп
171 370 541 0,838 20
Удаленные
соседи
177 71 248 0,926 20
Медиан 177 26 203 0,939 15
Неиерархические методы кластеризации
k-средних
для итераций и
классификации
116 564 680 0,797 10 %
k-средних
только для
классификации
172 119 291 0,914 15
Двухэтапный 78 1245 1323 0,605 45
Наилучшие иерархические методы с предварительной факторизацией
Ближнего
соседа
178 1 179 0,947 15
Линейная
вероятностная
модель
175 0 175 0,947 15
Логит модель 163 6 169 0,949 15
Пробит модель 168 2 170 0,948 15
Байесовская
сеть
115 157 272 0,918 15
Кластерный анализ
В 1939 г. Трион (Tryon) ввел новый термин — «кластерный анализ». В отли-
чие от классификации, кластерный анализ не требует априорных допущений от-
носительно данных. Задачу кластеризации объектов можно рассматривать как
процесс выявления существенно упорядоченных данных в многомерной матрице,
благодаря чему возможно выделение кластеров — «плотных» скоплений исследу-
емых объектов.
Проблемы управления и информатики, 2009, № 5 145
На сегодня кластерный анализ содержит более 100 разнообразных алгорит-
мов [2]. Для решения задачи построения скоринговых моделей использовано
49 методов кластерного анализа:
иерархические — связи между группами, связи внутри групп, ближнего со-
седа, удаленных соседей, взвешенный центроидный, медиан, Варда;
итерационные — k-средних, k-медиан, двухэтапный алгоритм BІRCH.
Для определения расстояния между кластерами использовались меры:
квадратичная евклидовая, простая евклидовая, коэффициент корреляции Пирсона,
Чебишева, Минковича.
Для решения задачи сокращения количества переменных в задаче кластери-
зации клиентов банка применяется популярный метод факторного анализа —
метод главных компонентов. При этом для решения задачи вращения факто-
ров применяется метод Varimax. В табл. 3 приведены полученные значения об-
ратной матрицы. По этим значениям можно определить, из каких перемен-
ных (атрибутов) состоит каждый из факторов. Фактор-1 состоит из переменных
«пол», «возраст», «семейное положение» и «тип трудозанятости»; фактор-2 —
из переменных «семейное положение», «количество детей» и «муж (жена) ра-
ботает»; фактор-3 — из переменных «образование», «поручитель» и «сумма
кредита».
Таблица 3
Атрибут Фактор-1 Фактор-2 Фактор-3
Пол – 0,538 0,085 – 0,223
Возраст 0,811 0,171 – 0,036
Семейное положение 0,577 0,566 – 0,024
Количество детей – 0,153 0,769 – 0,033
Муж (жена) работает 0,093 0,697 – 0,014
Образование – 0,158 – 0,075 0,537
Тип трудозанятости 0,543 – 0,266 – 0,369
Поручитель 0,121 – 0,141 0,529
Сумма кредита 0,085 0,181 0,626
По результатам вычислительных экспериментов и с использованием крите-
рия общей точности модели для классификации кредитоспособности клиентов
банка установлено, что лучшим оказался метод ближнего соседа, если мерой рас-
стояния служит коэффициент Пирсона. Также принятая общая точность модели
получена с помощью методов связи между группами, наиболее удаленных сосе-
дей, взвешенного центроидного, медиан и k-средних. Низкая точность показана
методом связи внутри групп и Варда (наихудшим оказался двухэтапный метод).
Искусственные нейронные сети
Один из известных методов ИАД — ИНС. Несмотря на большое разнооб-
разие вариантов существующих нейронных сетей, они имеют общие черты.
Так, все они состоят из большого числа связанных между собой однотипных
элементов — нейронов. На рис. 2 показана схема нейрона для задачи оценива-
ния кредитоспособности, где ix — значение i-го входа нейрона; iw — вес i-го
синапса.
146 ISSN 0572-2691
Пол
Возраст
Семейное положение
Количество детей
Муж работает
Образование
Тип трудозанятости
Сумма кредита
Поручитель
x1
x2
x3
x4
x5
x6
x7
x8
x9
w1
w9
S
y Результат
Входы Синапсы Ядро аксон Выход
Рис. 2
Для построения скоринговых моделей использованы такие методы построе-
ния ИНС:
— обратного распространения (back propagatіon) [3];
— resilient propagation [4].
Для моделирования задействована программная аналитическая платформа
Deductor. Среди моделей, построенных в виде ИНС, наилучшими оказались два
типа:
— количество нейронов в шаре: 9 входных, 3 скрытых и 1 выходной;
— количество нейронов в шаре: 9 входных, 5 скрытых и 1 выходной.
Другие, более сложные, при наличии обучающей выборки клиентов банка
обучались плохо или не обучались совсем. Для алгоритма Resilient propagation
было задано 2000 эпох обучения.
Бинарные регрессионные модели дискретного выбора
В 1805 г. опубликована первая работа, посвященная методу наименьших
квадратов (МНК), с которой началось формальное развитие регрессионного ана-
лиза, хотя этот метод Гаусс предложил еще в 1795 г. Модели дискретного выбора
предназначены для того, чтобы объяснить дискретный выбор результата, т.е. ре-
шение задачи оценивания кредитоспособности заемщика по моделям дискретного
выбора означает, что 1y (клиент кредитоспособен), если ,5,0yprobabilit или
0y (дефолт) иначе. Коэффициенты приведенных ниже уравнений вычислены с
использованием системы моделирования Eviews 3.
Линейная вероятностная модель — это разновидность множественной ре-
грессии, общее назначение которой основывается на анализе связи между не-
сколькими независимыми переменными (регрессорами или предикатами) и зави-
симой переменной:
4321 0121,001,00024,00358,07545,0yprobabilit xxxx
.6732,11112,00037,00142,00214,0 98765 xxxxx
Главный недостаток линейной вероятностной модели — то, что значение вероят-
ностей выходит за диапазон [0, 1], поэтому чаще всего используют логит и пробит
модели.
Логит модели. В 1838 г. бельгийский математик Верхулст (Verhulst) пред-
ложил идею использования логистической функции для демографических иссле-
дований, но широко популярной эта модель стала в 1925 г. благодаря подтвер-
Проблемы управления и информатики, 2009, № 5 147
ждающим практическим исследованиям Юла (Yule), Перла (Pearl) и Рида (Reed).
Логит модели оценивания кредитоспособности физических лиц имеет вид
,
)(exp1
1
))((exp1
1
)(exp1
)(exp
yprobabilit
1 zzz
z
где
4321 1875,01426,00695,09563,0 xxxxz
.0005,00315,30509,02727,02264,0 98765 xxxxx
Пробит модели. Предложена в 1935 г. биологом Блиссом (Bliss), но широко
распространяться стала лишь в начале 70-х годов прошлого столетия благодаря
распространению мейнфреймов, которые способны решать задачи нелинейной
максимизации. Для задачи, которая решается, логит модели записывается следу-
ющим образом:
,
2
exp
2
1
yprobabilit
2
dt
t
z
где
4321 1097,00918,0035,04469,02677,0 xxxxz
.0002,04139,11539,01436,01148,0 98765 xxxxx
Байесовские сети
Первое упоминание о байесовских сетях (БС) появилось в 1985 г. (Дж. Перл),
хотя теорема Байеса, положенная в основу построения вероятностного вывода по
БС, предложена еще в 1763 г. Идея использования БС основывается на представ-
лении причинно-наследственных связей процесса в виде графа, в котором каждая
переменная (фактор, атрибут) процесса — вершина, а существующие причинно-
наследственные связи между переменными процесса изображают направленными
дугами, которые соединяют соответственные вершины.
На рис. 3 показана скоринговая модель в виде БС, построенная по итерацион-
ному эвристическому методу, который основывается на использовании оценки вза-
имной информации между вершинами, и функции описания минимальной дли-
ны [5].
Образование Тип трудозанятости
Возраст
Семейное
положение
Пол
Поручитель Сумма кредита Количество детей
Муж (жена)
работает Кредитоспособный?
Рис. 3
В табл. 4 приведено десять смоделированных ситуаций с использованием ме-
тода построения точного вероятностного вывода в БС по обучающим данным [5].
Построенной скоринговой модели в виде БС (рис. 3) соответствуют такие
статистические характеристики: погрешность первого рода — 115; погрешность
второго рода — 157; общая погрешность — 272; общая точность модели — 0,918;
погрешность классификации — 15 %.
148 ISSN 0572-2691
Таблица 4
Номер
ситуации
Инстанциированые вершины
(априорная информация, касающаяся клиента)
Вероятность
возвращения кредита (%)
1 Пол «Мужской» 92,0
2 Пол «Женский» 97,55
3 Поручитель «Да» 99,06
4 Поручитель «Нет» 87,98
5
Возраст < 32 лет и Семейное положение «Одинокий»
и Сумму кредита > 5000
76,92
6
Тип трудозанятости «Работник банка»
и Семейное положение «Одинокий»
94,66
7
Образование «Высшее», Количество детей «один»,
Муж (Жена) работает «Да»
97,39
8
Образование «Среднее» и Количество детей «Нет»,
Муж (Жена) работает «Нет», Поручитель «Нет»,
Сумма кредита > 2500
69,78
9
Пол «Мужской» и Семейное положение «Вдовец»
и Образование «Среднее специальное»
78,95
10
Пол «Женский» и Семейное положение «Вдовец»
и Образование «Среднее специальное»
98,81
Анализ результатов
В табл. 2 и 5 приведены статистические и прогнозные характеристики, полу-
ченные при использовании соответствующих методов ИАД для построения ско-
ринговых моделей оценивания кредитоспособности физических лиц. При класси-
фикации рассматривалось значение порога 90 %, клиент классифицировался как
кредитоспособный.
Таблица 5
Название алгоритма
построения ИНС
Количество нейронов в шаре
Точность
модели
Процент
погрешностей
при классификации Входных Скрытых Выходных
Back propagation 9 3 1 0,9 20
Back propagation 9 5 1 0,91 15
Resilient propagation 9 3 1 0,91 15
Resilient propagation 9 5 1 0,9 15
Наилучшие результаты получены методами деревьев решений CHAІD и
кластерного анализа k-средних. Для этих методов процент погрешностей клас-
сификации равен 10, а это означает, что из 100 выданных кредитов 10 классифи-
цировались неправильно. Большинство скоринговых систем, полученных дру-
гими методами ИАД, дали погрешность классификации 15–20 %. По критерию
общей точности модели наилучший результат (0,949) показала логит модель,
а среди методов кластерного анализа — ближнего соседа с предварительной
факторизацией.
Заключение
Построение математических моделей оценивания рисков и показателей фи-
нансово-экономической деятельности методами ИАД — один из перспективных
направлений системного анализа. Среди методов ИАД, которые использовались
для построения скоринговых моделей, наилучшие результаты получены методом
деревьев решений Chaid и методом кластерного анализа k-средних. Таким обра-
Проблемы управления и информатики, 2009, № 5 149
зом, подтверждена высокая эффективность использования методов ИАД для ана-
лиза и моделирования эконометрических показателей как необходимый этап ре-
шения важной проблемы — обеспечение стабильности и финансовой безопасно-
сти банковской системы Украины.
В последующих разработках планируется исследовать возможности повыше-
ния точности моделей и внедрить механизм прогноза вероятностей дефолтов на
основании скоринговых моделей.
О.М. Терентьєв, П.І. Бідюк, О.В. Миронова, М.Ю. Медін
ПОРІВНЯННЯ МЕТОДІВ ІНТЕЛЕКТУАЛЬНОГО
АНАЛІЗУ ДАНИХ ПРИ ОЦІНЮВАННI
КРЕДИТОСПРОМОЖНОСТІ ФІЗИЧНИХ ОСІБ
Розглянуто задачу оцінювання ризиків при кредитуванні фізичних осіб за мето-
дами інтелектуального аналізу даних — кластерного аналізу, дерев рішень,
штучних нейронних мереж, регресійних моделей дискретного вибору та мереж
Байєса з метою їх порівняння. Для побудови моделей використовується база
даних клієнтів першої філії VAB-банку. Отримані скорингові моделі оцінено з
використанням таких критеріїв: загальна точність, похибки 1- та 2-го роду. На-
ведено експериментальні результати, опис методів та приклади скорингових
моделей.
A.N. Terentyev, P.I. Bidyuk, A.V. Mironova, N.Yu. Medin
COMPARISON OF DATA MINING
METHODS FOR ESTIMATING CREDIT
RATING OF NATURAL PERSONS
An analysis of the task of risk evaluation for crediting clients using the methods of
intellectual data analysis, namely cluster analysis, decision trees, artificial neural
networks, discrete choice models and Bayesian networks is performed with the pur-
pose of their comparison. For construction of scoring models the database of clients
of the first branch of VAB bank was used. The scoring models constructed are esti-
mated with the use of the following criteria: common accuracy, errors of the first and
second type. Experimental results, description of methods and examples of scoring
models are also presented.
1. Hunt E.B., Marin J., Stone P. Experiments in induction // The American Journal of Psycholo-
gy. — 1966. — 80, N 4. — P. 651–653.
2. Кривова О.А., Коваленко А.С. Применение кластерного анализа для выявления соотноше-
ний индикаторов демографического развития // Кибернетика и вычисл. техника. — 2007. —
Вып. 153. — С. 24–39.
3. Хайкин С. Нейронные сети : Полный курс. — М. : Издательский дом «Вильямс», 2008. —
1103 с.
4. Riedmiller, M., Braun, H. A direct adaptive method for faster back propagation learning: the
RPROP algorithm / IEEE Intern. Conf. on Image Process., Chicago, Illinois, USA, 3–6 May,
1993. — 1. — P. 586–591.
5. Terent’yev A.N., Bidyuk P.I., Korshevnyuk L.A. Bayesian network as instrument of intelligent data
analysis // J. of Automat. and Inform. Scie. — 2007. — 39, N 8. — P. 28–38.
Получено 28.04.2009
http://www.begellhouse.com/authors/7232d7aa34f2566a.html
http://www.begellhouse.com/journals/2b6239406278e43e.html
|
| id | nasplib_isofts_kiev_ua-123456789-210620 |
| institution | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| issn | 0572-2691 |
| language | Russian |
| last_indexed | 2025-12-17T12:04:21Z |
| publishDate | 2009 |
| publisher | Інститут кібернетики ім. В.М. Глушкова НАН України |
| record_format | dspace |
| spelling | Терентьев, А.Н. Бидюк, П.И. Миронова, А.В. Медин, Н.Ю. 2025-12-13T11:36:12Z 2009 Сравнение методов интеллектуального анализа данных при оценивании кредитоспособности физических лиц / А.Н. Терентьев, П.И. Бидюк, А.В. Миронова, Н.Ю. Медин // Проблемы управления и информатики. — 2009. — № 5. — С. 141-149. — Бібліогр.: 5 назв. — рос. 0572-2691 https://nasplib.isofts.kiev.ua/handle/123456789/210620 62-50 10.1615/JAutomatInfScien.v41.i10.60 Розглянуто задачу оцінювання ризиків при кредитуванні фізичних осіб за методами інтелектуального аналізу даних — кластерного аналізу, дерев рішень, штучних нейронних мереж, регресійних моделей дискретного вибору та мереж Байєса з метою їх порівняння. Для побудови моделей використовується база даних клієнтів першої філії VAB-банку. Отримані скорингові моделі оцінено з використанням таких критеріїв: загальна точність, похибки 1- та 2-го роду. Наведено експериментальні результати, опис методів та приклади скорингових моделей. An analysis of the task of risk evaluation for crediting clients using the methods of intellectual data analysis, namely cluster analysis, decision trees, artificial neural networks, discrete choice models and Bayesian networks is performed with the purpose of their comparison. For construction of scoring models the database of clients of the first branch of VAB bank was used. The scoring models constructed are estimated with the use of the following criteria: common accuracy, errors of the first and second type. Experimental results, description of methods and examples of scoring models are also presented. ru Інститут кібернетики ім. В.М. Глушкова НАН України Проблемы управления и информатики Экономические и управленческие системы Сравнение методов интеллектуального анализа данных при оценивании кредитоспособности физических лиц Порівняння методів інтелектуального аналізу даних при оцінюваннi кредитоспроможності фізичних осіб Comparison of data mining methods for estimating credit rating of natural persons Article published earlier |
| spellingShingle | Сравнение методов интеллектуального анализа данных при оценивании кредитоспособности физических лиц Терентьев, А.Н. Бидюк, П.И. Миронова, А.В. Медин, Н.Ю. Экономические и управленческие системы |
| title | Сравнение методов интеллектуального анализа данных при оценивании кредитоспособности физических лиц |
| title_alt | Порівняння методів інтелектуального аналізу даних при оцінюваннi кредитоспроможності фізичних осіб Comparison of data mining methods for estimating credit rating of natural persons |
| title_full | Сравнение методов интеллектуального анализа данных при оценивании кредитоспособности физических лиц |
| title_fullStr | Сравнение методов интеллектуального анализа данных при оценивании кредитоспособности физических лиц |
| title_full_unstemmed | Сравнение методов интеллектуального анализа данных при оценивании кредитоспособности физических лиц |
| title_short | Сравнение методов интеллектуального анализа данных при оценивании кредитоспособности физических лиц |
| title_sort | сравнение методов интеллектуального анализа данных при оценивании кредитоспособности физических лиц |
| topic | Экономические и управленческие системы |
| topic_facet | Экономические и управленческие системы |
| url | https://nasplib.isofts.kiev.ua/handle/123456789/210620 |
| work_keys_str_mv | AT terentʹevan sravneniemetodovintellektualʹnogoanalizadannyhpriocenivaniikreditosposobnostifizičeskihlic AT bidûkpi sravneniemetodovintellektualʹnogoanalizadannyhpriocenivaniikreditosposobnostifizičeskihlic AT mironovaav sravneniemetodovintellektualʹnogoanalizadannyhpriocenivaniikreditosposobnostifizičeskihlic AT medinnû sravneniemetodovintellektualʹnogoanalizadannyhpriocenivaniikreditosposobnostifizičeskihlic AT terentʹevan porívnânnâmetodívíntelektualʹnogoanalízudanihpriocínûvannikreditospromožnostífízičnihosíb AT bidûkpi porívnânnâmetodívíntelektualʹnogoanalízudanihpriocínûvannikreditospromožnostífízičnihosíb AT mironovaav porívnânnâmetodívíntelektualʹnogoanalízudanihpriocínûvannikreditospromožnostífízičnihosíb AT medinnû porívnânnâmetodívíntelektualʹnogoanalízudanihpriocínûvannikreditospromožnostífízičnihosíb AT terentʹevan comparisonofdataminingmethodsforestimatingcreditratingofnaturalpersons AT bidûkpi comparisonofdataminingmethodsforestimatingcreditratingofnaturalpersons AT mironovaav comparisonofdataminingmethodsforestimatingcreditratingofnaturalpersons AT medinnû comparisonofdataminingmethodsforestimatingcreditratingofnaturalpersons |