Сравнение методов интеллектуального анализа данных при оценивании кредитоспособности физических лиц

Розглянуто задачу оцінювання ризиків при кредитуванні фізичних осіб за методами інтелектуального аналізу даних — кластерного аналізу, дерев рішень, штучних нейронних мереж, регресійних моделей дискретного вибору та мереж Байєса з метою їх порівняння. Для побудови моделей використовується база даних...

Full description

Saved in:
Bibliographic Details
Published in:Проблемы управления и информатики
Date:2009
Main Authors: Терентьев, А.Н., Бидюк, П.И., Миронова, А.В., Медин, Н.Ю.
Format: Article
Language:Russian
Published: Інститут кібернетики ім. В.М. Глушкова НАН України 2009
Subjects:
Online Access:https://nasplib.isofts.kiev.ua/handle/123456789/210620
Tags: Add Tag
No Tags, Be the first to tag this record!
Journal Title:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Cite this:Сравнение методов интеллектуального анализа данных при оценивании кредитоспособности физических лиц / А.Н. Терентьев, П.И. Бидюк, А.В. Миронова, Н.Ю. Медин // Проблемы управления и информатики. — 2009. — № 5. — С. 141-149. — Бібліогр.: 5 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1859984236020236288
author Терентьев, А.Н.
Бидюк, П.И.
Миронова, А.В.
Медин, Н.Ю.
author_facet Терентьев, А.Н.
Бидюк, П.И.
Миронова, А.В.
Медин, Н.Ю.
citation_txt Сравнение методов интеллектуального анализа данных при оценивании кредитоспособности физических лиц / А.Н. Терентьев, П.И. Бидюк, А.В. Миронова, Н.Ю. Медин // Проблемы управления и информатики. — 2009. — № 5. — С. 141-149. — Бібліогр.: 5 назв. — рос.
collection DSpace DC
container_title Проблемы управления и информатики
description Розглянуто задачу оцінювання ризиків при кредитуванні фізичних осіб за методами інтелектуального аналізу даних — кластерного аналізу, дерев рішень, штучних нейронних мереж, регресійних моделей дискретного вибору та мереж Байєса з метою їх порівняння. Для побудови моделей використовується база даних клієнтів першої філії VAB-банку. Отримані скорингові моделі оцінено з використанням таких критеріїв: загальна точність, похибки 1- та 2-го роду. Наведено експериментальні результати, опис методів та приклади скорингових моделей. An analysis of the task of risk evaluation for crediting clients using the methods of intellectual data analysis, namely cluster analysis, decision trees, artificial neural networks, discrete choice models and Bayesian networks is performed with the purpose of their comparison. For construction of scoring models the database of clients of the first branch of VAB bank was used. The scoring models constructed are estimated with the use of the following criteria: common accuracy, errors of the first and second type. Experimental results, description of methods and examples of scoring models are also presented.
first_indexed 2025-12-17T12:04:21Z
format Article
fulltext © А.Н. ТЕРЕНТЬЕВ, П.И. БИДЮК, А.В. МИРОНОВА, Н Ю. МЕДИН, 2009 Проблемы управления и информатики, 2009, № 5 141 УДК 62-50 А.Н. Терентьев, П.И. Бидюк, А.В. Миронова, Н.Ю. Медин СРАВНЕНИЕ МЕТОДОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ ПРИ ОЦЕНИВАНИИ КРЕДИТОСПОСОБНОСТИ ФИЗИЧЕСКИХ ЛИЦ Введение На протяжении последних десяти лет в Украине быстрыми темпами развива- ется кредитование физических лиц. При этом увеличивается количество дефолтов (невозвращение кредитов). По некоторым продуктам (например, потребительские кредиты на покупку товаров) объемы потерь составляют около 15 %. По данным рейтинговой компании Standard and Poor’s (состоянием на конец 2008 г.) каждый третий выданный в Украине кредит проблемный. Standard and Poor’s относит бан- ковскую систему Украины к последней, самой слабой группе 10. Кроме Украины, в эту группу входят Венесуэла, Ямайка и Боливия. Для сравнения, Белоруссия входит в 9-ю группу, а Россия в 7-ю. Постановка задачи Построить скоринговые модели оценивания кредитоспособности физических лиц с использованием самых известных современных методов интеллектуального анализа данных (ИАД) — кластерного анализа, деревьев решений, искусственных нейронных сетей (ИНС), регрессионных моделей дискретного выбора и байесов- ских сетей. Выполнить сравнительный анализ результатов моделирования и пред- ложить лучший метод оценивания кредитоспособности физических лиц. Описание входных данных Для построения скоринговых моделей используется база данных клиентов первого филиала VAB-банка. Обучающая выборка данных создана из 3247 за- писей о клиентах; для определения качества прогнозирования использовано 100 записей, которые не учитывались при построении скоринговой модели. В качестве переменных процесса выбраны десять атрибутов: 1x — пол; 2x — возраст; 3x — семейное положение; 4x — количество детей; 5x — муж (жена) ра- ботает; 6x — образование; 7x — тип трудозанятости; 8x — поручитель; 9x — сумма кредита; y — результат (кредитоспособен или нет). Статистические критерии определения качества скоринговой модели Для оценивания построенных моделей обычно используют такие критерии:  общая точность модели (CA — common accuracy), вычисляется как отноше- ние правильно спрогнозированных значений к общему количеству значений N: ; значенийованныхспрогнозирправильноколичество N CA   погрешности первого и второго рода приведены в табл. 1; погрешности первого рода — прямые потери банка, а второго — нереализованный доход. 142 ISSN 0572-2691 Таблица 1 Вывод Прогноз: нормальный (кредитоспособный) Прогноз: дефолт (некредитоспособный) Нормальный Правильная классификация Погрешность 2-го рода Дефолт Погрешность 1-го рода Правильная классификация Деревья решений Метод деревьев решений (decision trees или answer tree) — один из популяр- ных методов решения задач классификации и прогнозирования. Иногда этот ме- тод ИАД называют также деревьями решающих правил, деревьями классифика- ции и регрессии. Впервые деревья решений были предложены Ховилендом (Hoveland) и Хан- том (Hunt) в конце 50-х годов прошлого века. Самой ранней публикацией, в кото- рой излагается суть деревьев решений, является работа Ханта «Эксперименты в индукции» («Experіments іn Іnductіon») [1], опубликованная в 1966 г. Назовем самые популярные методы построения деревьев решений. — CHAІD (CHi-squared Automatic Interaction Detector). Это самый известный метод построения деревьев решений, в котором для получения оптимального раз- биения используется критерий связи между категориальными переменными 2 (если целевая переменная является количественной, используется F-критерий). Данные анализа целевой переменной и переменных-факторов могут быть как ко- личественные, так и категориальные, но количественные переменные-факторы при построении дерева преобразуются в категориальные. — CART (Classification and regression trees). Метод, известный также как «метод построения деревьев регрессии и классификации». Он основан не на ста- тистических критериях, а на уменьшении неоднородности сегментов (узлов). Хо- рошо работает в том случае, если все переменные в анализе количественные. В методе могут использоваться как количественные, так и категориальные целе- вые переменные и переменные-факторы. — QUEST (Quick, Unbiased and Efficient Statistical Tree). В данном методе для выбора факторов используются разные критерии, в зависимости от типа потенци- ального фактора. Он позволяет избежать сдвигов, обусловленных выбором фак- торов с большим количеством категорий, но целевая переменная в этом случае должна быть категориальной. Переменные-факторы могут быть как количествен- ные, так и категориальные. Если зависимая, т.е. целевая переменная принимает дискретные значения, то с помощью метода деревьев решений решается задача классификации. Если же зависимая переменная принимает непрерывные значения, то дерево решений устанавливает зависимость этой переменной от независимых переменных, т.е. решается задача численного прогнозирования. В простом виде дерево решений — это способ представления правил в иерархической, последовательной структуре. Основа такой структуры — ответы «Да» или «Нет» на ряд возможных вопросов. На рис. 1 приведена скоринговая система в виде деревьев решений, по- строенного по методу CHAID, задачей которой является получение ответов на вопрос: «Выдавать ли кредит?». Чтобы решить эту задачу, необходимо опреде- лить вероятность дефолта клиента банка. Для этого необходимо ответить на ряд вопросов, которые находятся в узлах (вершинах) этого дерева, начиная Проблемы управления и информатики, 2009, № 5 143 с его корня. Вершина «Поручитель» — вершина проверки, т.е. условие. Если ответ положителен, то происходит переход к верхней части дерева к вершине «Возраст», если отрицательный — к нижней части дерева. Таким образом, внутренний узел (вершина) дерева — это узел проверки определенного усло- вия. Дальше идет следующий вопрос и так далее, пока не будет достигнут по- следний узел (вершина) дерева, который является узлом решения. Для нашего дерева конечный узел — вершина «Результат», которая принимает два значе- ния: T и F (T — true и F — false) (в %), где F — вероятность невозвращения клиентом кредита выданного банком (дефолт). Поручитель Возраст Сумма кредита Количество детей Результат T=91,4 F=8,6 Результат T=77,2 F=22,8 Результат T=64,5 F=35,5 Результат T=91,7 F=8,3 Результат T=76,3 % F=23,7 % Результат T=96,9 F=3,1 Результат T=99,9 F=0,1 Результат T=99,2 F=0,8 Результат T=98,4 % F=1,6 % Результат T=91,6 F=8,4 Результат T=93 F=7 Муж (жена) работает Возраст Количество детей Пол М Ж 0 1, 2 Да Нет 0 1, 2, 3 > 2471 ≤ 1000 (1000, 2471) Нет Да ≤ 28 (28, 38) > 38 ≤ 25 > 25 Рис. 1 144 ISSN 0572-2691 В результате прохождения от корня дерева «Поручитель» к его конечной вершине «Результат» решается задача классификации. На основании полученных значений вероятностей T и F определяется степень кредитоспособности клиента и принимается решение, касающееся выдачи или отказа предоставления кредита. Построение скоринговых моделей создано по трем описанным методам в си- стеме статистических расчетов SPSS 16. Как видно из табл. 2, наилучший резуль- тат среди деревьев решений получено по методу CHAID. Таблица 2 Название метода Погрешность Точность модели Процент погрешностей при классификации 1-го рода 2-го рода Общая Вероятность возвращения кредита 90 % CHAID 76 275 351 0,895 10 CART 68 299 367 0,891 20 QUEST 47 546 593 0,823 15 Наилучшие иерархические методы кластеризации с использованием квадратичной меры Евклида Взвешенный центроидный 174 93 267 0,92 15 Варда 146 296 442 0,868 15 Наилучшие иерархические методы кластеризации с использованием коэффициента Пирсона Связь между группами 177 26 203 0,939 20 Связь внутри групп 171 370 541 0,838 20 Удаленные соседи 177 71 248 0,926 20 Медиан 177 26 203 0,939 15 Неиерархические методы кластеризации k-средних для итераций и классификации 116 564 680 0,797 10 % k-средних только для классификации 172 119 291 0,914 15 Двухэтапный 78 1245 1323 0,605 45 Наилучшие иерархические методы с предварительной факторизацией Ближнего соседа 178 1 179 0,947 15 Линейная вероятностная модель 175 0 175 0,947 15 Логит модель 163 6 169 0,949 15 Пробит модель 168 2 170 0,948 15 Байесовская сеть 115 157 272 0,918 15 Кластерный анализ В 1939 г. Трион (Tryon) ввел новый термин — «кластерный анализ». В отли- чие от классификации, кластерный анализ не требует априорных допущений от- носительно данных. Задачу кластеризации объектов можно рассматривать как процесс выявления существенно упорядоченных данных в многомерной матрице, благодаря чему возможно выделение кластеров — «плотных» скоплений исследу- емых объектов. Проблемы управления и информатики, 2009, № 5 145 На сегодня кластерный анализ содержит более 100 разнообразных алгорит- мов [2]. Для решения задачи построения скоринговых моделей использовано 49 методов кластерного анализа:  иерархические — связи между группами, связи внутри групп, ближнего со- седа, удаленных соседей, взвешенный центроидный, медиан, Варда;  итерационные — k-средних, k-медиан, двухэтапный алгоритм BІRCH. Для определения расстояния между кластерами использовались меры: квадратичная евклидовая, простая евклидовая, коэффициент корреляции Пирсона, Чебишева, Минковича. Для решения задачи сокращения количества переменных в задаче кластери- зации клиентов банка применяется популярный метод факторного анализа — метод главных компонентов. При этом для решения задачи вращения факто- ров применяется метод Varimax. В табл. 3 приведены полученные значения об- ратной матрицы. По этим значениям можно определить, из каких перемен- ных (атрибутов) состоит каждый из факторов. Фактор-1 состоит из переменных «пол», «возраст», «семейное положение» и «тип трудозанятости»; фактор-2 — из переменных «семейное положение», «количество детей» и «муж (жена) ра- ботает»; фактор-3 — из переменных «образование», «поручитель» и «сумма кредита». Таблица 3 Атрибут Фактор-1 Фактор-2 Фактор-3 Пол – 0,538 0,085 – 0,223 Возраст 0,811 0,171 – 0,036 Семейное положение 0,577 0,566 – 0,024 Количество детей – 0,153 0,769 – 0,033 Муж (жена) работает 0,093 0,697 – 0,014 Образование – 0,158 – 0,075 0,537 Тип трудозанятости 0,543 – 0,266 – 0,369 Поручитель 0,121 – 0,141 0,529 Сумма кредита 0,085 0,181 0,626 По результатам вычислительных экспериментов и с использованием крите- рия общей точности модели для классификации кредитоспособности клиентов банка установлено, что лучшим оказался метод ближнего соседа, если мерой рас- стояния служит коэффициент Пирсона. Также принятая общая точность модели получена с помощью методов связи между группами, наиболее удаленных сосе- дей, взвешенного центроидного, медиан и k-средних. Низкая точность показана методом связи внутри групп и Варда (наихудшим оказался двухэтапный метод). Искусственные нейронные сети Один из известных методов ИАД — ИНС. Несмотря на большое разнооб- разие вариантов существующих нейронных сетей, они имеют общие черты. Так, все они состоят из большого числа связанных между собой однотипных элементов — нейронов. На рис. 2 показана схема нейрона для задачи оценива- ния кредитоспособности, где ix — значение i-го входа нейрона; iw — вес i-го синапса. 146 ISSN 0572-2691 Пол Возраст Семейное положение Количество детей Муж работает Образование Тип трудозанятости Сумма кредита Поручитель x1 x2 x3 x4 x5 x6 x7 x8 x9 w1 w9 S y Результат Входы Синапсы Ядро аксон Выход Рис. 2 Для построения скоринговых моделей использованы такие методы построе- ния ИНС: — обратного распространения (back propagatіon) [3]; — resilient propagation [4]. Для моделирования задействована программная аналитическая платформа Deductor. Среди моделей, построенных в виде ИНС, наилучшими оказались два типа: — количество нейронов в шаре: 9 входных, 3 скрытых и 1 выходной; — количество нейронов в шаре: 9 входных, 5 скрытых и 1 выходной. Другие, более сложные, при наличии обучающей выборки клиентов банка обучались плохо или не обучались совсем. Для алгоритма Resilient propagation было задано 2000 эпох обучения. Бинарные регрессионные модели дискретного выбора В 1805 г. опубликована первая работа, посвященная методу наименьших квадратов (МНК), с которой началось формальное развитие регрессионного ана- лиза, хотя этот метод Гаусс предложил еще в 1795 г. Модели дискретного выбора предназначены для того, чтобы объяснить дискретный выбор результата, т.е. ре- шение задачи оценивания кредитоспособности заемщика по моделям дискретного выбора означает, что 1y (клиент кредитоспособен), если ,5,0yprobabilit  или 0y (дефолт) иначе. Коэффициенты приведенных ниже уравнений вычислены с использованием системы моделирования Eviews 3. Линейная вероятностная модель — это разновидность множественной ре- грессии, общее назначение которой основывается на анализе связи между не- сколькими независимыми переменными (регрессорами или предикатами) и зави- симой переменной:  4321 0121,001,00024,00358,07545,0yprobabilit xxxx .6732,11112,00037,00142,00214,0 98765 xxxxx  Главный недостаток линейной вероятностной модели — то, что значение вероят- ностей выходит за диапазон [0, 1], поэтому чаще всего используют логит и пробит модели. Логит модели. В 1838 г. бельгийский математик Верхулст (Verhulst) пред- ложил идею использования логистической функции для демографических иссле- дований, но широко популярной эта модель стала в 1925 г. благодаря подтвер- Проблемы управления и информатики, 2009, № 5 147 ждающим практическим исследованиям Юла (Yule), Перла (Pearl) и Рида (Reed). Логит модели оценивания кредитоспособности физических лиц имеет вид , )(exp1 1 ))((exp1 1 )(exp1 )(exp yprobabilit 1 zzz z        где  4321 1875,01426,00695,09563,0 xxxxz .0005,00315,30509,02727,02264,0 98765 xxxxx  Пробит модели. Предложена в 1935 г. биологом Блиссом (Bliss), но широко распространяться стала лишь в начале 70-х годов прошлого столетия благодаря распространению мейнфреймов, которые способны решать задачи нелинейной максимизации. Для задачи, которая решается, логит модели записывается следу- ющим образом: , 2 exp 2 1 yprobabilit 2 dt t z              где  4321 1097,00918,0035,04469,02677,0 xxxxz .0002,04139,11539,01436,01148,0 98765 xxxxx  Байесовские сети Первое упоминание о байесовских сетях (БС) появилось в 1985 г. (Дж. Перл), хотя теорема Байеса, положенная в основу построения вероятностного вывода по БС, предложена еще в 1763 г. Идея использования БС основывается на представ- лении причинно-наследственных связей процесса в виде графа, в котором каждая переменная (фактор, атрибут) процесса — вершина, а существующие причинно- наследственные связи между переменными процесса изображают направленными дугами, которые соединяют соответственные вершины. На рис. 3 показана скоринговая модель в виде БС, построенная по итерацион- ному эвристическому методу, который основывается на использовании оценки вза- имной информации между вершинами, и функции описания минимальной дли- ны [5]. Образование Тип трудозанятости Возраст Семейное положение Пол Поручитель Сумма кредита Количество детей Муж (жена) работает Кредитоспособный? Рис. 3 В табл. 4 приведено десять смоделированных ситуаций с использованием ме- тода построения точного вероятностного вывода в БС по обучающим данным [5]. Построенной скоринговой модели в виде БС (рис. 3) соответствуют такие статистические характеристики: погрешность первого рода — 115; погрешность второго рода — 157; общая погрешность — 272; общая точность модели — 0,918; погрешность классификации — 15 %. 148 ISSN 0572-2691 Таблица 4 Номер ситуации Инстанциированые вершины (априорная информация, касающаяся клиента) Вероятность возвращения кредита (%) 1 Пол  «Мужской» 92,0 2 Пол  «Женский» 97,55 3 Поручитель  «Да» 99,06 4 Поручитель  «Нет» 87,98 5 Возраст < 32 лет и Семейное положение  «Одинокий» и Сумму кредита > 5000 76,92 6 Тип трудозанятости  «Работник банка» и Семейное положение  «Одинокий» 94,66 7 Образование  «Высшее», Количество детей  «один», Муж (Жена) работает  «Да» 97,39 8 Образование  «Среднее» и Количество детей  «Нет», Муж (Жена) работает  «Нет», Поручитель  «Нет», Сумма кредита > 2500 69,78 9 Пол  «Мужской» и Семейное положение  «Вдовец» и Образование  «Среднее специальное» 78,95 10 Пол  «Женский» и Семейное положение  «Вдовец» и Образование  «Среднее специальное» 98,81 Анализ результатов В табл. 2 и 5 приведены статистические и прогнозные характеристики, полу- ченные при использовании соответствующих методов ИАД для построения ско- ринговых моделей оценивания кредитоспособности физических лиц. При класси- фикации рассматривалось значение порога 90 %, клиент классифицировался как кредитоспособный. Таблица 5 Название алгоритма построения ИНС Количество нейронов в шаре Точность модели Процент погрешностей при классификации Входных Скрытых Выходных Back propagation 9 3 1 0,9 20 Back propagation 9 5 1 0,91 15 Resilient propagation 9 3 1 0,91 15 Resilient propagation 9 5 1 0,9 15 Наилучшие результаты получены методами деревьев решений CHAІD и кластерного анализа k-средних. Для этих методов процент погрешностей клас- сификации равен 10, а это означает, что из 100 выданных кредитов 10 классифи- цировались неправильно. Большинство скоринговых систем, полученных дру- гими методами ИАД, дали погрешность классификации 15–20 %. По критерию общей точности модели наилучший результат (0,949) показала логит модель, а среди методов кластерного анализа — ближнего соседа с предварительной факторизацией. Заключение Построение математических моделей оценивания рисков и показателей фи- нансово-экономической деятельности методами ИАД — один из перспективных направлений системного анализа. Среди методов ИАД, которые использовались для построения скоринговых моделей, наилучшие результаты получены методом деревьев решений Chaid и методом кластерного анализа k-средних. Таким обра- Проблемы управления и информатики, 2009, № 5 149 зом, подтверждена высокая эффективность использования методов ИАД для ана- лиза и моделирования эконометрических показателей как необходимый этап ре- шения важной проблемы — обеспечение стабильности и финансовой безопасно- сти банковской системы Украины. В последующих разработках планируется исследовать возможности повыше- ния точности моделей и внедрить механизм прогноза вероятностей дефолтов на основании скоринговых моделей. О.М. Терентьєв, П.І. Бідюк, О.В. Миронова, М.Ю. Медін ПОРІВНЯННЯ МЕТОДІВ ІНТЕЛЕКТУАЛЬНОГО АНАЛІЗУ ДАНИХ ПРИ ОЦІНЮВАННI КРЕДИТОСПРОМОЖНОСТІ ФІЗИЧНИХ ОСІБ Розглянуто задачу оцінювання ризиків при кредитуванні фізичних осіб за мето- дами інтелектуального аналізу даних — кластерного аналізу, дерев рішень, штучних нейронних мереж, регресійних моделей дискретного вибору та мереж Байєса з метою їх порівняння. Для побудови моделей використовується база даних клієнтів першої філії VAB-банку. Отримані скорингові моделі оцінено з використанням таких критеріїв: загальна точність, похибки 1- та 2-го роду. На- ведено експериментальні результати, опис методів та приклади скорингових моделей. A.N. Terentyev, P.I. Bidyuk, A.V. Mironova, N.Yu. Medin COMPARISON OF DATA MINING METHODS FOR ESTIMATING CREDIT RATING OF NATURAL PERSONS An analysis of the task of risk evaluation for crediting clients using the methods of intellectual data analysis, namely cluster analysis, decision trees, artificial neural networks, discrete choice models and Bayesian networks is performed with the pur- pose of their comparison. For construction of scoring models the database of clients of the first branch of VAB bank was used. The scoring models constructed are esti- mated with the use of the following criteria: common accuracy, errors of the first and second type. Experimental results, description of methods and examples of scoring models are also presented. 1. Hunt E.B., Marin J., Stone P. Experiments in induction // The American Journal of Psycholo- gy. — 1966. — 80, N 4. — P. 651–653. 2. Кривова О.А., Коваленко А.С. Применение кластерного анализа для выявления соотноше- ний индикаторов демографического развития // Кибернетика и вычисл. техника. — 2007. — Вып. 153. — С. 24–39. 3. Хайкин С. Нейронные сети : Полный курс. — М. : Издательский дом «Вильямс», 2008. — 1103 с. 4. Riedmiller, M., Braun, H. A direct adaptive method for faster back propagation learning: the RPROP algorithm / IEEE Intern. Conf. on Image Process., Chicago, Illinois, USA, 3–6 May, 1993. — 1. — P. 586–591. 5. Terent’yev A.N., Bidyuk P.I., Korshevnyuk L.A. Bayesian network as instrument of intelligent data analysis // J. of Automat. and Inform. Scie. — 2007. — 39, N 8. — P. 28–38. Получено 28.04.2009 http://www.begellhouse.com/authors/7232d7aa34f2566a.html http://www.begellhouse.com/journals/2b6239406278e43e.html
id nasplib_isofts_kiev_ua-123456789-210620
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 0572-2691
language Russian
last_indexed 2025-12-17T12:04:21Z
publishDate 2009
publisher Інститут кібернетики ім. В.М. Глушкова НАН України
record_format dspace
spelling Терентьев, А.Н.
Бидюк, П.И.
Миронова, А.В.
Медин, Н.Ю.
2025-12-13T11:36:12Z
2009
Сравнение методов интеллектуального анализа данных при оценивании кредитоспособности физических лиц / А.Н. Терентьев, П.И. Бидюк, А.В. Миронова, Н.Ю. Медин // Проблемы управления и информатики. — 2009. — № 5. — С. 141-149. — Бібліогр.: 5 назв. — рос.
0572-2691
https://nasplib.isofts.kiev.ua/handle/123456789/210620
62-50
10.1615/JAutomatInfScien.v41.i10.60
Розглянуто задачу оцінювання ризиків при кредитуванні фізичних осіб за методами інтелектуального аналізу даних — кластерного аналізу, дерев рішень, штучних нейронних мереж, регресійних моделей дискретного вибору та мереж Байєса з метою їх порівняння. Для побудови моделей використовується база даних клієнтів першої філії VAB-банку. Отримані скорингові моделі оцінено з використанням таких критеріїв: загальна точність, похибки 1- та 2-го роду. Наведено експериментальні результати, опис методів та приклади скорингових моделей.
An analysis of the task of risk evaluation for crediting clients using the methods of intellectual data analysis, namely cluster analysis, decision trees, artificial neural networks, discrete choice models and Bayesian networks is performed with the purpose of their comparison. For construction of scoring models the database of clients of the first branch of VAB bank was used. The scoring models constructed are estimated with the use of the following criteria: common accuracy, errors of the first and second type. Experimental results, description of methods and examples of scoring models are also presented.
ru
Інститут кібернетики ім. В.М. Глушкова НАН України
Проблемы управления и информатики
Экономические и управленческие системы
Сравнение методов интеллектуального анализа данных при оценивании кредитоспособности физических лиц
Порівняння методів інтелектуального аналізу даних при оцінюваннi кредитоспроможності фізичних осіб
Comparison of data mining methods for estimating credit rating of natural persons
Article
published earlier
spellingShingle Сравнение методов интеллектуального анализа данных при оценивании кредитоспособности физических лиц
Терентьев, А.Н.
Бидюк, П.И.
Миронова, А.В.
Медин, Н.Ю.
Экономические и управленческие системы
title Сравнение методов интеллектуального анализа данных при оценивании кредитоспособности физических лиц
title_alt Порівняння методів інтелектуального аналізу даних при оцінюваннi кредитоспроможності фізичних осіб
Comparison of data mining methods for estimating credit rating of natural persons
title_full Сравнение методов интеллектуального анализа данных при оценивании кредитоспособности физических лиц
title_fullStr Сравнение методов интеллектуального анализа данных при оценивании кредитоспособности физических лиц
title_full_unstemmed Сравнение методов интеллектуального анализа данных при оценивании кредитоспособности физических лиц
title_short Сравнение методов интеллектуального анализа данных при оценивании кредитоспособности физических лиц
title_sort сравнение методов интеллектуального анализа данных при оценивании кредитоспособности физических лиц
topic Экономические и управленческие системы
topic_facet Экономические и управленческие системы
url https://nasplib.isofts.kiev.ua/handle/123456789/210620
work_keys_str_mv AT terentʹevan sravneniemetodovintellektualʹnogoanalizadannyhpriocenivaniikreditosposobnostifizičeskihlic
AT bidûkpi sravneniemetodovintellektualʹnogoanalizadannyhpriocenivaniikreditosposobnostifizičeskihlic
AT mironovaav sravneniemetodovintellektualʹnogoanalizadannyhpriocenivaniikreditosposobnostifizičeskihlic
AT medinnû sravneniemetodovintellektualʹnogoanalizadannyhpriocenivaniikreditosposobnostifizičeskihlic
AT terentʹevan porívnânnâmetodívíntelektualʹnogoanalízudanihpriocínûvannikreditospromožnostífízičnihosíb
AT bidûkpi porívnânnâmetodívíntelektualʹnogoanalízudanihpriocínûvannikreditospromožnostífízičnihosíb
AT mironovaav porívnânnâmetodívíntelektualʹnogoanalízudanihpriocínûvannikreditospromožnostífízičnihosíb
AT medinnû porívnânnâmetodívíntelektualʹnogoanalízudanihpriocínûvannikreditospromožnostífízičnihosíb
AT terentʹevan comparisonofdataminingmethodsforestimatingcreditratingofnaturalpersons
AT bidûkpi comparisonofdataminingmethodsforestimatingcreditratingofnaturalpersons
AT mironovaav comparisonofdataminingmethodsforestimatingcreditratingofnaturalpersons
AT medinnû comparisonofdataminingmethodsforestimatingcreditratingofnaturalpersons