Оцінювання кредитоспроможності позичальників кредитів методами інтелектуального анализу даних

The actual task of creditworthiness based on the expert and scoring approach was considered. The analysis of the subject area was performed and the main methods of mathematical modeling and a credit risk assessment were analyzed; mathematical models for analyzing the credit risks of individual borro...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Datum:2019
Hauptverfasser: Guskova, Vira G., Bidyuk, Petro I.
Format: Artikel
Sprache:Ukrainisch
Veröffentlicht: The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2019
Schlagworte:
Online Zugang:https://journal.iasa.kpi.ua/article/view/155247
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:System research and information technologies
Завантажити файл: Pdf

Institution

System research and information technologies
_version_ 1867334348277022720
author Guskova, Vira G.
Bidyuk, Petro I.
author_facet Guskova, Vira G.
Bidyuk, Petro I.
author_institution_txt_mv [ { "author": "Vira G. Guskova", "institution": "Кафедра математичних методів системного аналізу Навчально-наукового комплексу \"Інститут прикладного системного аналізу\" Національного технічного університету України \"Київський політехнічний інститут імені Ігоря Сікорського\", Київ" }, { "author": "Petro I. Bidyuk", "institution": "Кафедра математичних методів системного аналізу Навчально-наукового комплексу \"Інститут прикладного системного аналізу\" Національного технічного університету України \"Київський політехнічний інститут імені Ігоря Сікорського\", Київ" } ]
author_sort Guskova, Vira G.
baseUrl_str http://journal.iasa.kpi.ua/oai
collection OJS
datestamp_date 2019-08-27T22:12:50Z
description The actual task of creditworthiness based on the expert and scoring approach was considered. The analysis of the subject area was performed and the main methods of mathematical modeling and a credit risk assessment were analyzed; mathematical models for analyzing the credit risks of individual borrowers based on alternative methods were proposed; mathematical models have been developed for analyzing the credit risks of individual borrowers based on decision trees, logistic regression, Bayesian networks, and fuzzy logic. It has been found that the model based on fuzzy logic for solving the problem of determining the probability of default for a loan borrower is more accurate, this is indicated by the calculated accuracy of models. This is due to the possibility of using the fuzzy logic method with fuzzy Mamdani’s conclusion to precisely establish the cause-and-effect relationships between the characteristics-factors of the task and their influence on the initial variable.
doi_str_mv 10.20535/SRIT.2308-8893.2019.2.04
first_indexed 2025-07-17T10:24:28Z
format Article
fulltext  В.Г. Гуськова, П.І. Бідюк, 2019 Системні дослідження та інформаційні технології, 2019, № 2 31 TIДC ПРОБЛЕМИ ПРИЙНЯТТЯ РІШЕНЬ ТА УПРАВЛІННЯ В ЕКОНОМІЧНИХ, ТЕХНІЧНИХ, ЕКОЛОГІЧНИХ І СОЦІАЛЬНИХ СИСТЕМАХ УДК 004.942 DOI: 10.20535/SRIT.2308-8893.2019.2.04 ОЦІНЮВАННЯ КРЕДИТОСПРОМОЖНОСТІ ПОЗИЧАЛЬНИКІВ КРЕДИТІВ МЕТОДАМИ ІНТЕЛЕКТУАЛЬНОГО АНАЛІЗУ ДАНИХ В.Г. ГУСЬКОВА, П.І. БІДЮК Анотація. Розглянуто актуальне завдання оцінювання кредитоспроможності на основі експертного та скорингово підходів. Виконано аналіз предметної га- лузі та проаналізовано основні методи математичного моделювання і оціню- вання кредитних ризиків, запропоновано математичні моделі для аналізу кре- дитних ризиків індивідуальних позичальників на основі альтернативних методів, розроблено математичні моделі для аналізу кредитних ризиків індиві- дуальних позичальників на основі дерев рішень, логістичної регресії, мереж Байєса та нечіткої логіки. Установлено, що модель на основі нечіткої логіки для розв’язання задачі визначення ймовірності дефолту для кредитного пози- чальника є більш точною, на що вказують пораховані точності моделей. Це зумовлено можливістю з використання методу нечіткої логіки з нечітким висновком Мамдані точніше встановлювати причинно-наслідкові зв’язки між характеристиками-факторами задачі та їх вплив на вихідну змінну. Ключові слова: дерева рішень, логістична регресія, мережа Байєса, нечітка логіка, імовірність дефолту, висновок Мамдані. ВСТУП Оцінювання кредитоспроможності — важливе завдання загальної проблеми менеджменту ризиків фінансових організацій, які забезпечують клієнтів кредитами. Коректне вирішення цього завдання забезпечує повне та своєчас- не повернення кредитів, зменшення можливих утрат. Є два основні підходи до його розв’язання: експертний та скоринговий. Експертний підхід передбачає, що фахівці з кредитування індивідуаль- них позичальників визначають істотні характеристики клієнта банку, які можуть впливати на повернення кредиту, ставлять у відповідність цим харак- теристикам певні ваги [1–3]. Для кожного клієнта за всіма характеристиками проставляються бали відповідно до вагових коефіцієнтів, установленими експертами, та підраховується сума всіх балів. Для банку завчасно встанов- люється певне порогове значення, яке визначає правило: якщо сума всіх ба- лів менша за це значення, то клієнту не слід видавати кредит, а якщо більша, то клієнт може отримати кредит. Банк може встановити ще одне обмеження (верхню межу), яке визначає таке правило: якщо сума балів більша від уста- В.Г. Гуськова, П.І. Бідюк ISSN 1681–6048 System Research & Information Technologies, 2019, № 2 32 новленого значення, то клієнту можна видавати кредит без надмірної обе- режності. Якщо і верхня, і нижня межі видачі кредиту задані, то значення між ними є компетенцією менеджера банку, який на власний розсуд визна- чає, чи видавати кредит клієнту, чи ні. Зрозуміла суб’єктивність цього під- ходу для встановлення як балів, так і порогового та верхнього значень. Скоринговий підхід ґрунтується на побудові математичної моделі для оцінювання кредитоспроможності позичальників на основі кредитних істо- рій банку та оцінюванні ймовірності дефолту потенційного позичальника з урахуванням його соціально-демографічних характеристик. Маючи стати- стичні дані «гарних» і «поганих» кредитів за певний період, банк може ви- значити безпосередньо фактори, які створюють передумови для повернен- ня/неповернення кредиту, і для кожного нового клієнта на основі цих характеристик визначити його можливість повернути кредит [4, 5]. На почат- ковому етапі скоринговий підхід ґрунтується на експертному підході, оскіль- ки необхідно передусім визначити, які саме характеристики щодо клієнта потрібно збирати та як перевірити надані клієнтом дані, і в процесі застосу- вання скорингової моделі змінювати оброблені банком дані про клієнта [6]. Очевидно, що скорингову модель необхідно коригувати у процесі роботи (кожні два-три роки), оскільки ситуація в країні динамічно змінюється, з’являються певні зловмисники, які прораховують фіктивні дані для скорин- гової моделі з надання кредиту і т. ін. Спільне використання обох підходів дозволило б полегшити процес прийняття рішення щодо видачі кредиту клі- єнту банком [7]. Більш адекватним є підхід на основі статистики дефолтів за попередні періоди, тобто побудова скорингової моделі. Статистичні методи передба- чають визначення ймовірності реалізації певної події на підставі певних ви- мог:  об’єкти, для аналізу яких пропонується використати статистичні дані, і об’єкти, на яких збираються статистичні дані, є еквівалентними;  умови, у яких пропонується використовувати статистичні дані і умо- ви їх збирання є еквівалентними;  обсяги вибірок статистичних даних є достатніми, методи оброблен- ня — коректними, а джерело інформації надійним. Такий підхід ставить високі вимоги до статистики дефолтів: 1. Однорідна вибірка (позичальники повинні бути досить схожими). 2. Вибірка має складатися з певної кількості випадків – чим більше де- фолтів, тим краще. За експертними оцінками для адекватності моделі обсяг вибірки повинен складати не менше ніж 2000 випадків. 3. Вибірка для побудови моделі повинна нагромаджуватися за доволі обмежений термін. Ця вимога викликана фактом зміни макроекономічного середовища. Позичальник з певними параметрами в одному макроекономіч- ному середовищі без проблем виплачуватиме кредит; а в іншому середовищі виявиться дефолтом. Вважається, що в умовах країн, які розвиваються, мо- дель для оцінювання ймовірності дефолту необхідно змінювати кожні два- три роки. 4. Необхідно нагромаджувати не лише кредитну історію позичальників (дефолт / не дефолт), але й параметри цих позичальників – вік, стать, місце роботи, посада, сім’я тощо. Проблема в тому, що спочатку невідомо, які са- Оцінювання кредитоспроможності позичальників кредитів методами … Системні дослідження та інформаційні технології, 2019, № 2 33 ме параметри виявляться значущими у моделі. Тому на етапі побудови мо- делі необхідно нагромаджувати максимальну кількість параметрів за кож- ним позичальником. 5. Вибірка має включати інформацію про кредити, цикл кредитування яких уже закінчився. Ця вимога необхідна, оскільки обов’язковою є інфор- мація про повернення / неповернення кредиту. 6. Історію потрібно нагромаджувати в межах кредитних продуктів (споживчий кредит, кредит на автомобільний транспорт, іпотечний кредит). Скорингову модель необхідно будувати для кожного кредитного продукту. Дані про процес кредитування фізичних осіб задовольняють майже всі ці вимоги. Для фізичних осіб параметрами скорингової моделі можуть бути вік, сімейний стан, кількість дітей, освіта, місце проживання, робота, посада, власність, кредитна історія і т. ін. ПОСТАНОВКА ЗАДАЧІ Для досягнення поставленої мети у роботі поставлені і вирішуються такі завдання: виконати аналіз предметної галузі і вибрати методи математично- го моделювання та оцінювання кредитних ризиків; запропонувати матема- тичні моделі для аналізу кредитних ризиків індивідуальних позичальників на основі альтернативних методів; розробити математичні моделі для аналі- зу кредитних ризиків індивідуальних позичальників на основі дерев рішень, логістичної регресії, мереж Байєса (МБ) та нечіткої логіки; створити проект та програмну реалізацію інформаційної системи підтримання прийняття рі- шень (СППР) для оцінювання кредитоспроможності позичальників і порів- няти показники якості моделей за допомогою ROC-аналізу. МЕТОДИ МОДЕЛЮВАННЯ І ПРОГНОЗУВАННЯ БАНКІВСЬКИХ КРЕДИТНИХ РИЗИКІВ Розглянемо особливості побудови моделей у формі логістичної регресії, МБ та нечіткої логіки. Логістична регресія — це різновид множинної регресії, загальне при- значення якої полягає в аналізі зв’язку між декількома незалежними змін- ними (регресорами або предикторами) і залежною змінною. Бінарна логіс- тична регресія, як випливає з назви, застосовується в разі, коли залежна змінна є бінарною (тобто може набувати тільки двох значень). Інакше кажу- чи, за допомогою логістичної регресії можна оцінювати ймовірність того, що подія настане для конкретної випробовуваної особи (хворий/здоровий, повернення кредиту/ дефолт і т. ін.). Це досягається застосуванням такого регресійного рівняння (логіт-перетворення) [8, 9]: ye+ =P 1 1 , де P — імовірність того, що відбудеться подія, яка цікавить; e — основа натуральних логарифмів 2,71; y — змінна, що визначається рівнянням лі- В.Г. Гуськова, П.І. Бідюк ISSN 1681–6048 System Research & Information Technologies, 2019, № 2 34 нійної регресії. Залежність, що зв’язує ймовірність події і величину у, пока- зано на рис. 1. БАЙЄСІВСЬКИЙ ПІДХІД НА ОСНОВІ МЕРЕЖ ДОВІРИ За допомогою МБ як інструменту аналізу даних вирішують дві математичні задачі: 1) побудову структури МБ і 2) формування імовірнісного висновку. Задача побудови МБ за заданими навчальними даними є NP-складною, тоб- то завданням нелінійної поліноміальної складності. Кількість усіх можливих нециклічних моделей, які потрібно проаналізувати, обчислюється за ре- курентною формулою Робінсона, запропонованою у 1976 р. [10]:    n =i i)(nii n +i infC=nf 1 1 )(2)1()( , де n — кількість вершин; 1)0( f . Однак на практиці виконати повний пе- ребір моделей можна тільки для мереж не більш ніж із сімома вершинами (вузлами), інакше не вистачить обчислювальних ресурсів. Завдання формування імовірнісного висновку в МБ є важливим і склад- ним і належить до класу задач прийняття рішень. Однак для реалізації цього методу необхідно звести структуру МБ до вигляду об’єднаного дерева (junction tree), і тільки тоді можна використовувати алгоритм імовірнісного висновку в об’єднаному дереві, який ґрунтується на проходженні  і  по- відомлень по дереву. Очевидно, що існуючі методи побудови МБ і форму- вання висновку потребують трудомістких обчислень. Тому розроблення ме- тодів, що дозволяють зменшити обчислювальну складність, є актуальним для моделювання процесів різної природи МБ [10, 11]. Постановка задачі побудови МБ складається з таких кроків: 1) розроблення евристичного методу побудови МБ, що містить два ета- пи. На першому етапі обчислюється значення інформації між усіма верши- нами, на другому — цілеспрямований пошук, який використовує як оцінну функцію оцінки мінімальної довжини, засновану на принципі опису, який застосовується на кожній ітерації алгоритму навчання. 2) розроблення методу ймовірнісного висновку в МБ з використанням двох кроків. На першому кроці обчислюється матриця емпіричних значень спільного розподілу ймовірностей всієї мережі, а на другому кроці — зна- чення ймовірностей всіх можливих станів неінстанційованих вершин [12]. P y Рис. 1. Логістична функція розподілу Оцінювання кредитоспроможності позичальників кредитів методами … Системні дослідження та інформаційні технології, 2019, № 2 35 Байєсова мережа являє собою пару ),( BG , перша компонента G якої — це напрямлений нециклічний граф, який відповідає випадковим змінним і записується як набір умов незалежності: кожна змінна незалежна від її батьків у G . Друга компонента пари B — це множина параметрів, що визначають мережу; містить параметри ))( ( )()( )()( ii iiX pa(X|XP= Xpa|  для кожного можливого значення )()( ii Xx  і )()( )()( ii XPaXpa  , де )( )(iXPa — набір батьків змінної GX i )( . Кожна змінна GX i )( зображується у вигляді вершини. Якщо розглядають більше одного графу, то для визначен- ня батьків змінної )(iX у графі використовують позначення )(iG XPa . Повна спільна ймовірність БМ обчислюється за виразом [12, 13]    N i i a i B N B XPXPXXP 1 )()()()1( ))(|(),...,( . Гібридна МБ ),,( PDXB  визначається через напрямлений ацикліч- ний граф ),( EXG  і його функції )}|({ iii paxPP  , де ipa — набір бать- ківських вузлів ix ; X — набір змінних, поділених на дискретні  і непере- рвні Г змінні, тобто  ГX . Структура графу G обмежена тим, що неперервні змінні не можуть мати дискретних змінних як їх вузли-нащадки. Умовний розподіл неперервних змінних задається лінійною гаусівською моделлю: ))()()(()( iz,i+iαN=z=Zi,=I|xP i  , ix , де Z та I — множини відповідно неперервних і дискретних батьків ix ; ))(( N — мультиноміальний нормальний розподіл. Мережа являє собою спільний розподіл усіх його змінних, заданих добутком усіх таблиць умов- них імовірностей. Можна розглядати сформульований висновок як шлях конвертації ба- гатовимірних гаусіанів у МБ. Змінні упорядковуються у певному порядку nXX ,,1  . Потім цей висновок використовується для знаходження умовно- го розподілу:              1 1 2 ,011 ,;),,|( i j ijjiiiii XXNXXXP  . Створюється ребро з jX до iX )1( ij  тоді і тільки тоді, коли 0ij . Умовний імовірнісний розподіл (УІР) iX називають лінійним умов- ним імовірнісним розподілом, що має вигляд деякого виразу після скоро- чення усіх нульових значень. Лінійний умовний імовірнісний розподіл для кореневих вузлів є просто одновимірною гаусіаною. Мережа Байєса, у якій всі умовні імовірнісні розподіли є лінійними, називається лінійною гаусіа- ною (ЛГ). Таким чином, кожна багатовимірна гаусіана може бути подана ЛГ. Обернене твердження також справедливе. Кожна МБ з лінійними УІР являє собою спільний нормальний розподіл. В.Г. Гуськова, П.І. Бідюк ISSN 1681–6048 System Research & Information Technologies, 2019, № 2 36 Умовна лінійна гаусіана (УЛГ) — це МБ, яка містить як неперервні змінні )( , так і дискретні змінні )( з такими обмеженнями [14, 15]:  дискретний вузол не може мати неперервних батьків, таким чином, усі УІР для дискретних вузлів можуть бути подані як у дискретних МБ;  умовно-імовірнісний розподіл будь-якої неперервної змінної є ліній- ним УІР, заданим будь-якою комбінацією дискретних батьків. Формально, якщо вузол Y має батьків },,{ 1 kXX  і  },,{ 1 lDDD  , він визна- чається як УІР з використанням таких параметрів: для кожного ),,,(Dom 0 dkdDd   і 2 d : ),;(),|( 1 2 ,0,    k i diidd xYNdxYP . Це найбільш поширений вид гібридних моделей. Вони дозволяють ма- ти лише лінійні відношення між неперервними змінними і не дозволяють дискретним змінним мати неперервних батьків. Широке використання таких моделей зумовлено їх математичною зручністю. В УЛГ задано значення дискретних змінних, розподіл неперервних змінних — багатовимірну гаусі- ану; отже спільний імовірнісний розподіл — це композиція гаусіан, з якими можна працювати, використовуючи аналітичні інструменти. Якщо всі дискретні змінні задані, то УІР неперервних змінних є ліній- ними умовними неперервними розподілами. Тоді з наданням будь-яких зна- чень дискретним змінним УЛГ редукується у ЛГ і тому є нормальним роз- поділом. Звідси випливає, що спільний розподіл, поданий УЛГ, є композицією гаусіан, де кожна композиція компонентів відповідає реалізації дискретних змінних. Таким чином, використання МБ дає змогу аналізувати причинно- наслідкові зв’язки між окремими змінними (подіями, даними) і формулюва- ти на цій основі обґрунтований імовірнісний прогноз. Використання гібрид- них МБ дозволяє коректно аналізувати неперервні змінні у моделі (напри- клад, вік чи суму кредиту) і досягати вищої точності прогнозу [15]. ЗАСТОСУВАННЯ МЕТОДІВ МОДЕЛЮВАННЯ КРЕДИТНИХ РИЗИКІВ Прогнозування кредитоспроможності індивідуального позичальника вико- нується на основі бінарної логістичної регресії. Для побудови моделі вико- ристаємо навчальну вибірку даних про клієнта та результати повернення чи неповернення цим клієнтом кредиту (0 — якщо кредит повернено і 1 — як- що ні). Маючи інформацію про 1500 клієнтів, спочатку будуємо модель ло- гістичної регресії на основі даних про 1200 клієнтів, а потім робимо прогноз на основі побудованої моделі для 300 клієнтів, маючи в моделі всі дані про них, окрім результатів повернення чи неповернення кредиту, і порівнюємо результати побудованого прогнозу з реальним станом подій. У цьому випадку як вхідні дані включено такі змінні: суму кредиту, вік позичальника, його дохід, платіж за кредитом, термін кредиту та освіту. Характеристики побу- дованих логіт і пробіт моделей подано в табл. 1. Оцінювання кредитоспроможності позичальників кредитів методами … Системні дослідження та інформаційні технології, 2019, № 2 37 Т а б л и ц я 1 . Статистичні характеристики якості прогнозів Характеристика Середньо- квадратична похибка САПП Коефіцієнт Тейла Логіт 0,407083 13,23895 0,493373 Пробіт 0,406719 13,23129 0,493053 Отримані статистичні характеристики прогнозування для обох типів моделей дуже близькі між собою. Тобто тип розподілу не є значущим для побудови моделі. ЗАСТОСУВАННЯ ДЕРЕВ РІШЕНЬ ДЛЯ ОЦІНЮВАННЯ КРЕДИТОСПРОМОЖНОСТІ ПОЗИЧАЛЬНИКІВ Дерева рішень часто використовують для розв’язання задач класифікації. Наприклад, звернення за кредитом можуть бути класифіковані як такі, що мають високий або низький ризик — дерева рішень дозволяють визначити правила для виконання такої класифікації на основі даних з навчальної ви- бірки. Порівняно з іншими алгоритмами дерева рішень мають такі переваги, як висока швидкість навчання, прийнятна точність та легко зрозумілі шаб- лони. На вибірці з 1600 кредитів побудовано дерево рішень, що дозволяє класифікувати нового клієнта як такого, що поверне кредит, або не поверне. Результати побудови дерев рішень зведено для порівняння в табл. 2 та пода- но у вигляді діаграми (рис. 2). Т а б л и ц я 2 . Результати для всіх типів дерев рішень Похибки класифікації Тип дерева рішень Загальна точність: CA I роду II роду Сумарна похибка Chaid 0,843 3,733 11,933 15,666 Exhaustive Chaid 0,825 3,733 13,733 17,466 CRT 0,922 4,4 3,4 7,8 Quest 0,885 5,333 6,1333 11,466 Рис. 2. Порівняльна діаграма похибок алгоритмів дерев рішень Помилки I роду Помилки II роду Помилки I та I I роду Chaid Exhaust ve chaid CRT Quest В.Г. Гуськова, П.І. Бідюк ISSN 1681–6048 System Research & Information Technologies, 2019, № 2 38 ПРОГНОЗУВАННЯ КРЕДИТОСПРОМОЖНОСТІ ІНДИВІДУАЛЬНОГО ПОЗИЧАЛЬНИКА ЗА ДОПОМОГОЮ БАЙЄСІВСЬКИХ МЕРЕЖ За рік банком видано 1600 кредитів. Кожний клієнт описується 18 характе- ристиками. За наявними даними побудовано мережу, яка показує зв’язок між характеристиками клієнта і вершиною — подією повернення кредиту. За наявними навчальними даними визначено ймовірність повернення креди- ту новим клієнтом, що звернувся до банку. Отже, треба визначити iPD — імовірність дефолту потенційного позичальника. Оскільки числові характе- ристики (сума кредиту, вік, дохід і т.ін.) набувають багато значень, тобто є неперервними, то для розв’язання поставленої задачі потрібно використову- вати гібридні МБ. За описаною вище методикою необхідно виконати аналіз проблеми і зробити формалізовану постановку задачі. Розглянемо детальні- ше схему застосування запропонованої методики. Крок 1. Для розв’язання задачі оцінювання кредитоспроможності по- зичальника зібрати статистичні дані про видані кредити, частину з яких по- вернуто, а частина виявилась дефолтом, тобто отримати позитивні і негати- вні приклади навчальних даних. На основі вибраних параметрів позичальника та кредиту x розробити формальну модель і оцінити ймовірно- сті дефолту позичальника iPD : ),( j i j i xwFPD  , де jw — ваги параметрів j ix ; i — кількість позичальників; j — кількість параметрів кредиту. Модель для оцінювання кредитоспроможності на осно- ві МБ описується таким чином: i k ii PRJGvFPD  1),,( , де k iv — змінні, що описують характеристики клієнта і кредиту; J — імовірнісний розподіл змінних k iv ; G — напрямлений ациклічний граф, вузли якого відповідають випадковим змінним k iv модельованого процесу; iPR — імовірність повернення кредиту. Крок 2. Дані задачі — це статистичні дані за 1600 виданими кредита- ми, з яких 450 випадків дефолтів, 1150 — повернутих кредитів. Крок 3. Взаємовиключними змінними для даної задачі є 18 характерис- тик, що описують клієнта та кредит. Кроки 4–5. Оскільки в задачі використовуються неперервні змінні і будується гібридна МБ, то для неперервних змінних використовується дис- кретизація, тобто область значень неперервної змінної розбивається на про- міжки. Кількість проміжків визначається користувачем, ті стовпчики, для яких не вказано кількість інтервалів розбиття, автоматично розбиваються на два проміжки. Доцільно виконувати дискретизацію даних за однаковою шириною класів або за однаковою кількістю точок усередині кластерів. Крім цього, ширина та кількість проміжків можуть бути регламентовані бан- ком, виходячи із соціологічних або демографічних досліджень груп клієн- тів [15]. Під час побудови структури МБ слід пам’ятати, що обраний алго- ритм впливає на швидкість виконання програми і на саму побудовану Оцінювання кредитоспроможності позичальників кредитів методами … Системні дослідження та інформаційні технології, 2019, № 2 39 структуру. Найшвидшим є алгоритм Greedy Thick Thinning, його і будемо використовувати для аналізу прикладів. У результаті роботи алгоритму отримуємо тільки одну структуру, яка є логічною і оптимальною. Побудо- вану за цими даними структуру МБ зображено на рис. 3. Вона наочно де- монструє зв’язки між даними. ОЦІНЮВАННЯ КРЕДИТОСПРОМОЖНОСТІ ПОЗИЧАЛЬНИКА З ВИКОРИСТАННЯМ НЕЧІТКОЇ ЛОГІКИ Для врахування не тільки кількісних, але і якісних характеристик вектор да- них можна подати за допомогою лінгвістичних змінних. Лінгвістична змінна визначається як  MGXTb ,,,, , де b — ім’я лінгвістичної змінної; T — базова терм-множина лінгвістичної змінної, кожний елемент якої (терм) подається як нечітка множина на універсальній множині X ; G — синтаксичне правило, часто у вигляді граматики, що дозволяє оперувати елементами терм-множини T , зокрема, генерувати нові терми (значення); M — семантичне правило, що задає функцію належності нечітких термів, утворених синтаксичними правилами [16, 17]. Для побудови правила Рис. 3. Структура побудованої МБ В.Г. Гуськова, П.І. Бідюк ISSN 1681–6048 System Research & Information Technologies, 2019, № 2 40 необхідно побудувати функції належності кожної лінгвістичної змінної, тобто задати вигляд функції та її параметри. Параметри функцій належності визначаються в процесі її побудови. Підхід на основі нечітких нейронних мереж (ННМ) дозволяє автоматично будувати функцію належності, а відповідно і базу знань та реалізувати нечіткий логічний висновок. У за- гальному вигляді алгоритм має такі етапи. 1. Визначення множини вхідних змінних про позичальника: },...,,...,,{ 21 Ni XXXXX   . 2. Визначення множини вихідних змінних — можливі групи ризику: },...,,...,,{ 21 Mi DDDDD  . 3. Формування базової терм-множини з відповідними функціями належності кожної змінної: },...,,{ 21 NaaaA  . 4. Формування кінцевої множини нечітких правил, узгоджених щодо змінних, що в них використовуються. 5. Реалізація логічного висновку, тобто визначення істинності для пе- редумов кожного правила та визначення нечітких підмножин для змінних виходу для кожного правила. 6. Композиція нечітких підмножин кожної змінної виходу за всіма пра- вилами. 7. Знаходження чіткого значення для кожної з вихідних лінгвістичних змінних. У ННМ з логічним висновком Мамдані реалізується логічний висновок, який має такі етапи. 1. Уведення нечіткості. Знаходимо ступінь істинності для передумов кожного правила: )(),(),(),( 02010201 xBxBxAxA . 2. Логічний висновок. Знаходимо рівні відсікання для передумов кожного з правил (з використанням операції знаходження мінімуму): )()( 01011 уВхА  ; )()( 02022 уВхА  . Знаходимо рівні відсікання функції належності: ))(( 111 zСС  ; ))(( 222 zСС  . 3. Композиція. Підсумовуємо знайдені відсічені функції належності з використанням операції максимум та отримуємо підсумкову нечітку підмножину для змінної виходу з функцією належності:  )(zС ))(())(()()( 221121 zСzСzCzC  . 4. Зведення до чіткості. Використовуються центроїдний метод (рис. 4). Вхідними є такі фактори впливу, як вік, рівень заробітної плати, термін кредитування, а вихідним — імовірність повернення кредиту та відповід- ний фінансовий клас позичальника. Задачу оцінювання кредитоспроможно- сті можна сформулювати таким чином [17–19]. Кожна кредитна заявка задається вектором },..,,..,,{ 21 ni xxxx , де ix — певним чином формалізовані дані з анкети позичальника та параметри кредиту. Далі за заданим вектором треба прийняти рішення про надання кредиту, тобто оцінити ймовірність повернення кредиту. У загальному вигляді нечіткий логічний висновок має такі етапи: визначення множини вхідних змінних; визначення множини ви- хідних змінних; формування базової терм-множини з відповідними функці- ями належності кожного терму; формування кінцевої множини нечітких правил, узгоджених щодо використовуваних у них змінних. Знаходження чіткого значення для кожної з вихідних лінгвістичних змінних. Оцінювання кредитоспроможності позичальників кредитів методами … Системні дослідження та інформаційні технології, 2019, № 2 41 Під час виконання аналітичних досліджень визначено перелік факторів, що впливають на формування рівня кредитоспроможності клієнта. Нижче подано перелік вхідних факторів, використаних для розроблення системи, зокрема: 1) вік позичальника )( 1x ; 2) стаж роботи )( 2x ; 3) місячна заробітна плата )( 3x ; 4) наявність майна )( 4x ; 5) наявність кредитної історії )( 5x ; 6) сума кредиту )( 6x ; 7) термін кредитування )( 7x . Для оцінювання кредитоспроможності фактори, що впливають на фор- мування рівня кредитоспроможності клієнта, можуть набувати таких зна- чень: вік = 18–65 (років); стаж роботи = 0–49 (років); заробітна плата = = 0–30000 (грн); наявність майна = 1 — ні; 2 — машина; 3 — квартира; 4 — дім; 5 — два та більше з перелічених значень. Наявність кредитної історії: 1 — є кредити, оплата за якими прострочена; 2 — не було; 3 — є кредити в інших банках і погашаються своєчасно; 4 — є кредити у банку і погашають- ся своєчасно; 5 — немає відкритих кредитів, попередні сплачувались своє- часно; сума кредиту: 1000–100000 (грн); термін кредитування: від 4 місяців до 5 років. Як вихідну маємо лінгвістичну змінну «імовірність повернення креди- ту», що має такі терми: «дуже низька ймовірність повернення», «низька ймовірність повернення», «середня ймовірність повернення», «висока ймо- Правило 1 Правило 2 Правило 3  1  1  1  1  1  1 () 1    x y z A B C x0 y0 z0 D E F D F E (x0) (y0) (z0) 0  Рис. 4. Ілюстрація логічного висновку Мамдані В.Г. Гуськова, П.І. Бідюк ISSN 1681–6048 System Research & Information Technologies, 2019, № 2 42 вірність повернення», «дуже висока ймовірність повернення». Приклади функцій належності для деяких змінних подано на рис. 4, 5. Для запису правил, що використовувались у програмі, уведемо позна- чення: «дуже низький» — ДН, «низький» — Н, «середній» — Ср, «висо- кий» — В, «дуже високий» — ДВ. Змінна «спроможність погашення» визначається так: платаЗаробітна якредитваннСтроккредитуСума погашеннятьСпроможніс   . РОЗРОБЛЕНЕ ПРОГРАМНЕ ЗАБЕЗПЕЧЕННЯ Для розроблення автоматизованої системи підтримання прийняття рішень (СППР) використано Microsoft Visual Studio (мова програмування — C#). Приклад інтерфейсу розробленої системи для оцінювання кредитоспромож- ності фізичних осіб, вхідними змінними якої є зазначені фактори впливу, а Рис. 4. Функція належності змінної «вік»:: 1 — ДН, 2 — Н, 3 — Ср, 4 — ДВ, 5 — В 1 2 3 4 1 2 3 4 5 Рис. 5. Функція належності змінної «спроможність погашення»: 1 — ДВ, 2 — В, 3 — Ср, 4 — Н, 5 — ДН Оцінювання кредитоспроможності позичальників кредитів методами … Системні дослідження та інформаційні технології, 2019, № 2 43 вихідною змінною — імовірність повернення кредиту, подано на рис. 6. Після заповнення полів з інформацією про позичальника необхідно натис- нути кнопку «Обчислити». Результатом роботи команди є відповідна інформація навпроти поля «Імовірність повернення кредиту» та фінансовий клас позичальника. АНАЛІЗ РЕЗУЛЬТАТІВ Для аналізу якості моделей і встановлення найкращої моделі для розв’язання певної задачі використовують декілька критеріїв для оцінюван- ня адекватності моделей: загальну точність моделі; помилки І та ІІ роду; ROC-криву та індекс GINI та загальну точність моделі (CA — Common Accuracy). Індекс GINI можна визначити через площу фігури, що міститься під ROC-кривою, таким чином: 12  AUCGINI . Діапазон значень індексу GINI становить 10  G , а моделі з найвищою роздільною здатністю, тобто моделі, які виконують високоякісне сортування схильних до дефолту клієн- тів і клієнтів, не схильних до дефолту, отримають найвищі коефіцієнти. На практиці оцінка якості моделі суттєво залежить від даних, за якими вона бу- Рис. 6. Приклад роботи програми Середня імовірність повернення Імовірність повернення кредиту Ім’я позичальника В.Г. Гуськова, П.І. Бідюк ISSN 1681–6048 System Research & Information Technologies, 2019, № 2 44 дується. Для застосування на практиці скорингу (оцінки фінансового стану нових клієнтів) індекс GINI на рівні 55% є вже дуже високим, у той час як для скорингу поведінки (оцінки фінансового стану існуючих клієнтів) ін- декс GINI зазвичай набуває значень вищих за 70%. Значення точок ROC-кривої використано для знаходження порога від- сікання — компромісу між чутливістю та специфічністю моделі. Критерія- ми вибору порога відсікання можуть бути: 1) вимога мінімальної величини чутливості (специфічності) моделі; 2) вимога максимальної сумарної чутливості та специфічності моделі, тобто )(max kk k Sp+Se=offcut  ; 3) вимога балансу між чутливістю і специфічністю [6], тобто коли SeSp : |SpSe|=offcut kk k  min . За побудованими моделями виконано аналіз прогнозів останніх 300 значень (з 1600) про кредити, отриманих за методами логістичної регресії, дерев рішень, МБ та нечіткої логіки, порівняно з реальними значеннями. Після проведення ROC-аналізу і встановлення порогів відсікання на певних рівнях, тобто, якщо ймовірність дефолту перевищує вказаний рівень, то клі- єнт вважається таким, що не поверне кредиту, отримано таблицю результа- тів для логістичної регресії (табл. 3). Т а б л и ц я 3 . Загальна точність моделі та помилки І та ІІ роду для різних рівнів порога відсікання, отримані для логістичної регресії Характеристика Прогноз: Повернення кредиту (0) Прогноз: Дефолт (1) cut-off = 0,1 Факт: Повернення кредиту (0) 57 183 Факт: Дефолт (1) 0 60 Загальна точність моделі = 61,9 % cut-off = 0,15 Факт: Повернення кредиту (0) 86 154 Факт: Дефолт (1) 1 59 Загальна точність моделі = 67 % cut-off = 0,2 Факт: Повернення кредиту (0) 109 131 Факт: Дефолт (1) 3 57 Загальна точність моделі = 70,3 % cut-off = 0,25 Факт: Повернення кредиту (0) 151 89 Факт: Дефолт (1) 6 54 Загальна точність моделі = 76,5 % cut-off = 0,3 Факт: Повернення кредиту (0) 184 56 Факт: Дефолт (1) 11 49 Загальна точність моделі = 79,2 % Оцінювання кредитоспроможності позичальників кредитів методами … Системні дослідження та інформаційні технології, 2019, № 2 45 Максимальна точність моделі на рівні 79,2 % досягається за значення порога відсікання 0,3, при цьому модель пропускає 11 дефолтів та відсіює 23,3% добросовісних позичальників. Значення площі під ROC-кривою ста- новить: 775,0AUC , а індекс GINI відповідно: GINI 549,012  AUC . На основі навчальної вибірки з 1300 клієнтів також побудовано МБ. Для пе- ревірної вибірки (300 випадків) обчислено ймовірності дефолтів (табл. 4). Т а б л и ц я 4 . Загальна точність моделі та помилки І та ІІ роду для різних рівнів порога відсікання, отримані для МБ Характеристика Прогноз: Повернення кредиту (0) Прогноз: Дефолт (1) cut-off = 0,1 Факт: Повернення кредиту (0) 3 237 Факт: Дефолт (1) 0 60 Загальна точність моделі = 50,6 % cut-off = 0,15 Факт: Повернення кредиту (0) 3 237 Факт: Дефолт (1) 0 60 Загальна точність моделі = 50,6 % cut-off = 0,2 Факт: Повернення кредиту (0) 22 218 Факт: Дефолт (1) 0 60 Загальна точність моделі = 54,6 % cut-of f = 0,25 Факт: Повернення кредиту (0) 23 217 Факт: Дефолт (1) 0 60 Загальна точність моделі = 54,8 % cut-off = 0,3 Факт: Повернення кредиту (0) 146 94 Факт: Дефолт (1) 3 57 Загальна точність моделі = 77,9 % Найбільша точність моделі досягається на рівні 77 % під час встанов- лення порога 0,3; при цьому буде пропущено три дефолти та відкинуто 39 % добросовісних позичальників. Значення площі під кривою становить: 879,0AUC , а індекс GINI відповідно: 758,012  AUCGINI . Результа- ти оцінювання кредитоспроможності для різних порогів відсікання під час використання нечіткої логіки подано в табл. 5. Як видно з отриманих результатів нечітка модель показує вищі значен- ня загальної точності для порогів відсікання 0,2 і 0,25, а також відсіює мен- ше добросовісних позичальників порівняно з даними для МБ. Значення площі під кривою для моделі на основі нечіткої логіки: 8875,0AUC , а індекс GINI відповідно: 775,012  AUCGINI , що є кращим резуль- татом. В.Г. Гуськова, П.І. Бідюк ISSN 1681–6048 System Research & Information Technologies, 2019, № 2 46 Т а б л и ц я 5 . Загальна точність моделі та помилки І та ІІ роду для різних рівнів порога відсікання, отримані для нечіткої логіки Характеристика Прогноз: Повернення кредиту (0) Прогноз: Дефолт (1) cut-off = 0,1 Факт: Повернення кредиту (0) 42 198 Факт: Дефолт (1) 0 60 Загальна точність моделі = 58,75 % cut-of f= 0,15 Факт: Повернення кредиту (0) 88 152 Факт: Дефолт (1) 0 60 Загальна точність моделі = 68,3 % cut-of f= 0,2 Факт: Повернення кредиту (0) 121 119 Факт: Дефолт (1) 0 60 Загальна точність моделі = 75,3 % cut-off = 0,25 Факт: Повернення кредиту (0) 161 79 Факт: Дефолт (1) 2 58 Загальна точність моделі = 81,9 % cut-off = 0,3 Факт: Повернення кредиту (0) 173 67 Факт: Дефолт (1) 3 57 Загальна точність моделі = 83,5 % Точність моделі та кількість помилок І та ІІ роду залежать від порога відсікання, який буде встановлений банком. Установлення порога відсікання визначає не лише відсоток відсіяних клієнтів, а і нижню межу ймовірності повернення кредиту, тобто поріг, нижче за який клієнт вважається таким, що не поверне кредит. При цьому значення ймовірності дефолту 0,1 або 0,2 для клієнта є статистично незначними, а тому поріг відсікання доцільно встановлювати на рівні 0,25–0,3. Таким чином, підхід за допомогою нечіткої логіки до оцінювання кредитоспроможності позичальника дозволяє підви- щити якість моделі, а також її здатність розрізняти надійних та ненадійних клієнтів та зменшити кількість некоректно відсіяних клієнтів. Результати застосування використаних методів оцінювання кредитоспроможності наве- дено на табл. 6. Т а б л и ц я 6 . Порівняльна таблиця характеристик для різних моделей Назва методу Індекс GINI Значення AUC Точність моделі, % Якість моделі Бінарна логістична регресія 0,5491 0,7745 79,2 Прийнятна Дерева рішень 0,548 0,774 71,25 Прийнятна Мережа Байєса 0,758 0,879 77,9 Висока Нечітка логіка 0,775 0,8875 83,5 Висока Оцінювання кредитоспроможності позичальників кредитів методами … Системні дослідження та інформаційні технології, 2019, № 2 47 Отримані результати обчислювальних експериментів свідчать, що най- кращі результати дає нечітка логіка (83,5%), також хороший результат дає модель у формі МБ (77,9%). Високі значення точності моделі отримано за логістичною регресією (79,2%). Ці результати ще раз підтверджують доці- льність використання нечіткої логіки, логістичної регресії, дерев рішень та МБ під час оцінювання кредитоспроможності позичальників кредитів. ВИСНОВКИ Виконано аналіз якості моделей, побудованих за методами логістичної ре- гресії, дерев рішень, МБ та нечіткою логікою. Установлено, що модель на основі нечіткої логіки є кращою (у розгляданого випадку) для розв’язання задачі визначення ймовірності дефолту для кредитного позичальника, на що вказує порахована точність моделі, яка становить 83,5% для моделі нечіткої логіки та 77,9% для МБ. Це зумовлено тим, що використання методу нечіт- кої логіки (за нечітким висновком Мамдані) дає змогу точніше встановити причинно-наслідкові зв’язки між характеристиками-факторами задачі, їх вплив на вихідну змінну. Для аналізу якості результатів використано кілька критеріїв. Для кож- ної з моделей обчислено помилки I та II роду, загальну точність моделей для заданих порогів відсікання, значення яких безпосередньо впливають на точ- ність моделі та кількість помилок I та II роду. Побудовано ROC-криві і об- числено площі під кривою та індекс GINI. Таким чином, застосування методів інтелектуального аналізу даних до розв’язання задачі прогнозування кредитоспроможності клієнтів фінансової установи уможливлює отримання високоякісних результатів, придатних для подальшого практичного використання для прийняття рішень. У подальших дослідженнях доцільно використати більші обсяги стати- стичних даних і розширити кількість змінних, які характеризують позичаль- ників кредиту. Необхідно також створити інформаційну систему підтриман- ня прийняття рішень комерційного типу на основі комбінованого використання ідеологічно різних типів моделей: статистичного типу та інте- лектуального аналізу даних для розв’язання задач такого класу. Це суттєво спростить роботу працівникам банків, які займаються розв’язуванням задач оцінювання та менеджменту ризиків. ЛІТЕРАТУРА 1. Крючковский В.В. Экспертная система оценки кредитоспособности банковских клиентов на основе методов нечеткой логики и сети Байеса / В.В. Крючковский, С.А. Бабичев, А.В. Шарко // Экономика научно- технического прогресса. — 2009. — № 1. — С.197–205. 2. Allen S. Financial risk management: A practitioner’s guide to managing market and credit risk / S. Allenб. — Hoboken, N.J.: John Wiley & Sons, Inc., 2003. — 567 p. 3. Hennie van Greuning. Analyzing and managing banking risk: a framework for as- sessing corporate governance and financial risk / Hennie van Greuning, Sonja Bratanovic. — 2nd ed. 4. Костюченко Н.С. Анализ кредитных рисков / Н.С. Костюченко. — СПб.: ИТД «Скифия», 2010. — 440 с. В.Г. Гуськова, П.І. Бідюк ISSN 1681–6048 System Research & Information Technologies, 2019, № 2 48 5. Бідюк П.І. Моделі оцінки ризиків кредитування фізичних осіб / П.І. Бідюк, Є.О. Матрос // Кібернетика та обчислювальна техніка. — 2007. — № 153. — C. 87–95. 6. Бідюк П.І. Порівняльний аналіз характеристик моделей оцінювання ризиків кредитування / П.І. Бідюк, Н.В. Кузнєцова // Наукові вісті НТУУ «КПІ». — 2010. — № 1. — С. 42–53. 7. Колпаков В.М. Теория и практика принятия управленческих решений: учеб. пособие / В.М. Колпаков. — 2-е изд., перераб. и доп. — К.: МАУП, 2004. — 504 с. 8. Agresti A. Building and applying logistic regression models. An Introduction to Cat- egorical Data Analysis / A. Agresti. — Hoboken, New Jersey: Wiley, 2007. — 138 p. 9. Shariff A. The Comparison Logit and Probit Regression Analyses in Research / A. Shariff, A. Zaharim, K. Sopian. — 2009. — Vol. 27, N 4. — P. 548–553. 10. Терентьев А.Н. Сравнение методов интеллектуального анализа данных при оце- нивании кредитоспособности физических лиц / А.Н. Терентьев, П.И. Бидюк, А.В. Миронова, Н.Ю. Медин // Проблемы управления и информатики. — К.: ИКИ НАНУ-НКАУ, 2009. — № 5. — С. 141–149. 11. Терентьев А.Н. Метод вероятностного вывода в байесовских сетях по обу- чающим данным / А.Н. Терентьев, П.И. Бидюк // Кибернетика и системный анализ. — 2007. — № 3. — С. 93–99. 12. Бідюк П.І. Основні етапи побудови і приклади застосування мереж Байєса / П.І. Бідюк, Н.В. Кузнєцова // Системні дослідження та інформаційні техно- логії. — 2007. — № 4. — С. 26–39. 13. Heckerman D. Bayesian Networks for Data Mining / D. Heckerman // Data Mining and Knowledge Discovery. — 1997. — № 1. — P. 79–119. 14. Кузнєцова Н.В. Гібридні мережі Байєса: основні особливості і точні методи формування висновку / Н.В. Кузнєцова // Праці Одеського політехн. ун-ту. — Одеса, 2009. — Вип. 1(31). — С. 114–121. 15. Кузнєцова Н.В. Системний підхід до аналізу кредитних ризиків з використан- ням мереж Байєса / Н.В. Кузнєцова, П.І. Бідюк // Наукові вісті НТУУ «КПІ». — 2008. — № 3. — С. 11–24. 16. Недосекин А. Методологические основы моделирования финансовой деятель- ности с использование нечетко множественных описаний / А. Недосекин. — СПб, 2003. — 280 с. 17. Зайченко Ю.П. Оценка кредитных банковских рисков с использованием нечет- кой логики // Системні дослідження та інформаційні технології. — 2010. — № 2. — С. 37–54. 18. Шовгун Н.В. Аналіз кредитоспроможності позичальника за допомогою методів з нечіткою логікою / Н.В. Шовгун // Вісник НТУУ «КПІ». Інформатика, управління та обчислювальна техніка: зб. наук. праць. — К.: Век+, 2012. — № 55. — С.169–173. 19. Shovgun Natalia. Fuzzy neural networks for evaluating the creditworthiness of the borrowers / Natalia Shovgun // Information theories & applications. ITHEA IBS ISC. — 2014. — Vol. 21. — P. 54–257. Надійшла 28.01.2019
id journaliasakpiua-article-155247
institution System research and information technologies
keywords_txt_mv keywords
language Ukrainian
last_indexed 2025-07-17T10:24:28Z
publishDate 2019
publisher The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute"
record_format ojs
resource_txt_mv journaliasakpiua/7f/e447def73657b5cfb1de705898567b7f.pdf
spelling journaliasakpiua-article-1552472019-08-27T22:12:50Z Evaluating the borrower's creditworthiness of loans using data mining methods Оценивание кредитоспособности заемщиков кредитов методами интеллектуального анализа данных Оцінювання кредитоспроможності позичальників кредитів методами інтелектуального анализу даних Guskova, Vira G. Bidyuk, Petro I. decision trees logistic regression Bayesian network fuzzy logic probability of default Mamdani conclusion деревья решений логистическая регрессия сеть Байеса нечеткая логика вероятность дефолта вывод Мамдани дерева рішень логістична регресія мережа Байєса нечітка логіка імовірність дефолту висновок Мамдані The actual task of creditworthiness based on the expert and scoring approach was considered. The analysis of the subject area was performed and the main methods of mathematical modeling and a credit risk assessment were analyzed; mathematical models for analyzing the credit risks of individual borrowers based on alternative methods were proposed; mathematical models have been developed for analyzing the credit risks of individual borrowers based on decision trees, logistic regression, Bayesian networks, and fuzzy logic. It has been found that the model based on fuzzy logic for solving the problem of determining the probability of default for a loan borrower is more accurate, this is indicated by the calculated accuracy of models. This is due to the possibility of using the fuzzy logic method with fuzzy Mamdani’s conclusion to precisely establish the cause-and-effect relationships between the characteristics-factors of the task and their influence on the initial variable. Рассмотрена актуальная задача оценки кредитоспособности на основе экспертного и скорингового подходов. Выполнен анализ предметной области и проанализированы основные методы математического моделирования и оценки кредитных рисков, предложены математические модели для анализа кредитных рисков индивидуальных заемщиков на основе альтернативных методов, разработаны математические модели для анализа кредитных рисков индивидуальных заемщиков на основе деревьев решений, логистической регрессии, сетей Байеса и нечеткой логики. Установлено, что модель на основе нечеткой логики для решения задачи определения вероятности дефолта для кредитного заемщика является более точной, на что указывают посчитанные точности моделей. Это обусловлено возможностью использования метода нечеткой логики с нечетким выводом Мамдани точнее устанавливать причинно-следственные связи между характеристиками-факторами задачи и их влияние на исходную переменную. Розглянуто актуальне завдання оцінювання кредитоспроможності на основі експертного та скорингово підходів. Виконано аналіз предметної галузі та проаналізовано основні методи математичного моделювання і оцінювання кредитних ризиків, запропоновано математичні моделі для аналізу кредитних ризиків індивідуальних позичальників на основі альтернативних методів, розроблено математичні моделі для аналізу кредитних ризиків індивідуальних позичальників на основі дерев рішень, логістичної регресії, мереж Байєса та нечіткої логіки. Установлено, що модель на основі нечіткої логіки для розв’язання задачі визначення ймовірності дефолту для кредитного позичальника є більш точною, на що вказують пораховані точності моделей. Це зумовлено можливістю з використання методу нечіткої логіки з нечітким висновком Мамдані точніше встановлювати причинно-наслідкові зв’язки між характеристиками-факторами задачі та їх вплив на вихідну змінну. The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2019-06-25 Article Article application/pdf https://journal.iasa.kpi.ua/article/view/155247 10.20535/SRIT.2308-8893.2019.2.04 System research and information technologies; No. 2 (2019); 31-48 Системные исследования и информационные технологии; № 2 (2019); 31-48 Системні дослідження та інформаційні технології; № 2 (2019); 31-48 2308-8893 1681-6048 uk https://journal.iasa.kpi.ua/article/view/155247/175462 Copyright (c) 2021 System research and information technologies
spellingShingle дерева рішень
логістична регресія
мережа Байєса
нечітка логіка
імовірність дефолту
висновок Мамдані
Guskova, Vira G.
Bidyuk, Petro I.
Оцінювання кредитоспроможності позичальників кредитів методами інтелектуального анализу даних
title Оцінювання кредитоспроможності позичальників кредитів методами інтелектуального анализу даних
title_alt Evaluating the borrower's creditworthiness of loans using data mining methods
Оценивание кредитоспособности заемщиков кредитов методами интеллектуального анализа данных
title_full Оцінювання кредитоспроможності позичальників кредитів методами інтелектуального анализу даних
title_fullStr Оцінювання кредитоспроможності позичальників кредитів методами інтелектуального анализу даних
title_full_unstemmed Оцінювання кредитоспроможності позичальників кредитів методами інтелектуального анализу даних
title_short Оцінювання кредитоспроможності позичальників кредитів методами інтелектуального анализу даних
title_sort оцінювання кредитоспроможності позичальників кредитів методами інтелектуального анализу даних
topic дерева рішень
логістична регресія
мережа Байєса
нечітка логіка
імовірність дефолту
висновок Мамдані
topic_facet decision trees
logistic regression
Bayesian network
fuzzy logic
probability of default
Mamdani conclusion
деревья решений
логистическая регрессия
сеть Байеса
нечеткая логика
вероятность дефолта
вывод Мамдани
дерева рішень
логістична регресія
мережа Байєса
нечітка логіка
імовірність дефолту
висновок Мамдані
url https://journal.iasa.kpi.ua/article/view/155247
work_keys_str_mv AT guskovavirag evaluatingtheborrowerscreditworthinessofloansusingdataminingmethods
AT bidyukpetroi evaluatingtheborrowerscreditworthinessofloansusingdataminingmethods
AT guskovavirag ocenivaniekreditosposobnostizaemŝikovkreditovmetodamiintellektualʹnogoanalizadannyh
AT bidyukpetroi ocenivaniekreditosposobnostizaemŝikovkreditovmetodamiintellektualʹnogoanalizadannyh
AT guskovavirag ocínûvannâkreditospromožnostípozičalʹnikívkreditívmetodamiíntelektualʹnogoanalizudanih
AT bidyukpetroi ocínûvannâkreditospromožnostípozičalʹnikívkreditívmetodamiíntelektualʹnogoanalizudanih